Wort- & Zeichenzähler
Füge Text ein und erhalte einen Live-Wortzähler mit Zeichen, Sätzen, Zeilen, Bytegröße und einer ungefähren Token-Schätzung. Alles läuft in deinem Browser.
Dein Text wird lokal in deinem Browser analysiert, um die Zählungen zu erzeugen, und nie hochgeladen, sodass Notizen, Entwürfe und Prompts auf deinem Gerät bleiben.
Musst du den Text umformen? Probiere den Case Converter.
Über Wortzähler
Dieser Wortzähler liefert dir Live-Statistiken in dem Moment, in dem du zu tippen beginnst oder Text einfügst. Als Wortzähler und Zeichenzähler meldet er Zeichen mit und ohne Leerzeichen, Wörter, Sätze, Absätze, Zeilen, UTF-8-Bytegröße, eine ungefähre LLM-Token-Schätzung und eine geschätzte Lesezeit von etwa 200 Wörtern pro Minute. Zeichenzählungen sind graphem-bewusst, sodass ein Emoji oder eine Flagge als ein Zeichen zählt, auch wenn es mehrere Bytes umfasst. Es ist praktisch, um eine Meta-Beschreibung zu straffen, einen Tweet oder eine Commit-Nachricht passend zu machen, einen Prompt vor dem Senden an ein Modell zu prüfen oder einfach Text auf Kurs zu halten. Es gibt auch eine optionale Liste der häufigsten Wörter. Alles wird lokal in deinem Browser berechnet, sodass der eingefügte Text auf deinem Gerät bleibt und nie hochgeladen wird.
Funktionen
- Live-Zeichen mit Leerzeichen und Zeichen ohne Leerzeichen, während du tippst
- Wort-, Satz-, Absatz- und Zeilenzählungen sofort aktualisiert
- UTF-8-Bytegröße, damit du Payload- und Speichergrenzen prüfen kannst
- Ungefähre LLM-Token-Schätzung mit einer ~Zeichen / 4-Heuristik, gekennzeichnet als ungefähr
- Lesezeit-Schätzung auf Basis von etwa 200 Wörtern pro Minute
- Graphem-bewusste Zählung, sodass Emoji und kombinierte Glyphen als ein Zeichen zählen
- Optionale Liste der häufigsten Wörter, ohne triviale Stoppwörter
- Die Schaltfläche Statistik kopieren kopiert eine saubere Klartext-Zusammenfassung jeder Kennzahl
So verwendest du Wortzähler
- Füge deinen Text in das Textfeld ein oder tippe ihn ein.
- Lies die Live-Statistikkarten für Zeichen, Wörter, Sätze, Zeilen, Bytes, Tokens und Lesezeit.
- Überfliege die optionale Liste der häufigsten Wörter, um zu sehen, welche Begriffe am meisten wiederkehren.
- Klicke auf Statistik kopieren, um eine Klartext-Zusammenfassung jeder Kennzahl zu erhalten.
Beispiel
Eingabe
The quick brown fox jumps over the lazy dog. 🦊
Ausgabe
Characters (with spaces): 46
Characters (no spaces): 37
Words: 9
Sentences: 1
Lines: 1
Size (UTF-8): 48 bytes
Tokens (approx): ~12
Reading time: 1 min
Das Fuchs-Emoji zählt als ein Zeichen, fügt aber vier UTF-8-Bytes hinzu.
Häufige Fehler & Fehlerbehebung
- Die Zeichenzählung sieht höher aus als die Anzahl der getippten Buchstaben. — Die Standardzählung schließt Leerzeichen, Satzzeichen und Zeilenumbrüche ein; prüfe die zweite Karte, Zeichen (ohne Leerzeichen), für nur Buchstaben und sichtbare Symbole.
- Ein Emoji oder ein Buchstabe mit Akzent verändert die Bytegröße stärker als die Zeichenzählung. — Zeichen werden graphem-bewusst gezählt, während Bytes UTF-8 sind, sodass ein Emoji ein einzelnes Zeichen, aber vier Bytes ist; das ist erwartetes Verhalten.
- Die Token-Zahl stimmt nicht exakt mit dem Tokenizer deines Modells überein. — Die Token-Angabe ist eine Näherung (etwa Zeichen / 4) und als ungefähr gekennzeichnet; verwende den echten Tokenizer deines Modells, wenn eine genaue Zahl wichtig ist.
- Die Wortzählung ist null, obwohl das Feld nicht leer ist. — Eine Eingabe, die nur aus Leerzeichen, Tabs oder Leerzeilen besteht, hat keine Wörter; tippe etwas sichtbaren Text und die Zählungen aktualisieren sich sofort.
Häufig gestellte Fragen
- Schließt die Zeichenzählung Leerzeichen und Zeilenumbrüche ein?
- Die Hauptkarte Zeichen zählt alles, einschließlich Leerzeichen, Satzzeichen und Zeilenumbrüche. Eine separate Karte Zeichen (ohne Leerzeichen) entfernt jeglichen Leerraum, sodass du nur Buchstaben und sichtbare Symbole siehst.
- Wie behandelt die Zeichenzählung Emoji und Buchstaben mit Akzent?
- Die Zählung ist graphem-bewusst und nutzt, wo verfügbar, Intl.Segmenter, sodass ein Emoji, eine Flagge oder ein Buchstabe mit kombinierendem Akzent als ein einzelnes Zeichen zählt, auch wenn er mehrere UTF-8-Bytes belegen kann.
- Wofür ist die ungefähre Token-Zählung?
- Sie gibt eine schnelle Schätzung, wie viele LLM-Tokens dein Text verbraucht, basierend auf einer ungefähren Zeichen / 4-Heuristik und als ungefähr gekennzeichnet. Sie ist nützlich, um unter dem Kontextbudget eines Modells zu bleiben, ersetzt aber nicht den exakten Tokenizer des Modells.
- Wie wird die Lesezeit berechnet?
- Die Lesezeit teilt die Wortzählung durch etwa 200 Wörter pro Minute und rundet auf, sodass jeder nicht leere Text mindestens eine Minute anzeigt. Sie ist ein grober Anhaltspunkt, wie lange der Abschnitt zum Lesen braucht.
- Wie unterscheidet sich die Bytegröße von der Zeichenzählung?
- Die Bytegröße ist die UTF-8-Länge deines Textes, die viele APIs und Datenbanken begrenzen. ASCII-Zeichen sind ein Byte, Buchstaben mit Akzent meist zwei, die meisten CJK-Zeichen drei und Emoji vier, daher sind Bytes oft höher als die Zeichenzählung.
- Wird mein Text hochgeladen, wenn ich ihn zähle?
- Nein. Der Wortzähler läuft vollständig in deinem Browser, sodass der eingefügte Text lokal auf deinem Gerät verarbeitet und nie an einen Server gesendet wird.
Verwandte Tools
Alle ArrayKit-Tools