AI Text Cleaner
Füge Text ein, um unsichtbare Zeichen und Typografie-Artefakte zu erkennen und zu entfernen, die KI-Modelle und Kopieren-Einfügen hinterlassen. Alles läuft in deinem Browser.
Dein Text wird lokal in deinem Browser inspiziert und bereinigt und niemals hochgeladen, aber vermeide es, vertrauliche Inhalte in ein Online-Tool einzufügen.
Siehst du kaputte Akzente wie Café? Probiere den Mojibake Fixer.
Über AI Text Cleaner
Dieser AI Text Cleaner ist ein einfacher Inspektor und Reiniger für Text, der Zeichen enthält, die du nicht sehen kannst. Füge alles ein, was ein Sprachmodell erzeugt hat, oder Inhalte, die du aus einem Dokument, PDF oder von einer Webseite kopiert hast, und er zählt und entfernt die versteckten Formatzeichen, die sich einschleichen: zero-width space und Joiner, die schmalen und normalen geschützten Leerzeichen, bedingte Trennstriche, bidirektionale Steuerzeichen, unsichtbare mathematische Operatoren und Emoji-Variationsselektoren. Optionale Schalter richten typografische Anführungszeichen gerade, wandeln Geviert- und Halbgeviertstriche in einfache Bindestriche um, fassen Folgen von Leerzeichen zusammen und wenden Unicode-NFC-Normalisierung an. Du erhältst eine Zusammenfassung nach Typ des Entfernten sowie Zeichen- und UTF-8-Byte-Zahlen vor und nach der Bereinigung und kannst das Ergebnis dann kopieren oder herunterladen. Die gesamte Prüfung läuft in deinem Browser, sodass der eingefügte Text auf deinem Gerät bleibt.
Funktionen
- Erkennt und zählt jedes versteckte Zeichen nach Typ, einschließlich zero-width space, Joiner und Non-Joiner
- Entfernt geschützte und schmale geschützte Leerzeichen, bedingte Trennstriche und die Byte-Order-Mark
- Entfernt bidirektionale Steuerzeichen (LRM, RLM, LRO/RLO, Isolates), die Text umordnen oder vortäuschen können
- Löscht unsichtbare mathematische Operatoren (U+2061–U+2064) und Emoji-Variationsselektoren (U+FE00–U+FE0F)
- Optional: typografische Anführungszeichen geraderichten und Geviert-/Halbgeviertstriche in einen einfachen Bindestrich umwandeln
- Optional: Folgen von Leerzeichen zusammenfassen und Unicode-NFC-Normalisierung anwenden
- Zeigt eine Zusammenfassung nach Typ des Entfernten mit Zeichen- und UTF-8-Byte-Zahlen vor und nach der Bereinigung
- Kopiere den bereinigten Text oder lade ihn mit einem Klick als cleaned.txt herunter
So verwendest du AI Text Cleaner
- Füge deinen Text in das Eingabefeld links ein oder tippe ihn ein.
- Lies das Banner und die Liste nach Typ des Entfernten, um zu sehen, welche versteckten Zeichen gefunden wurden.
- Aktiviere die gewünschten Typografie-Optionen, etwa Anführungszeichen geraderichten oder Leerzeichen zusammenfassen.
- Prüfe die Zeichen- und Byte-Zahlen vor und nach der Bereinigung, um zu bestätigen, was sich geändert hat.
- Kopiere den bereinigten Text oder lade ihn als cleaned.txt herunter.
Beispiel
Eingabe
The model said “this is clean”—or is it?
Ausgabe
The model said "this is clean"-or is it?
Ein zero-width space wird entfernt; mit aktivierten Anführungszeichen- und Strich-Optionen werden typografische Anführungszeichen gerade und der Geviertstrich zu einem Bindestrich.
Häufige Fehler & Fehlerbehebung
- Der bereinigte Text sieht identisch zur Eingabe aus, aber die Zahlen haben sich trotzdem geändert. — Die entfernten Zeichen waren auf dem Bildschirm unsichtbar. Prüfe die Liste nach Typ des Entfernten und die Differenz der Zeichenzahl, um genau zu sehen, was herausgekommen ist.
- Ein geschütztes Leerzeichen zwischen Wörtern wurde zu einem normalen Leerzeichen oder verschwand. — Geschützte und schmale geschützte Leerzeichen werden als versteckte Zeichen entfernt. Wenn du dort ein echtes Leerzeichen brauchst, hält die Option Leerzeichen zusammenfassen einzelne Leerzeichen intakt.
- Akzentbuchstaben haben ihre Länge geändert, obwohl sie gleich aussehen. — Das ist die Unicode-NFC-Normalisierung, die einen Grundbuchstaben und ein kombinierendes Zeichen zu einem Codepunkt zusammenführt. Schalte die Option Normalisieren (NFC) aus, wenn du die ursprüngliche Form möchtest.
- Ein Emoji hat nach der Bereinigung seine Farbe oder seinen Stil verloren. — Variationsselektoren (U+FE00–U+FE0F), die eine Text- oder Emoji-Darstellung erzwingen, werden entfernt. Füge das Emoji über deine Tastatur neu ein, wenn du einen bestimmten Stil brauchst.
Häufig gestellte Fragen
- Was ist ein zero-width space?
- Ein zero-width space (U+200B) ist ein Unicode-Zeichen ohne sichtbare Breite. Er kann unsichtbare Worttrennungen erzeugen, exakte Suchen durcheinanderbringen und Byte-Zahlen ändern, obwohl auf dem Bildschirm nichts erscheint. Dieses Tool entfernt ihn zusammen mit verwandten zero-width Joinern und geschützten Leerzeichen.
- Warum enthält KI-generierter Text manchmal versteckte Zeichen?
- Modelle werden auf Web- und Dokumenttext trainiert, der bereits geschützte Leerzeichen, typografische Anführungszeichen, bedingte Trennstriche und andere Formatierungen enthält, und Tokenizer können sie reproduzieren. Kopieren-Einfügen aus Rich-Editoren, PDFs und Chat-Apps fügt weitere hinzu. Das Ergebnis ist Text, der sauber aussieht, aber Zeichen enthält, die du nicht sehen kannst.
- Welche Zeichen entfernt der AI Text Cleaner?
- Er entfernt zero-width space, Joiner, Non-Joiner und Word Joiner, die Byte-Order-Mark, geschützte und schmale geschützte Leerzeichen, bedingte Trennstriche, bidirektionale Steuerzeichen, unsichtbare mathematische Operatoren (U+2061–U+2064) und Emoji-Variationsselektoren (U+FE00–U+FE0F). Änderungen an Anführungszeichen, Strichen, Abständen und NFC sind optionale Schalter.
- Was sind bidirektionale Steuerzeichen und warum sollte man sie entfernen?
- Bidi-Steuerzeichen wie der Right-to-Left Override ordnen um, wie Text angezeigt wird. Sie sind für gemischtschriftliche Inhalte legitim, können aber auch benutzt werden, um Dateinamen oder Code zu tarnen, daher markiert und entfernt dieses Tool sie, sodass das, was du siehst, zu den zugrunde liegenden Zeichen passt.
- Ändert dieses Tool meine sichtbaren Wörter oder schreibt es den Text um?
- Nein. Es ist ein Inspektor und Reiniger: Standardmäßig löscht es nur Zeichen, die du nicht sehen kannst, und meldet, was es entfernt hat. Es paraphrasiert, ergänzt oder schreibt deine Wörter niemals um, und die Typografie-Optionen laufen nur, wenn du sie einschaltest.
- Wird mein Text irgendwohin hochgeladen, wenn ich unsichtbare Zeichen entferne?
- Nein. Die Erkennung und Bereinigung laufen vollständig in deinem Browser, sodass der eingefügte Text auf deinem Gerät verarbeitet und nicht an einen Server gesendet wird.
Verwandte Tools
Alle ArrayKit-Tools