Mojibake- / Kodierungs-Fixer
Repariere verstümmelten Mojibake-Text wie Café oder don’t zurück zu Café und don’t, direkt in deinem Browser.
Dein Text wird lokal in deinem Browser repariert und nie hochgeladen, aber vermeide es, sensible persönliche Daten in irgendein Online-Tool einzufügen.
Musst du HTML-Sonderzeichen escapen? Probiere das HTML-Entities-Tool.
Über Mojibake-Fixer
Dieser Mojibake-Fixer repariert verstümmelten Text, der durch eine Kodierungs-Diskrepanz entsteht – die Art, die aus "Café" "Café", aus "don't" "don’t" und aus "😀" "😀" macht. Der übliche Übeltäter sind UTF-8-Bytes, die fälschlicherweise als Windows-1252 oder Latin-1 dekodiert wurden, sodass Akzentbuchstaben, typografische Anführungszeichen, Gedankenstriche und Emojis als Müllzeichen herauskommen. Der Fixer kehrt das um: Er bildet jedes verstümmelte Zeichen auf sein ursprüngliches Byte zurück und dekodiert das Ergebnis erneut als UTF-8. Da mehr als eine Diskrepanz möglich ist, bietet er mehrere Interpretationen (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1 und einen doppelten Dekodierungsdurchlauf) und hebt die sauberste hervor, während er dich eine andere wählen lässt. Füge Text links ein und lies die Reparatur rechts. Alles läuft in deinem Browser, sodass der eingefügte Text auf deinem Gerät bleibt.
Funktionen
- Repariert die häufigsten Mojibake: UTF-8-Bytes, die als Windows-1252 oder Latin-1 dekodiert wurden
- Behebt Akzentbuchstaben, typografische Anführungszeichen, Gedankenstriche, das Euro-Zeichen und kaputte Emojis
- Bietet mehrere Kandidaten-Interpretationen und markiert die sauberste Reparatur als Beste
- Enthält einen doppelten Dekodierungsdurchlauf für Text, der zweimal falsch dekodiert wurde
- Markiert, ob die Eingabe tatsächlich wie Mojibake aussieht, bevor du einer Reparatur vertraust
- Live-Ein- und -Ausgabe – füge links ein, lies den reparierten Text rechts
- Kopiere den reparierten Text mit einem Klick oder lade ein bekannt verstümmeltes Beispiel zum Ausprobieren
- Läuft vollständig in deinem Browser; der eingefügte Text wird auf deinem Gerät verarbeitet
So verwendest du Mojibake-Fixer
- Füge den verstümmelten Text in das Eingabefeld auf der linken Seite ein.
- Lies die beste Reparatur im Ausgabe-Panel "Behoben" auf der rechten Seite.
- Durchsuche die Liste der Interpretationen und wähle einen anderen Kandidaten, wenn er sich sauberer liest.
- Klicke auf Kopieren, um den reparierten Text zu übernehmen.
Beispiel
Eingabe
Café — don’t panic
Ausgabe
Café — don’t panic
UTF-8-Text, der fälschlicherweise als Windows-1252 dekodiert wurde, zu sauberen Zeichen repariert.
Häufige Fehler & Fehlerbehebung
- Die Reparatur macht sauberen Akzenttext zu neuem Müll wie "Cé". — Dein Text war wahrscheinlich bereits korrektes UTF-8. Wähle den Kandidaten Original oder führe den Fixer nur auf Eingaben aus, die tatsächlich verstümmelt aussehen.
- Einige Zeichen sehen nach einem Durchlauf noch kaputt aus. — Der Text könnte zweimal falsch dekodiert worden sein. Wähle die doppelte Dekodierungs-Interpretation, die die Reparatur ein zweites Mal anwendet.
- Ein paar Zeichen werden als schwarzes Rauten-Fragezeichen (�) angezeigt. — Diese Bytes gingen verloren oder wurden ersetzt, bevor du sie eingefügt hast, und können nicht wiederhergestellt werden. Exportiere den Text erneut aus der ursprünglichen Quelle als UTF-8.
- Geschwungene Anführungszeichen und Gedankenstriche sind behoben, aber ein seltsames Symbol bleibt. — Probiere die Latin-1-Interpretation statt Windows-1252; die beiden unterscheiden sich nur bei einer Handvoll Interpunktions- und Symbol-Bytes.
Häufig gestellte Fragen
- Was verursacht Mojibake?
- Mojibake entsteht, wenn Text, der in einer Zeichenkodierung gespeichert wurde, in einer anderen gelesen wird. Der klassische Fall sind UTF-8-Bytes, die als Windows-1252 oder Latin-1 dekodiert werden, sodass Mehrbyte-Zeichen wie Akzente, typografische Anführungszeichen und Emojis in mehrere falsche Einzelbyte-Glyphen zerfallen.
- Warum wird Café als Café angezeigt?
- In UTF-8 ist das é zwei Bytes (0xC3 0xA9). Wenn diese Bytes als Windows-1252 gelesen werden, wird 0xC3 zu à und 0xA9 zu ©, sodass aus "Café" "Café" wird. Der Fixer bildet diese Zeichen auf Bytes zurück und dekodiert sie als UTF-8, um das é wiederherzustellen.
- Warum wird ein Apostroph zu ’?
- Ein geschwungener Apostroph (’, U+2019) sind drei UTF-8-Bytes. Als Windows-1252 dekodiert werden sie zu â, € und ™, weshalb "don't" als "don’t" erscheint. Das erneute Dekodieren dieser drei Zeichen als UTF-8 baut das ursprüngliche ’ wieder auf.
- Was ist der Unterschied zwischen den Windows-1252- und Latin-1-Reparaturen?
- Windows-1252 und Latin-1 (ISO-8859-1) sind fast identisch, unterscheiden sich aber im Bereich 0x80–0x9F, wo Windows-1252 typografische Anführungszeichen, Gedankenstriche und das Euro-Zeichen enthält. Probiere zuerst die Windows-1252-Reparatur; wechsle zu Latin-1, wenn ein Interpunktions- oder Symbolzeichen noch falsch ist.
- Kann Mojibake immer repariert werden?
- Oft, aber nicht immer. Wenn die ursprünglichen Bytes durch einen generischen Platzhalter (das Ersatzzeichen �) ersetzt wurden, bevor du den Text kopiert hast, ist die Information weg und kein Fixer kann sie wiederherstellen. Die Reparatur funktioniert nur, solange die verstümmelten, aber umkehrbaren Bytes intakt sind.
- Wird der eingefügte Text irgendwohin hochgeladen?
- Nein. Die Mojibake-Reparatur läuft vollständig in deinem Browser, sodass der eingefügte Text lokal auf deinem Gerät verarbeitet und nicht an einen Server gesendet wird.
Verwandte Tools
Alle ArrayKit-Tools