Mojibake- / Kodierungs-Fixer

Repariere verstümmelten Mojibake-Text wie Café oder don’t zurück zu Café und don’t, direkt in deinem Browser.

Dein Text wird lokal in deinem Browser repariert und nie hochgeladen, aber vermeide es, sensible persönliche Daten in irgendein Online-Tool einzufügen.

Musst du HTML-Sonderzeichen escapen? Probiere das HTML-Entities-Tool.

Über Mojibake-Fixer

Dieser Mojibake-Fixer repariert verstümmelten Text, der durch eine Kodierungs-Diskrepanz entsteht – die Art, die aus "Café" "Café", aus "don't" "don’t" und aus "😀" "😀" macht. Der übliche Übeltäter sind UTF-8-Bytes, die fälschlicherweise als Windows-1252 oder Latin-1 dekodiert wurden, sodass Akzentbuchstaben, typografische Anführungszeichen, Gedankenstriche und Emojis als Müllzeichen herauskommen. Der Fixer kehrt das um: Er bildet jedes verstümmelte Zeichen auf sein ursprüngliches Byte zurück und dekodiert das Ergebnis erneut als UTF-8. Da mehr als eine Diskrepanz möglich ist, bietet er mehrere Interpretationen (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1 und einen doppelten Dekodierungsdurchlauf) und hebt die sauberste hervor, während er dich eine andere wählen lässt. Füge Text links ein und lies die Reparatur rechts. Alles läuft in deinem Browser, sodass der eingefügte Text auf deinem Gerät bleibt.

Funktionen

So verwendest du Mojibake-Fixer

  1. Füge den verstümmelten Text in das Eingabefeld auf der linken Seite ein.
  2. Lies die beste Reparatur im Ausgabe-Panel "Behoben" auf der rechten Seite.
  3. Durchsuche die Liste der Interpretationen und wähle einen anderen Kandidaten, wenn er sich sauberer liest.
  4. Klicke auf Kopieren, um den reparierten Text zu übernehmen.

Beispiel

Eingabe

Café — don’t panic

Ausgabe

Café — don’t panic

UTF-8-Text, der fälschlicherweise als Windows-1252 dekodiert wurde, zu sauberen Zeichen repariert.

Häufige Fehler & Fehlerbehebung

Häufig gestellte Fragen

Was verursacht Mojibake?
Mojibake entsteht, wenn Text, der in einer Zeichenkodierung gespeichert wurde, in einer anderen gelesen wird. Der klassische Fall sind UTF-8-Bytes, die als Windows-1252 oder Latin-1 dekodiert werden, sodass Mehrbyte-Zeichen wie Akzente, typografische Anführungszeichen und Emojis in mehrere falsche Einzelbyte-Glyphen zerfallen.
Warum wird Café als Café angezeigt?
In UTF-8 ist das é zwei Bytes (0xC3 0xA9). Wenn diese Bytes als Windows-1252 gelesen werden, wird 0xC3 zu à und 0xA9 zu ©, sodass aus "Café" "Café" wird. Der Fixer bildet diese Zeichen auf Bytes zurück und dekodiert sie als UTF-8, um das é wiederherzustellen.
Warum wird ein Apostroph zu ’?
Ein geschwungener Apostroph (’, U+2019) sind drei UTF-8-Bytes. Als Windows-1252 dekodiert werden sie zu â, € und ™, weshalb "don't" als "don’t" erscheint. Das erneute Dekodieren dieser drei Zeichen als UTF-8 baut das ursprüngliche ’ wieder auf.
Was ist der Unterschied zwischen den Windows-1252- und Latin-1-Reparaturen?
Windows-1252 und Latin-1 (ISO-8859-1) sind fast identisch, unterscheiden sich aber im Bereich 0x80–0x9F, wo Windows-1252 typografische Anführungszeichen, Gedankenstriche und das Euro-Zeichen enthält. Probiere zuerst die Windows-1252-Reparatur; wechsle zu Latin-1, wenn ein Interpunktions- oder Symbolzeichen noch falsch ist.
Kann Mojibake immer repariert werden?
Oft, aber nicht immer. Wenn die ursprünglichen Bytes durch einen generischen Platzhalter (das Ersatzzeichen �) ersetzt wurden, bevor du den Text kopiert hast, ist die Information weg und kein Fixer kann sie wiederherstellen. Die Reparatur funktioniert nur, solange die verstümmelten, aber umkehrbaren Bytes intakt sind.
Wird der eingefügte Text irgendwohin hochgeladen?
Nein. Die Mojibake-Reparatur läuft vollständig in deinem Browser, sodass der eingefügte Text lokal auf deinem Gerät verarbeitet und nicht an einen Server gesendet wird.

Verwandte Tools

Alle ArrayKit-Tools