Correcteur de mojibake / d’encodage

Réparez le texte illisible (mojibake) comme Café ou don’t pour retrouver Café et don’t, directement dans votre navigateur.

Votre texte est réparé localement dans votre navigateur et n’est jamais téléversé, mais évitez de coller des données personnelles sensibles dans tout outil en ligne.

Besoin d’échapper les caractères spéciaux HTML ? Essayez l’outil Entités HTML.

À propos de Correcteur de mojibake

Ce correcteur de mojibake répare le texte illisible causé par une incohérence d’encodage — le genre qui transforme « Café » en « Café », « don't » en « don’t » et « 😀 » en « 😀 ». Le coupable habituel est des octets UTF-8 décodés à tort comme Windows-1252 ou Latin-1, si bien que les lettres accentuées, les guillemets typographiques, les tirets et les emoji ressortent en caractères parasites. Le correcteur inverse cela : il remappe chaque caractère illisible vers son octet d’origine et redécode le résultat en UTF-8. Comme plus d’une incohérence est possible, il propose plusieurs interprétations (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1 et une passe à double décodage) et met en avant la plus propre, tout en vous laissant en choisir une autre. Collez le texte à gauche et lisez la réparation à droite. Tout s’exécute dans votre navigateur, le texte que vous collez reste sur votre appareil.

Fonctionnalités

Comment utiliser Correcteur de mojibake

  1. Collez le texte illisible dans la zone de saisie à gauche.
  2. Lisez la meilleure réparation dans le panneau de sortie Corrigé à droite.
  3. Parcourez la liste des interprétations et choisissez un autre candidat s’il se lit mieux.
  4. Cliquez sur Copier pour récupérer le texte réparé.

Exemple

Entrée

Café — don’t panic

Sortie

Café — don’t panic

Texte UTF-8 décodé à tort comme Windows-1252, réparé pour retrouver des caractères propres.

Erreurs courantes et dépannage

Foire aux questions

Qu’est-ce qui cause le mojibake ?
Le mojibake survient lorsqu’un texte enregistré dans un encodage de caractères est lu dans un autre. Le cas classique est des octets UTF-8 décodés comme Windows-1252 ou Latin-1, si bien que des caractères multi-octets comme les accents, les guillemets typographiques et les emoji se fractionnent en plusieurs glyphes mono-octet erronés.
Pourquoi Café s’affiche-t-il comme Café ?
En UTF-8, le é fait deux octets (0xC3 0xA9). Quand ces octets sont lus comme Windows-1252, 0xC3 devient à et 0xA9 devient ©, si bien que « Café » se transforme en « Café ». Le correcteur remappe ces caractères vers des octets et les décode en UTF-8 pour restaurer le é.
Pourquoi une apostrophe se transforme-t-elle en ’ ?
Une apostrophe courbe (’, U+2019) fait trois octets UTF-8. Décodés comme Windows-1252, ils deviennent â, € et ™, ce qui explique pourquoi « don't » apparaît comme « don’t ». Redécoder ces trois caractères en UTF-8 reconstruit le ’ d’origine.
Quelle est la différence entre les corrections Windows-1252 et Latin-1 ?
Windows-1252 et Latin-1 (ISO-8859-1) sont presque identiques mais diffèrent dans la plage 0x80–0x9F, où Windows-1252 héberge les guillemets typographiques, les tirets et le signe euro. Essayez d’abord la correction Windows-1252 ; passez à Latin-1 si un caractère de ponctuation ou de symbole reste erroné.
Le mojibake peut-il toujours être réparé ?
Souvent, mais pas toujours. Si les octets d’origine ont été remplacés par un caractère de remplacement générique (le caractère �) avant que vous ne copiiez le texte, l’information est perdue et aucun correcteur ne peut la récupérer. La réparation ne fonctionne que tant que les octets illisibles mais réversibles sont intacts.
Le texte que je colle est-il téléversé quelque part ?
Non. La réparation du mojibake s’exécute entièrement dans votre navigateur, le texte que vous collez est traité localement sur votre appareil et n’est pas envoyé à un serveur.

Outils associés

Tous les outils ArrayKit