Correcteur de mojibake / d’encodage
Réparez le texte illisible (mojibake) comme Café ou don’t pour retrouver Café et don’t, directement dans votre navigateur.
Votre texte est réparé localement dans votre navigateur et n’est jamais téléversé, mais évitez de coller des données personnelles sensibles dans tout outil en ligne.
Besoin d’échapper les caractères spéciaux HTML ? Essayez l’outil Entités HTML.
À propos de Correcteur de mojibake
Ce correcteur de mojibake répare le texte illisible causé par une incohérence d’encodage — le genre qui transforme « Café » en « Café », « don't » en « don’t » et « 😀 » en « 😀 ». Le coupable habituel est des octets UTF-8 décodés à tort comme Windows-1252 ou Latin-1, si bien que les lettres accentuées, les guillemets typographiques, les tirets et les emoji ressortent en caractères parasites. Le correcteur inverse cela : il remappe chaque caractère illisible vers son octet d’origine et redécode le résultat en UTF-8. Comme plus d’une incohérence est possible, il propose plusieurs interprétations (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1 et une passe à double décodage) et met en avant la plus propre, tout en vous laissant en choisir une autre. Collez le texte à gauche et lisez la réparation à droite. Tout s’exécute dans votre navigateur, le texte que vous collez reste sur votre appareil.
Fonctionnalités
- Répare le mojibake le plus courant : des octets UTF-8 décodés comme Windows-1252 ou Latin-1
- Corrige les lettres accentuées, les guillemets typographiques, les tirets, le signe euro et les emoji cassés
- Propose plusieurs interprétations candidates et signale la réparation la plus propre comme Meilleure
- Inclut une passe à double décodage pour le texte mal décodé deux fois
- Indique si la saisie ressemble réellement à du mojibake avant que vous ne fassiez confiance à une correction
- Saisie et sortie en direct — collez à gauche, lisez le texte réparé à droite
- Copiez le texte corrigé en un clic, ou chargez un exemple connu pour le tester
- S’exécute entièrement dans votre navigateur ; le texte que vous collez est traité sur votre appareil
Comment utiliser Correcteur de mojibake
- Collez le texte illisible dans la zone de saisie à gauche.
- Lisez la meilleure réparation dans le panneau de sortie Corrigé à droite.
- Parcourez la liste des interprétations et choisissez un autre candidat s’il se lit mieux.
- Cliquez sur Copier pour récupérer le texte réparé.
Exemple
Entrée
Café — don’t panic
Sortie
Café — don’t panic
Texte UTF-8 décodé à tort comme Windows-1252, réparé pour retrouver des caractères propres.
Erreurs courantes et dépannage
- La correction transforme un texte accentué propre en nouveaux parasites comme « Cé ». — Votre texte était probablement déjà du UTF-8 correct. Choisissez le candidat Original, ou n’exécutez le correcteur que sur une saisie qui semble réellement illisible.
- Certains caractères restent cassés après une passe. — Le texte a peut-être été mal décodé deux fois. Choisissez l’interprétation à double décodage, qui applique la réparation une seconde fois.
- Quelques caractères s’affichent en losange noir avec point d’interrogation (�). — Ces octets ont été perdus ou remplacés avant que vous ne les colliez et ne peuvent pas être récupérés. Réexportez le texte depuis la source d’origine en UTF-8.
- Les guillemets courbes et les tirets sont corrigés mais un symbole bizarre subsiste. — Essayez l’interprétation Latin-1 plutôt que Windows-1252 ; les deux ne diffèrent que pour une poignée d’octets de ponctuation et de symboles.
Foire aux questions
- Qu’est-ce qui cause le mojibake ?
- Le mojibake survient lorsqu’un texte enregistré dans un encodage de caractères est lu dans un autre. Le cas classique est des octets UTF-8 décodés comme Windows-1252 ou Latin-1, si bien que des caractères multi-octets comme les accents, les guillemets typographiques et les emoji se fractionnent en plusieurs glyphes mono-octet erronés.
- Pourquoi Café s’affiche-t-il comme Café ?
- En UTF-8, le é fait deux octets (0xC3 0xA9). Quand ces octets sont lus comme Windows-1252, 0xC3 devient à et 0xA9 devient ©, si bien que « Café » se transforme en « Café ». Le correcteur remappe ces caractères vers des octets et les décode en UTF-8 pour restaurer le é.
- Pourquoi une apostrophe se transforme-t-elle en ’ ?
- Une apostrophe courbe (’, U+2019) fait trois octets UTF-8. Décodés comme Windows-1252, ils deviennent â, € et ™, ce qui explique pourquoi « don't » apparaît comme « don’t ». Redécoder ces trois caractères en UTF-8 reconstruit le ’ d’origine.
- Quelle est la différence entre les corrections Windows-1252 et Latin-1 ?
- Windows-1252 et Latin-1 (ISO-8859-1) sont presque identiques mais diffèrent dans la plage 0x80–0x9F, où Windows-1252 héberge les guillemets typographiques, les tirets et le signe euro. Essayez d’abord la correction Windows-1252 ; passez à Latin-1 si un caractère de ponctuation ou de symbole reste erroné.
- Le mojibake peut-il toujours être réparé ?
- Souvent, mais pas toujours. Si les octets d’origine ont été remplacés par un caractère de remplacement générique (le caractère �) avant que vous ne copiiez le texte, l’information est perdue et aucun correcteur ne peut la récupérer. La réparation ne fonctionne que tant que les octets illisibles mais réversibles sont intacts.
- Le texte que je colle est-il téléversé quelque part ?
- Non. La réparation du mojibake s’exécute entièrement dans votre navigateur, le texte que vous collez est traité localement sur votre appareil et n’est pas envoyé à un serveur.
Outils associés
Tous les outils ArrayKit