Nettoyeur de texte IA
Collez du texte pour détecter et supprimer les caractères invisibles et les artefacts typographiques laissés par les modèles d’IA et le copier-coller. Tout s’exécute dans votre navigateur.
Votre texte est inspecté et nettoyé localement dans votre navigateur et n’est jamais téléversé, mais évitez de coller du contenu confidentiel dans un outil en ligne.
Vous voyez des accents illisibles comme Café ? Essayez le Réparateur de Mojibake.
À propos de Nettoyeur de texte IA
Ce Nettoyeur de texte IA est un inspecteur et assainisseur simple pour le texte qui contient des caractères que vous ne pouvez pas voir. Collez ce qu’un modèle de langage a généré, ou du contenu copié depuis un document, un PDF ou une page web, et il compte et supprime les caractères de mise en forme cachés qui s’y glissent : les espaces et jointures de largeur nulle, les espaces insécables étroits et normaux, les traits d’union conditionnels, les contrôles bidirectionnels, les opérateurs mathématiques invisibles et les sélecteurs de variante d’emoji. Des options facultatives redressent les guillemets courbes, transforment les tirets cadratins et demi-cadratins en simples traits d’union, réduisent les suites d’espaces et appliquent la normalisation Unicode NFC. Vous obtenez un récapitulatif des suppressions par type ainsi que les décomptes de caractères et d’octets UTF-8 avant et après, puis vous copiez ou téléchargez le résultat nettoyé. Toute la vérification s’exécute dans votre navigateur, de sorte que le texte que vous collez reste sur votre appareil.
Fonctionnalités
- Détecte et compte chaque caractère caché par type, y compris l’espace de largeur nulle, la jointure et l’anti-jointure
- Supprime les espaces insécables et insécables étroits, les traits d’union conditionnels et la marque d’ordre des octets
- Retire les contrôles bidirectionnels (LRM, RLM, LRO/RLO, isolats) qui peuvent réordonner ou usurper le texte
- Efface les opérateurs mathématiques invisibles (U+2061–U+2064) et les sélecteurs de variante d’emoji (U+FE00–U+FE0F)
- Facultatif : redresse les guillemets courbes et convertit les tirets cadratins/demi-cadratins en simple trait d’union
- Facultatif : réduit les suites d’espaces et applique la normalisation Unicode NFC
- Affiche un récapitulatif des suppressions par type avec les décomptes de caractères et d’octets UTF-8 avant et après
- Copiez le texte nettoyé ou téléchargez-le sous cleaned.txt en un clic
Comment utiliser Nettoyeur de texte IA
- Collez ou saisissez votre texte dans la zone de saisie à gauche.
- Lisez la bannière et la liste des suppressions par type pour voir quels caractères cachés ont été trouvés.
- Activez les options typographiques souhaitées, comme le redressement des guillemets ou la réduction des espaces.
- Vérifiez les décomptes de caractères et d’octets avant et après pour confirmer ce qui a changé.
- Copiez le texte nettoyé ou téléchargez-le sous cleaned.txt.
Exemple
Entrée
The model said “this is clean”—or is it?
Sortie
The model said "this is clean"-or is it?
Un espace de largeur nulle est supprimé ; avec les options de guillemets et de tiret activées, les guillemets courbes deviennent droits et le tiret cadratin devient un trait d’union.
Erreurs courantes et dépannage
- Le texte nettoyé semble identique à l’entrée, mais les décomptes ont pourtant changé. — Les caractères supprimés étaient invisibles à l’écran. Consultez la liste des suppressions par type et la différence de décompte de caractères pour voir exactement ce qui a été retiré.
- Un espace insécable entre deux mots est devenu un espace normal ou a disparu. — Les espaces insécables et insécables étroits sont supprimés en tant que caractères cachés. Si vous avez besoin d’un vrai espace à cet endroit, l’option de réduction des espaces conserve les espaces simples intacts.
- Des lettres accentuées ont changé de longueur alors qu’elles paraissent identiques. — C’est la normalisation Unicode NFC qui combine une lettre de base et un signe combinatoire en un seul point de code. Désactivez l’option Normaliser (NFC) si vous voulez conserver la forme d’origine.
- Un emoji a perdu sa couleur ou son style après le nettoyage. — Les sélecteurs de variante (U+FE00–U+FE0F) qui forcent une présentation texte ou emoji sont retirés. Réinsérez l’emoji depuis votre clavier si vous avez besoin d’un style précis.
Foire aux questions
- Qu’est-ce qu’un espace de largeur nulle ?
- Un espace de largeur nulle (U+200B) est un caractère Unicode sans largeur visible. Il peut créer des coupures de mots invisibles, fausser les recherches par correspondance exacte et modifier les décomptes d’octets alors que rien n’apparaît à l’écran. Cet outil le supprime avec les jointures de largeur nulle et les espaces insécables associés.
- Pourquoi le texte généré par IA contient-il parfois des caractères cachés ?
- Les modèles sont entraînés sur du texte web et documentaire qui inclut déjà des espaces insécables, des guillemets typographiques, des traits d’union conditionnels et d’autres mises en forme, et les tokeniseurs peuvent les reproduire. Le copier-coller depuis des éditeurs enrichis, des PDF et des applications de discussion en ajoute davantage. Le résultat est un texte qui semble propre mais qui contient des caractères que vous ne pouvez pas voir.
- Quels caractères le Nettoyeur de texte IA supprime-t-il ?
- Il supprime l’espace de largeur nulle, la jointure, l’anti-jointure et la jointure de mots, la marque d’ordre des octets, les espaces insécables et insécables étroits, les traits d’union conditionnels, les contrôles bidirectionnels, les opérateurs mathématiques invisibles (U+2061–U+2064) et les sélecteurs de variante d’emoji (U+FE00–U+FE0F). Les changements de guillemets, de tirets, d’espaces et de NFC sont des options facultatives.
- Que sont les caractères de contrôle bidirectionnels et pourquoi les supprimer ?
- Les contrôles bidi comme le forçage droite-à-gauche réordonnent l’affichage du texte. Ils sont légitimes pour du contenu à écritures mixtes, mais peuvent aussi servir à déguiser des noms de fichiers ou du code ; cet outil les signale et les retire pour que ce que vous voyez corresponde aux caractères sous-jacents.
- Cet outil modifie-t-il mes mots visibles ou réécrit-il le texte ?
- Non. C’est un inspecteur et un assainisseur : par défaut, il supprime uniquement les caractères que vous ne pouvez pas voir et signale ce qu’il a retiré. Il ne paraphrase, n’ajoute ni ne réécrit jamais vos mots, et les options typographiques ne s’appliquent que lorsque vous les activez.
- Mon texte est-il téléversé quelque part lorsque je nettoie les caractères invisibles ?
- Non. La détection et le nettoyage s’exécutent entièrement dans votre navigateur, de sorte que le texte que vous collez est traité sur votre appareil et n’est pas envoyé à un serveur.
Outils associés
Tous les outils ArrayKit