Nettoyeur de texte IA

Collez du texte pour détecter et supprimer les caractères invisibles et les artefacts typographiques laissés par les modèles d’IA et le copier-coller. Tout s’exécute dans votre navigateur.

Votre texte est inspecté et nettoyé localement dans votre navigateur et n’est jamais téléversé, mais évitez de coller du contenu confidentiel dans un outil en ligne.

Vous voyez des accents illisibles comme Café ? Essayez le Réparateur de Mojibake.

À propos de Nettoyeur de texte IA

Ce Nettoyeur de texte IA est un inspecteur et assainisseur simple pour le texte qui contient des caractères que vous ne pouvez pas voir. Collez ce qu’un modèle de langage a généré, ou du contenu copié depuis un document, un PDF ou une page web, et il compte et supprime les caractères de mise en forme cachés qui s’y glissent : les espaces et jointures de largeur nulle, les espaces insécables étroits et normaux, les traits d’union conditionnels, les contrôles bidirectionnels, les opérateurs mathématiques invisibles et les sélecteurs de variante d’emoji. Des options facultatives redressent les guillemets courbes, transforment les tirets cadratins et demi-cadratins en simples traits d’union, réduisent les suites d’espaces et appliquent la normalisation Unicode NFC. Vous obtenez un récapitulatif des suppressions par type ainsi que les décomptes de caractères et d’octets UTF-8 avant et après, puis vous copiez ou téléchargez le résultat nettoyé. Toute la vérification s’exécute dans votre navigateur, de sorte que le texte que vous collez reste sur votre appareil.

Fonctionnalités

Comment utiliser Nettoyeur de texte IA

  1. Collez ou saisissez votre texte dans la zone de saisie à gauche.
  2. Lisez la bannière et la liste des suppressions par type pour voir quels caractères cachés ont été trouvés.
  3. Activez les options typographiques souhaitées, comme le redressement des guillemets ou la réduction des espaces.
  4. Vérifiez les décomptes de caractères et d’octets avant et après pour confirmer ce qui a changé.
  5. Copiez le texte nettoyé ou téléchargez-le sous cleaned.txt.

Exemple

Entrée

The​ model said “this is clean”—or is it?

Sortie

The model said "this is clean"-or is it?

Un espace de largeur nulle est supprimé ; avec les options de guillemets et de tiret activées, les guillemets courbes deviennent droits et le tiret cadratin devient un trait d’union.

Erreurs courantes et dépannage

Foire aux questions

Qu’est-ce qu’un espace de largeur nulle ?
Un espace de largeur nulle (U+200B) est un caractère Unicode sans largeur visible. Il peut créer des coupures de mots invisibles, fausser les recherches par correspondance exacte et modifier les décomptes d’octets alors que rien n’apparaît à l’écran. Cet outil le supprime avec les jointures de largeur nulle et les espaces insécables associés.
Pourquoi le texte généré par IA contient-il parfois des caractères cachés ?
Les modèles sont entraînés sur du texte web et documentaire qui inclut déjà des espaces insécables, des guillemets typographiques, des traits d’union conditionnels et d’autres mises en forme, et les tokeniseurs peuvent les reproduire. Le copier-coller depuis des éditeurs enrichis, des PDF et des applications de discussion en ajoute davantage. Le résultat est un texte qui semble propre mais qui contient des caractères que vous ne pouvez pas voir.
Quels caractères le Nettoyeur de texte IA supprime-t-il ?
Il supprime l’espace de largeur nulle, la jointure, l’anti-jointure et la jointure de mots, la marque d’ordre des octets, les espaces insécables et insécables étroits, les traits d’union conditionnels, les contrôles bidirectionnels, les opérateurs mathématiques invisibles (U+2061–U+2064) et les sélecteurs de variante d’emoji (U+FE00–U+FE0F). Les changements de guillemets, de tirets, d’espaces et de NFC sont des options facultatives.
Que sont les caractères de contrôle bidirectionnels et pourquoi les supprimer ?
Les contrôles bidi comme le forçage droite-à-gauche réordonnent l’affichage du texte. Ils sont légitimes pour du contenu à écritures mixtes, mais peuvent aussi servir à déguiser des noms de fichiers ou du code ; cet outil les signale et les retire pour que ce que vous voyez corresponde aux caractères sous-jacents.
Cet outil modifie-t-il mes mots visibles ou réécrit-il le texte ?
Non. C’est un inspecteur et un assainisseur : par défaut, il supprime uniquement les caractères que vous ne pouvez pas voir et signale ce qu’il a retiré. Il ne paraphrase, n’ajoute ni ne réécrit jamais vos mots, et les options typographiques ne s’appliquent que lorsque vous les activez.
Mon texte est-il téléversé quelque part lorsque je nettoie les caractères invisibles ?
Non. La détection et le nettoyage s’exécutent entièrement dans votre navigateur, de sorte que le texte que vous collez est traité sur votre appareil et n’est pas envoyé à un serveur.

Outils associés

Tous les outils ArrayKit