Limpiador de texto de IA
Pega texto para detectar y eliminar caracteres invisibles y artefactos tipográficos que dejan los modelos de IA y el copiar y pegar. Todo se ejecuta en tu navegador.
Tu texto se inspecciona y se limpia localmente en tu navegador y nunca se sube, pero evita pegar contenido confidencial en cualquier herramienta en línea.
¿Ves acentos corruptos como Café? Prueba el Corrector de Mojibake.
Acerca de Limpiador de texto de IA
Este Limpiador de texto de IA es un inspector y sanitizador sencillo para textos que arrastran caracteres que no puedes ver. Pega cualquier cosa generada por un modelo de lenguaje, o contenido que copiaste de un documento, un PDF o una página web, y la herramienta cuenta y elimina los caracteres de formato ocultos que se cuelan: espacios y uniones de ancho cero, los espacios de no separación estrechos y normales, guiones suaves, controles bidireccionales, operadores matemáticos invisibles y selectores de variación de emoji. Interruptores opcionales enderezan las comillas tipográficas, convierten las rayas largas y cortas en guiones simples, colapsan secuencias de espacios y aplican la normalización NFC de Unicode. Obtienes un resumen de lo eliminado por tipo, además del recuento de caracteres y de bytes UTF-8 antes y después, y luego copias o descargas el resultado limpio. Toda la comprobación se ejecuta en tu navegador, así que el texto que pegas se queda en tu dispositivo.
Características
- Detecta y cuenta cada carácter oculto por tipo, incluidos zero-width space, unión y no unión de ancho cero
- Elimina espacios de no separación normales y estrechos, guiones suaves y la marca de orden de bytes (BOM)
- Quita controles bidireccionales (LRM, RLM, LRO/RLO, aislantes) que pueden reordenar o falsear el texto
- Borra operadores matemáticos invisibles (U+2061–U+2064) y selectores de variación de emoji (U+FE00–U+FE0F)
- Opcional: enderezar las comillas tipográficas y convertir las rayas larga y corta en un guion simple
- Opcional: colapsar secuencias de espacios y aplicar la normalización NFC de Unicode
- Muestra un resumen de lo eliminado por tipo con el recuento de caracteres y de bytes UTF-8 antes y después
- Copia el texto limpio o descárgalo como cleaned.txt con un clic
Cómo usar Limpiador de texto de IA
- Pega o escribe tu texto en el cuadro de entrada de la izquierda.
- Lee el aviso y la lista de eliminados por tipo para ver qué caracteres ocultos se encontraron.
- Activa las opciones tipográficas que quieras, como enderezar comillas o colapsar espacios.
- Comprueba el recuento de caracteres y de bytes antes y después para confirmar qué cambió.
- Copia el texto limpio o descárgalo como cleaned.txt.
Ejemplo
Entrada
The model said “this is clean”—or is it?
Salida
The model said "this is clean"-or is it?
Se elimina un zero-width space; con las opciones de comillas y guion activadas, las comillas tipográficas se vuelven rectas y la raya larga se convierte en un guion.
Errores comunes y solución de problemas
- El texto limpio se ve idéntico a la entrada, pero los recuentos igual cambiaron. — Los caracteres eliminados eran invisibles en pantalla. Revisa la lista de eliminados por tipo y la diferencia en el recuento de caracteres para ver exactamente qué salió.
- Un espacio de no separación entre palabras se convirtió en un espacio normal o desapareció. — Los espacios de no separación, normales y estrechos, se eliminan como caracteres ocultos. Si necesitas un espacio real ahí, la opción de colapsar espacios conserva intactos los espacios simples.
- Las letras acentuadas cambiaron de longitud aunque se ven igual. — Eso es la normalización NFC de Unicode combinando una letra base y una marca combinante en un solo punto de código. Desactiva la opción Normalizar (NFC) si quieres conservar la forma original.
- Un emoji perdió su color o su estilo tras la limpieza. — Los selectores de variación (U+FE00–U+FE0F) que fuerzan la presentación de texto o de emoji se eliminan. Vuelve a añadir el emoji desde tu teclado si necesitas un estilo concreto.
Preguntas frecuentes
- ¿Qué es un zero-width space?
- Un zero-width space (U+200B) es un carácter Unicode sin ancho visible. Puede crear saltos de palabra invisibles, arruinar las búsquedas por coincidencia exacta y alterar los recuentos de bytes aunque nada aparezca en pantalla. Esta herramienta lo elimina junto con las uniones de ancho cero y los espacios de no separación relacionados.
- ¿Por qué el texto generado por IA a veces contiene caracteres ocultos?
- Los modelos se entrenan con texto de la web y de documentos que ya incluye espacios de no separación, comillas tipográficas, guiones suaves y otro formato, y los tokenizadores pueden reproducirlos. Copiar y pegar desde editores enriquecidos, PDF y apps de chat añade más. El resultado es un texto que parece limpio pero arrastra caracteres que no puedes ver.
- ¿Qué caracteres elimina el Limpiador de texto de IA?
- Elimina el zero-width space, la unión, la no unión y la unión de palabras de ancho cero, la marca de orden de bytes, los espacios de no separación normales y estrechos, los guiones suaves, los controles bidireccionales, los operadores matemáticos invisibles (U+2061–U+2064) y los selectores de variación de emoji (U+FE00–U+FE0F). Los cambios de comillas, guiones, espaciado y NFC son interruptores opcionales.
- ¿Qué son los caracteres de control bidireccional y por qué eliminarlos?
- Los controles bidi, como la anulación de derecha a izquierda, reordenan la forma en que se muestra el texto. Son legítimos para contenido con varias escrituras, pero también pueden usarse para disfrazar nombres de archivo o código, así que esta herramienta los marca y los elimina para que lo que ves coincida con los caracteres subyacentes.
- ¿Esta herramienta cambia mis palabras visibles o reescribe el texto?
- No. Es un inspector y sanitizador: por defecto solo elimina caracteres que no puedes ver e informa de lo que quitó. Nunca parafrasea, añade ni reescribe tus palabras, y las opciones tipográficas solo se ejecutan cuando las activas.
- ¿Se sube mi texto a algún lugar cuando limpio los caracteres invisibles?
- No. La detección y la limpieza se ejecutan por completo en tu navegador, así que el texto que pegas se procesa en tu dispositivo y no se envía a ningún servidor.
Herramientas relacionadas
Todas las herramientas de ArrayKit