Reparador de Mojibake / Codificación
Arregla el texto corrupto por mojibake como Café o don’t y devuélvelo a Café y don’t, directamente en tu navegador.
Tu texto se repara localmente en tu navegador y nunca se sube, pero evita pegar datos personales sensibles en cualquier herramienta en línea.
¿Necesitas escapar caracteres especiales de HTML? Prueba la herramienta de Entidades HTML.
Acerca de Reparador de Mojibake
Este reparador de mojibake repara el texto corrupto causado por un desajuste de codificación, el tipo que convierte "Café" en "Café", "don't" en "don’t" y "😀" en "😀". El culpable habitual son los bytes UTF-8 que se decodificaron por error como Windows-1252 o Latin-1, así que las letras acentuadas, las comillas tipográficas, los guiones y los emoji salen como caracteres basura. El reparador revierte eso: mapea cada carácter corrupto de vuelta a su byte original y vuelve a decodificar el resultado como UTF-8. Como es posible más de un desajuste, ofrece varias interpretaciones (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1 y una pasada de doble decodificación) y resalta la más limpia, dejándote elegir otra. Pega el texto a la izquierda y lee la reparación a la derecha. Todo se ejecuta en tu navegador, así que el texto que pegas se queda en tu dispositivo.
Características
- Repara el mojibake más común: bytes UTF-8 decodificados como Windows-1252 o Latin-1
- Arregla letras acentuadas, comillas tipográficas, guiones, el signo del euro y emoji rotos
- Ofrece varias interpretaciones candidatas y marca la reparación más limpia como Mejor
- Incluye una pasada de doble decodificación para texto que se decodificó mal dos veces
- Indica si la entrada realmente parece mojibake antes de que confíes en una reparación
- Entrada y salida en vivo: pega a la izquierda, lee el texto reparado a la derecha
- Copia el texto arreglado con un clic, o carga una muestra de texto corrupto conocido para probarlo
- Se ejecuta por completo en tu navegador; el texto que pegas se procesa en tu dispositivo
Cómo usar Reparador de Mojibake
- Pega el texto corrupto en el cuadro de entrada a la izquierda.
- Lee la mejor reparación en el panel de salida Arreglado a la derecha.
- Revisa la lista de Interpretaciones y elige un candidato distinto si se lee más limpio.
- Haz clic en Copiar para tomar el texto reparado.
Ejemplo
Entrada
Café — don’t panic
Salida
Café — don’t panic
Texto UTF-8 decodificado por error como Windows-1252, reparado de vuelta a caracteres limpios.
Errores comunes y solución de problemas
- La reparación convierte texto acentuado limpio en nueva basura como "Cé". — Tu texto probablemente ya era UTF-8 correcto. Elige el candidato Original, o solo ejecuta el reparador en entradas que realmente parezcan corruptas.
- Algunos caracteres siguen viéndose rotos tras una pasada. — El texto puede haberse decodificado mal dos veces. Elige la interpretación de doble decodificación, que aplica la reparación una segunda vez.
- Algunos caracteres aparecen como un rombo negro con signo de interrogación (�). — Esos bytes se perdieron o se reemplazaron antes de que los pegaras y no se pueden recuperar. Vuelve a exportar el texto desde la fuente original como UTF-8.
- Las comillas curvas y los guiones se arreglan pero queda un símbolo raro. — Prueba la interpretación Latin-1 en lugar de Windows-1252; las dos difieren solo en un puñado de bytes de puntuación y símbolos.
Preguntas frecuentes
- ¿Qué causa el mojibake?
- El mojibake ocurre cuando un texto guardado en una codificación de caracteres se lee en otra. El caso clásico es bytes UTF-8 que se decodifican como Windows-1252 o Latin-1, así que los caracteres multibyte como los acentos, las comillas tipográficas y los emoji se parten en varios glifos de un solo byte erróneos.
- ¿Por qué Café se muestra como Café?
- En UTF-8 la é son dos bytes (0xC3 0xA9). Cuando esos bytes se leen como Windows-1252, 0xC3 se vuelve à y 0xA9 se vuelve ©, así que "Café" se convierte en "Café". El reparador mapea esos caracteres de vuelta a bytes y los decodifica como UTF-8 para restaurar la é.
- ¿Por qué un apóstrofo se convierte en ’?
- Un apóstrofo curvo (’, U+2019) son tres bytes UTF-8. Decodificados como Windows-1252 se vuelven â, € y ™, por eso "don't" aparece como "don’t". Volver a decodificar esos tres caracteres como UTF-8 reconstruye el ’ original.
- ¿Cuál es la diferencia entre las reparaciones de Windows-1252 y Latin-1?
- Windows-1252 y Latin-1 (ISO-8859-1) son casi idénticos pero difieren en el rango 0x80–0x9F, donde Windows-1252 alberga las comillas tipográficas, los guiones y el signo del euro. Prueba primero la reparación de Windows-1252; cambia a Latin-1 si un carácter de puntuación o símbolo aún está mal.
- ¿El mojibake siempre se puede reparar?
- A menudo, pero no siempre. Si los bytes originales se reemplazaron por un marcador genérico (el carácter de reemplazo �) antes de que copiaras el texto, la información se perdió y ningún reparador puede recuperarla. La reparación solo funciona mientras los bytes corruptos pero reversibles estén intactos.
- ¿El texto que pego se sube a algún lugar?
- No. La reparación de mojibake se ejecuta por completo en tu navegador, así que el texto que pegas se procesa localmente en tu dispositivo y no se envía a un servidor.
Herramientas relacionadas
Todas las herramientas de ArrayKit