Reparador de Mojibake / Codificación

Arregla el texto corrupto por mojibake como Café o don’t y devuélvelo a Café y don’t, directamente en tu navegador.

Tu texto se repara localmente en tu navegador y nunca se sube, pero evita pegar datos personales sensibles en cualquier herramienta en línea.

¿Necesitas escapar caracteres especiales de HTML? Prueba la herramienta de Entidades HTML.

Acerca de Reparador de Mojibake

Este reparador de mojibake repara el texto corrupto causado por un desajuste de codificación, el tipo que convierte "Café" en "Café", "don't" en "don’t" y "😀" en "😀". El culpable habitual son los bytes UTF-8 que se decodificaron por error como Windows-1252 o Latin-1, así que las letras acentuadas, las comillas tipográficas, los guiones y los emoji salen como caracteres basura. El reparador revierte eso: mapea cada carácter corrupto de vuelta a su byte original y vuelve a decodificar el resultado como UTF-8. Como es posible más de un desajuste, ofrece varias interpretaciones (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1 y una pasada de doble decodificación) y resalta la más limpia, dejándote elegir otra. Pega el texto a la izquierda y lee la reparación a la derecha. Todo se ejecuta en tu navegador, así que el texto que pegas se queda en tu dispositivo.

Características

Cómo usar Reparador de Mojibake

  1. Pega el texto corrupto en el cuadro de entrada a la izquierda.
  2. Lee la mejor reparación en el panel de salida Arreglado a la derecha.
  3. Revisa la lista de Interpretaciones y elige un candidato distinto si se lee más limpio.
  4. Haz clic en Copiar para tomar el texto reparado.

Ejemplo

Entrada

Café — don’t panic

Salida

Café — don’t panic

Texto UTF-8 decodificado por error como Windows-1252, reparado de vuelta a caracteres limpios.

Errores comunes y solución de problemas

Preguntas frecuentes

¿Qué causa el mojibake?
El mojibake ocurre cuando un texto guardado en una codificación de caracteres se lee en otra. El caso clásico es bytes UTF-8 que se decodifican como Windows-1252 o Latin-1, así que los caracteres multibyte como los acentos, las comillas tipográficas y los emoji se parten en varios glifos de un solo byte erróneos.
¿Por qué Café se muestra como Café?
En UTF-8 la é son dos bytes (0xC3 0xA9). Cuando esos bytes se leen como Windows-1252, 0xC3 se vuelve à y 0xA9 se vuelve ©, así que "Café" se convierte en "Café". El reparador mapea esos caracteres de vuelta a bytes y los decodifica como UTF-8 para restaurar la é.
¿Por qué un apóstrofo se convierte en ’?
Un apóstrofo curvo (’, U+2019) son tres bytes UTF-8. Decodificados como Windows-1252 se vuelven â, € y ™, por eso "don't" aparece como "don’t". Volver a decodificar esos tres caracteres como UTF-8 reconstruye el ’ original.
¿Cuál es la diferencia entre las reparaciones de Windows-1252 y Latin-1?
Windows-1252 y Latin-1 (ISO-8859-1) son casi idénticos pero difieren en el rango 0x80–0x9F, donde Windows-1252 alberga las comillas tipográficas, los guiones y el signo del euro. Prueba primero la reparación de Windows-1252; cambia a Latin-1 si un carácter de puntuación o símbolo aún está mal.
¿El mojibake siempre se puede reparar?
A menudo, pero no siempre. Si los bytes originales se reemplazaron por un marcador genérico (el carácter de reemplazo �) antes de que copiaras el texto, la información se perdió y ningún reparador puede recuperarla. La reparación solo funciona mientras los bytes corruptos pero reversibles estén intactos.
¿El texto que pego se sube a algún lugar?
No. La reparación de mojibake se ejecuta por completo en tu navegador, así que el texto que pegas se procesa localmente en tu dispositivo y no se envía a un servidor.

Herramientas relacionadas

Todas las herramientas de ArrayKit