Corretor de Mojibake / Codificação

Corrija texto mojibake corrompido como Café ou don’t de volta para Café e don’t, direto no seu navegador.

Seu texto é reparado localmente no seu navegador e nunca é enviado, mas evite colar dados pessoais sensíveis em qualquer ferramenta online.

Precisa escapar caracteres especiais de HTML? Experimente a ferramenta de Entidades HTML.

Sobre Corretor de Mojibake

Este corretor de mojibake repara texto corrompido causado por uma incompatibilidade de codificação — do tipo que transforma "Café" em "Café", "don't" em "don’t" e "😀" em "😀". O culpado de sempre são bytes UTF-8 que foram decodificados erroneamente como Windows-1252 ou Latin-1, então letras acentuadas, aspas inteligentes, travessões e emoji saem como caracteres inúteis. O corretor reverte isso: ele mapeia cada caractere corrompido de volta ao seu byte original e decodifica o resultado novamente como UTF-8. Como mais de uma incompatibilidade é possível, ele oferece várias interpretações (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1 e uma passagem de dupla decodificação) e destaca a mais limpa, permitindo que você escolha outra. Cole o texto à esquerda e leia o reparo à direita. Tudo roda no seu navegador, então o texto que você cola fica no seu dispositivo.

Recursos

Como usar Corretor de Mojibake

  1. Cole o texto corrompido na caixa de entrada à esquerda.
  2. Leia o melhor reparo no painel de saída Corrigido à direita.
  3. Examine a lista de Interpretações e escolha um candidato diferente se ele ler de forma mais limpa.
  4. Clique em Copiar para pegar o texto reparado.

Exemplo

Entrada

Café — don’t panic

Saída

Café — don’t panic

Texto UTF-8 decodificado erroneamente como Windows-1252, reparado de volta para caracteres limpos.

Erros comuns e solução de problemas

Perguntas frequentes

O que causa o mojibake?
O mojibake acontece quando um texto salvo em uma codificação de caracteres é lido em outra. O caso clássico são bytes UTF-8 sendo decodificados como Windows-1252 ou Latin-1, então caracteres de múltiplos bytes como acentos, aspas inteligentes e emoji se dividem em vários glifos errados de um único byte.
Por que Café aparece como Café?
Em UTF-8 o é são dois bytes (0xC3 0xA9). Quando esses bytes são lidos como Windows-1252, 0xC3 vira à e 0xA9 vira ©, então "Café" se transforma em "Café". O corretor mapeia esses caracteres de volta para bytes e os decodifica como UTF-8 para restaurar o é.
Por que um apóstrofo vira ’?
Um apóstrofo curvo (’, U+2019) são três bytes UTF-8. Decodificados como Windows-1252 eles viram â, € e ™, e é por isso que "don't" aparece como "don’t". Decodificar esses três caracteres novamente como UTF-8 reconstrói o ’ original.
Qual é a diferença entre os reparos Windows-1252 e Latin-1?
Windows-1252 e Latin-1 (ISO-8859-1) são quase idênticos, mas diferem na faixa 0x80–0x9F, onde o Windows-1252 contém aspas inteligentes, travessões e o símbolo do euro. Experimente o reparo Windows-1252 primeiro; mude para Latin-1 se um caractere de pontuação ou símbolo ainda estiver errado.
O mojibake pode sempre ser reparado?
Frequentemente, mas nem sempre. Se os bytes originais foram substituídos por um marcador genérico (o caractere de substituição �) antes de você copiar o texto, a informação se foi e nenhum corretor pode recuperá-la. O reparo só funciona enquanto os bytes corrompidos, mas reversíveis, estão intactos.
O texto que eu colo é enviado para algum lugar?
Não. O reparo de mojibake roda inteiramente no seu navegador, então o texto que você cola é processado localmente no seu dispositivo e não é enviado para um servidor.

Ferramentas relacionadas

Todas as ferramentas de ArrayKit