Corretor de Mojibake / Codificação
Corrija texto mojibake corrompido como Café ou don’t de volta para Café e don’t, direto no seu navegador.
Seu texto é reparado localmente no seu navegador e nunca é enviado, mas evite colar dados pessoais sensíveis em qualquer ferramenta online.
Precisa escapar caracteres especiais de HTML? Experimente a ferramenta de Entidades HTML.
Sobre Corretor de Mojibake
Este corretor de mojibake repara texto corrompido causado por uma incompatibilidade de codificação — do tipo que transforma "Café" em "Café", "don't" em "don’t" e "😀" em "😀". O culpado de sempre são bytes UTF-8 que foram decodificados erroneamente como Windows-1252 ou Latin-1, então letras acentuadas, aspas inteligentes, travessões e emoji saem como caracteres inúteis. O corretor reverte isso: ele mapeia cada caractere corrompido de volta ao seu byte original e decodifica o resultado novamente como UTF-8. Como mais de uma incompatibilidade é possível, ele oferece várias interpretações (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1 e uma passagem de dupla decodificação) e destaca a mais limpa, permitindo que você escolha outra. Cole o texto à esquerda e leia o reparo à direita. Tudo roda no seu navegador, então o texto que você cola fica no seu dispositivo.
Recursos
- Repara o mojibake mais comum: bytes UTF-8 decodificados como Windows-1252 ou Latin-1
- Corrige letras acentuadas, aspas inteligentes, travessões, o símbolo do euro e emoji quebrados
- Oferece várias interpretações candidatas e sinaliza o reparo mais limpo como o Melhor
- Inclui uma passagem de dupla decodificação para texto que foi mal decodificado duas vezes
- Sinaliza se a entrada realmente parece mojibake antes de você confiar em um reparo
- Entrada e saída ao vivo — cole à esquerda, leia o texto reparado à direita
- Copie o texto corrigido com um clique, ou carregue um exemplo sabidamente corrompido para testar
- Roda inteiramente no seu navegador; o texto que você cola é processado no seu dispositivo
Como usar Corretor de Mojibake
- Cole o texto corrompido na caixa de entrada à esquerda.
- Leia o melhor reparo no painel de saída Corrigido à direita.
- Examine a lista de Interpretações e escolha um candidato diferente se ele ler de forma mais limpa.
- Clique em Copiar para pegar o texto reparado.
Exemplo
Entrada
Café — don’t panic
Saída
Café — don’t panic
Texto UTF-8 decodificado erroneamente como Windows-1252, reparado de volta para caracteres limpos.
Erros comuns e solução de problemas
- O reparo transforma texto acentuado limpo em novo lixo como "Cé". — Seu texto provavelmente já era UTF-8 correto. Escolha o candidato Original, ou rode o corretor apenas em entradas que realmente pareçam corrompidas.
- Alguns caracteres ainda parecem quebrados após uma passagem. — O texto pode ter sido mal decodificado duas vezes. Escolha a interpretação de dupla decodificação, que aplica o reparo uma segunda vez.
- Alguns caracteres aparecem como um losango preto com ponto de interrogação (�). — Esses bytes foram perdidos ou substituídos antes de você colá-los e não podem ser recuperados. Exporte o texto novamente da fonte original como UTF-8.
- Aspas curvas e travessões são corrigidos, mas um símbolo estranho permanece. — Experimente a interpretação Latin-1 em vez de Windows-1252; as duas diferem apenas em alguns poucos bytes de pontuação e símbolos.
Perguntas frequentes
- O que causa o mojibake?
- O mojibake acontece quando um texto salvo em uma codificação de caracteres é lido em outra. O caso clássico são bytes UTF-8 sendo decodificados como Windows-1252 ou Latin-1, então caracteres de múltiplos bytes como acentos, aspas inteligentes e emoji se dividem em vários glifos errados de um único byte.
- Por que Café aparece como Café?
- Em UTF-8 o é são dois bytes (0xC3 0xA9). Quando esses bytes são lidos como Windows-1252, 0xC3 vira à e 0xA9 vira ©, então "Café" se transforma em "Café". O corretor mapeia esses caracteres de volta para bytes e os decodifica como UTF-8 para restaurar o é.
- Por que um apóstrofo vira ’?
- Um apóstrofo curvo (’, U+2019) são três bytes UTF-8. Decodificados como Windows-1252 eles viram â, € e ™, e é por isso que "don't" aparece como "don’t". Decodificar esses três caracteres novamente como UTF-8 reconstrói o ’ original.
- Qual é a diferença entre os reparos Windows-1252 e Latin-1?
- Windows-1252 e Latin-1 (ISO-8859-1) são quase idênticos, mas diferem na faixa 0x80–0x9F, onde o Windows-1252 contém aspas inteligentes, travessões e o símbolo do euro. Experimente o reparo Windows-1252 primeiro; mude para Latin-1 se um caractere de pontuação ou símbolo ainda estiver errado.
- O mojibake pode sempre ser reparado?
- Frequentemente, mas nem sempre. Se os bytes originais foram substituídos por um marcador genérico (o caractere de substituição �) antes de você copiar o texto, a informação se foi e nenhum corretor pode recuperá-la. O reparo só funciona enquanto os bytes corrompidos, mas reversíveis, estão intactos.
- O texto que eu colo é enviado para algum lugar?
- Não. O reparo de mojibake roda inteiramente no seu navegador, então o texto que você cola é processado localmente no seu dispositivo e não é enviado para um servidor.
Ferramentas relacionadas
Todas as ferramentas de ArrayKit