O que causa o mojibake?

O mojibake acontece quando um texto salvo em uma codificação de caracteres é lido em outra. O caso clássico são bytes UTF-8 sendo decodificados como Windows-1252 ou Latin-1, então caracteres de múltiplos bytes como acentos, aspas inteligentes e emoji se dividem em vários glifos errados de um único byte.

Por que Café aparece como CafÃ©?

Em UTF-8 o é são dois bytes (0xC3 0xA9). Quando esses bytes são lidos como Windows-1252, 0xC3 vira Ã e 0xA9 vira ©, então "Café" se transforma em "CafÃ©". O corretor mapeia esses caracteres de volta para bytes e os decodifica como UTF-8 para restaurar o é.

Por que um apóstrofo vira â€™?

Um apóstrofo curvo (’, U+2019) são três bytes UTF-8. Decodificados como Windows-1252 eles viram â, € e ™, e é por isso que "don't" aparece como "donâ€™t". Decodificar esses três caracteres novamente como UTF-8 reconstrói o ’ original.

Qual é a diferença entre os reparos Windows-1252 e Latin-1?

Windows-1252 e Latin-1 (ISO-8859-1) são quase idênticos, mas diferem na faixa 0x80–0x9F, onde o Windows-1252 contém aspas inteligentes, travessões e o símbolo do euro. Experimente o reparo Windows-1252 primeiro; mude para Latin-1 se um caractere de pontuação ou símbolo ainda estiver errado.

O mojibake pode sempre ser reparado?

Frequentemente, mas nem sempre. Se os bytes originais foram substituídos por um marcador genérico (o caractere de substituição �) antes de você copiar o texto, a informação se foi e nenhum corretor pode recuperá-la. O reparo só funciona enquanto os bytes corrompidos, mas reversíveis, estão intactos.

O texto que eu colo é enviado para algum lugar?

Não. O reparo de mojibake roda inteiramente no seu navegador, então o texto que você cola é processado localmente no seu dispositivo e não é enviado para um servidor.

Corretor de Mojibake / Codificação

Corrija texto mojibake corrompido como CafÃ© ou donâ€™t de volta para Café e don’t, direto no seu navegador.

Seu texto é reparado localmente no seu navegador e nunca é enviado, mas evite colar dados pessoais sensíveis em qualquer ferramenta online.

Precisa escapar caracteres especiais de HTML? Experimente a ferramenta de Entidades HTML.

Sobre Corretor de Mojibake

Este corretor de mojibake repara texto corrompido causado por uma incompatibilidade de codificação — do tipo que transforma "Café" em "CafÃ©", "don't" em "donâ€™t" e "😀" em "ðŸ˜€". O culpado de sempre são bytes UTF-8 que foram decodificados erroneamente como Windows-1252 ou Latin-1, então letras acentuadas, aspas inteligentes, travessões e emoji saem como caracteres inúteis. O corretor reverte isso: ele mapeia cada caractere corrompido de volta ao seu byte original e decodifica o resultado novamente como UTF-8. Como mais de uma incompatibilidade é possível, ele oferece várias interpretações (UTF-8 ↔ Windows-1252, UTF-8 ↔ Latin-1 e uma passagem de dupla decodificação) e destaca a mais limpa, permitindo que você escolha outra. Cole o texto à esquerda e leia o reparo à direita. Tudo roda no seu navegador, então o texto que você cola fica no seu dispositivo.

Recursos

Repara o mojibake mais comum: bytes UTF-8 decodificados como Windows-1252 ou Latin-1
Corrige letras acentuadas, aspas inteligentes, travessões, o símbolo do euro e emoji quebrados
Oferece várias interpretações candidatas e sinaliza o reparo mais limpo como o Melhor
Inclui uma passagem de dupla decodificação para texto que foi mal decodificado duas vezes
Sinaliza se a entrada realmente parece mojibake antes de você confiar em um reparo
Entrada e saída ao vivo — cole à esquerda, leia o texto reparado à direita
Copie o texto corrigido com um clique, ou carregue um exemplo sabidamente corrompido para testar
Roda inteiramente no seu navegador; o texto que você cola é processado no seu dispositivo

Como usar Corretor de Mojibake

Cole o texto corrompido na caixa de entrada à esquerda.
Leia o melhor reparo no painel de saída Corrigido à direita.
Examine a lista de Interpretações e escolha um candidato diferente se ele ler de forma mais limpa.
Clique em Copiar para pegar o texto reparado.

Exemplo

Entrada

CafÃ© â€” donâ€™t panic

Saída

Café — don’t panic

Texto UTF-8 decodificado erroneamente como Windows-1252, reparado de volta para caracteres limpos.

Erros comuns e solução de problemas

O reparo transforma texto acentuado limpo em novo lixo como "CÃ©". — Seu texto provavelmente já era UTF-8 correto. Escolha o candidato Original, ou rode o corretor apenas em entradas que realmente pareçam corrompidas.
Alguns caracteres ainda parecem quebrados após uma passagem. — O texto pode ter sido mal decodificado duas vezes. Escolha a interpretação de dupla decodificação, que aplica o reparo uma segunda vez.
Alguns caracteres aparecem como um losango preto com ponto de interrogação (�). — Esses bytes foram perdidos ou substituídos antes de você colá-los e não podem ser recuperados. Exporte o texto novamente da fonte original como UTF-8.
Aspas curvas e travessões são corrigidos, mas um símbolo estranho permanece. — Experimente a interpretação Latin-1 em vez de Windows-1252; as duas diferem apenas em alguns poucos bytes de pontuação e símbolos.

Perguntas frequentes

O que causa o mojibake?: O mojibake acontece quando um texto salvo em uma codificação de caracteres é lido em outra. O caso clássico são bytes UTF-8 sendo decodificados como Windows-1252 ou Latin-1, então caracteres de múltiplos bytes como acentos, aspas inteligentes e emoji se dividem em vários glifos errados de um único byte.
Por que Café aparece como CafÃ©?: Em UTF-8 o é são dois bytes (0xC3 0xA9). Quando esses bytes são lidos como Windows-1252, 0xC3 vira Ã e 0xA9 vira ©, então "Café" se transforma em "CafÃ©". O corretor mapeia esses caracteres de volta para bytes e os decodifica como UTF-8 para restaurar o é.
Por que um apóstrofo vira â€™?: Um apóstrofo curvo (’, U+2019) são três bytes UTF-8. Decodificados como Windows-1252 eles viram â, € e ™, e é por isso que "don't" aparece como "donâ€™t". Decodificar esses três caracteres novamente como UTF-8 reconstrói o ’ original.
Qual é a diferença entre os reparos Windows-1252 e Latin-1?: Windows-1252 e Latin-1 (ISO-8859-1) são quase idênticos, mas diferem na faixa 0x80–0x9F, onde o Windows-1252 contém aspas inteligentes, travessões e o símbolo do euro. Experimente o reparo Windows-1252 primeiro; mude para Latin-1 se um caractere de pontuação ou símbolo ainda estiver errado.
O mojibake pode sempre ser reparado?: Frequentemente, mas nem sempre. Se os bytes originais foram substituídos por um marcador genérico (o caractere de substituição �) antes de você copiar o texto, a informação se foi e nenhum corretor pode recuperá-la. O reparo só funciona enquanto os bytes corrompidos, mas reversíveis, estão intactos.
O texto que eu colo é enviado para algum lugar?: Não. O reparo de mojibake roda inteiramente no seu navegador, então o texto que você cola é processado localmente no seu dispositivo e não é enviado para um servidor.

Ferramentas relacionadas

Codificar / Decodificar URL — Codifique e decodifique componentes de URL.
Escapar / Desescapar HTML — Escape e desescape caracteres especiais e entidades HTML.
Codificar / Decodificar Base64 — Codificação e decodificação Base64 segura em UTF-8.
Conversor de maiúsculas e minúsculas — Converta texto entre camelCase, snake_case, kebab-case, PascalCase e mais.
Conversor de base numérica — Converta inteiros entre binário, octal, decimal e hexadecimal.