Limpador de Texto de IA
Cole um texto para detectar e remover caracteres invisíveis e artefatos tipográficos deixados por modelos de IA e por copiar e colar. Tudo roda no seu navegador.
Seu texto é inspecionado e limpo localmente no seu navegador e nunca é enviado, mas evite colar conteúdo confidencial em qualquer ferramenta online.
Vendo acentos truncados como Café? Experimente o Corretor de Mojibake.
Sobre Limpador de Texto de IA
Este Limpador de Texto de IA é um inspetor e higienizador simples para textos que carregam caracteres que você não consegue ver. Cole qualquer coisa que um modelo de linguagem tenha gerado, ou conteúdo que você copiou de um documento, PDF ou página web, e ele conta e remove os caracteres de formatação ocultos que se infiltram: zero-width space e joiners, os espaços não separáveis estreitos e normais, hifens suaves, controles bidirecionais, operadores matemáticos invisíveis e seletores de variação de emoji. Opções extras endireitam aspas curvas, transformam travessões e meias-riscas em hifens simples, colapsam sequências de espaços e aplicam normalização Unicode NFC. Você recebe um resumo do que foi removido por tipo, além das contagens de caracteres e de bytes UTF-8 antes e depois, e então copia ou baixa o resultado limpo. Toda a verificação roda no seu navegador, então o texto que você cola permanece no seu dispositivo.
Recursos
- Detecta e conta cada caractere oculto por tipo, incluindo zero-width space, joiner e non-joiner
- Remove espaços não separáveis normais e estreitos (NNBSP), hifens suaves e a marca de ordem de bytes
- Remove controles bidirecionais (LRM, RLM, LRO/RLO, isolates) que podem reordenar ou falsificar texto
- Elimina operadores matemáticos invisíveis (U+2061–U+2064) e seletores de variação de emoji (U+FE00–U+FE0F)
- Opcional: endireitar aspas curvas e converter travessões e meias-riscas em um hifen simples
- Opcional: colapsar sequências de espaços e aplicar normalização Unicode NFC
- Mostra um resumo do que foi removido por tipo, com contagens de caracteres e de bytes UTF-8 antes e depois
- Copie o texto limpo ou baixe-o como cleaned.txt com um clique
Como usar Limpador de Texto de IA
- Cole ou digite seu texto na caixa de entrada à esquerda.
- Leia o aviso e a lista de remoções por tipo para ver quais caracteres ocultos foram encontrados.
- Ative as opções de tipografia que quiser, como endireitar aspas ou colapsar espaços.
- Confira as contagens de caracteres e de bytes antes e depois para confirmar o que mudou.
- Copie o texto limpo ou baixe-o como cleaned.txt.
Exemplo
Entrada
The model said “this is clean”—or is it?
Saída
The model said "this is clean"-or is it?
Um zero-width space é removido; com as opções de aspas e travessão ativadas, as aspas curvas viram retas e o travessão vira um hifen.
Erros comuns e solução de problemas
- O texto limpo parece idêntico à entrada, mas as contagens mudaram. — Os caracteres removidos eram invisíveis na tela. Confira a lista de remoções por tipo e a diferença na contagem de caracteres para ver exatamente o que saiu.
- Um espaço não separável entre palavras virou um espaço normal ou desapareceu. — Espaços não separáveis normais e estreitos (NNBSP) são removidos como caracteres ocultos. Se você precisa de um espaço real ali, a opção de colapsar espaços mantém os espaços simples intactos.
- Letras acentuadas mudaram de tamanho mesmo parecendo iguais. — Isso é a normalização Unicode NFC combinando uma letra base e uma marca combinante em um único ponto de código. Desative a opção Normalizar (NFC) se quiser a forma original.
- Um emoji perdeu a cor ou o estilo depois da limpeza. — Os seletores de variação (U+FE00–U+FE0F) que forçam a apresentação como texto ou emoji são removidos. Reinsira o emoji pelo seu teclado se precisar de um estilo específico.
Perguntas frequentes
- O que é um zero-width space?
- Um zero-width space (U+200B) é um caractere Unicode sem largura visível. Ele pode criar quebras de palavra invisíveis, atrapalhar buscas por correspondência exata e alterar as contagens de bytes mesmo sem nada aparecer na tela. Esta ferramenta o remove junto com joiners de largura zero e espaços não separáveis relacionados.
- Por que textos gerados por IA às vezes contêm caracteres ocultos?
- Os modelos são treinados em textos da web e de documentos que já incluem espaços não separáveis, aspas curvas, hifens suaves e outras formatações, e os tokenizadores conseguem reproduzi-los. Copiar e colar de editores ricos, PDFs e aplicativos de chat adiciona mais. O resultado é um texto que parece limpo, mas carrega caracteres que você não consegue ver.
- Quais caracteres o Limpador de Texto de IA remove?
- Ele remove zero-width space, joiner, non-joiner e word joiner, a marca de ordem de bytes, espaços não separáveis normais e estreitos (NNBSP), hifens suaves, controles bidirecionais, operadores matemáticos invisíveis (U+2061–U+2064) e seletores de variação de emoji (U+FE00–U+FE0F). As mudanças de aspas, travessão, espaçamento e NFC são opções que você ativa manualmente.
- O que são caracteres de controle bidirecional e por que removê-los?
- Controles bidirecionais como a sobreposição da direita para a esquerda reordenam como o texto é exibido. Eles são legítimos para conteúdo com escritas mistas, mas também podem ser usados para disfarçar nomes de arquivos ou código, então esta ferramenta os sinaliza e remove para que o que você vê corresponda aos caracteres subjacentes.
- Esta ferramenta altera minhas palavras visíveis ou reescreve o texto?
- Não. Ela é um inspetor e higienizador: por padrão, só apaga caracteres que você não consegue ver e informa o que removeu. Ela nunca parafraseia, adiciona nem reescreve suas palavras, e as opções de tipografia só rodam quando você as ativa.
- Meu texto é enviado para algum lugar quando eu limpo caracteres invisíveis?
- Não. A detecção e a limpeza rodam inteiramente no seu navegador, então o texto que você cola é processado no seu dispositivo e não é enviado para um servidor.
Ferramentas relacionadas
Todas as ferramentas de ArrayKit