Contador de Palavras e Caracteres
Cole o texto e tenha um contador de palavras ao vivo com caracteres, frases, linhas, tamanho em bytes e uma estimativa aproximada de tokens. Tudo roda no seu navegador.
Seu texto é analisado localmente no seu navegador para produzir as contagens e nunca é enviado, então notas, rascunhos e prompts permanecem no seu dispositivo.
Precisa reformatar esse texto? Experimente o Conversor de Maiúsculas e Minúsculas.
Sobre Contador de Palavras
Este contador de palavras fornece estatísticas ao vivo no momento em que você começa a digitar ou cola um texto. Como contador de palavras e contador de caracteres, ele informa caracteres com e sem espaços, palavras, frases, parágrafos, linhas, tamanho em bytes UTF-8, uma estimativa aproximada de tokens de LLM e um tempo de leitura estimado em cerca de 200 palavras por minuto. As contagens de caracteres reconhecem grafemas, então um emoji ou uma bandeira conta como um caractere mesmo ocupando vários bytes. É útil para ajustar uma meta description, encaixar um tweet ou mensagem de commit, conferir um prompt antes de enviá-lo a um modelo, ou simplesmente manter o texto no tamanho certo. Há também uma lista opcional de frequência das palavras mais usadas. Tudo é calculado localmente no seu navegador, então o texto que você cola permanece no seu dispositivo e nunca é enviado.
Recursos
- Caracteres com espaços e caracteres sem espaços ao vivo enquanto você digita
- Contagens de palavras, frases, parágrafos e linhas atualizadas instantaneamente
- Tamanho em bytes UTF-8 para que você verifique limites de payload e de armazenamento
- Estimativa aproximada de tokens de LLM usando uma heurística de ~caracteres / 4, rotulada como aprox.
- Estimativa de tempo de leitura baseada em cerca de 200 palavras por minuto
- Contagem que reconhece grafemas, então emoji e glifos combinados contam como um caractere
- Lista opcional de frequência das palavras mais usadas, com palavras vazias triviais removidas
- O botão Copiar estatísticas copia um resumo limpo em texto puro de cada métrica
Como usar Contador de Palavras
- Cole ou digite seu texto na caixa de texto.
- Leia os cartões de estatísticas ao vivo para caracteres, palavras, frases, linhas, bytes, tokens e tempo de leitura.
- Examine a lista opcional de palavras mais usadas para ver quais termos mais se repetem.
- Clique em Copiar estatísticas para pegar um resumo em texto puro de cada métrica.
Exemplo
Entrada
The quick brown fox jumps over the lazy dog. 🦊
Saída
Characters (with spaces): 46
Characters (no spaces): 37
Words: 9
Sentences: 1
Lines: 1
Size (UTF-8): 48 bytes
Tokens (approx): ~12
Reading time: 1 min
O emoji da raposa conta como um caractere, mas adiciona quatro bytes UTF-8.
Erros comuns e solução de problemas
- A contagem de caracteres parece maior do que o número de letras que você digitou. — A contagem padrão inclui espaços, pontuação e quebras de linha; veja o segundo cartão, Caracteres (sem espaços), para letras e símbolos visíveis apenas.
- Um emoji ou letra acentuada altera o tamanho em bytes mais do que a contagem de caracteres. — Os caracteres são contados reconhecendo grafemas, enquanto os bytes são UTF-8, então um emoji é um único caractere mas quatro bytes; esse é o comportamento esperado.
- O número de tokens não corresponde exatamente ao tokenizador do seu modelo. — O valor de tokens é uma aproximação (cerca de caracteres / 4) e está rotulado como aprox.; use o tokenizador real do seu modelo quando uma contagem exata importar.
- A contagem de palavras é zero mesmo com a caixa não vazia. — Uma entrada formada apenas por espaços, tabulações ou linhas em branco não tem palavras; digite algum texto visível e as contagens atualizam imediatamente.
Perguntas frequentes
- A contagem de caracteres inclui espaços e quebras de linha?
- O cartão principal Caracteres conta tudo, incluindo espaços, pontuação e quebras de linha. Um cartão separado Caracteres (sem espaços) remove todos os espaços em branco para que você veja apenas letras e símbolos visíveis.
- Como a contagem de caracteres lida com emoji e letras acentuadas?
- A contagem reconhece grafemas usando Intl.Segmenter quando disponível, então um emoji, uma bandeira ou uma letra com acento combinado conta como um único caractere mesmo que ocupe vários bytes UTF-8.
- Para que serve a contagem aproximada de tokens?
- Ela dá uma estimativa rápida de quantos tokens de LLM seu texto usa, baseada em uma heurística de cerca de caracteres / 4 e rotulada como aprox. É útil para ficar dentro do orçamento de contexto de um modelo, mas não substitui o tokenizador exato do modelo.
- Como o tempo de leitura é calculado?
- O tempo de leitura divide a contagem de palavras por cerca de 200 palavras por minuto e arredonda para cima, então qualquer texto não vazio mostra ao menos um minuto. É um guia aproximado de quanto tempo o trecho leva para ser lido em voz alta ou silenciosamente.
- Como o tamanho em bytes difere da contagem de caracteres?
- O tamanho em bytes é o comprimento UTF-8 do seu texto, que muitas APIs e bancos de dados limitam. Caracteres ASCII têm um byte, letras acentuadas geralmente dois, a maioria dos caracteres CJK três e emoji quatro, então os bytes costumam ser maiores que a contagem de caracteres.
- Meu texto é enviado para algum lugar quando eu o conto?
- Não. O contador de palavras roda inteiramente no seu navegador, então o texto que você cola é processado localmente no seu dispositivo e nunca é enviado para um servidor.
Ferramentas relacionadas
Todas as ferramentas de ArrayKit