Contador de Palavras e Caracteres

Cole o texto e tenha um contador de palavras ao vivo com caracteres, frases, linhas, tamanho em bytes e uma estimativa aproximada de tokens. Tudo roda no seu navegador.

Seu texto é analisado localmente no seu navegador para produzir as contagens e nunca é enviado, então notas, rascunhos e prompts permanecem no seu dispositivo.

Precisa reformatar esse texto? Experimente o Conversor de Maiúsculas e Minúsculas.

Sobre Contador de Palavras

Este contador de palavras fornece estatísticas ao vivo no momento em que você começa a digitar ou cola um texto. Como contador de palavras e contador de caracteres, ele informa caracteres com e sem espaços, palavras, frases, parágrafos, linhas, tamanho em bytes UTF-8, uma estimativa aproximada de tokens de LLM e um tempo de leitura estimado em cerca de 200 palavras por minuto. As contagens de caracteres reconhecem grafemas, então um emoji ou uma bandeira conta como um caractere mesmo ocupando vários bytes. É útil para ajustar uma meta description, encaixar um tweet ou mensagem de commit, conferir um prompt antes de enviá-lo a um modelo, ou simplesmente manter o texto no tamanho certo. Há também uma lista opcional de frequência das palavras mais usadas. Tudo é calculado localmente no seu navegador, então o texto que você cola permanece no seu dispositivo e nunca é enviado.

Recursos

Como usar Contador de Palavras

  1. Cole ou digite seu texto na caixa de texto.
  2. Leia os cartões de estatísticas ao vivo para caracteres, palavras, frases, linhas, bytes, tokens e tempo de leitura.
  3. Examine a lista opcional de palavras mais usadas para ver quais termos mais se repetem.
  4. Clique em Copiar estatísticas para pegar um resumo em texto puro de cada métrica.

Exemplo

Entrada

The quick brown fox jumps over the lazy dog. 🦊

Saída

Characters (with spaces): 46
Characters (no spaces): 37
Words: 9
Sentences: 1
Lines: 1
Size (UTF-8): 48 bytes
Tokens (approx): ~12
Reading time: 1 min

O emoji da raposa conta como um caractere, mas adiciona quatro bytes UTF-8.

Erros comuns e solução de problemas

Perguntas frequentes

A contagem de caracteres inclui espaços e quebras de linha?
O cartão principal Caracteres conta tudo, incluindo espaços, pontuação e quebras de linha. Um cartão separado Caracteres (sem espaços) remove todos os espaços em branco para que você veja apenas letras e símbolos visíveis.
Como a contagem de caracteres lida com emoji e letras acentuadas?
A contagem reconhece grafemas usando Intl.Segmenter quando disponível, então um emoji, uma bandeira ou uma letra com acento combinado conta como um único caractere mesmo que ocupe vários bytes UTF-8.
Para que serve a contagem aproximada de tokens?
Ela dá uma estimativa rápida de quantos tokens de LLM seu texto usa, baseada em uma heurística de cerca de caracteres / 4 e rotulada como aprox. É útil para ficar dentro do orçamento de contexto de um modelo, mas não substitui o tokenizador exato do modelo.
Como o tempo de leitura é calculado?
O tempo de leitura divide a contagem de palavras por cerca de 200 palavras por minuto e arredonda para cima, então qualquer texto não vazio mostra ao menos um minuto. É um guia aproximado de quanto tempo o trecho leva para ser lido em voz alta ou silenciosamente.
Como o tamanho em bytes difere da contagem de caracteres?
O tamanho em bytes é o comprimento UTF-8 do seu texto, que muitas APIs e bancos de dados limitam. Caracteres ASCII têm um byte, letras acentuadas geralmente dois, a maioria dos caracteres CJK três e emoji quatro, então os bytes costumam ser maiores que a contagem de caracteres.
Meu texto é enviado para algum lugar quando eu o conto?
Não. O contador de palavras roda inteiramente no seu navegador, então o texto que você cola é processado localmente no seu dispositivo e nunca é enviado para um servidor.

Ferramentas relacionadas

Todas as ferramentas de ArrayKit