Compteur de mots et de caractères
Collez du texte et obtenez un compteur de mots en direct avec caractères, phrases, lignes, taille en octets et une estimation approximative de tokens. Tout s'exécute dans votre navigateur.
Votre texte est analysé localement dans votre navigateur pour produire les comptages et n'est jamais téléversé, donc vos notes, brouillons et prompts restent sur votre appareil.
Besoin de remettre en forme ce texte ? Essayez le Convertisseur de casse.
À propos de Compteur de mots
Ce compteur de mots vous donne des statistiques en direct dès que vous commencez à taper ou à coller du texte. En tant que compteur de mots et compteur de caractères, il indique les caractères avec et sans espaces, les mots, les phrases, les paragraphes, les lignes, la taille en octets UTF-8, une estimation approximative de tokens LLM et un temps de lecture estimé à environ 200 mots par minute. Le comptage des caractères tient compte des graphèmes, donc un emoji ou un drapeau compte pour un seul caractère même s'il s'étend sur plusieurs octets. Il est pratique pour resserrer une méta-description, faire tenir un tweet ou un message de commit, vérifier un prompt avant de l'envoyer à un modèle, ou simplement garder un texte dans la cible. Il propose aussi une liste optionnelle des mots les plus fréquents. Tout est calculé localement dans votre navigateur, donc le texte que vous collez reste sur votre appareil et n'est jamais téléversé.
Fonctionnalités
- Caractères avec espaces et caractères sans espaces en direct au fil de la frappe
- Compteurs de mots, de phrases, de paragraphes et de lignes mis à jour instantanément
- Taille en octets UTF-8 pour vérifier les limites de charge utile et de stockage
- Estimation approximative de tokens LLM avec une heuristique ~caractères / 4, indiquée comme approximative
- Estimation du temps de lecture basée sur environ 200 mots par minute
- Comptage tenant compte des graphèmes : les emoji et glyphes combinés comptent pour un seul caractère
- Liste optionnelle des mots les plus fréquents, les mots vides triviaux étant retirés
- Le bouton Copier les stats copie un résumé en texte brut de chaque métrique
Comment utiliser Compteur de mots
- Collez ou saisissez votre texte dans la zone Texte.
- Lisez les cartes de statistiques en direct pour les caractères, mots, phrases, lignes, octets, tokens et temps de lecture.
- Parcourez la liste optionnelle des mots les plus fréquents pour voir lesquels reviennent le plus.
- Cliquez sur Copier les stats pour récupérer un résumé en texte brut de chaque métrique.
Exemple
Entrée
The quick brown fox jumps over the lazy dog. 🦊
Sortie
Characters (with spaces): 46
Characters (no spaces): 37
Words: 9
Sentences: 1
Lines: 1
Size (UTF-8): 48 bytes
Tokens (approx): ~12
Reading time: 1 min
L'emoji du renard compte pour un seul caractère mais ajoute quatre octets UTF-8.
Erreurs courantes et dépannage
- Le nombre de caractères semble supérieur au nombre de lettres saisies. — Le comptage par défaut inclut les espaces, la ponctuation et les sauts de ligne ; consultez la deuxième carte, Caractères (sans espaces), pour les lettres et symboles visibles uniquement.
- Un emoji ou une lettre accentuée change plus la taille en octets que le nombre de caractères. — Les caractères sont comptés en tenant compte des graphèmes tandis que les octets sont en UTF-8, donc un emoji est un seul caractère mais quatre octets ; c'est le comportement attendu.
- Le nombre de tokens ne correspond pas exactement au tokenizer de votre modèle. — Le chiffre des tokens est une approximation (environ caractères / 4) indiquée comme approximative ; utilisez le vrai tokenizer de votre modèle lorsqu'un comptage exact est important.
- Le nombre de mots est zéro alors que la zone n'est pas vide. — Une entrée composée uniquement d'espaces, de tabulations ou de lignes vides ne contient aucun mot ; tapez du texte visible et les compteurs se mettent à jour immédiatement.
Foire aux questions
- Le nombre de caractères inclut-il les espaces et les sauts de ligne ?
- La carte principale Caractères compte tout, y compris les espaces, la ponctuation et les sauts de ligne. Une carte distincte Caractères (sans espaces) retire toutes les espaces pour ne montrer que les lettres et symboles visibles.
- Comment le nombre de caractères gère-t-il les emoji et les lettres accentuées ?
- Le comptage tient compte des graphèmes via Intl.Segmenter lorsqu'il est disponible, donc un emoji, un drapeau ou une lettre avec un accent combiné compte pour un seul caractère même s'il occupe plusieurs octets UTF-8.
- À quoi sert le nombre de tokens approximatif ?
- Il donne une estimation rapide du nombre de tokens LLM que votre texte utilise, basée sur une heuristique d'environ caractères / 4 et indiquée comme approximative. C'est utile pour rester sous le budget de contexte d'un modèle, mais cela ne remplace pas le tokenizer exact du modèle.
- Comment le temps de lecture est-il calculé ?
- Le temps de lecture divise le nombre de mots par environ 200 mots par minute et arrondit au supérieur, donc tout texte non vide affiche au moins une minute. C'est un repère approximatif du temps nécessaire pour lire le passage à voix haute ou en silence.
- En quoi la taille en octets diffère-t-elle du nombre de caractères ?
- La taille en octets est la longueur UTF-8 de votre texte, que de nombreuses API et bases de données limitent. Les caractères ASCII font un octet, les lettres accentuées généralement deux, la plupart des caractères CJK trois, et les emoji quatre, donc les octets dépassent souvent le nombre de caractères.
- Mon texte est-il téléversé lorsque je le compte ?
- Non. Le compteur de mots fonctionne entièrement dans votre navigateur, donc le texte que vous collez est traité localement sur votre appareil et n'est jamais envoyé à un serveur.
Outils associés
Tous les outils ArrayKit