Le nombre de caractères inclut-il les espaces et les sauts de ligne ?

La carte principale Caractères compte tout, y compris les espaces, la ponctuation et les sauts de ligne. Une carte distincte Caractères (sans espaces) retire toutes les espaces pour ne montrer que les lettres et symboles visibles.

Comment le nombre de caractères gère-t-il les emoji et les lettres accentuées ?

Le comptage tient compte des graphèmes via Intl.Segmenter lorsqu'il est disponible, donc un emoji, un drapeau ou une lettre avec un accent combiné compte pour un seul caractère même s'il occupe plusieurs octets UTF-8.

À quoi sert le nombre de tokens approximatif ?

Il donne une estimation rapide du nombre de tokens LLM que votre texte utilise, basée sur une heuristique d'environ caractères / 4 et indiquée comme approximative. C'est utile pour rester sous le budget de contexte d'un modèle, mais cela ne remplace pas le tokenizer exact du modèle.

Comment le temps de lecture est-il calculé ?

Le temps de lecture divise le nombre de mots par environ 200 mots par minute et arrondit au supérieur, donc tout texte non vide affiche au moins une minute. C'est un repère approximatif du temps nécessaire pour lire le passage à voix haute ou en silence.

En quoi la taille en octets diffère-t-elle du nombre de caractères ?

La taille en octets est la longueur UTF-8 de votre texte, que de nombreuses API et bases de données limitent. Les caractères ASCII font un octet, les lettres accentuées généralement deux, la plupart des caractères CJK trois, et les emoji quatre, donc les octets dépassent souvent le nombre de caractères.

Mon texte est-il téléversé lorsque je le compte ?

Non. Le compteur de mots fonctionne entièrement dans votre navigateur, donc le texte que vous collez est traité localement sur votre appareil et n'est jamais envoyé à un serveur.

Compteur de mots et de caractères

Collez du texte et obtenez un compteur de mots en direct avec caractères, phrases, lignes, taille en octets et une estimation approximative de tokens. Tout s'exécute dans votre navigateur.

Votre texte est analysé localement dans votre navigateur pour produire les comptages et n'est jamais téléversé, donc vos notes, brouillons et prompts restent sur votre appareil.

Besoin de remettre en forme ce texte ? Essayez le Convertisseur de casse.

À propos de Compteur de mots

Ce compteur de mots vous donne des statistiques en direct dès que vous commencez à taper ou à coller du texte. En tant que compteur de mots et compteur de caractères, il indique les caractères avec et sans espaces, les mots, les phrases, les paragraphes, les lignes, la taille en octets UTF-8, une estimation approximative de tokens LLM et un temps de lecture estimé à environ 200 mots par minute. Le comptage des caractères tient compte des graphèmes, donc un emoji ou un drapeau compte pour un seul caractère même s'il s'étend sur plusieurs octets. Il est pratique pour resserrer une méta-description, faire tenir un tweet ou un message de commit, vérifier un prompt avant de l'envoyer à un modèle, ou simplement garder un texte dans la cible. Il propose aussi une liste optionnelle des mots les plus fréquents. Tout est calculé localement dans votre navigateur, donc le texte que vous collez reste sur votre appareil et n'est jamais téléversé.

Fonctionnalités

Caractères avec espaces et caractères sans espaces en direct au fil de la frappe
Compteurs de mots, de phrases, de paragraphes et de lignes mis à jour instantanément
Taille en octets UTF-8 pour vérifier les limites de charge utile et de stockage
Estimation approximative de tokens LLM avec une heuristique ~caractères / 4, indiquée comme approximative
Estimation du temps de lecture basée sur environ 200 mots par minute
Comptage tenant compte des graphèmes : les emoji et glyphes combinés comptent pour un seul caractère
Liste optionnelle des mots les plus fréquents, les mots vides triviaux étant retirés
Le bouton Copier les stats copie un résumé en texte brut de chaque métrique

Comment utiliser Compteur de mots

Collez ou saisissez votre texte dans la zone Texte.
Lisez les cartes de statistiques en direct pour les caractères, mots, phrases, lignes, octets, tokens et temps de lecture.
Parcourez la liste optionnelle des mots les plus fréquents pour voir lesquels reviennent le plus.
Cliquez sur Copier les stats pour récupérer un résumé en texte brut de chaque métrique.

Exemple

Entrée

The quick brown fox jumps over the lazy dog. 🦊

Sortie

Characters (with spaces): 46
Characters (no spaces): 37
Words: 9
Sentences: 1
Lines: 1
Size (UTF-8): 48 bytes
Tokens (approx): ~12
Reading time: 1 min

L'emoji du renard compte pour un seul caractère mais ajoute quatre octets UTF-8.

Erreurs courantes et dépannage

Le nombre de caractères semble supérieur au nombre de lettres saisies. — Le comptage par défaut inclut les espaces, la ponctuation et les sauts de ligne ; consultez la deuxième carte, Caractères (sans espaces), pour les lettres et symboles visibles uniquement.
Un emoji ou une lettre accentuée change plus la taille en octets que le nombre de caractères. — Les caractères sont comptés en tenant compte des graphèmes tandis que les octets sont en UTF-8, donc un emoji est un seul caractère mais quatre octets ; c'est le comportement attendu.
Le nombre de tokens ne correspond pas exactement au tokenizer de votre modèle. — Le chiffre des tokens est une approximation (environ caractères / 4) indiquée comme approximative ; utilisez le vrai tokenizer de votre modèle lorsqu'un comptage exact est important.
Le nombre de mots est zéro alors que la zone n'est pas vide. — Une entrée composée uniquement d'espaces, de tabulations ou de lignes vides ne contient aucun mot ; tapez du texte visible et les compteurs se mettent à jour immédiatement.

Foire aux questions

Le nombre de caractères inclut-il les espaces et les sauts de ligne ?: La carte principale Caractères compte tout, y compris les espaces, la ponctuation et les sauts de ligne. Une carte distincte Caractères (sans espaces) retire toutes les espaces pour ne montrer que les lettres et symboles visibles.
Comment le nombre de caractères gère-t-il les emoji et les lettres accentuées ?: Le comptage tient compte des graphèmes via Intl.Segmenter lorsqu'il est disponible, donc un emoji, un drapeau ou une lettre avec un accent combiné compte pour un seul caractère même s'il occupe plusieurs octets UTF-8.
À quoi sert le nombre de tokens approximatif ?: Il donne une estimation rapide du nombre de tokens LLM que votre texte utilise, basée sur une heuristique d'environ caractères / 4 et indiquée comme approximative. C'est utile pour rester sous le budget de contexte d'un modèle, mais cela ne remplace pas le tokenizer exact du modèle.
Comment le temps de lecture est-il calculé ?: Le temps de lecture divise le nombre de mots par environ 200 mots par minute et arrondit au supérieur, donc tout texte non vide affiche au moins une minute. C'est un repère approximatif du temps nécessaire pour lire le passage à voix haute ou en silence.
En quoi la taille en octets diffère-t-elle du nombre de caractères ?: La taille en octets est la longueur UTF-8 de votre texte, que de nombreuses API et bases de données limitent. Les caractères ASCII font un octet, les lettres accentuées généralement deux, la plupart des caractères CJK trois, et les emoji quatre, donc les octets dépassent souvent le nombre de caractères.
Mon texte est-il téléversé lorsque je le compte ?: Non. Le compteur de mots fonctionne entièrement dans votre navigateur, donc le texte que vous collez est traité localement sur votre appareil et n'est jamais envoyé à un serveur.

Outils associés

Convertisseur de casse — Convertit le texte entre camelCase, snake_case, kebab-case, PascalCase et plus.
Générateur de slug — Transformez un titre en slug d’URL propre et sûr, au fil de la frappe.
Générateur de Lorem Ipsum — Génère des paragraphes, des phrases ou des mots de remplissage lorem ipsum.
Comparer du texte — Compare deux textes ligne par ligne et affiche ajouts et suppressions.
Générateur de données de test — Génère de fausses données JSON : noms, e-mails, UUID, dates et plus.
Encoder / Décoder Base64 — Encodage et décodage Base64 sûrs en UTF-8.
Aperçu Markdown — Rend le Markdown en HTML avec un aperçu en direct.