字数与字符统计工具
粘贴文本,即可实时统计字符、单词、句子、行数、字节大小,以及大致的 token 估算。一切都在你的浏览器中运行。
你的文本在浏览器本地分析以生成统计,绝不会上传,因此笔记、草稿和提示都留在你的设备上。
需要重新整理这段文本?试试大小写转换器。
关于 字数统计
这款字数统计工具会在你开始输入或粘贴文本的那一刻给出实时统计。作为字数与字符统计工具,它会报告含空格与不含空格的字符数、单词数、句子数、段落数、行数、UTF-8 字节大小、大致的 LLM token 估算,以及按约每分钟 200 词计算的预计阅读时长。字符统计是按字素感知的,因此一个表情符号或国旗只算一个字符,即便它跨越多个字节。它非常适合用来精简 meta description、控制一条推文或提交信息的长度、在把提示发给模型前检查它,或只是让文稿保持在目标字数内。还有一个可选的高频词列表。一切都在你的浏览器本地计算,因此你粘贴的文本留在你的设备上,绝不会上传。
功能特性
- 随输入实时统计含空格与不含空格的字符数
- 即时更新单词、句子、段落和行数
- UTF-8 字节大小,便于检查负载与存储限制
- 使用约「字符数 / 4」的启发式给出大致的 LLM token 估算,并标注为「约」
- 基于约每分钟 200 词的阅读时长估算
- 按字素感知计数,因此表情符号和组合字形算作一个字符
- 可选的高频词列表,已移除常见的停用词
- 「复制统计」按钮可复制一份所有指标的整洁纯文本摘要
如何使用 字数统计
- 将文本粘贴或输入到「文本」框中。
- 查看字符、单词、句子、行数、字节、token 和阅读时长的实时统计卡片。
- 浏览可选的高频词列表,看看哪些词出现得最多。
- 点击「复制统计」获取一份所有指标的纯文本摘要。
示例
输入
The quick brown fox jumps over the lazy dog. 🦊
输出
Characters (with spaces): 46
Characters (no spaces): 37
Words: 9
Sentences: 1
Lines: 1
Size (UTF-8): 48 bytes
Tokens (approx): ~12
Reading time: 1 min
狐狸表情符号算作一个字符,但增加了四个 UTF-8 字节。
常见错误与故障排除
- 字符数看起来比你输入的字母还多。 — 默认计数包含空格、标点和换行;如需仅看字母和可见符号,请查看第二张卡片「不含空格的字符数」。
- 一个表情符号或带重音的字母对字节大小的影响超过对字符数的影响。 — 字符按字素感知计数,而字节按 UTF-8 计算,因此一个表情符号是单个字符却占四个字节;这是预期行为。
- token 数量与你的模型分词器并不完全一致。 — token 数是近似值(约为字符数 / 4)并标注为「约」;当需要精确计数时,请使用你模型的真实分词器。
- 框里明明有内容,单词数却为零。 — 仅含空格、制表符或空行的输入没有单词;输入一些可见文本后计数会立即更新。
常见问题
- 字符数是否包含空格和换行?
- 主「字符数」卡片统计一切,包括空格、标点和换行。另有一张「不含空格的字符数」卡片会去除所有空白,让你只看到字母和可见符号。
- 字符统计如何处理表情符号和带重音的字母?
- 在可用时使用 Intl.Segmenter 进行字素感知计数,因此一个表情符号、一面国旗,或带组合重音的字母都算作单个字符,即便它可能占用多个 UTF-8 字节。
- 大致的 token 数有什么用?
- 它基于约「字符数 / 4」的启发式快速估算你的文本使用了多少 LLM token,并标注为「约」。它有助于控制在模型的上下文预算之内,但不能替代模型的精确分词器。
- 阅读时长是如何计算的?
- 阅读时长将单词数除以约每分钟 200 词并向上取整,因此任何非空文本都至少显示一分钟。它是对朗读或默读所需时间的粗略参考。
- 字节大小与字符数有何不同?
- 字节大小是文本的 UTF-8 长度,许多 API 和数据库会对其设限。ASCII 字符占一个字节,带重音的字母通常占两个,大多数 CJK 字符占三个,表情符号占四个,因此字节数往往高于字符数。
- 统计时我的文本会被上传吗?
- 不会。字数统计工具完全在你的浏览器中运行,因此你粘贴的文本在你的设备上本地处理,绝不会发送到服务器。
相关工具
全部 ArrayKit 工具