LLM Token 计数器
在你键入时为 GPT、Claude 和 Gemini 计数 token。你的提示词绝不离开你的设备。
你的文本在浏览器本地完成分词,绝不会上传,但请避免粘贴你不希望出现在自己机器剪贴板里的机密或生产数据。
知道了你的 token 数?估算一下 API 成本。
关于 Token 计数器
这款 token 计数器会显示你的文本在主流语言模型上各用了多少 token,并在你键入或粘贴时实时更新。OpenAI 的计数是精确的,因为它运行的就是 OpenAI 发布的同一批分词器 —— GPT-4o、GPT-4.1 和 o 系列用 o200k_base,GPT-3.5 Turbo 和 GPT-4 用 cl100k_base。Claude 用一个子词分词器(o200k_base)估算,Gemini 按大约每 token 四个字符估算 —— Anthropic 和 Google 没有公开浏览器分词器,所以对当前模型而言两者都是近似的,并已清楚标注。除了 token,你还能得到字符数、词数以及每字符 token 比,这对于守住上下文窗口或估算提示词成本很方便。一切都在你的浏览器本地完成分词,因此你粘贴的提示词在你的设备上处理,绝不离开它。
功能特性
- 通过 o200k_base(GPT-4o、GPT-4.1、o 系列)和 cl100k_base(GPT-3.5 Turbo、GPT-4)给出精确的 OpenAI token 计数
- 使用子词分词器给出近似的 Claude 计数,并清楚标注
- 按约每 token 四个字符给出近似的 Gemini 估算
- 在你键入或粘贴时实时重新计数,没有「运行」按钮
- 同时显示字符数、词数以及每字符 token 比
- 「精确」与「近似」徽章,让你知道该信任哪些计数
- 一键复制所有计数的摘要,用于笔记或工单
- 完全在你的浏览器中运行,不上传提示词
如何使用 Token 计数器
- 将你的提示词粘贴或键入到文本框中。
- 读取 OpenAI o200k、OpenAI cl100k、Claude 和 Gemini 的实时 token 计数。
- 查看「exact」和「approx」徽章,了解哪些计数是精确的。
- 用字符数、词数和每字符 token 这些统计来衡量上下文占用。
- 点击「复制摘要」一次性获取所有计数。
示例
输入
Summarize this article in three bullet points.
输出
OpenAI o200k: 10 tokens (exact)
OpenAI cl100k: 10 tokens (exact)
Claude: 10 tokens (approx)
Gemini: 12 tokens (approx)
OpenAI 的计数是精确的;Claude 和 Gemini 是近似估算。
常见错误与故障排除
- Claude 的计数与我的 Anthropic 控制台用量不完全一致。 — 请把 Claude 的计数当作近似值。Anthropic 没有发布浏览器分词器,所以本工具用一个子词分词器估算 Claude;请在你的 Anthropic 控制台中确认精确用量。
- Gemini 的数字看起来比其他的更粗略。 — Google 没有公开浏览器分词器,所以 Gemini 按大约每 token 四个字符估算。请把它当作一个大致数,在精度要紧时用 Google 的 count-tokens 接口核实。
- 对于同一段文本,OpenAI o200k 和 cl100k 显示出不同的计数。 — 这是预期的。GPT-4o 和 o 系列使用 o200k_base,而 GPT-3.5 Turbo 和 GPT-4 使用 cl100k_base,这两个编码器对文本的切分方式不同。请读取你所针对的模型家族的计数。
- 一篇很长的文档重新计数时感觉很慢。 — 在每次按键时对大段文本分词都很吃重。计数器仅在文本变化时重新计算;对于超大输入,如果你的浏览器卡顿,可分块粘贴。
常见问题
- OpenAI 的 token 计数是精确的吗?
- 是的。计数器使用 OpenAI 发布的同一批字节对(BPE)分词器 —— GPT-4o、GPT-4.1 和 o 系列用 o200k_base,GPT-3.5 Turbo 和 GPT-4 用 cl100k_base —— 因此这些计数与 OpenAI API 的计费相符。
- 为什么 Claude 和 Gemini 的计数被标为近似?
- 当前的 Claude 和 Gemini 模型在提供商的服务器上分词,并不暴露精确的浏览器分词器。Claude 用一个子词分词器估算,Gemini 用约每 token 四个字符的启发式,所以两者都标为 approx。
- o200k 和 cl100k 的 token 有什么区别?
- 它们是两种 OpenAI 编码。o200k_base 用于 GPT-4o、GPT-4.1 和 o 系列;cl100k_base 用于 GPT-3.5 Turbo 和 GPT-4。它们对同一段文本的切分略有不同,这就是计数会有差异的原因。
- 一个 token 里有多少个字符?
- 对于英文文本,平均大约每 token 四个字符,但它会随标点、空白、代码和其他语言而变化。每字符 token 这一统计会显示你确切输入的真实比值。
- 我的提示词会被发送到 OpenAI、Anthropic 或 Google 吗?
- 不会。所有分词都使用打包的分词器在你的浏览器本地运行,因此你粘贴的文本在你的设备上处理,绝不会上传到任何模型提供商或 ArrayKit。
相关工具
全部 ArrayKit 工具