为什么 Claude 和 Gemini 的计数被标为近似？

当前的 Claude 和 Gemini 模型在提供商的服务器上分词，并不暴露精确的浏览器分词器。Claude 用一个子词分词器估算，Gemini 用约每 token 四个字符的启发式，所以两者都标为 approx。

o200k 和 cl100k 的 token 有什么区别？

它们是两种 OpenAI 编码。o200k_base 用于 GPT-4o、GPT-4.1 和 o 系列；cl100k_base 用于 GPT-3.5 Turbo 和 GPT-4。它们对同一段文本的切分略有不同，这就是计数会有差异的原因。

一个 token 里有多少个字符？

对于英文文本，平均大约每 token 四个字符，但它会随标点、空白、代码和其他语言而变化。每字符 token 这一统计会显示你确切输入的真实比值。

我的提示词会被发送到 OpenAI、Anthropic 或 Google 吗？

不会。所有分词都使用打包的分词器在你的浏览器本地运行，因此你粘贴的文本在你的设备上处理，绝不会上传到任何模型提供商或 ArrayKit。

LLM Token 计数器

在你键入时为 GPT、Claude 和 Gemini 计数 token。你的提示词绝不离开你的设备。

你的文本在浏览器本地完成分词，绝不会上传，但请避免粘贴你不希望出现在自己机器剪贴板里的机密或生产数据。

知道了你的 token 数？估算一下 API 成本。

关于 Token 计数器

这款 token 计数器会显示你的文本在主流语言模型上各用了多少 token，并在你键入或粘贴时实时更新。OpenAI 的计数是精确的，因为它运行的就是 OpenAI 发布的同一批分词器 —— GPT-4o、GPT-4.1 和 o 系列用 o200k_base，GPT-3.5 Turbo 和 GPT-4 用 cl100k_base。Claude 用一个子词分词器（o200k_base）估算，Gemini 按大约每 token 四个字符估算 —— Anthropic 和 Google 没有公开浏览器分词器，所以对当前模型而言两者都是近似的，并已清楚标注。除了 token，你还能得到字符数、词数以及每字符 token 比，这对于守住上下文窗口或估算提示词成本很方便。一切都在你的浏览器本地完成分词，因此你粘贴的提示词在你的设备上处理，绝不离开它。

功能特性

通过 o200k_base（GPT-4o、GPT-4.1、o 系列）和 cl100k_base（GPT-3.5 Turbo、GPT-4）给出精确的 OpenAI token 计数
使用子词分词器给出近似的 Claude 计数，并清楚标注
按约每 token 四个字符给出近似的 Gemini 估算
在你键入或粘贴时实时重新计数，没有「运行」按钮
同时显示字符数、词数以及每字符 token 比
「精确」与「近似」徽章，让你知道该信任哪些计数
一键复制所有计数的摘要，用于笔记或工单
完全在你的浏览器中运行，不上传提示词

如何使用 Token 计数器

将你的提示词粘贴或键入到文本框中。
读取 OpenAI o200k、OpenAI cl100k、Claude 和 Gemini 的实时 token 计数。
查看「exact」和「approx」徽章，了解哪些计数是精确的。
用字符数、词数和每字符 token 这些统计来衡量上下文占用。
点击「复制摘要」一次性获取所有计数。

示例

输入

Summarize this article in three bullet points.

输出

OpenAI o200k: 10 tokens (exact)
OpenAI cl100k: 10 tokens (exact)
Claude: 10 tokens (approx)
Gemini: 12 tokens (approx)

OpenAI 的计数是精确的；Claude 和 Gemini 是近似估算。

常见错误与故障排除

Claude 的计数与我的 Anthropic 控制台用量不完全一致。 — 请把 Claude 的计数当作近似值。Anthropic 没有发布浏览器分词器，所以本工具用一个子词分词器估算 Claude；请在你的 Anthropic 控制台中确认精确用量。
Gemini 的数字看起来比其他的更粗略。 — Google 没有公开浏览器分词器，所以 Gemini 按大约每 token 四个字符估算。请把它当作一个大致数，在精度要紧时用 Google 的 count-tokens 接口核实。
对于同一段文本，OpenAI o200k 和 cl100k 显示出不同的计数。 — 这是预期的。GPT-4o 和 o 系列使用 o200k_base，而 GPT-3.5 Turbo 和 GPT-4 使用 cl100k_base，这两个编码器对文本的切分方式不同。请读取你所针对的模型家族的计数。
一篇很长的文档重新计数时感觉很慢。 — 在每次按键时对大段文本分词都很吃重。计数器仅在文本变化时重新计算；对于超大输入，如果你的浏览器卡顿，可分块粘贴。

常见问题

OpenAI 的 token 计数是精确的吗？: 是的。计数器使用 OpenAI 发布的同一批字节对（BPE）分词器 —— GPT-4o、GPT-4.1 和 o 系列用 o200k_base，GPT-3.5 Turbo 和 GPT-4 用 cl100k_base —— 因此这些计数与 OpenAI API 的计费相符。
为什么 Claude 和 Gemini 的计数被标为近似？: 当前的 Claude 和 Gemini 模型在提供商的服务器上分词，并不暴露精确的浏览器分词器。Claude 用一个子词分词器估算，Gemini 用约每 token 四个字符的启发式，所以两者都标为 approx。
o200k 和 cl100k 的 token 有什么区别？: 它们是两种 OpenAI 编码。o200k_base 用于 GPT-4o、GPT-4.1 和 o 系列；cl100k_base 用于 GPT-3.5 Turbo 和 GPT-4。它们对同一段文本的切分略有不同，这就是计数会有差异的原因。
一个 token 里有多少个字符？: 对于英文文本，平均大约每 token 四个字符，但它会随标点、空白、代码和其他语言而变化。每字符 token 这一统计会显示你确切输入的真实比值。
我的提示词会被发送到 OpenAI、Anthropic 或 Google 吗？: 不会。所有分词都使用打包的分词器在你的浏览器本地运行，因此你粘贴的文本在你的设备上处理，绝不会上传到任何模型提供商或 ArrayKit。