词元（Token）十问

AI视界 | 2026-04-21 16:44:10

微信扫码扫码下载客户端

1.什么是Token？

Token是AI模型处理文本的最小计算单元。

它不等同于汉字或单词：“你好”可能是一个Token，“ChatGPT”可能拆成“Chat”和“GPT”两个Token。

标点符号也算Token。模型先把句子拆成Token，再逐个运算。

在这个运算过程，模型会通过查表将Token转为“向量”，即一个固定长度的浮点数数组，进行计算。

2.普通人如何估算Token数量？

粗略换算：1个汉字约等于1.5-2个Token，1个英文单词约1-2个Token。

不同模型分词方式略有差异，以官方文档为准。

日常使用中，一段200字的短问题+300字的回答，大约消耗1000-1500 Token。

3.AI的输入输出都消耗Token吗？

是的。

模型读懂你输入的问题，需要把输入内容拆成Token并计算，同样消耗Token资源。

模型帮你生成内容，也消耗Token资源。

最终你用模型的账单 = 输入Token数×输入单价 + 输出Token数×输出单价。

4.为什么智能体会消耗更多Token？

小龙虾（OpenClaw）等智能体会把你布置的一个简单问题拆成多轮“思考-行动-反馈”的循环。

每轮都要发起新请求（输入+输出），还要携带历史对话、工具（skill）返回结果等长上下文，甚至试错重试。

总Token量可能是单次问答的5-10倍。

5.调用Skills（工具）也耗Token吗？

会，而且通常更耗费。

调用Skills过程包括：模型输出调用指令（输出Token）→ 系统返回结果作为新输入（输入Token）→ 模型生成最终回答（输出Token）。

一次工具调用，三个环节都要消耗Token。

6.Token和算力什么关系？

Token数 × 模型参数量 ≈ 算力消耗。

因为，每个Token都要“过一遍”整个神经网络，1个Token对应一次完整计算。

所以算力成本 ∝ 参数量 × Token数。

7.Token的本质是什么？

Token是计算模型工作量的计量单位。

打个比方，如果知识是模型参数里的库存，思考是推理过程，那么Token就是用来对模型工作量进行记账的“工时单”——每处理一个词元（Token），记一次费。

8.Token经济的逻辑是什么？

把AI模型计算转化为类似水电煤的公用事业计价：

模型成本几乎正比于处理Token总数，所以按Token收费就是按成本收费。

不同模型单价不同（参数越大，单价越贵），但Token让开发者有了统一“计件”和计价的标准，形成了AI模型的盈利模式。

9.输出Token比输入Token更贵吗？

许多模型的输出单价略高于输入，因为生成每个输出Token时，模型需要做自回归计算（依赖之前所有Token），无法完全并行。但两者计算量在同一量级。

10.按Token计费会激励模型故意啰嗦吗？

理论上存在这种激励，但现实中被竞争和设计避免了：

用户会跑向更简洁的模型；模型训练（RLHF）时，啰嗦的回答会被打低分；模型本身并没有“赚钱意识”。

市场最终奖励效率高的模型。

总之，Token是AI世界里的“燃油”，每一滴（每一次计算）都按量计价，驱动着模型的理解与生成。

责任编辑：赵夏晔