词元(Token)十问

AI视界 |  2026-04-21 16:44:10

微信扫码扫码下载客户端

1.什么是Token?

Token是AI模型处理文本的最小计算单元。

它不等同于汉字或单词:“你好”可能是一个Token,“ChatGPT”可能拆成“Chat”和“GPT”两个Token。

标点符号也算Token。模型先把句子拆成Token,再逐个运算。

在这个运算过程,模型会通过查表将Token转为“向量”,即一个固定长度的浮点数数组,进行计算。

2.普通人如何估算Token数量?

粗略换算:1个汉字约等于1.5-2个Token,1个英文单词约1-2个Token。

不同模型分词方式略有差异,以官方文档为准。

日常使用中,一段200字的短问题+300字的回答,大约消耗1000-1500 Token。

3.AI的输入输出都消耗Token吗?

是的。

模型读懂你输入的问题,需要把输入内容拆成Token并计算,同样消耗Token资源。

模型帮你生成内容,也消耗Token资源。

最终你用模型的账单 = 输入Token数×输入单价 + 输出Token数×输出单价。

4.为什么智能体会消耗更多Token?

小龙虾(OpenClaw)等智能体会把你布置的一个简单问题拆成多轮“思考-行动-反馈”的循环。

每轮都要发起新请求(输入+输出),还要携带历史对话、工具(skill)返回结果等长上下文,甚至试错重试。

总Token量可能是单次问答的5-10倍。

5.调用Skills(工具)也耗Token吗?

会,而且通常更耗费。

调用Skills过程包括:模型输出调用指令(输出Token)→ 系统返回结果作为新输入(输入Token)→ 模型生成最终回答(输出Token)。

一次工具调用,三个环节都要消耗Token。

6.Token和算力什么关系?

Token数 × 模型参数量 ≈ 算力消耗。

因为,每个Token都要“过一遍”整个神经网络,1个Token对应一次完整计算。

所以算力成本 ∝ 参数量 × Token数。

7.Token的本质是什么?

Token是计算模型工作量的计量单位。

打个比方,如果知识是模型参数里的库存,思考是推理过程,那么Token就是用来对模型工作量进行记账的“工时单”——每处理一个词元(Token),记一次费。

8.Token经济的逻辑是什么?

把AI模型计算转化为类似水电煤的公用事业计价:

模型成本几乎正比于处理Token总数,所以按Token收费就是按成本收费。

不同模型单价不同(参数越大,单价越贵),但Token让开发者有了统一“计件”和计价的标准,形成了AI模型的盈利模式。

9.输出Token比输入Token更贵吗?

许多模型的输出单价略高于输入,因为生成每个输出Token时,模型需要做自回归计算(依赖之前所有Token),无法完全并行。但两者计算量在同一量级。

10.按Token计费会激励模型故意啰嗦吗?

理论上存在这种激励,但现实中被竞争和设计避免了:

用户会跑向更简洁的模型;模型训练(RLHF)时,啰嗦的回答会被打低分;模型本身并没有“赚钱意识”。

市场最终奖励效率高的模型。

总之,Token是AI世界里的“燃油”,每一滴(每一次计算)都按量计价,驱动着模型的理解与生成。

责任编辑:赵夏晔