从“Token”到“词元”,意味几何
齐鲁晚报·齐鲁壹点客户端 刘宗智 2026-03-25 18:04:46原创
3月23日,一个生僻的中文词汇“词元”突然闯入公众视野。在国家数据局局长刘烈宏的论坛发言中,它被正式确认为英文“Token”的中文译名。
从互联网时代的“流量”“端口”,到移动互联网时代的“扫码”“算法”,再到智能时代的“算力”“词元”,每一个标志性词汇的诞生与定名,都不只是语言的自然更迭,更是一段技术如何嵌入日常、重塑社会的微缩史。
“词元”成为Token的中文翻译
日前落幕的中国发展高层论坛2026年年会上,国家数据局局长刘烈宏表示,Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能。一个舶来的技术概念,由此终于穿上了合身的中文“外衣”。
AI生成·新闻配图
词元(Token)是大模型处理信息的最小信息单元,具有智能时代可计量、可定价、可交易的特征。在“词元”之前,“Token”在不同领域有着截然不同的译名。区块链世界里,它叫“代币”,强调其金融属性和交换价值;在计算机系统里,它叫“令牌”,指向其授权和验证功能。而在大模型语境下,最终胜出的是“词元”,一个更强调信息单元属性的译名。
为什么是“词元”,而不是此前民间流传的“令牌”或“代币”?拆解这两个字,或许能窥见其中的文化逻辑。“词”指向语言的基本单位,朴素而准确;“元”则带有中国传统文化特有的哲学意味。《易经》开篇便言“‘元’者,善之长也”,“元”指向根本、起始。两个字组合在一起,既交代了技术内涵,又赋予了这个冷冰冰的技术词汇以文化温度。
这种命名方式并非孤例。20世纪20年代,“Telephone”进入中国时,曾有过“德律风”“电话”等多种译名并存。“德律风”是音译,带着洋气;“电话”是意译,透着亲切。最终“电话”胜出,因为它更符合汉语的构词习惯,也更贴合大众的认知,隔着“电”也能“说话”,简单明了。“Laser”被译为“激光”,用“激”字传达出光能的聚集与释放,比“镭射”多了几分汉语的灵动;“Computer”被译为“电脑”,用“脑”字将机器的计算功能与人类最核心的器官相类比,让抽象的技术变得可感可知。
每一个成功本土化的科技词汇,都经历了一次文化翻译的过程。它们用中国人熟悉的字眼,承载陌生的技术概念,让舶来的知识在中文语境里扎下根。今天,“词元”也加入了这一行列。
更精细、更量化的智能时代
每一个时代的标志性词语,都是技术变革与社会变迁的忠实记录者。比如,互联网时代,“流量”从一个物理学概念,变成了衡量注意力的单位。人们开始说“流量明星”“流量变现”,一个与水有关的词,被用来描述信息的流动与注意力的汇聚。“端口”也从硬件的接口,引申为人与世界的连接点。这些词语的流行,对应着信息从稀缺到泛滥、连接从有限到无限的转变。
“扫码”将一个简单的动作变成了时代的符号。人们不再需要钱包和证件,只需要一个二维码。“算法”从数学概念,变成了左右人们能看到什么、不能看到什么的隐形之手。这两个词的普及,记录着技术如何从电脑屏幕走向街头巷尾,如何渗透到日常生活的每一个角落。
而今天,我们迎来了“算力”和“词元”。“算力”将计算能力类比为电力般的公共资源,暗示着智能正在成为像水、电一样的基础设施。“词元”则将语言、思维、创意这些人类特有的活动,拆解为可定价、可交易的最小单元。
这背后的文化变迁同样耐人寻味。关于“流量”,我们关心的是“有多少人看到”;关于“词元”,我们关心的是“机器理解了多少”。从注意力经济到智能经济,衡量价值的标尺正在发生根本性的位移。
这些词汇也记录着人与技术关系的变化。“流量”是人对信息的消费,“算法”是技术对人的引导,而“词元”则是人与机器的共同语言,每一次人机交互,都在消耗和生成词元。当“词元”成为日常词汇,意味着我们与AI的关系,已经从“使用工具”变成了“共同创作”。
大众新闻·齐鲁壹点记者 刘宗智
责任编辑:刘宗智
