来源:新华社
近期,随着人工智能(AI)技术的快速迭代与产业化加速,词元(Token)作为大模型处理信息的基本单位,成为公众日益熟知、高度关注的热词。
我们每使用一次AI大模型,都要消耗一定数量的词元,一次复杂的智能体任务可能要消耗数万个词元。小小的词元,如何撬动AI大产业?当前还存在哪些挑战、短板?“新华视点”记者进行了调查。
调用量两年间增长超千倍
“今天北京的天气如何?”“能帮我生成一个AI短剧吗”“我要去演讲,帮我做一份PPT”……如今,在工作生活中遇到问题,找大模型助手“AI一下”越来越常见。
这些AI应用的背后,都离不开词元。深圳行胜数字技术有限公司CEO郝放表示,词元是信息时代和AI时代的分水岭,信息时代的度量单位是字节,AI时代的度量单位是词元。
深圳云天励飞技术股份有限公司董事长兼CEO陈宁表示,词元是数字化的价值载体,可计量、定价、交易,是智能时代的价值锚点和连接技术供给与商业需求的结算单位。一个词元约等于0.75个英文单词,背后对应着真实的算力、电力和基础设施成本。
词元正串联起新的经济链条。如上游GPU(图形处理器)芯片、AI服务器等为词元提供算力支持,中游云服务商、大模型厂商负责词元的工业化生产、分销与商业化运营,下游AI智能体、企业级应用等是词元消耗的最终场景。
在广东韶关,一个个数据中心日夜不停处理着大湾区的算力请求,有了这些算力,词元才能源源不断产生。而在下游的深圳华强北,玩具、眼镜、乐器等普通硬件产品,加载AI智能体、有了“新大脑”后,便成为词元的消耗载体。
来自国家数据局的数据表示,我国日均词元调用量从2024年初的1000亿跃升至2026年3月的140万亿以上,两年间增长超千倍。第三方机构预测,到2030年中国AI推理词元消耗量将增长超300倍。
中国(深圳)综合开发研究院通证数字经济研究中心主任李恩汉说,工厂、港口、跨境电商、金融、物流等高频场景有海量的词元调用需求。当把AI嵌入生产、运营和服务流程,把问答工具升级成真正能“跑业务”的智能体,词元就能变成实实在在的产值和税收。
今年初,以“龙虾”为代表的AI智能体爆火,推动词元调用量激增。不少海外用户调用中国大模型API(应用程序编程接口),在中国完成推理运算,结果回传境外,“电力未出境,但价值跨境交付”。部分中国大模型收入爆发式增长,20天的累计收入已超过2025年全年总收入。

发表评论 取消回复