官方定名!Token标准中文译名确定为“词元”,我国日均调用量已超140万亿
国家数据局在官方公告中,首次将AI领域核心术语Token的标准中文译名定为词元,这标志着该术语在国内人工智能领域正式确立统一规范,结束此前行业内译名不统一的局面。
日均词元调用量暴涨,中国AI进入快速增长期
3月24日,国家数据局局长刘烈宏在国新办新闻发布会上公布重磅数据:截至2026年3月,我国日均词元(Token)调用量已突破140万亿。对比过往数据,这一数值相较2024年初的1000亿,实现了超1000倍的跨越式增长;相较2025年底的100万亿,短短三个月内再度增长40%以上。
刘烈宏表示,日均词元调用量的大幅攀升,充分印证我国人工智能发展已迈入快速增长阶段。当前AI应用场景持续深化,从基础对话向可决策、可执行的智能体升级,我国AI产业竞争力显著增强,备受行业关注的词元出海,正是产业竞争力提升的核心标志之一。
“词元”译名全面普及,多方权威平台统一使用
早在2026年1月,《人民日报》就发布《漫谈词元》科普文章,将Token定义为“处理文本的最小数据单元”,率先推广“词元”这一译法。此后,苹果中国官网、央视新闻、中国计算机学会(CCF)等各类权威平台及技术文档,均统一采用“词元”作为Token的标准译名,此次国家数据局正式官宣,进一步确立了其官方地位。
一文读懂词元:AI时代的核心度量单位
通俗来讲,词元是AI大模型为高效处理数据,拆分后的最小信息载体,可以理解为单个汉字、词语片段、标点符号等。例如“我爱中国!”这句话,可被拆分为“我”“爱”“中国”“!”4个词元。
如果说互联网时代,信息传输的核心度量指标是流量,那么人工智能时代,词元就是核心度量指标。用户输入的每一段文字、AI生成的每一段话、识别的每一幅图像,都会消耗词元,词元调用量也成为衡量AI产业活跃度的关键数据。
暂无评论...












