日前,国家数据局明确将人工智能(AI)领域的Token定名为“词元”。所谓词元,是人工智能大模型处理信息的最小单元。它可以是一个汉字、一个标点,抑或是一个词汇片段。用户向AI的每一次提问、AI生成的每一段内容、识别的每一幅图像,本质都是词元的调用与运算。作为智能交互的基础“原子”,词元的数量规模、流转速度、使用成本,直接决定着人工智能产业的运行效率与发展高度,也成为衡量一国智能经济活跃度与竞争力的重要标尺。
今年以来,“龙虾”等智能体的爆发,带动词元消耗量显著增长。数据显示,2024年初,我国日均词元调用量为1000亿;到2025年底,跃升至100万亿;到今年3月,已突破140万亿,两年增长超过1000倍。日均超140万亿的词元调用量,相当于1000万亿个中文词汇,也相当于250个中国国家图书馆的资源量,不仅印证着词元已成为智能时代的基础资源,更标志着以词元为核心的价值体系与商业逻辑正在形成。
长期以来,AI服务面临难结算的困境。算力成本高昂,模型调用难以量化,用户往往需要为整体服务支付固定费用,导致供需双方都难以找到精准的价值锚点。无论是面向个人的智能问答、内容生成,还是面向企业的行业解决方案、定制化模型服务,都因计价模糊、成本不透明,制约了市场规模的进一步扩大。词元作为一种可计量、可定价、可交易的最小计算单位,让AI服务拥有了清晰的“结算货币”。就像我们按流量付费使用网络、按度数缴纳电费一样,未来企业可以按实际消耗的词元数向用户收费,用户也可以根据自身需求灵活选择服务规模,不再为冗余能力买单。词元计价打破了AI服务“高门槛、高成本、难普及”的限制,让中小企业乃至个人开发者都能以低成本接入智能服务,依托海量词元资源开展创新应用,推动人工智能从少数科技企业的“专属工具”转变为全社会共享的公共资源。词元与AI芯片、AI数据中心深度绑定,随着词元调用量激增,算力租赁、内容分发网络等领域需求也将大幅增长。词元串联起模型研发、算力支撑、场景应用,让智能产业形成良性循环,真正实现从技术到价值的跨越。
从更深层次来看,140万亿词元调用量,是人工智能与实体经济深度融合的生动注脚。以往,人工智能更多停留在实验室或科研场景,更多体现为技术层面的探索。而如今,词元的海量调用,广泛分布在工业制造、现代农业、金融服务、医疗健康、教育科研、城市治理等千行百业。在工厂车间,智能质检、设备运维、生产调度依靠高频词元调用实现精准决策,大幅提升生产效率、降低不良率;在田间地头,AI通过分析气象、土壤、作物数据生成的词元指令,指导精准播种、水肥管理,助力粮食稳产增收;在政务服务领域,智能客服、政策解读、流程审批依托词元运算实现“秒批秒办”,让数字政务更高效、更便民。每一次词元调用,都是智能技术对传统场景的改造与赋能;每一份词元消耗,都在转化为产业升级、民生改善的实际效能。海量词元在实体经济场景中的持续流转,也将拓宽人工智能的应用边界,让新质生产力有了具体可感的落地载体,推动数字技术与实体经济从浅层结合走向深度交融。
海量词元调用量的背后,是我国在政策、算力、电力等多维度形成的全链条创新优势的集中体现,是国家战略布局下智能经济发展的必然结果。在政策层面,今年政府工作报告首次将“算电协同”列为新基建工程,依托我国超前的绿电优势,将新能源与算力产业、人工智能产业深度耦合,为词元的海量调用提供了稳定且低成本的能源支撑;《中华人民共和国国民经济和社会发展第十五个五年规划纲要》对“人工智能+”行动的全面部署、对数据要素市场化配置改革的纵深推进,更让数据、算力、算法的协同供给有了明确的战略导向。在算力布局层面,“东数西算”工程持续落地,西部算力枢纽与东部数据需求高效联动,让算力资源得到优化配置,从基础设施层面放大了词元生产的效率优势。在数据基础层面,截至2025年底我国已建成高质量数据集超10万个,规模超890PB,为词元生成筑牢了数据根基。在技术创新层面,国产推理芯片、模型架构与系统优化的持续突破,不仅让相同的AI需求能够以更少的算力、更短的时延完成运算,更在深层次上改变了词元的成本结构。
正是凭借这些保障优势,我国正在全球智能经济竞争中形成不可替代的独特优势。以往,全球AI产业竞争多聚焦于模型参数规模、技术论文数量,而词元作为通用计量单位的出现,让竞争焦点转向应用规模、成本优势与产业生态。数据表明,我国AI大模型周调用量已连续多周领跑全球,国产大模型包揽全球调用量前四席位,而国产词元价格仅为海外同类产品的十几分之一。随着词元逐渐成为全球智能经济的通用计量单位,我国依托海量应用场景、规模化供给能力和显著成本优势,让“中国词元”成为全球人工智能产业链中不可或缺的基础资源,也在无形中带动了以清洁能源为底色的算力电力协同出海。越来越多的国家开始选择接入中国智能服务体系,依托低成本、高效率的词元资源推进本国数字化转型。这不仅提升了我国在全球AI产业链中的话语权,更推动全球智能经济朝着普惠、均衡、绿色的方向发展,打破少数国家对核心技术与资源的垄断格局。
词元爆发式增长的同时,也对数据安全、隐私保护与治理体系提出了全新考验。海量词元流转背后,是海量用户数据、行业信息、国家关键数据的处理与传输。如何在保障词元高效流通的同时,守住数据安全底线、保护个人隐私权益,成为智能经济健康发展的重要前提。随着词元调用量持续攀升,数据泄露、算法滥用、虚假信息生成等风险随之放大,要求我们加快构建与之相适应的治理体系。要完善数据安全、人工智能监管相关法律法规,明确词元生成、流转、交易中的权责边界,严厉打击利用AI开展的违法违规行为。推动技术赋能治理,研发数据脱敏、隐私计算、溯源追踪等技术工具,实现对词元全生命周期的安全管控。唯有安全和发展同步推进、监管和创新协同发力,才能让海量词元在规范有序的轨道上释放更大价值,避免规模扩张带来的治理失序风险。
同时,还要清醒认识到,词元调用量更多反映的是AI应用规模与使用热度,并不完全等同于原始创新能力。当前,我国人工智能产业在基础理论、核心算法、高端芯片等领域仍存在短板,词元规模优势尚未完全转化为技术创新优势。只有在大规模真实应用中发现问题、提炼需求、补齐短板,才能持续优化产品、推动技术突破。未来既要依托庞大应用场景与完整产业基础,把生成式AI做深做透,也要加快布局具身智能、人机协同等前沿方向,让人工智能从“能说会写”真正走向“能干活、能赋能、能创造”,在推动新质生产力发展、服务经济社会高质量发展中发挥更大作用。
责任编辑:张少义





