词元用量两年激增千倍,AI云市场进入提价与双强格局新周期
引言:词元作为AI云价值锚点,引爆市场增长数据
在智能时代,任何一项颠覆性技术的规模化应用,都必须找到其可量化、可交易的商业价值单元。国家数据局相关负责人近期在公开论坛上的阐述,精准地揭示了这一核心逻辑:Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”。这一论断,为理解当前如火如荼的AI云市场提供了一个根本性的视角。它意味着,如同电力时代的“千瓦时”、互联网时代的“点击量”或“月活用户”,词元正成为衡量和结算人工智能计算服务消耗与产出的标准度量衡,使得从前模糊不清的AI能力输出,得以被精确计量、定价和交易,从而为整个产业的商业化落地铺平了道路。
词元作为价值锚点的确立,其威力在近两年的市场增长数据中得到了爆炸性的印证。根据公开数据,中国日均词元调用量在2024年初仅为1000亿。然而,这一数字在随后两年里呈现了令人瞠目的指数级跃升:至2025年底,已跃升至100万亿;而到2026年3月,更是突破了140万亿。这意味着,在短短两年多的时间里,市场对AI计算服务的需求规模增长了超过一千倍。这组数据并非孤立的增长曲线,其背后直接映射了AI模型训练与推理需求的井喷,以及基于词元计费的新型商业逻辑的全面加速演进。一个更具冲击力的事实是,有模型企业在2026年1月底以来的20天内,创下了收入超越2025年全年总收入的业绩纪录。这清晰地表明,以词元为结算单位的商业模式,不仅可行,而且正在催生前所未有的商业价值释放速度。
这一由词元驱动的市场爆发,其宏观背景是中国AI云市场的整体性快速扩张。据IDC测算,该市场在2024年的规模约为150亿元,并预计将以72%的复合年均增长率持续高速增长,至2029年规模将增至2180亿元。更为关键的是市场结构的深刻变化:在IaaS(基础设施即服务)与PaaS(平台即服务)构成的云服务市场中,生成式AI的占比预计将从2024年的6%大幅提升至2029年的39%。这一结构性变迁,与词元调用量的千倍增长相互印证,共同指向一个结论:生成式AI的推理与应用正从边缘走向核心,成为驱动整个云市场增长的最主要引擎。词元,作为这场变革中最基础的“流通货币”,其调用量的激增既是市场爆发的直接结果,也是推动整个产业从技术探索迈向大规模商业化应用的核心动力。
作为从业者,我观察到,技术史上的每一次重大产业升级,都伴随着一个关键度量标准的统一和普及。词元在AI云领域的角色,与此类似。它使得复杂的模型能力得以被标准化“切片”和交付,降低了企业使用的门槛和评估成本,从而极大地加速了AI技术的渗透。当前140万亿的日均调用量,不仅是一个惊人的数字,更是一个强烈的信号:基于词元结算的AI云服务,其市场基础已经夯实,商业飞轮开始高速旋转。这为后续讨论市场竞争格局、定价策略与利润率变化,奠定了无可辩驳的客观事实基础。
词元用量激增的驱动因素:从训练到推理的需求转变
日均140万亿词元调用量的惊人数字,其背后是驱动力的结构性变迁。这一变迁并非一蹴而就,而是遵循着技术产业化的普遍规律:从早期的研发投入主导,逐步过渡到大规模商业应用驱动。摩根斯坦利发布的研报明确指出,词元需求在训练与推理双重驱动下快速增长,而推理需求将成为未来增长最主要的驱动力。这一判断精准地揭示了当前市场动能转换的核心逻辑。
在产业发展初期,词元消耗的主要驱动力无疑是模型训练。从2024年初日均1000亿词元的起点开始,市场经历了大规模的基础模型研发、迭代与优化浪潮。这一时期,词元调用量的增长主要反映了科技巨头和创业公司为构建和打磨AI“大脑”所进行的巨额资本与技术投入。这类似于数据库领域早期,企业需要投入大量资源进行数据仓库的架构设计与ETL流程开发,为后续的数据分析应用奠定基础。然而,训练本身是一次性的或周期性的高成本投入,其产生的词元消耗虽然巨大,但增长曲线可能相对陡峭而后趋于平缓。真正的爆发式、可持续的增长,必须依赖于模型走出实验室,进入千行百业的实际生产环境,即推理阶段。
推理需求的崛起,标志着AI技术从“能力建设期”迈入“价值释放期”。当模型训练成熟后,将其应用于具体的业务场景——如智能内容生成、实时对话客服、代码辅助编程、图像识别与处理等——所产生的每一次用户交互、每一次任务执行,都在持续消耗词元。这种消耗是高频、海量且与商业活动直接绑定的。摩根斯坦利的观点得到了市场数据的强力印证:模型企业在2026年1月底创下的“20天收入超越2025年全年总收入”的业绩纪录,其本质正是推理服务大规模商业化落地的直接体现。以词元作为“结算单位”的新型商业模式,将AI能力变成了可精确计量、按需付费的标准化商品,极大地降低了企业使用门槛,从而引爆了推理侧的需求。这种转变,使得词元调用量从反映“研发热度”的指标,转变为衡量“经济活性”的晴雨表。
我们可以从以下几个层面来理解推理需求成为主驱动力的深层含义及其影响:
| 驱动层面 | 具体表现与影响 | 对应素材依据 |
|---|---|---|
| 商业逻辑闭环 | 词元计费使AI服务成为可量化、可结算的标准商品,加速了从技术到收入的转化。模型企业收入的飙升案例,证明了该商业模式的可行性。 | “以Token计费为基础的新型商业逻辑正在加速演进”;“20天收入超越2025年全年总收入的业绩纪录” |
| 市场结构变化 | 推理工作负载的持续性和规模化,支撑了AI云市场的长期高增长预期(IDC预测2024-2029年CAGR达72%),并推动生成式AI在云服务中的占比从6%提升至39%。 | “预计2029年规模增至2180亿元,对应复合年均增长率为72%”;“生成式AI的占比将由2024年的6%提升至2029年底的39%” |
| 产业利润导向 | 相比训练,推理业务有望带来更高利润率。原因在于其具备更优的定价机制、更多的增值服务捆绑可能性,以及通过软件与架构创新、资源配置优化(如批处理)来提升词元生成效率和资源利用率。 | “推理业务有望带来更高利润率,原因包括更优的定价机制及更多的增值服务捆绑,软件与架构创新推动词元生成效率提升,更优的资源配置(如批处理)提升利用率” |
作为从业者,我观察到这种从训练到推理的转变,与软件服务(SaaS)的演进历史有异曲同工之妙。早期企业需要购买昂贵的服务器和数据库软件进行部署(类似训练投入),而云服务的普及使得企业可以按需调用API服务(类似推理消费),从而极大地扩展了市场边界。当前,推理需求的爆发正在重塑AI云的竞争要素:它要求云厂商不仅要有充足的芯片产能(供给保障),更需要具备全栈解决方案能力和深厚的服务经验,以解决客户在复杂业务场景中的实际需求。这也正是摩根士丹利所分析的,阿里巴巴、字节跳动等厂商凭借综合实力形成双强格局的背景所在。推理,已成为AI云战场的主旋律,其消耗的每一个词元,都是AI技术创造真实商业价值的刻度。

AI云市场进入提价周期:全球趋势与利润率影响
当AI推理的规模化需求成为常态,一个深刻影响产业格局的商业信号随之浮现:价格。摩根士丹利在2026年3月25日发布的研报明确指出,中国AI云市场正进入20年来的首个提价周期。这一判断并非孤立,而是全球趋势的映射。全球超大规模云厂商(GCP、AWS)已率先上调云服务价格,其中AWS于2026年将机器学习相关价格上调15%。这一系列动作标志着,由AI算力需求激增和供应链成本上升共同驱动的价格拐点已经确立,云服务从过去长期的“降本增效”竞争,转向了价值回归与利润修复的新阶段。
提价周期的开启,为云厂商带来了久违的利润率扩张机会。根据摩根士丹利的估算,在其他条件不变的假设下,每1%的价格上调,或可带来约1个百分点的利润率提升,或使EBITA预测上调11%。这背后是一套清晰的商业逻辑:当Token调用量从2024年初的日均1000亿激增至2026年3月的140万亿,增长超千倍时,支撑这一庞大规模的基础设施成本(尤其是高端GPU芯片)已成为沉重的资本开支。提价成为消化成本压力、将技术投入转化为财务回报的直接手段。更重要的是,与传统的通用计算服务不同,AI云服务,特别是推理服务,因其与客户业务深度绑定、能直接创造价值,具备了更强的定价能力和增值服务捆绑空间,这为利润率改善提供了结构性支撑。
然而,提价并非一个简单的单向操作,其背后是复杂的成本与市场竞争力平衡。摩根士丹利的研报也同时指出,需要密切观察成本涨价因素。芯片等核心硬件的供需紧张和价格上涨,会直接侵蚀提价带来的利润空间。此外,市场竞争格局是另一重关键变量。报告特别提到,需要关注字节跳动在AI云定价上的竞争定价策略。在阿里巴巴与字节跳动形成的双强格局下,任何一方的激进定价策略都可能影响整个市场的提价节奏和幅度。因此,中国本土云厂商的提价进程,将是一个在“全球成本压力传导”、“自身利润率诉求”与“国内市场激烈竞争”三者间寻求动态平衡的谨慎过程。
| 关键因素 | 对提价周期的影响 | 备注 |
|---|---|---|
| 全球趋势 | 正向驱动。AWS、GCP已率先提价,为中国市场提供参照和传导压力。 | AWS于2026年将机器学习相关价格上调15%。 |
| 利润率潜力 | 正向驱动。每1%价格上调或带来约1个百分点利润率提升。 | 基于其他条件不变的假设,EBITA预测可能上调11%。 |
| 成本压力 | 制约因素。芯片等供应链成本上涨,可能抵消部分提价收益。 | 需与提价效应综合权衡。 |
| 市场竞争 | 核心变量。双强格局下,竞争者的定价策略将直接影响提价的实际落地。 | 需密切观察字节跳动等厂商的策略。 |
从技术演进的视角看,提价周期的可持续性,最终取决于云厂商能否通过技术创新实现“增效”来对冲“涨价”带来的客户成本感知。例如,自研ASIC芯片有助于降低基础设施资本开支,并与自研模型协同优化模型算力利用率(MFU)及词元生成效率;软件与架构创新也能推动词元生成效率提升。这意味着,未来的AI云市场,价格战将让位于“价值战”——厂商提供的将不再仅仅是裸算力,而是包含优化效率、降低总体拥有成本(TCO)的全栈解决方案能力。因此,当前开启的提价周期,实质上是AI云产业从粗放式资源投入走向精细化商业运营、从技术驱动迈向技术与商业双轮驱动的一个重要里程碑。它考验的不仅是厂商的定价勇气,更是其通过技术深度构筑成本护城河和产品差异化的长期能力。
竞争格局演变:双强形成与关键决胜因素
当AI云市场从“跑马圈地”的价格战阶段,迈入以价值和服务为核心的“提价周期”时,竞争的核心逻辑也随之发生了根本性转变。价格弹性的提升,意味着客户愿意为更确定、更高效、更可靠的AI能力支付溢价,这直接考验着云厂商的综合实力。摩根士丹利的研报明确指出,决定AI云竞争胜负的三大关键因素包括:总体芯片产能、全栈解决方案能力、服务能力。而在这三项能力的综合评估下,一个清晰的“双强”格局正在形成:阿里巴巴与字节跳动凭借其深厚的积累和前瞻布局,正在拉开与其他竞争者的身位。
这种格局的形成并非偶然,而是由AI云产业的重资产、高技术壁垒和强生态依赖特性所决定的。我们可以从摩根士丹利所提的三大关键因素进行拆解分析:
| 关键竞争因素 | 核心内涵 | 对竞争格局的影响 |
|---|---|---|
| 总体芯片产能 | 获取和部署先进AI芯片(如GPU)及自研ASIC的能力、投资规模及与上游供应商的关系。 | 这是决定算力供给规模与成本的基石,是参与竞争的“入场券”。鉴于其巨大的投资规模及与核心供应商的紧密关系,阿里巴巴、字节跳动和腾讯被指出具备明显优势。 |
| 全栈解决方案能力 | 覆盖自研ASIC、基础大模型、多模态模型、模型即服务(MaaS)、应用层等五大关键产品类别的技术整合与协同能力。 | 这决定了厂商能否提供端到端的优化方案,最大化模型算力利用率(MFU)和词元生成效率,从而在性能和成本上建立优势。 |
| 服务能力 | 解决企业客户复杂、个性化需求的经验、可靠性与生态支持能力。 | 在AI从技术演示走向核心生产系统的过程中,稳定性、安全性和持续运维支持变得至关重要。传统云厂商凭借多年市场经验,在此方面被认为更具可靠性。 |
其中,芯片产能是当前最刚性的约束条件,也是头部厂商构建护城河的首要环节。日均词元调用量从2024年初的1000亿激增至2026年3月的140万亿,这种超千倍的增长对算力基础设施产生了海量且迫切的需求。谁能掌握更多、更先进的算力资源,谁就能在满足市场爆发性需求中占据先机。阿里巴巴、字节跳动等巨头凭借其雄厚的资本实力和与英伟达等芯片巨头的长期战略合作关系,在产能争夺战中占据了有利位置。更进一步,自研ASIC(如阿里巴巴的平头哥芯片)不仅是降低对通用GPU依赖、优化成本结构的关键,更是实现从硬件到模型深度协同优化、提升整体效率的战略武器。
然而,仅有算力“硬实力”并不足以确保胜利。AI云的竞争,本质上是“系统效率”的竞争。这就引向了第二个因素:全栈解决方案能力。从自研芯片、基础模型到上层应用的全栈掌控,意味着厂商可以在整个技术栈上进行垂直优化。例如,针对自研芯片架构特点专门优化的大模型,能够获得远高于通用硬件平台的算力利用率(MFU)和词元生成效率。这种软硬一体的协同效应,能够将原始的芯片算力转化为更高性价比、更低延迟的AI服务,这正是客户愿意为“提价”买单的核心价值所在。阿里巴巴与字节跳动均在自研芯片、大模型体系及应用生态上进行了全面布局,形成了从底层到顶层的闭环能力,这是其构筑差异化优势的关键。
最后,服务能力是将技术实力转化为商业成功的“临门一脚”。IDC的调研显示,超大规模云厂商仍是企业AI部署的首选,这反映出CIO对公有云部署意愿正在改善。这种意愿的背后,是对云厂商服务可靠性的信任。AI模型的训练与推理,尤其是涉及企业核心数据和业务流程时,其复杂性和稳定性要求远超传统的IT部署。传统云厂商在服务大型政企客户过程中积累的合规、安全、运维和集成经验,构成了显著的服务门槛。尽管新兴云厂商可能在某个技术点上表现突出,但在承接企业级全局性、复杂性的AI转型项目时,综合服务能力更强的阿里巴巴等厂商往往被视为更稳妥的选择。

作为从业者的观察: 中国AI云市场从“群雄逐鹿”到“双强引领”的格局演变,标志着行业进入了成熟期的新阶段。竞争的重点从单一模型的性能比拼,转向了涵盖算力产能、技术栈深度和生态服务厚度的综合体系较量。这类似于数据库领域从单一数据库产品竞争,发展到云原生、HTAP、AI融合的完整数据平台解决方案竞争。未来,阿里巴巴与字节跳动的“双强”格局可能进一步巩固,但竞争并未结束。竞争的焦点将深入至如何通过全栈优化持续降低“每Token成本”,以及如何在特定的行业场景中打造不可替代的解决方案能力。这场竞赛,是规模、技术与生态的马拉松,而不仅仅是短跑冲刺。
未来展望:市场规模预测与生成式AI占比提升
展望未来,中国AI云市场的增长轨迹已由权威数据勾勒出清晰的轮廓。根据IDC的测算,该市场将从2024年约150亿元的规模,以高达72%的复合年均增长率,扩张至2029年的2180亿元。这一预测不仅描绘了市场总量的飞跃,更揭示了其内部结构的深刻变革:生成式AI在IaaS+PaaS整体结构中的占比,将从2024年的6%显著提升至2029年的39%。这意味着,驱动市场增长的核心引擎正在从传统的、以资源消耗为主的云服务,加速转向以模型能力和创新应用为核心的生成式AI服务。这种结构性变化,是产业从技术探索迈向大规模商业化应用的关键标志,它将从根本上重塑云厂商的收入构成与利润模型。
生成式AI占比的急剧提升,是推动整个产业商业化和利润率改善的核心逻辑。这并非简单的业务叠加,而是一场从底层算力到上层商业模式的系统性升级。首先,生成式AI,尤其是其中的推理业务,被摩根士丹利研报视为未来最主要的增长驱动力。相较于训练阶段的一次性、集中式投入,推理是持续、分散的价值实现过程,其商业模式更成熟、现金流更稳定。更重要的是,推理业务有望带来更高利润率,原因在于其更优的定价机制、更多的增值服务捆绑可能性,以及通过软件与架构创新(如批处理优化)带来的词元生成效率提升和资源配置优化。其次,生成式AI占比的提升,倒逼云厂商加速技术栈的垂直整合。自研ASIC芯片、基础大模型与多模态模型,不仅是为了降低对通用GPU的依赖和基础设施资本开支,更是为了通过软硬件协同,极致优化模型算力利用率(MFU)与词元生成效率,从而在“每Token成本”的竞争中建立壁垒。因此,从6%到39%的跨越,本质上是产业价值重心从“提供算力资源”向“交付智能能力”的迁移,这为云厂商打开了利润率上行的空间。
然而,在词元调用量两年增长超千倍、市场规模向2180亿元迈进的高歌猛进中,行业也需冷静审视其面临的挑战与机遇,以维持可持续增长。首要挑战来自技术迭代的加速度。模型的快速演进要求底层算力架构、存储与网络必须保持同步甚至超前升级,任何技术代差都可能被迅速放大为市场竞争劣势。其次,监管环境将成为不可忽视的变量。随着AI深入经济社会各领域,数据安全、隐私保护、算法公平与内容治理等议题将催生更细致的合规要求,这要求云厂商不仅提供技术,还需构建可信、可控的服务能力。最后,全球竞争动态将更加复杂。一方面,全球超大规模云厂商(如AWS、GCP)因需求激增及供应链成本上升已率先提价,为中国市场提供了价格调整的参照系与潜在空间;但另一方面,国内市场双强格局下的竞争策略(如研报中提及需关注字节跳动的竞争定价策略)可能抑制整体的提价节奏。机遇则蕴藏于交叉融合之中。AI与云原生、数据库、行业知识图谱的深度融合,将催生出更高效、更易用、更贴近场景的解决方案,这正是决定未来竞争胜负的“全栈解决方案能力”与“服务能力”的具体体现。
作为长期观察技术趋势的从业者,我认为,未来五年的中国AI云市场,将是一场规模扩张与结构升级并行的双重竞赛。2180亿元的市场预期和39%的生成式AI占比,共同指向一个更成熟、更分层的产业生态。成功者将不仅是芯片产能的拥有者,更是能够将算力、算法、行业知识以及合规信任进行高效整合的“智能服务运营商”。市场的增长故事,正从单纯比拼调用量的“规模叙事”,转向兼顾效率、价值与可持续性的“质量叙事”。
值得警惕的反面观点:增长背后的潜在风险与不确定性
市场的“质量叙事”固然令人期待,但在迈向这一未来的道路上,并非只有坦途。高速增长的背后,潜藏着不容忽视的结构性风险与不确定性,它们可能重塑甚至打断当前的演进路径。对这些风险保持清醒,是确保行业长期健康发展的前提。
首先,成本端的刚性压力可能侵蚀提价带来的利润空间,使企业陷入“增收不增利”的窘境。 摩根士丹利的研报在指出提价带来利润率扩张机会的同时,也明确警示了“成本涨价因素同样存在”。这一判断切中了当前AI云市场的核心矛盾。一方面,作为算力基础的芯片产能,其投资规模巨大且供应链关系复杂,是决定竞争胜负的首要因素。尽管头部厂商在产能上具备优势,但全球性的芯片供应紧张与成本上涨已是既定事实,这从全球云厂商(如AWS、GCP)因供应链成本上升而提价的行为中可见一斑。另一方面,模型推理虽然被寄望于带来更高利润率,但其效率提升高度依赖于软件架构创新与资源配置优化(如批处理),这本身需要持续的研发投入。因此,简单的“提价-利润”线性推演可能过于乐观。成本与售价的“剪刀差”能否持续扩大,而非被不断上涨的硬件与研发成本所吞噬,将是检验商业模式韧性的关键。乐观情境下每1%的价格上调或可带来约1个百分点的利润率提升,但若成本涨幅同步甚至更快,这一红利将大打折扣。
其次,市场格局的快速集中化,可能带来创新活力减弱与生态单一化的长期风险。 当前,阿里巴巴与字节跳动双强格局的形成,是基于芯片产能、全栈解决方案和服务能力的综合实力体现。这种集中有利于在短期内快速整合资源、建立标准、推动市场成熟。然而,从产业生态的多样性角度看,过度集中的市场结构存在隐忧。当少数巨头掌控了从底层芯片(自研ASIC)、基础模型到上层应用的关键节点时,中小型创新厂商的生存空间可能被挤压,它们要么被迫依附于巨头的生态体系,接受其规则和分成,要么在资源竞争中逐渐边缘化。这可能导致技术路线、商业模式乃至应用创新的同质化,削弱了整个产业应对未来技术范式变迁的灵活性和抵抗力。一个健康的生态系统不仅需要参天大树,也需要繁茂的灌木与花草。双强格局下,如何构建开放、公平的竞争与合作环境,避免形成封闭的“算力孤岛”或“模型围墙花园”,是行业监管者和参与者都需要深思的课题。
最后,伴随Token调用量千倍级激增而来的数据安全、隐私保护与合规挑战,是悬在市场头顶的“达摩克利斯之剑”。 Token作为“结算单位”连接了技术供给与商业需求,其调用量的爆炸式增长(从2024年初日均1000亿到2026年3月的140万亿)本质上是数据流动与处理规模的指数级放大。这必然涉及海量用户数据、企业敏感信息乃至公共数据的处理、传输与存储。国家数据局相关负责人将Token定位为“智能时代的价值锚点”,这一官方定调本身就蕴含着对数据要素规范流通与价值实现的深层要求。未来,数据安全法、个人信息保护法等相关监管政策的细化和严格执行,可能对数据采集、标注、训练及推理服务的流程与边界提出更明确、更严格的约束。任何重大的数据安全事件或隐私泄露丑闻,都可能引发强监管,从而制约市场扩张的速度与方式。此外,不同行业(如金融、医疗、政务)对数据合规有着迥异的要求,这要求云厂商和模型企业必须具备极强的“服务能力”来应对复杂需求。未能妥善解决这些挑战,不仅会招致监管风险,更会动摇客户(尤其是对数据安全极为敏感的大型企业和政府机构)采用AI云服务的根本信心。
前瞻判断与行动建议:
基于以上分析,可以预见,中国AI云市场的下一阶段竞争,将是一场在增长、利润、创新与合规之间寻求精妙平衡的“多维棋局”。企业不能仅满足于追逐Token调用量的规模扩张或简单的价格调整,而必须构建系统性的风险抵御能力。这包括:1)通过自研ASIC、架构优化和混合部署(GPU自采与租赁结合)来建立更具弹性和成本优势的算力供应链;2)在构建自身生态的同时,有意识地通过开源、标准化接口和分层合作模式,为中小参与者留出创新空间,维护生态多样性;3)将数据安全与合规能力提升至与算力、算法同等重要的战略高度,将其内化为产品与服务的基础特性,而非事后补救的附加项。对于投资者和从业者而言,在关注市场规模(预计2029年达2180亿元)和生成式AI占比(从6%提升至39%)这些宏大数字的同时,更应细致审视企业在上述风险维度上的具体策略与执行成效。唯有穿越这些潜在的风险地带,AI云产业才能真正实现从爆发式增长到高质量、可持续发展的历史性跨越。
