第九届数字中国建设峰会披露《全国数据资源调查报告(2025)》。2025 全年中国词元累计调用 21100 万亿。日均调用从年初 1 万亿+ 增至年末 100 万亿,年化 100 倍。
报告显示,AI 推理需求已经从训练阶段的一次性 capex 切换到使用阶段的持续算力消耗。光模块、IDC、电力是直接传导链条。
事件 — 21100 万亿词元 / 年末日均 100 万亿 / 100 倍增速
数据显示,2025 年初中国大模型日均调用量 1 万亿+。年末同口径达 100 万亿。指数级曲线的拐点出现在 2025 年下半年。
推理算力是 sticky 需求。训练 capex 是一次性投入,推理算力对应每天发生的 token 调用,是经常性支出。需求曲线远比训练平稳。
市场反应是,算力底座环节估值锚被重估。可参阅 NVIDIA 系统级深度。资本开支量级参照 AI Capex 4950 亿。
中国词元日均调用量 2025 年走势
| 时点 | 日均调用量 | 阶段特征 |
|---|---|---|
| 2025 年初 | ≈ 1 万亿 | 大模型 B 端试点 |
| 2025 Q2 | ≈ 5 万亿 | C 端应用规模化 |
| 2025 Q3 | ≈ 30 万亿 | Agent 推理放量 |
| 2025 年末 | ≈ 100 万亿 | 多模态 + 长上下文 |
| 全年累计 | 21100 万亿 | 报告披露口径 |
传导 — 推理 vs 训练 / 光模块 / IDC / 电力
第一条线是 光模块。Token 调用量决定数据中心东西向流量,800G 与 1.6T 升级是确定性需求。代表标的中际旭创 300308,详见 中际旭创 300308。
第二条线是 IDC 与服务器。100 万亿日均 token 对应机柜功率密度持续上行,液冷与高密 IDC 是受益方向。
第三条线是 推理芯片国产化。token 单价下行倒逼国产推理芯片放量。半导体周期参照 半导体周期 2026。
推理算力 vs 训练算力对比
| 对比项 | 训练算力 | 推理算力 |
|---|---|---|
| 支出性质 | 一次性 capex | 经常性 opex |
| 需求曲线 | 项目制波动 | token 调用正比 |
| 芯片需求 | H100/B200 旗舰 | L40S / 国产推理卡 |
| 网络结构 | 大集群东西向 | 分布式南北向 |
| 电力特征 | 峰值高 / 周期短 | 负荷稳定 / 全天候 |
观察节点 — 5 月美股财报 / 6 月 GTC China / token 招标价
未来 6 周关注三组数据。第一是 5 月美股科技巨头 Capex 指引,校验全球 AI 推理资本开支节奏。
第二是 6 月 GTC China 推理芯片产品发布,决定国内推理算力的供给侧定价。
第三是 国内大模型 token 招标价。下一关键事件是 5 月主流云厂商 token 报价是否继续下行,以及 token 调用量能否维持 100 万亿/日的中枢。
By m8 康哥。关注时效性资讯与跨市场综述。
免责声明:本文为公开信息综述,不构成投资建议。市场有风险,决策需独立判断。