开场:三组数字定义这场芯片战争

4.7倍算力提升,67%能耗效率优化,推理成本比A100低35-40%。Google在2024年底向企业客户开放TPU v5 Trillium,这三个数字不是参数表里的营销话术,而是重新定价AI基础设施的实弹。

Google Cloud Q1 2026营收达125亿美元,同比增长28%,超过Azure同期增速。这个数字背后有多少归因于Trillium?Google不会直接说,但GCP CEO Thomas Kurian在财报电话中罕见地提及TPU供给是赢取大型AI客户的关键差异化点。

本文要拆解的不是Trillium的技术参数,而是自研芯片战略对Google Cloud定价权、毛利率和竞争格局的实际影响——以及这条路径对NVIDIA长期需求曲线意味着什么。


TPU v5 Trillium:第六代的规格跃迁

Trillium是Google TPU体系的第六代产品,官方代号TPU v5e和TPU v5p。TPU v5e面向推理优化,TPU v5p面向大规模训练,两者共用Trillium架构但在互联带宽和内存容量上有所差异。

核心规格提升来自三个维度:矩阵乘法单元(MXU)数量翻倍、高带宽内存(HBM)容量扩展、以及芯片间互联(ICI)速度大幅提升。与TPU v4相比,单芯片峰值BF16算力约为4.7倍,但更值得关注的是系统级效率:每瓦性能提升67%,这在数据中心规模部署下直接转化为运营成本优势。

互联架构是Trillium区别于GPU集群的关键设计选择。TPU Pod通过专有ICI网络以超低延迟连接数千颗芯片,无需依赖InfiniBand。这套架构在Google内部已经运行了多代,Gemini 1.5系列的训练全部在TPU v5p上完成,这本身就是最好的压力测试。

软件生态方面,Google将JAX作为TPU的主要框架,同时通过XLA编译器支持PyTorch和TensorFlow。生态兼容性仍是TPU的软肋——CUDA生态二十年积累无法在短期内被替代,但对于使用Google自有模型API(Gemini系列)的企业客户,这个问题不存在。


成本对比:TPU v5 vs H100 vs AWS Trainium2

以下是当前主流AI加速器在主要云平台上的推理成本对比(基于公开定价和行业估算,2025年底数据):

加速器 平台 类型 推理成本指数 训练成本指数 备注
NVIDIA H100 SXM GCP / AWS / Azure GPU 100(基准) 100(基准) CUDA生态完整,通用性最强
NVIDIA A100 80G 多云 GPU 78 82 上一代,仍大量部署
Google TPU v5e GCP TPU(推理优化) 60-65 75 推理场景下比H100低约35-40%
Google TPU v5p GCP TPU(训练优化) 72 75 大规模训练下成本优势收窄
AWS Trainium2 AWS 自研芯片 62-68 78 SageMaker生态绑定,外部可用性有限
Azure MAIA 100 Azure 自研芯片 尚未外部开放,主要服务OpenAI内部

注:成本指数以H100为100基准,数字越低代表单位算力成本越低。数据基于公开定价、第三方云成本分析报告及行业估算,不代表所有配置下的实际情况。

推理场景下TPU v5e的成本优势最为突出,约低于H100 35-40%。这个差距来自两个来源:一是GCP自研芯片无需向NVIDIA支付高溢价,二是Trillium的能耗效率优化直接压缩数据中心运营成本(电费和冷却)。

训练场景下差距收窄至约25%,原因是大规模训练对互联带宽和显存容量的要求更高,H100 NVLink在某些并行配置下仍有工程优势。但对于已经将工作流标准化在JAX上的AI公司,这个差距已经足够大,足以驱动迁移决策。


GCP竞争力:定价策略与客户结构变化

Trillium对GCP竞争力的影响不只体现在单一客户的账单上,而是在改变Google Cloud的客户结构。过去GCP在AI基础设施市场的主要客户是Google自己(搜索、YouTube、广告)和少数AI初创公司。Trillium开放后,中型AI公司——年AI算力支出在1000-5000万美元区间——成为GCP新的目标客群。

这类客户对NVIDIA GPU有真实的替代需求。他们的工作负载以推理为主(已训练好的模型持续服务用户),推理成本是主要的运营支出项。当GCP能提供比H100低35-40%的推理成本,同时配套Vertex AI的MLOps工具链,迁移的经济账开始成立。

Google的定价策略也在配合这个逻辑。TPU v5 Pod的预留实例定价明显低于同等性能的H100集群预留价,而且Google在2024-2025年间对部分战略客户提供了免费试用配额,降低了测试成本和迁移摩擦。

从财务角度看,这个策略对GCP毛利率是双赢:用低于H100的定价吸引客户,但因为内部芯片成本更低,单位利润实际上比转售NVIDIA GPU更高。这正是AWS靠Graviton处理器在EC2市场验证过的商业逻辑——差异化自研硬件创造定价灵活性,同时改善成本结构。


Axion处理器:另一条战线

Trillium是Google自研芯片战略的AI加速器分支,但Google同时在通用计算领域推进另一个项目:Axion处理器。Axion基于ARM Neoverse N2架构定制,是Google对x86服务器芯片(Intel Xeon / AMD EPYC)的替代方案。

2024年Axion实例进入GA,Google官方数据显示Axion实例在通用计算负载上比同价位x86实例性能提升约30-50%,能耗降低约60%。这与AWS Graviton4在EC2市场的定位高度相似。

从战略意图看,Axion和Trillium是同一逻辑的两条腿:全面替代外购处理器,将硬件利润内化。Axion针对通用工作负载(Web服务、数据库、微服务),Trillium针对AI训练和推理。两者结合,GCP理论上可以在不依赖Intel、AMD、NVIDIA的情况下运营整个数据中心。

这对供应链的战略意义不亚于成本优势。AI芯片短缺在2023-2024年让所有云厂商都感受到对NVIDIA的过度依赖风险,自研硅片是提升供应确定性的根本手段。


对NVIDIA的长期影响:替代逻辑的边界

超大规模云厂商的自研芯片会对NVIDIA构成多大威胁?这是市场上争议最大的问题之一,答案需要分场景讨论。

内部工作负载替代:已经发生,但有天花板。 Google、Amazon、微软三家合计在NVIDIA GPU上的年采购额估计在200-300亿美元区间(2024年)。随着TPU v5、Trainium2的规模化,这部分采购中有一定比例会被内部替代。行业估算约5-10%的云端GPU需求可能在未来3-5年内被自研芯片替代,但这个数字相对NVIDIA数据中心业务的增量需求来说并不致命。

推理市场是真正的战场。 随着AI模型进入大规模部署阶段,推理算力需求正在超越训练需求成为主导。Trillium在推理场景的成本优势最明显,而推理工作负载也最容易标准化(固定模型服务固定请求,不需要频繁的框架调试)。如果推理市场向自研芯片迁移,NVIDIA在数据中心推理这个高增长赛道的份额将承压。

NVIDIA的护城河依然在生态。 企业客户的训练工作负载深度绑定CUDA生态——数百万行优化代码、成熟的分布式训练库(NCCL、Megatron-LM)、工程师的技能积累。这道护城河不是靠价格差距能短期突破的。此外,NVIDIA的增量客户来自企业数据中心、主权AI(国家级AI基础设施)、边缘AI——这些场景的自研芯片渗透率极低,大型云厂商没有动机为这些市场开发专用硅片。

综合判断:自研芯片对NVIDIA的影响是结构性的慢变量,不是颠覆性冲击。NVIDIA在AI芯片市场的份额从峰值90%+逐步下降至长期的60-70%区间是合理预期,但这个过程需要5-8年,期间AI总需求的扩张会部分对冲份额损失带来的绝对量影响。


主要风险

软件生态碎片化风险。 每家云厂商各搞一套自研芯片,意味着开发者需要针对TPU/Trainium/MAIA分别优化,这会增加AI工程师的迁移成本,也可能成为企业客户采用自研芯片的阻力。如果生态碎片化程度超过预期,自研芯片的渗透速度会慢于乐观预期。

NVIDIA持续迭代的反应速度。 NVIDIA不会静止等待替代——Blackwell架构(H200/B100/B200)已在2024-2025年推出,下一代Rubin预计2026年发布。每一代NVIDIA GPU都在压缩自研芯片的成本优势窗口,迫使云厂商持续投入研发追赶。这是一场没有终点的军备竞赛,研发投入压力长期存在。

Google Cloud执行风险。 GCP历史上有过多次优秀技术商业化能力不足的案例(Google Cloud Spanner等)。Trillium的技术领先能否有效转化为客户增长和市场份额,取决于销售能力、合作伙伴生态和企业支持服务的配套——这些是Google Cloud相对于AWS的传统短板。

地缘政治与出口管制。 中国市场的AI芯片出口管制已经影响了NVIDIA的部分营收,但同样限制了Google在中国市场部署Trillium的可能性。全球AI基础设施的地缘碎片化可能使自研芯片战略的规模经济效果打折。


数据来源

  • Google Cloud Next 2024发布材料(TPU v5 Trillium官方规格)
  • Alphabet Q1 2026财报电话会议记录
  • SemiAnalysis《Google TPU v5 Deep Dive》(2024年)
  • Bernstein Research《Hyperscaler Custom Silicon Impact on NVIDIA》(2025年Q3)
  • AWS Trainium2官方文档及定价页面
  • Gartner《Cloud AI Infrastructure Cost Benchmark》(2025年)
  • Goldman Sachs《AI Infrastructure Capex Cycle》(2025年12月)

本文数据截至2026年5月,部分成本对比基于公开信息及行业估算,不构成投资建议。

常见问题

这篇文章属于 m8 的哪个研究入口?

这篇文章归入 AI产业链 主线,建议先从 AI产业链栏目 进入,再结合研究目录里的相邻专题一起看。

读完这篇后,下一步应该看什么?

优先继续看 AI产业链文章列表AI产业链研究中心GPU / 算力平台。这些入口能把单篇内容放回市场、行业和方法论框架里。

后续最需要跟踪哪些变量?

后续重点跟踪:AI capex、GPU/HBM/先进封装供给、服务器交付、软件变现和产业链利润分配是否兑现。

这篇内容可以直接当作投资建议吗?

不可以。m8 的文章用于整理公开信息、研究框架和风险变量,不构成个股买卖建议,也不替代个人的仓位管理和风险评估。

m8 会如何更新这类主题?

如果后续出现财报、政策、订单、资金流或估值假设的关键变化,m8 会在对应栏目和专题页继续补充更新,并通过内链把新旧文章串起来。