Google I/O 2026 核心发布梳理
本届 I/O 的产品节奏比往年更密集。Gemini 2.5 Pro 与 2.5 Flash 同步发布,定位分别为旗舰推理模型与成本优先部署模型。[2] Project Astra 从演示阶段进入开发者预览,支持持续多模态感知。
NotebookLM 升级为 NotebookLM Plus,加入企业级协作功能,订阅定价 19.99 美元/月。Google Search 全面接入 AI Overview,并首次展示 AI 生成式搜索结果(AI Mode)的广告位布局。
TPU v5 量产公告是硬件侧最重要的发布。Google 宣布 TPU v5p 已向 Cloud 客户开放,训练吞吐量较 v4 提升约 2 倍,内存带宽提升 3 倍。[3]
AI Overview 对搜索广告的影响测算
市场此前最大的担忧是:AI Overview 将答案直接呈现,用户点击率下降,广告收入受损。Q1 2026 数据初步否定了这一判断。
| 指标 | Q1 2025 | Q1 2026 | 同比变动 |
|---|---|---|---|
| 搜索广告营收(亿美元) | 455 | 503 | +10.4% |
| AI Overview 月活用户(亿) | 约 10 | 15 | +50% |
| 搜索查询总量(指数,2025Q1=100) | 100 | 约 108 | +8% |
| 每查询广告变现效率(相对指数) | 100 | 约 102 | +2% |
管理层在 Q1 财报电话会上的表述具有参考价值:带有 AI Overview 的搜索,用户后续点击行为实际上有所增加,而非减少。[1] 机制解释是:AI Overview 帮助用户将模糊意图精确化,触发更多细化搜索,带动下游高商业价值查询。
广告位布局方面,AI Mode 目前在 Overview 下方保留标准广告槽位,并测试嵌入式广告单元。投资者需要关注的风险点是:若 AI Mode 大规模替代传统 10 蓝链搜索,广告位数量本身可能收缩,即便单位变现效率提升,总库存变化方向尚不确定。
Gemini 2.5 系列:成本结构与竞争定位
Gemini 2.5 Flash 是本轮发布的商业化重点。Google 公布的定价为输入 0.15 美元/百万 token、输出 0.60 美元/百万 token,较 GPT-4o 同等调用场景成本低约 65%。[2]
| 模型 | 输入($/M tokens) | 输出($/M tokens) | MMLU 得分 | 代码能力(HumanEval) |
|---|---|---|---|---|
| Gemini 2.5 Flash | 0.15 | 0.60 | 89.1% | 85.4% |
| Gemini 2.5 Pro | 1.25 | 5.00 | 92.4% | 91.2% |
| GPT-4o(参考) | 2.50 | 10.00 | 88.7% | 90.2% |
| Claude 3.5 Sonnet(参考) | 3.00 | 15.00 | 88.3% | 92.0% |
在 API 开发者市场,价格是关键变量。Flash 系列以接近开源模型的成本提供云端推理,对 Mistral、Llama 3 等开源选项构成直接压力。Google Cloud AI Studio 的活跃开发者数量据称在 I/O 后一周内增长超过 40%。
Gemini 2.5 Pro 的推理能力是另一个关注点。在 AIME 2025 数学竞赛基准测试中,2.5 Pro 得分超过 GPT-4o 约 3 个百分点,进入与 o3 系列竞争的区间。[2] 对于需要长链推理的企业应用(法律、金融分析、代码审查),这一差距具有实际选型意义。
TPU v5 战略:对抗 NVIDIA 的自研路径
Google 的 TPU 战略本质是纵向整合:通过控制训练与推理芯片,降低对 NVIDIA GPU 的依赖,同时向 Cloud 客户提供差异化算力。
| 指标 | TPU v4 | TPU v5p | H100(参考) |
|---|---|---|---|
| 训练吞吐量(相对 v4=1) | 1× | ~2× | ~2.5×(FP8) |
| 内存带宽(TB/s) | 1.2 | 3.6 | 3.35 |
| 互联带宽(Pod 级) | 高 | 极高(ICI 升级) | NVLink/InfiniBand |
| 云端可用性 | Google Cloud | Google Cloud(2026 开放) | 主流云厂商均有 |
TPU v5p 的竞争优势不在单卡峰值性能,而在 Pod 级扩展时的互联效率。Google 的 ICI(Inter-Chip Interconnect)在数千卡并行训练时通信开销更低,这也是 Gemini 超大模型训练的基础设施优势。[3]
对 Google Cloud 的商业意义在于:TPU 实例的毛利率高于租用 NVIDIA GPU 的转售模式。Cloud 营收 28% 增速中,AI 加速器需求贡献显著。管理层披露 Cloud 业务待执行合同(backlog)已超过 900 亿美元,同比翻倍。
风险侧:NVIDIA 在软件生态(CUDA、cuDNN)的护城河仍然宽阔。多数企业 MLOps 工程师的工具链围绕 CUDA 构建,迁移至 TPU 需要重写训练脚本。Google 需要持续投入 JAX/XLA 生态建设,才能扩大 TPU 的市场渗透。
Cloud 业务:结构性加速还是周期性需求?
28% 的增速是近五个季度最高值,但需要分解驱动因素。[1] AI 工作负载(Vertex AI、Gemini API、TPU 租用)是增量来源;传统 IaaS/PaaS 迁移业务增速约为 15-18%,与 AWS/Azure 同期数据接近。
Google Cloud 市场份额约为 12-13%,与 AWS(约 31%)、Azure(约 25%)仍有明显差距。但在 AI 原生工作负载细分市场,Google 的竞争地位被认为强于整体份额数字所反映的水平——主要因为 Vertex AI 的模型生态与 BigQuery 数据仓库的深度集成。
营业利润率方面,Cloud 本季度 operating margin 约为 12%,同比提升约 3 个百分点,但仍低于 AWS 的约 37%。规模效应尚未充分释放,资本开支仍处于高位扩张期。Alphabet 全年 capex 指引为约 750 亿美元,主要用于数据中心和 AI 基础设施。
估值参考框架
以当前市值约 2.2 万亿美元、2026 年预期 EPS 约 10.5 美元计算,GOOGL 前向 P/E 约为 21 倍,低于 Microsoft(约 33 倍)和 Meta(约 26 倍)。[4]
| 业务板块 | 2026E 营收(亿美元) | 参考估值倍数 | 隐含价值(亿美元) |
|---|---|---|---|
| 搜索广告 | 2,050 | 8× EV/Sales | 16,400 |
| YouTube 广告 | 420 | 6× EV/Sales | 2,520 |
| Google Cloud | 500 | 10× EV/Sales | 5,000 |
| Other Bets + Waymo | — | 期权价值 | 500-1,000 |
分部加总估值约为 2.4-2.5 万亿美元区间,与当前市值相比溢价空间有限。核心上行催化剂在于:AI Mode 广告变现成功、Cloud 毛利率持续改善、以及 Waymo 商业化加速。核心风险是:监管反垄断行动(DOJ 搜索案尚未终局)和 AI 搜索竞争格局恶化。
FAQ
AI Overview 会不会长期损害搜索广告收入?
短期数据显示未见明显损伤。机制上,AI Overview 将模糊查询精确化,有助于提升高商业价值查询的比例。中长期风险在于广告库存结构变化——若 AI Mode 大规模普及,传统广告位数量可能下降,需持续观察每查询变现单价的趋势。
Gemini 2.5 Flash 65% 的成本优势能持续多久?
模型成本竞争通常呈现快速均值回归特征。OpenAI、Anthropic 均在持续优化推理效率。Google 的优势在于 TPU 垂直整合降低了基础设施成本,但软件层面的竞争优势较难量化和持续。6-12 个月内竞争对手跟进定价压缩是大概率事件。
TPU v5 能否真正挑战 NVIDIA 在数据中心的地位?
在 Google 自用训练场景,TPU 已证明经济性。在第三方市场,CUDA 生态的护城河仍是最大障碍。短期内 TPU 更可能巩固 Google Cloud 的差异化定位,而非对 NVIDIA 整体市场份额构成实质威胁。
Google Cloud 的 28% 增速能否持续?
900 亿美元的 backlog 提供了较强的能见度。但增速的维持依赖 AI 工作负载持续迁移上云,以及 Vertex AI 在企业客户中的渗透加深。宏观环境对企业 IT 支出的影响是主要不确定变量。
DOJ 反垄断案对 Alphabet 的实质影响有多大?
DOJ 搜索垄断案最严重的结构性救济方案(强制剥离 Chrome 或 Android)目前看执行概率较低,但谷歌向 Apple 等设备商支付的默认搜索引擎分成协议(2024 年约 200 亿美元)可能被限制。若该协议受限,搜索流量的获取成本将下降,但也存在流量分流风险,净影响方向不确定。
数据来源
- Alphabet Inc. Q1 2026 Earnings Release & Investor Presentation(2026年4月)
- Google I/O 2026 Keynote 官方发布与技术文档(2026年5月)
- Google TPU v5 系统架构白皮书,Google Research(2025-2026)
- Bloomberg Intelligence,Alphabet 分部加总估值模型(2026年5月)
- IDC Worldwide Public Cloud Services Tracker,Q1 2026(2026年4月)
站内延伸阅读
如果要把这篇文章放回 m8 的研究框架,可以继续沿着以下入口阅读:
常见问题
这篇文章属于 m8 的哪个研究入口?
这篇文章归入 美股 主线,建议先从 美股栏目 进入,再结合研究目录里的相邻专题一起看。
读完这篇后,下一步应该看什么?
优先继续看 美股文章列表、美股重点标的研究中心、美股 AI 基建 / 半导体。这些入口能把单篇事件放回市场、行业和专题框架里,减少只看一篇文章造成的信息断层。
后续最需要跟踪哪些变量?
后续重点跟踪:财报指引、AI capex、利率预期、美元流动性和估值对盈利增速的容忍度。
这篇内容可以直接当作投资建议吗?
不可以。m8 的文章用于整理公开信息、研究框架和风险变量,不构成个股买卖建议,也不替代个人的仓位管理和风险评估。
m8 会如何更新这类主题?
如果后续出现财报、政策、订单、资金流或估值假设的关键变化,m8 会在对应栏目和专题页继续补充更新,并通过内链把新旧文章串起来。