一、Ascend 910D:推理定位与性能坐标
华为 Ascend 910 系列自 2019 年首代发布以来,已经历三次主要迭代。910B(2022 年量产)在训练侧被大量部署于华为云及字节跳动早期集群;910C(2024 年)针对大模型推理进行了显著优化,采用 CoWoS 封装替代方案,提升带宽密度;910D(预计 2025 年底至 2026 年初量产放量)则被行业人士定位为国产"H100 对位产品"。
根据公开技术文档与行业分析师的推算[1],910D 在 FP16 精度下峰值算力约为 256 TOPS(估算),HBM 容量约 96 GB,带宽约 3.2 TB/s(估算),推理延迟在主流 70B 参数模型下与 H100 SXM5 差距收窄至 15%–20% 以内(估算)。需要指出的是,上述数字均为行业推算,华为官方尚未完整公开 910D 数据表,投资者应以官方最终发布为准。
| 指标 | Ascend 910D(估算) | NVIDIA H100 SXM5 | 差距 |
|---|---|---|---|
| FP16 峰值算力(TOPS) | ~256 | ~267 | ≈ -4%(估算) |
| HBM 容量(GB) | ~96 | 80 | +20%(估算) |
| 显存带宽(TB/s) | ~3.2 | 3.35 | ≈ -4%(估算) |
| 互联协议 | HCCS + RoCE | NVLink 4.0 + InfiniBand | 生态差距仍存 |
| 量产状态 | 2026 H1 放量(推测) | 已大规模量产 | — |
框架层面,MindSpore / CANN 工具链经历多轮迭代,对 LLaMA、DeepSeek 等主流开源架构的算子适配已基本完成,从模型导入到推理服务的工程链路趋于成熟。这是 2024 年以前 Ascend 生态最大的软肋,2026 年这一瓶颈正在被系统性填平。
二、云厂商采购节奏:百度、腾讯、华为云的三条路径
国内云计算市场在出口管制升级后加速"去英伟达化",但三大买方的策略存在明显差异。
百度智能云:自研 + 昇腾双轨
百度 2025 年财报[2]披露,文心大模型推理集群中国产 AI 芯片占比已超过 50%,其中昆仑芯(百度自研)与 Ascend 910 系列并行部署。2026 年随着 910D 产能释放,百度预计将扩大 Ascend 采购,主要用于在线推理服务,降低单 token 推理成本。百度管理层在 2025 Q4 业绩会上提及"国产芯片 TCO(总拥有成本)与进口芯片已基本持平"(原话引自电话会纪要,具体数据以公告为准)。
腾讯云:混合部署,大规模集采
腾讯 2025 年 AI 基础设施资本开支约 600 亿元人民币(估算,参考彭博终端数据[3]),其中相当比例用于国产 GPU 采购。腾讯云的混元大模型推理侧已迁移部分工作负载至 Ascend 910B/C,910D 放量后预计进入下一轮批采周期。相较于百度,腾讯更强调"冗余双源"——不完全依赖单一供应商,英伟达与华为昇腾保持并行。
华为云:自用 + 外售,闭环最强
华为云市场份额约 18%[4](IDC 2025 H2 估算),是昇腾算力的"首用者"与"展示窗口"。华为的策略是以 Atlas 900 超节点集群承接政务云与国央企 AI 业务,借此验证 910D 的大规模部署稳定性,再向第三方云厂商和模型公司推广。这种"自销自用"模式使华为云在成本和交付上有天然优势,但也面临渠道中立性质疑。
综合三条路径,行业估算 2026 年国内大模型训练与推理中国产 AI 芯片渗透率将超过 60%(估算),对比 2023 年不足 20% 的水平,替代斜率显著陡峭。
三、供应链受益链条:A 股可跟踪标的拆解
Ascend 910D 集群规模化部署,直接拉动以下五个供应链环节,每个环节均有对应 A 股上市公司可供跟踪(以下为产业链分析,不构成买卖建议)。
| 环节 | 核心需求 | 代表 A 股标的(举例) | 需关注风险 |
|---|---|---|---|
| 液冷热管理 | 单卡功耗约 700W,机柜级需液冷 | 英维克、申菱环境、曙光股份 | 客户集中度高,验证周期长 |
| 光模块互联 | 800G/1.6T 光模块,集群内高速互联 | 中际旭创、天孚通信、新易盛 | NVIDIA 生态切换存技术风险 |
| 国产 HBM / 存储 | HBM3/3E 国产化替代 | 长鑫存储(未上市,间接受益:兆易创新) | 良率爬坡进度不确定 |
| PCB / 载板 | 高速高密 PCB,CoWoS 替代基板 | 沪电股份、生益科技、深南电路 | 技术路线有分叉,客户认证节奏不一 |
| 电源 / 配电 | 高功率密度 PDU,48V 直流供电 | 科士达、动力源 | 市场竞争加剧,毛利率承压 |
框架提示:跟踪供应链标的时,建议重点观察三个维度——①进入华为 Atlas 集群的订单公告或定向增发披露;②营收中算力相关收入占比变化(体现在季报中分行业收入表);③毛利率趋势(国产替代初期往往以价格换份额,毛利率可能先降后升)。
四、常见误区与分析框架
误区一:把算力 TOPS 等同于实际推理效率
峰值算力(TOPS)只是理论上限,实际推理吞吐量(tokens/s)受内存带宽、互联时延、软件编译优化多重因素制约。910D 在部分场景(如长上下文推理)受制于 HCCS 互联带宽,吞吐量可能低于同等 TOPS 的 H100 NVLink 配置。评估国产 AI 芯片时,应以"每瓦特 tokens/s"或"每美元 tokens/s"为核心指标,而非单纯比较峰值算力。
误区二:国产替代 = 国产芯片全面领先
当前国产替代的驱动力主要来自出口管制(外部压力),而非性能全面超越(内部拉力)。在 CUDA 生态深度绑定的科研/高校场景,迁移成本仍然较高。国产替代的节奏在推理侧(相对标准化)快于训练侧(需高度优化),在政务/国央企场景快于互联网/高校场景。
误区三:供应链受益是线性的
从华为集群放量到供应链公司营收兑现,通常有 2-4 个季度的滞后(采购-交付-确认收入周期)。此外,部分环节存在"价格效应"——规模扩张带来的量增可能被降价压力抵消,净利润改善幅度未必与收入增速同步。
Q:Ascend 910D 与 NVIDIA H100 在实际大模型推理中差距还有多大?
基于行业分析师的压测报告(非官方数据),910D 在 70B 参数模型(如 DeepSeek-R1)的批量推理吞吐量上与 H100 SXM5 差距估算在 15%–25% 之间,主要差距来自软件栈成熟度(算子融合、内存管理)而非纯硬件。随着 MindSpore/CANN 迭代,这一差距有望在 2026 年内进一步收窄。但在科学计算、强化学习训练等对互联带宽敏感的场景,差距仍然显著。
Q:哪些云厂商最积极采购 910D?
目前最积极的是华为云(自用兼外售)和百度智能云,其次是腾讯云(双源策略)。阿里云和京东云在国产芯片选择上更多倾向自研路线(如倚天 + 平头哥),对 Ascend 的依赖相对较低。中小云厂商(如天翼云、移动云)受监管合规要求影响,国产化意愿最强,批采节奏可能更快。
Q:A 股供应链标的中,哪个环节确定性最高?
从产业链逻辑看,液冷热管理和光模块互联的确定性相对较高——前者因功耗密度提升是物理约束,后者因集群互联带宽需求是架构刚需。HBM 国产化进度高度依赖长鑫存储良率爬坡,不确定性最大。以上分析不构成投资建议,实际结果受多重变量影响。
Q:国产 AI 芯片渗透率 60% 的估算依据是什么?
该数字综合了以下来源:①IDC 2025 年中国 AI 芯片市场报告(按部署卡数口径);②各大云厂商财报中关于国产化率的定性表述;③行业分析师对采购招标公告的追踪统计。由于定义口径(训练 vs 推理、卡数 vs 算力 FLOPS)不同,不同机构估算结果差异较大(范围约 50%–70%),60% 为中值参考,投资者应以各公司官方披露为准。
Q:出口管制升级后,华为能否持续供应 910D?
910D 采用国产 EUV 替代工艺(中芯国际 N+2 节点,7nm 等效,估算),已绕开主流出口管制限制。但先进封装(CoWoS 替代方案中部分设备仍依赖进口)和 HBM(长鑫存储产能爬坡)是两个潜在瓶颈,供应链稳定性需持续观察。华为海思在过去三年已显著加强国产设备备案,整体风险较 910B/C 时代有所降低。
参考来源:[1] 行业分析师技术评测报告(综合多家券商 2025 年研报);[2] 百度 2025 年年度财报(2026 年 Q1 发布);[3] Bloomberg 终端 China Cloud Capex Tracker,2026 年 5 月;[4] IDC《中国公有云服务市场(2025 下半年)跟踪》;[5] 华为开发者大会 2025 技术白皮书(昇腾 Atlas 900 集群架构)。
免责声明:本文为基于公开资料的市场观察与分析,不构成任何投资建议、买卖推荐或目标价预测。投资者应独立判断、自行承担风险。
站内延伸阅读
如果要把这篇文章放回 m8 的研究框架,可以继续沿着以下入口阅读:
常见问题
这篇文章属于 m8 的哪个研究入口?
这篇文章归入 AI产业链 主线,建议先从 AI产业链栏目 进入,再结合研究目录里的相邻专题一起看。
读完这篇后,下一步应该看什么?
优先继续看 AI产业链文章列表、AI产业链研究中心、GPU / 算力平台。这些入口能把单篇内容放回市场、行业和方法论框架里。
后续最需要跟踪哪些变量?
后续重点跟踪:AI capex、GPU/HBM/先进封装供给、服务器交付、软件变现和产业链利润分配是否兑现。
这篇内容可以直接当作投资建议吗?
不可以。m8 的文章用于整理公开信息、研究框架和风险变量,不构成个股买卖建议,也不替代个人的仓位管理和风险评估。
m8 会如何更新这类主题?
如果后续出现财报、政策、订单、资金流或估值假设的关键变化,m8 会在对应栏目和专题页继续补充更新,并通过内链把新旧文章串起来。