有一个数字值得放在开头:每块NVIDIA GB200 GPU,配备192GB HBM3E内存。不是192MB,不是192GB的显存——是192GB的高带宽内存堆叠体,由6颗HBM3E堆叠芯片组成,封装在与GPU同一基板上。
放在历史坐标里看,H100时代每块GPU是80GB HBM3,GB200翻了2.4倍。Blackwell Ultra(GB300)预计进一步提升。全球能生产这种内存的工厂,只有三家:SK Hynix、Micron、Samsung。其中真正能稳定供货的,目前实质上只有一家半。
这是2026年AI算力供应链里最不对称的定价权格局。
HBM是什么,为什么AI离不开它
普通DRAM内存(DDR5)是平铺在主板上的,通过总线与CPU通信,带宽上限约100-200GB/s。HBM(High Bandwidth Memory,高带宽内存)则完全不同:它把多层DRAM芯片像三明治一样垂直堆叠,通过硅通孔(TSV,Through-Silicon Via)在层间打通数千个数据通道,然后用先进封装技术(CoWoS或类似工艺)把整个HBM堆叠体与GPU芯片封装在同一个基板上,通过极宽的物理接口传输数据[1]。
结果就是:HBM3E的带宽约1.2TB/s,是DDR5的六到八倍;HBM4的目标带宽超过1.5-1.7TB/s。对AI训练来说,模型权重动辄数百GB乃至数TB,每个训练步骤都要反复将权重加载到计算单元,内存带宽不足时,GPU的算力大量闲置——这叫"内存墙"。HBM的存在,本质上是把内存带宽瓶颈从供应链底部往上移了两个数量级[2]。
| HBM代际 | 上市年份 | 带宽(单颗) | 容量(单颗) | 主要应用 |
|---|---|---|---|---|
| HBM1 | 2015 | ~128GB/s | 4-8GB | AMD Fiji GPU |
| HBM2 | 2016-2018 | ~256GB/s | 8-16GB | NVIDIA V100 |
| HBM2E | 2019-2021 | ~460GB/s | 16-24GB | NVIDIA A100 |
| HBM3 | 2022-2023 | ~819GB/s | 24GB | NVIDIA H100(早期) |
| HBM3E | 2024-2026 | ~1.2TB/s | 24-36GB | NVIDIA H200、GB200 |
| HBM4 | 2026-2027E | >1.5TB/s | 32-48GB(预计) | NVIDIA GB300+、下代TPU |
需要分清的是:每颗GPU不是配一颗HBM,而是配多颗HBM堆叠体(stack)。H100配6个HBM3 stack,合计80GB;GB200配6个HBM3E stack,合计192GB。HBM4一旦量产并被下一代GPU采用,单卡HBM容量还会进一步跳升[1][3]。
SK Hynix:独跑者的定价权
过去两年,SK Hynix在HBM3/HBM3E市场的地位可以用一个词来描述:结构性垄断。NVIDIA H100发布初期,SK Hynix是唯一通过质量认证并能稳定供货的HBM3供应商,市场份额一度超过70%。进入2025-2026年,Micron获得NVIDIA HBM3E认证,份额有所稀释,但SK Hynix的HBM3E市场份额依然维持在50%以上[3]。
在HBM4上,SK Hynix的计划节奏最清晰:2026年下半年向主要客户(包括NVIDIA)交付HBM4工程样品,完成认证后于2027年进入规模量产。SK Hynix已公开表示,HBM4将采用新一代12层堆叠结构(相比HBM3E的8层),并搭配台积电CoWoS-L封装工艺,进一步提升带宽密度[3][4]。
SK Hynix的护城河来自三个维度。第一是工艺积累:TSV钻孔、层间连接、热管理是HBM生产的核心难点,SK Hynix量产HBM已近十年,良率和一致性控制远高于后来者。第二是客户关系:NVIDIA长期依赖SK Hynix作为主供,供应链切换成本极高。第三是封装产能绑定:SK Hynix与台积电CoWoS产能深度绑定,而台积电CoWoS是目前最成熟的HBM封装方案,产能稀缺[3]。
在韩国证券交易所(KRX)挂牌的SK Hynix(000660.KS),FY2025 HBM相关营收占总营收比例已超过30%,并仍在快速上升。HBM4量产周期一旦开启,这一比例有望进一步提升。
Micron:HBM3E的份额战,以及HBM4的追赶
Micron(MU,纳斯达克)是这场HBM竞赛中变化最积极的选手。2024年初,Micron正式通过NVIDIA HBM3E认证,成为H200和GB200的合格供应商——这是Micron在HBM市场第一次实质性切入主流AI训练市场[2]。
Micron的HBM3E切入时机并不完美,但策略清晰:以价格和供货弹性换份额。2025年,Micron HBM3E份额从个位数提升到约20-25%,主要客户是对SK Hynix过度集中有供应链分散需求的客户(包括部分云厂商自研芯片项目)。Micron管理层公开表示,HBM3E产能将持续扩张,HBM4研发同步推进[2][4]。
Micron的HBM4时间表相比SK Hynix滞后约6-12个月:预计2027年中至2027年底进入量产。Micron具备自有封装产能(爱达荷州晶圆厂),但CoWoS封装仍需依赖台积电,封装产能分配是其追赶的核心约束[2]。
从投资视角看,Micron比SK Hynix有一个结构性优势:美股流动性。MU是美股中唯一纯HBM直接受益标的,每次AI算力需求超预期,MU往往有直接的估值弹性。但其相对弱势也同样结构性:HBM毛利率低于SK Hynix(良率和规模效应差距),且DRAM周期底部时现金流压力更明显。
Samsung:良率阴影与艰难复盘
Samsung(005930.KS)的HBM故事,是这场竞赛中最戏剧性的一章。作为全球最大的DRAM厂商,Samsung在HBM3一代的量产上出现了严重的良率问题:据多家行业分析机构的报告,Samsung HBM3的良率一度显著低于SK Hynix,导致NVIDIA在H100批量供货阶段拒绝了Samsung的交货,双方关系严重受损[3][4]。
这是近年半导体产业里最具标志性的供应链质量事件之一。Samsung拥有全球最先进的晶圆产能、最大的DRAM市场份额,却在AI时代最核心的内存产品上被客户拒之门外——背后的原因复杂,包括TSV工艺的热管理控制、堆叠后的电性测试良率,以及HBM对封装一致性要求远高于普通DRAM等技术细节。
到2025-2026年,Samsung已针对HBM3E重新进行了NVIDIA认证测试,并据报道获得部分合格认定,但份额仍远低于竞争对手。HBM4上,Samsung的官方表态是2027年进入量产——但业界普遍预期其实际节奏不会早于2027年底至2028年初[4]。
这对Samsung的整体估值是一个持续的压制变量。三星半导体业务包含逻辑晶圆(代工)、DRAM、NAND三大板块,HBM失位意味着最高利润率的AI内存业务拱手相让,代工业务又面临台积电的竞争压力,两线承压是Samsung当前估值折价的核心解释。
需求侧:NVIDIA Blackwell Ultra与HBM消耗方程
从历史坐标观察,每次NVIDIA架构升级,HBM需求都是乘法而非加法。
NVIDIA GB200 NVL72机架是当前AI训练集群的核心单元:单个NVL72机架包含72块GB200 GPU,每块配192GB HBM3E,合计单机架HBM用量约13.8TB。按每颗HBM3E stack 32GB计算,单机架需要约432颗HBM stack。GB300(Blackwell Ultra)预计保持192GB配置但进一步提升带宽,HBM4样品一旦通过认证即可切换[1][3]。
| NVIDIA GPU | 架构 | HBM规格 | 单卡HBM容量 | 带宽 | 量产时间 |
|---|---|---|---|---|---|
| H100 SXM5 | Hopper | HBM3 | 80GB | 3.35TB/s | 2022-2023 |
| H200 SXM5 | Hopper+ | HBM3E | 141GB | 4.8TB/s | 2024 |
| GB200 SXM6 | Blackwell | HBM3E | 192GB | 8.0TB/s | 2025-2026 |
| GB300(Blackwell Ultra) | Blackwell+ | HBM3E/HBM4E | 192GB+ | >8TB/s | 2026-2027 |
| Rubin(下代) | Rubin | HBM4/HBM4E | TBD | TBD | 2027-2028E |
需求端的另一个变量是非NVIDIA客户。Google TPU v6(Trillium)、Amazon Trainium 2、Meta MTIA、微软Maia 100都在使用HBM,且规模持续扩大。HBM已不是NVIDIA的专属配件,而是整个AI算力基础设施的标配组件。全球HBM年消耗量(按HBM3E等效计)预计2026年将突破500亿美元级别的市场规模[2][4]。
供需格局:2026年的瓶颈仍在
全球能生产HBM的工厂极其有限。技术壁垒体现在三个环节:TSV钻孔精度(每层间数千个微米级通孔)、多层堆叠的热管理(堆叠后散热是普通DRAM的五倍难度)、以及CoWoS等先进封装(台积电产能受限)[1][3]。
据行业分析机构TrendForce的估算,全球HBM有效产能(折算为HBM3E等效晶圆)在2026年约为40-45万片/年,SK Hynix约占50%,Micron约占20-25%,Samsung约占25-30%(但Samsung的实际出货因良率问题低于产能)。与此同时,NVIDIA一家的需求就能消耗全球HBM产能的50-60%,加上Google、Amazon、Meta等云厂商自研芯片的需求,供给端持续偏紧[3][4]。
HBM4的量产不会在2026年解决供需矛盾——因为HBM4产能要到2027年才能形成规模,而Blackwell Ultra需求已提前锁定了绝大部分HBM3E产能。这意味着整个2026年,AI算力的最大供应链瓶颈之一仍然是HBM:不是GPU算力本身,而是封装HBM的内存和封装产能。
A股视角:澜起科技与国内DRAM的距离
国内有没有受益于HBM产业链扩张的标的?答案是有,但需要区分"直接受益"和"概念联动"。
澜起科技(688008.SH)是A股中与HBM产业链关联最清晰的标的。澜起的核心产品是内存接口芯片——包括用于DDR5服务器内存的RCD(Register Clock Driver)和DB(Data Buffer),这类芯片在高带宽内存模组中作为信号缓冲和控制单元,是HBM配套生态的组成部分之一。随着AI服务器DRAM用量提升(HBM + DDR5双轨扩张),澜起的RCD/DB需求有直接拉动[2]。
但要直接生产HBM的核心堆叠芯片?国内厂商目前距离还很远。
长鑫存储(CXMT)是国内最接近先进DRAM技术节点的厂商,目前量产的DRAM约在DDR4/LPDDR5级别(相当于HBM2时代的基础DRAM工艺),距HBM3E主流工艺节点(需要10nm级以下DRAM工艺 + TSV封装能力)仍有2-3代的代际差距,短期无法切入HBM主流供应链[4]。封装测试端(长电科技、通富微电)因先进封装产能扩张而间接受益,但HBM的关键封装(CoWoS)主要由台积电完成,国内封装厂的受益路径仍处于边缘位置。
若我们把视角切到更长的时间维度:国内AI算力对HBM的需求是真实的,但受制于出口管制,国内AI服务器大量使用的是H20等出口版本(HBM规格降级),这反而给国内DRAM厂商留出了"非主流HBM"的生态位——但这个市场空间与全球HBM主流市场不在同一量级。
投资视角:三家标的的结构差异
不做买卖推荐,但以下结构性特征值得作为观察框架。
| 标的 | 交易所 | HBM定位 | HBM4时间表 | 核心观察变量 |
|---|---|---|---|---|
| SK Hynix(000660.KS) | 韩国KRX | HBM3/3E第一供应商,NVIDIA主供 | 2026 H2样品,2027量产 | HBM3E出货量、NVIDIA供应协议续签 |
| Micron(MU) | 美国纳斯达克 | HBM3E第二供应商,份额持续提升 | 2027年中量产(预计) | HBM3E月出货量、DRAM周期利润率 |
| Samsung(005930.KS) | 韩国KRX | HBM3E认证重获,但份额仍低 | 2027年底至2028年初(最保守) | HBM3E良率改善数据、NVIDIA重新采购信号 |
| 澜起科技(688008.SH) | 中国A股 | 内存接口芯片,HBM生态周边 | 不直接生产HBM | AI服务器DDR5 RCD/DB出货量 |
拉长视野看:这场HBM4竞赛的胜负手,不只是技术代际的比拼,更是产能锁定能力的比拼。NVIDIA每年与HBM供应商签署的长期产能预购协议,是比任何季度财报数字更关键的先行指标。谁锁定了更多的2027年HBM4产能配额,谁就实质上锁定了Rubin时代的GPU供应链地位。
下一观察节点
2026年下半年是HBM4的关键窗口期。SK Hynix的工程样品是否如期交付NVIDIA,是HBM4竞赛的第一个可观察锚点;Samsung HBM3E的良率改善数据,是其能否重新切入Blackwell Ultra供应链的核心前置条件。
Micron的季度财报(每季度更新HBM出货量和毛利率)是最高频、最透明的跟踪窗口——MU管理层对HBM占比收入的指引,是全球HBM供需格局变化的最直接领先指标之一。
从历史坐标观察:每一次内存技术代际切换(HBM2→HBM2E→HBM3→HBM3E→HBM4),都重新洗牌过供应商格局,也重新定价过持有相关标的的风险收益比。HBM4的量产竞赛,本质上是对下一个AI算力周期定价权的争夺。这个时间窗口,比大多数人预期的要短。
常见问题(FAQ)
Q1:HBM4和HBM3E有什么区别?为什么AI训练芯片要用HBM?
HBM(高带宽内存)是垂直堆叠的DRAM芯片组,通过硅通孔(TSV)连接,与GPU/TPU封装在同一基板上,带宽远超传统GDDR内存。HBM3E(当前主流)带宽约1.2TB/s,HBM4(下一代)目标带宽超过1.5TB/s,同时功耗更低、容量更大。AI大模型训练需要持续搬运海量权重数据,内存带宽是比算力更频繁的瓶颈——这是HBM成为AI算力核心组件的根本原因[1]。
Q2:SK Hynix、Micron、Samsung在HBM4上的进度差距有多大?
SK Hynix领先最明显:预计2026年下半年向NVIDIA交付HBM4工程样品,2027年进入规模量产,当前HBM3E市场份额约50%+。Micron是第二梯队,已完成HBM3E NVIDIA认证,HBM4预计2027年中量产,当前份额约20-25%。Samsung处于追赶状态:HBM3良率问题导致NVIDIA关系受损,HBM3E已重新认证但份额仍低,HBM4量产时间表最保守,预计不早于2027年底[3][4]。
Q3:NVIDIA GB300对HBM的需求有多大?为什么说HBM是AI Capex的最大瓶颈?
NVIDIA GB200 NVL72机架每块GPU搭载192GB HBM3E,单个NVL72机架合计HBM用量超过13.8TB。GB300(Blackwell Ultra)延续相同架构并进一步提升带宽。全球HBM年产能(以HBM3E等效计)约40-45万片晶圆当量,而NVIDIA、Google、Meta、微软、亚马逊合计需求持续扩张,供给弹性受限于TSV封装和CoWoS产能,这是HBM成为AI Capex链最关键瓶颈的结构原因[2][3]。
Q4:A股有哪些公司受益于HBM产业链扩张?
直接受益最清晰的是澜起科技(688008),其内存接口芯片(RCD/DB)用于DDR5和HBM配套Buffer芯片,随HBM3E/HBM4供货量上升有直接需求拉动。国内DRAM厂商(长鑫存储、兆易创新生态链)目前技术代际距HBM3E仍有2-3代差距,短期不具备直接切入HBM主流市场的能力。封装测试端(长电科技、通富微电)间接受益于CoWoS和先进封装产能扩张[2][4]。
方法论与数据来源
本文数据来源:① TrendForce 2025-2026年HBM市场份额与产能报告;② Micron Technology季度业绩公告(FY2025-FY2026)及管理层HBM指引;③ SK Hynix投资者关系披露及HBM4技术路线图(2025年IR Day);④ Samsung Electronics半导体业务官方披露及HBM认证进展报告(2025-2026);⑤ NVIDIA GPU规格表与NVL机架产品手册(公开版本)。所有具体数字均可追溯至原始披露或行业分析机构报告。本文不构成投资建议。
引用 [1] NVIDIA GPU产品规格表与Blackwell架构白皮书;[2] Micron Technology FY2025-FY2026季度业绩公告及HBM3E认证披露;[3] TrendForce 2026年HBM市场份额与产能分析报告;[4] SK Hynix / Samsung Electronics 投资者关系与技术路线图公开披露(2025-2026)。
By m8 康哥。m8 主理人,跨市场宏观与行业观察 20 年。
免责声明:本文为基于公开资料的市场观察与分析,不构成任何投资建议、买卖推荐或目标价预测。投资者应独立判断、自行承担风险。所引用机构数据仅作参照,不代表 m8 立场。
常见问题
这篇文章属于 m8 的哪个研究入口?
这篇文章归入 AI产业链 主线,建议先从 AI产业链栏目 进入,再结合研究目录里的相邻专题一起看。
读完这篇后,下一步应该看什么?
优先继续看 AI产业链文章列表、HBM / 先进封装、AI产业链研究中心。这些入口能把单篇内容放回市场、行业和方法论框架里。
后续最需要跟踪哪些变量?
后续重点跟踪:AI capex、GPU/HBM/先进封装供给、服务器交付、软件变现和产业链利润分配是否兑现。
这篇内容可以直接当作投资建议吗?
不可以。m8 的文章用于整理公开信息、研究框架和风险变量,不构成个股买卖建议,也不替代个人的仓位管理和风险评估。
m8 会如何更新这类主题?
如果后续出现财报、政策、订单、资金流或估值假设的关键变化,m8 会在对应栏目和专题页继续补充更新,并通过内链把新旧文章串起来。