据供应链消息,NVIDIA Blackwell Ultra架构旗舰产品B300的核心规格已进一步明朗:FP8算力达到288 TFLOPS,较上一代B200(180 TFLOPS)提升约60%;HBM3e显存容量从192GB跃升至288GB;台积电CoWoS-L先进封装成为供应端最紧张的产能节点;下一代Rubin平台预计2027年H1进入量产阶段。[1]
四条主线叠加,牵动从晶圆代工、HBM存储到光模块的整条AI算力供应链。以下逐层拆解。
B200 vs B300规格对比
| 规格项 | B200(Blackwell) | B300(Blackwell Ultra) | 提升幅度 |
|---|---|---|---|
| FP8算力 | 180 TFLOPS | 288 TFLOPS | +60% |
| HBM规格 | HBM3e | HBM3e(升级堆叠) | 容量+50% |
| 显存容量 | 192 GB | 288 GB | +50% |
| 内存带宽 | ~8.0 TB/s | ~11.5 TB/s(市场测算) | ~+44% |
| 封装技术 | CoWoS-S/L | CoWoS-L(升级版) | 面积扩大 |
| 制程节点 | 台积电 N4P | 台积电 N4P(优化) | — |
| 互联协议 | NVLink 4.0 | NVLink 4.0(同代) | — |
| 量产时间 | 2025 Q1开始爬坡 | 2026 H1开始爬坡 | 约+12个月 |
数据来源:供应链渠道测算与公开报道综合,FP8算力为理论峰值。
CoWoS-L封装:台积电产能瓶颈分析
CoWoS-L(Chip on Wafer on Substrate with Local Si Interconnect)是台积电专为大面积AI芯片设计的先进封装路线,通过本地硅互联层大幅提升HBM与GPU Die之间的互联密度。[2]
B300较B200需要集成更多HBM3e堆栈——从6组增至9组(市场测算),封装基板面积随之扩大约30%-40%。这直接推高了每颗GPU对CoWoS-L产线机时的占用。
据供应链消息,台积电CoWoS产能2026年底前计划扩张至约每月5万片等效晶圆,但需求端(B300 + B200混跑 + AMD MI350系列并行)已让排期拉满至2027年初。[3]这不是技术问题——良率已经稳定——而是纯粹的产能供给跟不上需求速度。
市场反应是:CoWoS相关的ABF载板(台湾欣兴、南亚科技)报价持续走强,部分品项交期已延至28-32周。
HBM3e 288GB:内存带宽飞跃的背后
B300搭载的HBM3e总容量达到288GB,内存带宽测算值约11.5 TB/s,较B200(~8.0 TB/s)提升约44%。[4]这一跃升来自两个叠加因素:每组HBM3e由12层堆叠升级至16层(容量从24GB→32GB per stack),以及stack数量的扩增。
SK Hynix是HBM3e的主力供应商,目前占据超过50%的市场份额,并已在2026年初完成16-Hi HBM3e的认证。[5]三星正在加速追赶,但据分析师测算,其2026年HBM3e份额仍难超过25%。
数据显示,大模型推理阶段(inference)对内存带宽的敏感度高于训练阶段——B300的带宽提升直接对应更高的token生成吞吐量,这是云厂商愿意支付溢价的核心驱动力。
Rubin架构:2027量产路线图与竞争格局
Rubin平台是NVIDIA下一代GPU架构,预计2027年H1正式量产。与Blackwell相比,Rubin有三项结构性变化:[6]
- 制程升级至台积电N2节点,晶体管密度再度跃升
- 引入CPO(共封装光学),将光电转换集成至封装内部,互联功耗预计降低30%以上
- 存储切换至HBM4,带宽目标超过15 TB/s
竞争格局方面,AMD MI350系列(CDNA4架构)预计在2026年H2正式出货,对B300形成阶段性分流。但GPU软件生态(CUDA、NIM微服务)的护城河使大型云厂商难以快速切换供应商,AMD的市占率提升将是渐进式而非跃升式。[7]
据供应链消息,谷歌、微软、亚马逊、Meta四家云厂商的B300预订量合计已超过100亿美元等值,交货期排至2027年初。这意味着即便Rubin按时量产,Blackwell Ultra仍将在2027年贡献相当体量的营收。
供应链传导:TSMC / SK Hynix / 三星受益分析
B300的供应链受益格局可以分三层拆解:
第一层:台积电(TSM) — 同时受益于两条线:N4P制程晶圆(GPU Die)和CoWoS-L先进封装。CoWoS业务的毛利率普遍高于标准晶圆代工15-20个百分点,是台积电近两年利润率提升的核心驱动之一。[8]B300爬坡将进一步推升台积电CoWoS产线的利用率。
第二层:SK Hynix(000660.KS) — HBM3e主要供应商,B300对16-Hi堆叠的采用使SK Hynix的单位ASP(平均售价)较标准DDR5再度溢价。数据显示,HBM3e单价约为普通GDDR6X的5-7倍,毛利率显著优于DRAM大宗产品。[9]
第三层:三星(005930.KS) — 作为HBM3e第二供应商,三星正在争取B300订单分配,但需先通过NVIDIA的终端认证。认证进度决定其受益时间窗口是否来得及在B300爬坡期内兑现。市场反应是:三星HBM相关股价对每次认证进度消息均高度敏感。
光模块环节同样不容忽视。DGX B300系统对InfiniBand带宽需求从400G升至800G,国内光模块供应链(中际旭创等)在AI数据中心扩张周期中持续受益。[10]
BESI Hybrid Bonding订单的超预期表明HBM4先进封装需求已在上游设备层面确认——这是Rubin周期提前布局的先行指标。
五个监控变量
- 台积电CoWoS产能月报:台积电每季度法说会披露先进封装产能利用率,任何超预期扩产都直接改变B300供给节奏。
- SK Hynix HBM3e 16-Hi良率:16层堆叠良率是B300HBM成本端的最大不确定性,良率爬坡速度决定单卡成本是否如期下降。
- 三星HBM认证进度:若三星获得B300认证,市场对SK Hynix供应集中度的溢价预期将有所收缩。
- 云厂商Capex指引修订:四大云厂商(微软/谷歌/亚马逊/Meta)每季度Capex指引是B300需求最可靠的前瞻信号——任何上调均推升NVDA估值,下调则触发回调。
- AMD MI350实际出货数据:市场目前将AMD视为边际威胁而非主要替代,若MI350实际部署量超预期,将重新定价NVDA的定价权边界。
数据来源说明:本文算力规格数据综合自供应链渠道报道与行业分析师测算,HBM及CoWoS产能数据参考台积电公开披露与市场研究机构报告。部分数字为市场估算而非官方确认值,投资决策请以官方公告为准。
FAQ
NVIDIA B300和B200的算力差距有多大?
B300(Blackwell Ultra)的FP8算力为288 TFLOPS,B200为180 TFLOPS,提升幅度约60%。HBM3e显存从B200的192GB跃升至288GB,内存带宽同步提升约44%,主要受益于台积电CoWoS-L先进封装对更多HBM堆栈的支持。
CoWoS-L封装为什么是B300的核心瓶颈?
CoWoS-L能在单一封装中集成更多HBM颗粒,但面积较大,台积电产线扩张节奏难以快速响应需求爆发。B300对CoWoS-L机时占用较B200扩大约30%-40%,而台积电2026年底前的CoWoS产能规划已基本被B300 + B200混合订单填满,排期紧张延续至2027年初。
NVIDIA Rubin架构什么时候量产?比Blackwell有什么提升?
Rubin平台预计2027年H1开始量产,采用台积电N2制程,引入CPO共封装光学与HBM4存储。最大结构变化在于以CPO替代外置光模块方案,有望降低数据中心互联功耗30%以上,内存带宽目标超过15 TB/s。
B300供应链中谁最直接受益?
台积电(CoWoS-L封装 + N4P晶圆)和SK Hynix(HBM3e主供应商)是第一层直接受益方。三星作为HBM3e第二供应商,认证进度是关键变量。光模块环节随800G InfiniBand需求扩张持续受益。
数据来源
- 供应链渠道综合报道,B300规格为市场测算值,非NVIDIA官方确认(2026年4-5月)
- 台积电法说会披露,CoWoS-L技术白皮书(TSMC,2025-2026)
- 供应链产能追踪,多家半导体设备厂商交期数据(2026年Q1-Q2)
- 行业分析师测算综合,HBM3e内存带宽估算值(2026年)
- SK Hynix投资者日披露,HBM市场份额数据(2026年Q1)
- NVIDIA GTC 2025架构路线图披露,Rubin平台方向性公告
- AMD MI350产品路线图,供应链渠道补充(2026年)
- 台积电年报及法说会,先进封装毛利率披露(FY2025)
- 行业研究报告,HBM ASP vs 标准DRAM溢价估算(2026年)
- NVIDIA DGX B300系统规格,InfiniBand带宽需求(2026年H1)
By m8 康哥。关注时效性资讯与跨市场综述。
免责声明:本文内容仅供参考,不构成任何投资建议或买卖指引。AI芯片供应链数据部分来自市场测算,存在不确定性。投资者应自行判断风险,独立作出投资决策。