B300单卡搭载288GB HBM3e、8TB/s内存带宽、1400W TDP;GB300 NVL72机架交付1.1 ExaFLOPS FP4算力,较上一代GB200提升50%。官方规格同期NVIDIA发布NVLink Fusion,首次允许第三方CPU和定制ASIC接入其互联生态。这是两条同时推进的战略主线,而非单纯的芯片迭代。

GB300核心规格:比GB200强在哪

B300(Blackwell Ultra)相对B200最直接的升级是内存。HBM3e堆叠层数从8层升至12层,单卡显存从192GB扩至288GB,增幅50%。架构细节这意味着更大的模型可以在单卡上完整运行,减少跨卡模型切片带来的通信开销。

规格项 B200(GB200) B300(GB300) 提升幅度
HBM版本 HBM3e 8H HBM3e 12H
单卡显存 192 GB 288 GB +50%
内存带宽 8 TB/s 8 TB/s 持平
FP4算力 ~10 PFLOPS 15 PFLOPS +50%
TDP 1000 W 1400 W +40%
NVLink带宽(单GPU) 1.8 TB/s 1.8 TB/s 持平
NVL72机架算力(FP4) ~0.73 ExaFLOPS 1.1 ExaFLOPS +50%

TDP从1000W跃升至1400W是一个值得关注的变量。NVIDIA技术博客需要观察的是,现有部分数据中心机房的供电和液冷密度是否能直接支持GB300部署,或需要基础设施改造投入。GB300 NVL72机架采用全液冷设计,72颗GPU通过NVLink互联后对外呈现为单一逻辑节点,与GB200架构一脉相承。

NVLink Fusion:打开第三方生态

2025年Computex,NVIDIA发布NVLink Fusion,允许第三方CPU和定制ASIC通过NVLink协议与NVIDIA GPU直连。Tom's Hardware报道首批合作伙伴包括MediaTek、Marvell、Alchip、高通、富士通,2026年1月SiFive带着RISC-V加入。值得关注的是,AMD、Intel、Broadcom目前均未进入该生态。

这一设计的战略含义超出表面。超大型云厂商长期倾向于自研ASIC降低对单一芯片厂商的依赖,NVLink Fusion给了他们一条路径:用自研CPU或定制推理芯片配合NVIDIA GPU,而不是全套替换。据此推算,NVIDIA不仅守住了GPU核心收入,还通过协议授权将竞争对手的ASIC纳入自身生态体系。

NVIDIA同期向Marvell投资20亿美元加深NVLink Fusion合作关系。Tom's Hardware这意味着NVIDIA在押注:即使客户用自研芯片替代部分GPU,替代方案本身也需要经过NVIDIA的互联基础设施。这是一种软性生态锁定,而非硬性排他。

对传统InfiniBand/Ethernet组网路径的影响同样不可忽视。GB300 NVL72已集成NVIDIA ConnectX-8 SuperNIC,每GPU提供800Gb/s网络吞吐,配合Quantum-X800 InfiniBand或Spectrum-X Ethernet组成完整AI工厂架构。相比纯以太网方案,NVIDIA主导的全栈方案在带宽密度和延迟上仍有系统性优势。

Rubin路线图:2027年的下一跳

Rubin(Vera Rubin平台)已进入全产量状态,预计2026年下半年量产交货NVIDIA新闻稿Rubin GPU采用双reticle设计,3360亿晶体管,FP4推理峰值50 PFLOPS、训练35 PFLOPS,内存升级至HBM4,单GPU容量288GB,带宽高达22TB/s。

Vera Rubin NVL144系统搭载144个GPU die(72个封装体)和36颗Vera CPU,FP4推理算力3.6 ExaFLOPS,是Blackwell Ultra NVL72的3.3倍VideoCardz详解Scale-up带宽达到260TB/s量级,较GB300代际跃升明显。

Rubin Ultra计划2027年下半年发布,采用四reticle设计,FP4推理峰值100 PFLOPS,HBM4e总容量达1TB,NVL系统规模从144扩至576。Introl分析对应机架功耗预计达600千瓦,基础设施要求进一步提升。需要观察的是,Rubin与GB300之间是否存在显著的采购切换窗口,或者超大型云厂商会直接从GB200跨代采购Rubin,这将影响GB300的实际出货量。

FY2027财务预期与估值

NVIDIA于2026年5月20日发布Q1 FY2027财报:总营收816亿美元,同比增长85.2%;数据中心分部营收752亿美元,同比增长92%;非GAAP摊薄EPS 2.39美元,超出市场预期1.75美元约37%。GuruFocus报道自由现金流达485亿美元,同比增长85%。

卖方一致预期FY2027数据中心全年营收超过3430亿美元,较FY2026大幅提升。Tickeron分析这意味着全年数据中心收入将在Q1基础上持续爬坡,主要驱动力来自GB300的规模交货和Rubin预付款。超大型云厂商贡献了Q1数据中心营收的50%以上,达380亿美元,季度环比增长12%。

微软($1450亿Capex指引)、谷歌($1750-1850亿)、亚马逊($2000亿)、Meta($1150-1350亿)四家合计2026年Capex指引区间在6350-6650亿美元,其中大部分流向AI数据中心和GPU采购。Tom's HardwareGB300机架出货量保守估计2026年接近6万套。

估值层面,截至2026年5月20日,NVDA前瞻PE约27倍,EV/EBITDA约40倍,对应一致EPS预期约10美元。GuruFocus相对半导体行业平均前瞻PE约75倍,当前水平并不极端。卖方研报普遍将12个月目标价维持在280美元附近,Buy评级机构占主流。对应PE区间在25-30倍是当前多数机构的定价中枢,核心逻辑是Rubin爬坡将持续驱动营收同比。

供应链约束与交付节奏

GB300面临的供应链瓶颈集中在两处。第一是TSMC CoWoS-L先进封装:NVIDIA锁定了2025年TSMC超70%的CoWoS-L产能,2026年CoWoS总产能约9.5万片/月,2027年有望扩至13.5万片/月。供应链分析有效产能扩张主要集中在2026年底至2027年,这制约了短期出货量的弹性上限。

第二是HBM3e 12H堆叠供应。SK Hynix是GB300独家供应商,锁定了全部12H HBM3e供货。TrendForce报道Micron目前只能满足核心客户55-60%的需求;Samsung和SK Hynix已将2026年HBM3e合同价上调约20%。HBM4(用于Rubin)的16Hi堆叠研发三家同步推进,三星、SK Hynix、Micron均在2026年Q4前后加速量产准备。

需要观察的是,部分超大型云厂商是否会跳过GB300、直接等待Rubin,以规避今年的封装瓶颈期。据此推算,如果Rubin 2026年下半年顺利交货,GB300的有效采购窗口约6-9个月,与常规大客户采购周期基本匹配。

竞争压力:AMD与自研芯片

AMD MI400(CDNA 5架构)预计2026年发布,规格包括432GB HBM4、19.6TB/s带宽、40 PFLOPS FP4,内存容量超过B300的288GB。Tweaktown报道AMD声称MI400在内存容量和Scale-out带宽上优于Rubin平台。这意味着AMD在选择正面对比内存规格,而非算力密度,是刻意规避NVIDIA优势区域的打法。

自研ASIC方面,谷歌TPU v8在Cloud Next 2026亮相,分Training和Inference两个独立架构(TPU 8t / TPU 8i),TPU 8t声称训练价格性能比较上代Ironwood提升2.8倍。HyperFrame ResearchAWS Trainium3已进入量产,2026年年中前预计全部产能承诺完毕,性价比较Trainium2提升30-40%。Motley Fool分析

卖方研报普遍认为,自研芯片对NVIDIA的冲击主要体现在特定工作负载(内部推理)的替代,而非全面替代。NVIDIA的优势在于软件生态(CUDA)、互联带宽(NVLink vs. InfiniBand)和工作负载兼容性的综合护城河。AMD的ROCm生态成熟度依然是关键制约,实际生产部署中的稳定性和调优便利性仍与CUDA存在差距。

风险提示

以下风险值得跟踪但不作为投资建议:

出口管制扩大:美国对华AI芯片管制持续收紧,Q1 FY2027管理层在业绩指引中已明确排除中国数据中心算力收入。如果限制进一步扩大至其他地区,对营收预期有直接影响。

Rubin爬坡节奏延迟:如果TSMC CoWoS-L产能扩张慢于预期,或HBM4供应不足,Rubin 2026年下半年的实际交货量可能低于市场预期,影响FY2028的营收可见度。

大客户资本支出周期转向:四大超大型云厂商合计6350亿美元的Capex指引已处于历史高位,是否具有可持续性取决于各自AI业务的货币化进展。如果某家大客户下调采购节奏,对NVIDIA短期营收有直接传导。

NVLink Fusion生态摩擦:NVIDIA保留NVLink IP授权的控制权,合作伙伴芯片的认证周期和互操作性问题可能使NVLink Fusion在2026年实际落地规模有限,需要持续跟踪合作方公告。

竞争格局加速变化:AMD MI400实际性能数据(基准测试结果)和ROCm生产稳定性报告,以及谷歌TPU v8的第三方测评,将是判断市场份额能否实质性位移的关键数据点。


数据来源:NVIDIA官方规格文档、Q1 FY2027财报及电话会纪要、TrendForce供应链报告、Tom's Hardware/VideoCardz技术评测、GuruFocus/Tickeron卖方估值汇总。估值数据截至2026年5月20日,规格参数以NVIDIA官方发布为准。本文不构成投资建议。

常见问题

GB300与GB200的核心区别是什么?

GB300搭载B300 GPU,HBM3e从8层升至12层,单卡显存从192GB增至288GB,FP4算力从约10 PFLOPS升至15 PFLOPS。GB300 NVL72机架整体算力达1.1 ExaFLOPS,是GB200 NVL72的1.5倍。TDP从1000W提升至1400W,需液冷基础设施配套。

NVLink Fusion有哪些合作伙伴,AMD参与了吗?

已确认合作伙伴包括MediaTek、Marvell、Alchip、Astera Labs、高通、富士通及SiFive(RISC-V)。AMD、Intel、Broadcom目前均未加入NVLink Fusion生态。NVIDIA通过IP授权控制合作方资质。

NVIDIA Rubin GPU什么时候量产?

Rubin已进入全产量状态,合作伙伴产品预计2026年下半年开始交货。Rubin NVL144系统FP4算力3.6 ExaFLOPS,是Blackwell Ultra的3.3倍。Rubin Ultra计划2027年下半年发布。

NVDA当前估值是否合理?

截至2026年5月,前瞻PE约27倍,EV/EBITDA约40倍。相对半导体行业均值PE约75倍,当前估值水平并不极端。FY2027数据中心卖方一致预期超3430亿美元,估值合理性取决于Rubin爬坡节奏与毛利率稳定性。

GB300最大的供应瓶颈是什么?

两处主要瓶颈:TSMC CoWoS-L先进封装产能(NVIDIA锁定2025年超70%份额,2026年产能约9.5万片/月);SK Hynix独供的HBM3e 12H堆叠(Micron目前只能满足55-60%核心需求)。有效产能扩张预计2026年底至2027年才逐步释放。

By m8 康哥。卖方研究员视角,专注个股深度与估值参照系。

数据来源:NVIDIA GB300 NVL72官方页面 | NVIDIA Blackwell Ultra技术博客 | Rubin CPX发布公告 | TrendForce HBM3e供应报告 | CoWoS产能约束分析 | Q1 FY2027财报

常见问题

这篇文章属于 m8 的哪个研究入口?

这篇文章归入 美股 主线,建议先从 美股栏目 进入,再结合研究目录里的相邻专题一起看。

读完这篇后,下一步应该看什么?

优先继续看 美股文章列表美股重点标的研究中心美股 AI 基建 / 半导体。这些入口能把单篇事件放回市场、行业和专题框架里,减少只看一篇文章造成的信息断层。

后续最需要跟踪哪些变量?

后续重点跟踪:财报指引、AI capex、利率预期、美元流动性和估值对盈利增速的容忍度。

这篇内容可以直接当作投资建议吗?

不可以。m8 的文章用于整理公开信息、研究框架和风险变量,不构成个股买卖建议,也不替代个人的仓位管理和风险评估。

m8 会如何更新这类主题?

如果后续出现财报、政策、订单、资金流或估值假设的关键变化,m8 会在对应栏目和专题页继续补充更新,并通过内链把新旧文章串起来。