写前判断:当前 SERP 主意图是“Rubin 到底用了什么、为什么比 Blackwell 强、HBM4 和 NVLink 分别扮演什么角色”。

NVIDIA 官方对 Rubin 的描述并不含糊:第六代 NVLink 把 72 块 Rubin GPU 统一到一个 performance domain,单卡互连带宽 3.6 TB/s,整柜连接能力 260 TB/s[1]。而 HGX Rubin NVL8 页面又给出另一组更关键的数字:单卡 288GB HBM4、22 TB/s 显存带宽,八卡服务器总计 2.3TB HBM4 与 176 TB/s 内存带宽[2]

这组规格的真正含义,不是“PFLOPS 又翻倍了”这么简单。它更像是在告诉产业链:下一阶段的瓶颈不再只是 GPU 算力本身,而是 HBM4 供给、先进封装、机柜内 scale-up fabric 以及它们之间的配套效率。

一张 Rubin 三层带宽升级图,画单卡 HBM4 带宽、单卡 NVLink 带宽与机柜级 72 GPU 互连,帮助读者理解 Rubin 为什么把瓶颈从单卡算力推向系统互连

Rubin 改掉了三件事:显存、互连、机柜尺度

如果把 Rubin 和上一代 Blackwell 放在同一张表里,差别会更直观。NVIDIA HGX 页面显示,HGX B200 的 8 卡平台是 1.4TB 总显存、14.4 TB/s 总 NVLink 带宽;而 HGX Rubin NVL8 变成了 2.3TB HBM4、28.8 TB/s NVLink Switch 带宽[2]

维度 HGX B200 HGX Rubin NVL8 变化重点
8 卡总显存 1.4TB 2.3TB HBM4 更长上下文与更大 KV cache
单卡显存规格 上一代 HBM3/3E 体系 288GB HBM4,22 TB/s 带宽和容量同时上台阶
8 卡 NVLink 带宽 14.4 TB/s 28.8 TB/s 机柜内 GPU 间通信翻倍
整柜尺度 以服务器为核心 72 GPU 单一性能域 从服务器思维切换到 rack-scale 思维

这意味着,Rubin 的“升级对象”不是某一块芯片,而是整条系统路径:模型在 GPU 之间搬数据更快,GPU 从显存里取数据也更快,整个机柜被当成一个更紧密的训练与推理单元来设计。对产业链来说,受益点自然不再只落在 GPU 本体。

HBM4 才是最先被重新定价的环节

Micron 在 2026 年 3 月的官方新闻稿里写得很直接:HBM4 36GB 12H 已进入高量产阶段,面向 NVIDIA Vera Rubin,单 stack 带宽超过 2.8 TB/s,功耗效率比上一代提高 20%[3]。Micron 的 HBM4 产品页还补充了两点:接口拓宽到 2048-pin,pin speed 超过 11.0 Gbps,这也是为什么它能把单 stack 带宽拉到 2.8 TB/s 以上[4]

把这些数字和 NVIDIA 的 288GB HBM4 / 22 TB/s 单卡规格放在一起,读者会更容易看懂一件事:Rubin 不是简单“多装一点显存”,而是在把显存带宽本身变成系统级性能的核心约束。只要 HBM4 供给、良率或封装节奏出现偏差,Rubin 的整机放量就会被拖住。

这也是为什么站内的 BESI HBM4 混合键合周期信号 不是一篇孤立的设备新闻。它和 Rubin 的关系在于:当显存带宽继续上行,封装、键合和散热不再是配角,而是决定整机交付节奏的主线变量。

NVLink 6 的意义,不是“还在用”,而是“用得更深”

SERP 里的高频问题之一是:NVIDIA 还在用 NVLink 吗?答案不只是“是”,而且是“比以前更深”。NVIDIA 官方页面明确写出,第六代 NVLink 把 72 块 Rubin GPU 统一到一个性能域,单卡 3.6 TB/s,整柜 260 TB/s[1]

这背后的工程含义是:当模型训练和推理进入长上下文、MoE 和高并发服务阶段,系统瓶颈越来越少出现在“某一张卡算得不够快”,而更多出现在“卡与卡之间、机柜与机柜之间的数据搬运不够顺”。NVLink 6 的作用,就是把 rack 内部的 scale-up 路径尽量做成低延迟、全互联、高带宽,让更多流量留在机柜内部解决。

因此,PAA 里“NVLink 是否比 PCIe 更快”这个问题,真正的答案并不是做一条参数对比表就结束。对 Rubin 这一代来说,NVIDIA 仍然把 PCIe 放在通用主机连接位置,把 NVLink 放在 AI 训练与推理最核心的 GPU-to-GPU 路径上。这说明在 rack-scale AI 时代,专用 scale-up fabric 仍然不可替代。

Rubin 之后,产业链要分成四层看

一张 Rubin 平台产业链关系图,画 HBM4、先进封装、NVLink 机柜互连、scale-out 网络四层分工,帮助读者建立供应链框架
层级 核心问题 Rubin 带来的变化 读者应盯什么
HBM4 谁能稳定供货、谁的带宽与功耗效率更高 显存从配套件变成核心瓶颈 量产节奏、良率、供货认证
先进封装 更高 I/O 密度、更高热流密度如何落地 封装节奏直接影响整机交付 CoWoS、混合键合、基板与热管理
机柜内互连 72 GPU 单域内如何保持低延迟高带宽 NVLink 6 成为系统级价值中心 Switch 带宽、机柜设计、供电散热
机柜外网络 scale-out 流量如何承接 Rack 内部越强,外部网络分层越清楚 Spectrum-X、ConnectX、数据中心布线

对中文投资者而言,这张分层图比单纯背规格更重要。因为真正的机会不在“Rubin 很强”这句结论,而在于你能不能把这句话拆解成:谁提供 HBM4,谁吃 advanced packaging,谁受益于 NVLink rack design,谁只是在概念上蹭上了一个名字。

如果想把这条链拉长看,可以继续读 半导体周期 2026:AI 算力与消费电子的 K 型分化;如果想回到 GPU 主机厂和系统级竞争本身,可以看 NVIDIA FY2026 系统级深度。而从栏目入口看,这篇更适合放回 AI 产业链栏目行业深度栏目 去组织后续内链。

我们和前排 spec 页的差异在哪

Google 前排结果里,官方页面和二次整理页大多已经把规格写全了:288GB HBM4、22 TB/s、3.6 TB/s NVLink、72 GPU 单域。它们缺的不是参数,而是“这些参数分别会把钱和瓶颈推向哪一层”。

这也是 m8 这篇文章真正要补上的部分:Rubin 不是只利好 GPU 本体,而是把 HBM4、先进封装、机柜内互连和机柜外网络重新排序。对产业链研究来说,这比再复述一次“50 PFLOPS”更有信息量。

常见问题(FAQ)

Does the NVIDIA Rubin use HBM4?

是。NVIDIA HGX Rubin NVL8 页面写明单卡是 288GB HBM4、22 TB/s 显存带宽;Micron 也在 2026 年 3 月的官方新闻稿里明确表示其 HBM4 产品面向 NVIDIA Vera Rubin[2][3]

Does NVIDIA still use NVLink?

是,而且在 Rubin 这一代用得更深。NVIDIA 官方说明,第六代 NVLink 把 72 块 Rubin GPU 统一进一个性能域,单卡互连带宽达到 3.6 TB/s[1]

How much bandwidth does Vera Rubin NVLink have?

官方页面给出的数字是:单卡 NVLink 带宽 3.6 TB/s,整柜连接能力 260 TB/s;在 8 卡 HGX Rubin NVL8 平台上,NVLink Switch 带宽为 28.8 TB/s[1][2]

Is NVLink faster than PCIe?

对 Rubin 面向的多 GPU AI 训练与推理场景来说,是的。更重要的是它承担的任务不同:PCIe 负责通用主机连接,而 NVLink 负责机柜内最关键的 GPU-to-GPU scale-up 路径,所以 NVIDIA 在 Rubin 上继续强化的是 NVLink 而不是弱化它。

数据来源

  1. NVIDIA, Infrastructure for Scalable AI Reasoning | Vera Rubin Platform.
  2. NVIDIA, HGX Platform specifications.
  3. Micron, Press Release: HBM4 Designed for NVIDIA Vera Rubin.
  4. Micron, HBM4 product page.

引用 [1] NVIDIA Rubin 平台官方页面;[2] NVIDIA HGX Rubin 规格页;[3] Micron 2026 年 3 月 16 日 HBM4 新闻稿;[4] Micron HBM4 产品页。

By m8 康哥。行业内部研究者视角,深耕产业链上下游。

免责声明:本文为基于公开资料的市场观察与分析,不构成任何投资建议、买卖推荐或目标价预测。投资者应独立判断、自行承担风险。

常见问题

这篇文章属于 m8 的哪个研究入口?

这篇文章归入 AI产业链 主线,建议先从 AI产业链栏目 进入,再结合研究目录里的相邻专题一起看。

读完这篇后,下一步应该看什么?

优先继续看 AI产业链文章列表HBM / 先进封装AI产业链研究中心。这些入口能把单篇内容放回市场、行业和方法论框架里。

后续最需要跟踪哪些变量?

后续重点跟踪:AI capex、GPU/HBM/先进封装供给、服务器交付、软件变现和产业链利润分配是否兑现。

这篇内容可以直接当作投资建议吗?

不可以。m8 的文章用于整理公开信息、研究框架和风险变量,不构成个股买卖建议,也不替代个人的仓位管理和风险评估。

m8 会如何更新这类主题?

如果后续出现财报、政策、订单、资金流或估值假设的关键变化,m8 会在对应栏目和专题页继续补充更新,并通过内链把新旧文章串起来。