GPUaaS算力租赁2026：三类玩家与供需结构深度

Q: 这篇文章属于 m8 的哪个研究入口？

这篇文章归入 AI产业链 主线，建议先从 AI产业链栏目 进入，再结合研究目录里的相邻专题一起看。

算力租赁不是一个新概念，但2026年是这个行业从"野蛮扩张"走向"商业模式定型"的关键节点。全球GPU云租赁市场2025年约350亿美元，2026年预计约480亿美元，同比增长约37%。增速依然强劲，但背后的玩家分化、价格信号和地缘裂变，才是值得深究的结构性问题。

GPUaaS（GPU-as-a-Service）的本质是算力的工业租赁——把高密度GPU集群按小时或按月出租给AI训练和推理负载。它区别于传统云计算的核心在于：没有软件生态捆绑，没有数据库或容器服务，只卖裸金属算力。客户关心的是GPU型号（H100/B200）、互联带宽（InfiniBand速率）、交付周期和合约灵活性。

三类玩家的商业模式对比

当前市场已形成三类玩家的分层格局，商业逻辑各异，竞争维度并不完全重叠。

超大规模云（AWS/Azure/GCP）：捆绑生态是核心武器。Azure提供H100集群，但真正的护城河是与Azure OpenAI Service、Azure ML的深度整合；AWS的Trainium和Inferentia自研芯片试图在训练和推理环节与NVIDIA形成差异；GCP则以TPU为核心卖点，面向谷歌内部模型和Vertex AI客户。三家共同特征是毛利率高（软件服务叠加），但GPU资源通常不是专属分配，大客户往往需要排队。纯算力需求客户普遍反映，超大规模云的GPU可用性和交付速度不及独立GPUaaS。

独立GPUaaS（CoreWeave/Lambda Labs/Voltage Park）：纯算力中介，不附带软件服务。这类玩家的商业模式更接近工业地产或融资租赁——低毛利、高周转、靠规模和利用率盈利。CoreWeave是该类别的绝对头部；Lambda Labs定位按需+长约混合，估值约15亿美元，月营收约1亿美元，服务中小模型厂商和学术研究；Voltage Park则由慈善基金支持，以低价策略切入学术和开源社区。

运营商转型（Equinix/Iron Mountain）：托管+算力的混合模式。Equinix通过数据中心托管基础向客户提供"裸机+机房"组合，Iron Mountain在传统存储业务之外开始布局AI数据中心。这类玩家的优势是现有客户关系和机房基础设施，劣势是GPU采购能力和运营专业度弱于专注型GPUaaS。从估值逻辑看，两家都在享受"AI基础设施溢价"的重估，但实质上更接近房地产而非算力运营商。

类型	代表玩家	核心护城河	毛利率特征	客户粘性
超大规模云	AWS/Azure/GCP	软件生态捆绑	高（30-50%+）	极高（数据迁移成本）
独立GPUaaS	CoreWeave/Lambda	GPU直供+长约锁客	中低（15-30%）	中（合约期内高，到期后竞价）
运营商转型	Equinix/Iron Mountain	机房位置+客户关系	中（房地产型）	中（设施依赖）

CoreWeave的范式：NVIDIA直供 + 债务扩张 + 长约锁客

CoreWeave是2026年算力租赁行业最值得解剖的样本。2025年营收约35亿美元，同比增长超300%；2026年3月完成IPO，上市估值约230亿美元。这家公司在短短三年内从加密货币挖矿转型为AI算力巨头，背后是一套独特的商业范式。

第一层是供给端：与NVIDIA建立了直供关系。CoreWeave不通过分销商采购GPU，而是直接从NVIDIA取货，叠加NVIDIA的战略投资背书，获得优先供应权。这在GPU供给紧张期（2023-2024年）是决定性优势——客户选择CoreWeave，本质上是在选择一个能稳定拿到H100/H200的渠道。

第二层是资金端：以GPU资产为抵押进行大规模债务融资。CoreWeave的杠杆率显著高于传统云厂商，债务规模一度达到数十亿美元量级。这套逻辑类似REITs——用长期租金现金流支撑债务，用债务撬动更多GPU采购，形成规模飞轮。代价是资产负债表高度杠杆化，对利率变动和GPU资产折价均较敏感。

第三层是客户端：微软是CoreWeave最大单一客户，贡献收入比例超过30%。OpenAI、Cohere等AI原生公司也是重要客户。长期合约（通常1-3年）锁定收入，使CoreWeave的收入可预测性远高于现货算力市场的其他玩家。

CoreWeave的估值逻辑不是传统SaaS的ARR倍数，也不是云计算的EV/Revenue，更接近电力公用事业+REITs的混合框架：稳定的长约现金流 + 资产重置成本 + 稀缺供给溢价。问题在于，当B200/B300逐步扩产、H100租金下行，"稀缺溢价"的持续性将被重新定价。

供需结构：2026年H100/H200库存松动 vs B200/B300紧缺

GPU租金价格是观察算力租赁行业供需的最直接指标，2026年出现了明显的型号分层。

H100现货租金从2024年高峰约3.5美元/GPU/小时，降至2026年Q1约2.2美元/小时，降幅约37%。驱动因素有两个：一是B100/B200量产后，大量原本等待新一代GPU的客户转向采购H100填补空档，推动独立GPUaaS玩家集中建仓，2025年H100供给大量释放到市场；二是新进入的GPUaaS玩家（包括多家中小型算力云）以价格竞争拉低现货市场均价。

B200/B300的情况截然不同。NVIDIA对B200/B300实行定向供应，优先分配给超大规模云厂商和CoreWeave等直供合作伙伴，现货市场几乎无法采购到。这意味着：对于无法进入NVIDIA直供体系的中小GPUaaS玩家，2026年将面临GPU结构性缺货——H100库存充裕但租金下行，B200/B300无货可买。

供需分层的投资含义是：能拿到B200/B300定向配额的玩家（CoreWeave/Azure/AWS/GCP）具备议价权，其余玩家将在H100价格战中压缩利润率。GPUaaS行业的"马太效应"在2026年加速显现。

中国市场：昆仑/华为昇腾GPUaaS的平行宇宙

中国的算力租赁市场在出口管制的约束下走向了一条平行路径。美国出口管制将H100/A100/H800全面纳入管控后，国内无法通过正规渠道采购CUDA生态的高端GPU，本土GPUaaS市场被迫围绕华为昇腾和国内自研芯片重构。

华为云昇腾910B算力云是当前规模最大的国产算力租赁服务。百度智能云的千帆大模型平台同样基于昇腾集群，提供训练和推理云服务。阿里云和腾讯云也在昇腾环境下布局，但核心软件生态仍面临与CUDA的兼容性问题。

中国市场的结构性特征：监管环境实际上为昇腾生态提供了天然保护，国内AI公司若使用算力云服务，本土供应商是事实上的首选；但软件生态与CUDA的差距在短期内难以弥合，尤其是在高性能训练框架、算子库和模型优化工具链层面。这使得国内GPUaaS市场呈现"数量可观、质量分层"的格局——中等规模训练和推理任务已可本土消化，但对标A100/H100性能的顶级训练需求仍有缺口。

昆仑芯（百度系）、壁仞科技、摩尔线程等国产GPU厂商也在布局算力云，但短期内规模和生态成熟度与昇腾910B仍有差距。中长期看，国产算力云的渗透率提升是确定性趋势，政策采购和大模型国产化需求是最直接的驱动力。

投资逻辑与主要风险

从产业链视角看算力租赁的投资机会，有两个维度值得区分：短期事件驱动与中长期结构。

短期（0-12个月）：CoreWeave上市后的估值锚定是市场关注焦点。230亿美元估值对应约6.5倍2025年营收，对标AWS（约3-4倍）明显溢价，反映的是增速和供给稀缺性溢价。关键风险在于微软客户集中度——若微软下一轮合约续约条款收紧或部分迁回Azure自建，CoreWeave的营收可预测性将显著下降。

中长期（1-3年）：算力租赁的结构性驱动力是AI推理需求的指数级增长。模型服务化（Model-as-a-Service）的扩张意味着推理算力需求远超训练——据行业估算，推理与训练的算力消耗比在大模型大规模商用后将达到10:1以上。这对持续运营的GPUaaS玩家是长期利好，但也对GPU利用率和运营效率提出更高要求。

主要风险点：

GPU价格下行风险：B200/B300大规模量产后，H100的折旧压力和残值风险将集中暴露，高杠杆玩家（CoreWeave）对此敏感度最高。
客户集中度风险：头部GPUaaS玩家的收入高度依赖少数大客户，超大模型厂商（OpenAI/Anthropic）若增加自建算力，会产生替代效应。
利率风险：债务扩张模式对利率变动敏感，高利率环境直接压缩债务扩张的经济性。
技术迭代风险：每一代新GPU的上市都会引发上一代的价格重置，资产折旧节奏快于传统数据中心基础设施。
地缘政策风险：出口管制范围若进一步收紧，对依赖NVIDIA GPU的非美GPUaaS玩家构成供给冲击。

数据口径说明：本文市场规模数据参考Synergy Research Group及公开分析师报告，CoreWeave财务数据来源于其IPO招股说明书及公开媒体报道，GPU现货租金参考CoreWeave官网历史定价及Vast.ai现货市场数据，中国市场数据来源于各公司官网及行业媒体公开披露。部分数据为市场估算，非官方口径，仅供参考。

数据来源

CoreWeave S-1 招股说明书（2026年3月），SEC EDGAR
Synergy Research Group，全球云基础设施市场季度报告，2025Q4
Vast.ai GPU现货市场价格数据，2024-2026年历史记录
NVIDIA FY2026财报及投资者日演示材料
Lambda Labs官方博客：算力定价与市场透明度报告，2026年
IDC Worldwide Cloud Infrastructure Market Forecast，2026
华为云官网昇腾算力云产品介绍，2026年
百度智能云千帆大模型平台官网，2026年

By m8 康哥。行业内部研究者视角，深耕产业链上下游。

站内延伸阅读

如果要把这篇文章放回 m8 的研究框架，可以继续沿着以下入口阅读：

常见问题

这篇文章属于 m8 的哪个研究入口？

这篇文章归入 AI产业链主线，建议先从 AI产业链栏目进入，再结合研究目录里的相邻专题一起看。

读完这篇后，下一步应该看什么？

优先继续看 AI产业链文章列表、AI产业链研究中心、GPU / 算力平台。这些入口能把单篇内容放回市场、行业和方法论框架里。

后续最需要跟踪哪些变量？

后续重点跟踪：AI capex、GPU/HBM/先进封装供给、服务器交付、软件变现和产业链利润分配是否兑现。

这篇内容可以直接当作投资建议吗？

不可以。m8 的文章用于整理公开信息、研究框架和风险变量，不构成个股买卖建议，也不替代个人的仓位管理和风险评估。

m8 会如何更新这类主题？

如果后续出现财报、政策、订单、资金流或估值假设的关键变化，m8 会在对应栏目和专题页继续补充更新，并通过内链把新旧文章串起来。

延伸阅读：继续沿着这条研究链往下读

这篇文章不应该孤立阅读。下面这些页面把同一市场、同一产业链或同一研究框架串起来，适合作为下一步阅读路径。

同一主题继续读

这篇文章属于 m8 的「ai-infra-and-software」研究链。继续阅读下面几篇，可以把公司、产业链和宏观变量放到同一张图里理解。

GPUaaS 2026：算力租赁产业链的商业模式与市场格局