算力租赁不是一个新概念,但2026年是这个行业从"野蛮扩张"走向"商业模式定型"的关键节点。全球GPU云租赁市场2025年约350亿美元,2026年预计约480亿美元,同比增长约37%。增速依然强劲,但背后的玩家分化、价格信号和地缘裂变,才是值得深究的结构性问题。
GPUaaS(GPU-as-a-Service)的本质是算力的工业租赁——把高密度GPU集群按小时或按月出租给AI训练和推理负载。它区别于传统云计算的核心在于:没有软件生态捆绑,没有数据库或容器服务,只卖裸金属算力。客户关心的是GPU型号(H100/B200)、互联带宽(InfiniBand速率)、交付周期和合约灵活性。
三类玩家的商业模式对比
当前市场已形成三类玩家的分层格局,商业逻辑各异,竞争维度并不完全重叠。
超大规模云(AWS/Azure/GCP):捆绑生态是核心武器。Azure提供H100集群,但真正的护城河是与Azure OpenAI Service、Azure ML的深度整合;AWS的Trainium和Inferentia自研芯片试图在训练和推理环节与NVIDIA形成差异;GCP则以TPU为核心卖点,面向谷歌内部模型和Vertex AI客户。三家共同特征是毛利率高(软件服务叠加),但GPU资源通常不是专属分配,大客户往往需要排队。纯算力需求客户普遍反映,超大规模云的GPU可用性和交付速度不及独立GPUaaS。
独立GPUaaS(CoreWeave/Lambda Labs/Voltage Park):纯算力中介,不附带软件服务。这类玩家的商业模式更接近工业地产或融资租赁——低毛利、高周转、靠规模和利用率盈利。CoreWeave是该类别的绝对头部;Lambda Labs定位按需+长约混合,估值约15亿美元,月营收约1亿美元,服务中小模型厂商和学术研究;Voltage Park则由慈善基金支持,以低价策略切入学术和开源社区。
运营商转型(Equinix/Iron Mountain):托管+算力的混合模式。Equinix通过数据中心托管基础向客户提供"裸机+机房"组合,Iron Mountain在传统存储业务之外开始布局AI数据中心。这类玩家的优势是现有客户关系和机房基础设施,劣势是GPU采购能力和运营专业度弱于专注型GPUaaS。从估值逻辑看,两家都在享受"AI基础设施溢价"的重估,但实质上更接近房地产而非算力运营商。
| 类型 | 代表玩家 | 核心护城河 | 毛利率特征 | 客户粘性 |
|---|---|---|---|---|
| 超大规模云 | AWS/Azure/GCP | 软件生态捆绑 | 高(30-50%+) | 极高(数据迁移成本) |
| 独立GPUaaS | CoreWeave/Lambda | GPU直供+长约锁客 | 中低(15-30%) | 中(合约期内高,到期后竞价) |
| 运营商转型 | Equinix/Iron Mountain | 机房位置+客户关系 | 中(房地产型) | 中(设施依赖) |
CoreWeave的范式:NVIDIA直供 + 债务扩张 + 长约锁客
CoreWeave是2026年算力租赁行业最值得解剖的样本。2025年营收约35亿美元,同比增长超300%;2026年3月完成IPO,上市估值约230亿美元。这家公司在短短三年内从加密货币挖矿转型为AI算力巨头,背后是一套独特的商业范式。
第一层是供给端:与NVIDIA建立了直供关系。CoreWeave不通过分销商采购GPU,而是直接从NVIDIA取货,叠加NVIDIA的战略投资背书,获得优先供应权。这在GPU供给紧张期(2023-2024年)是决定性优势——客户选择CoreWeave,本质上是在选择一个能稳定拿到H100/H200的渠道。
第二层是资金端:以GPU资产为抵押进行大规模债务融资。CoreWeave的杠杆率显著高于传统云厂商,债务规模一度达到数十亿美元量级。这套逻辑类似REITs——用长期租金现金流支撑债务,用债务撬动更多GPU采购,形成规模飞轮。代价是资产负债表高度杠杆化,对利率变动和GPU资产折价均较敏感。
第三层是客户端:微软是CoreWeave最大单一客户,贡献收入比例超过30%。OpenAI、Cohere等AI原生公司也是重要客户。长期合约(通常1-3年)锁定收入,使CoreWeave的收入可预测性远高于现货算力市场的其他玩家。
CoreWeave的估值逻辑不是传统SaaS的ARR倍数,也不是云计算的EV/Revenue,更接近电力公用事业+REITs的混合框架:稳定的长约现金流 + 资产重置成本 + 稀缺供给溢价。问题在于,当B200/B300逐步扩产、H100租金下行,"稀缺溢价"的持续性将被重新定价。
供需结构:2026年H100/H200库存松动 vs B200/B300紧缺
GPU租金价格是观察算力租赁行业供需的最直接指标,2026年出现了明显的型号分层。
H100现货租金从2024年高峰约3.5美元/GPU/小时,降至2026年Q1约2.2美元/小时,降幅约37%。驱动因素有两个:一是B100/B200量产后,大量原本等待新一代GPU的客户转向采购H100填补空档,推动独立GPUaaS玩家集中建仓,2025年H100供给大量释放到市场;二是新进入的GPUaaS玩家(包括多家中小型算力云)以价格竞争拉低现货市场均价。
B200/B300的情况截然不同。NVIDIA对B200/B300实行定向供应,优先分配给超大规模云厂商和CoreWeave等直供合作伙伴,现货市场几乎无法采购到。这意味着:对于无法进入NVIDIA直供体系的中小GPUaaS玩家,2026年将面临GPU结构性缺货——H100库存充裕但租金下行,B200/B300无货可买。
供需分层的投资含义是:能拿到B200/B300定向配额的玩家(CoreWeave/Azure/AWS/GCP)具备议价权,其余玩家将在H100价格战中压缩利润率。GPUaaS行业的"马太效应"在2026年加速显现。
中国市场:昆仑/华为昇腾GPUaaS的平行宇宙
中国的算力租赁市场在出口管制的约束下走向了一条平行路径。美国出口管制将H100/A100/H800全面纳入管控后,国内无法通过正规渠道采购CUDA生态的高端GPU,本土GPUaaS市场被迫围绕华为昇腾和国内自研芯片重构。
华为云昇腾910B算力云是当前规模最大的国产算力租赁服务。百度智能云的千帆大模型平台同样基于昇腾集群,提供训练和推理云服务。阿里云和腾讯云也在昇腾环境下布局,但核心软件生态仍面临与CUDA的兼容性问题。
中国市场的结构性特征:监管环境实际上为昇腾生态提供了天然保护,国内AI公司若使用算力云服务,本土供应商是事实上的首选;但软件生态与CUDA的差距在短期内难以弥合,尤其是在高性能训练框架、算子库和模型优化工具链层面。这使得国内GPUaaS市场呈现"数量可观、质量分层"的格局——中等规模训练和推理任务已可本土消化,但对标A100/H100性能的顶级训练需求仍有缺口。
昆仑芯(百度系)、壁仞科技、摩尔线程等国产GPU厂商也在布局算力云,但短期内规模和生态成熟度与昇腾910B仍有差距。中长期看,国产算力云的渗透率提升是确定性趋势,政策采购和大模型国产化需求是最直接的驱动力。
投资逻辑与主要风险
从产业链视角看算力租赁的投资机会,有两个维度值得区分:短期事件驱动与中长期结构。
短期(0-12个月):CoreWeave上市后的估值锚定是市场关注焦点。230亿美元估值对应约6.5倍2025年营收,对标AWS(约3-4倍)明显溢价,反映的是增速和供给稀缺性溢价。关键风险在于微软客户集中度——若微软下一轮合约续约条款收紧或部分迁回Azure自建,CoreWeave的营收可预测性将显著下降。
中长期(1-3年):算力租赁的结构性驱动力是AI推理需求的指数级增长。模型服务化(Model-as-a-Service)的扩张意味着推理算力需求远超训练——据行业估算,推理与训练的算力消耗比在大模型大规模商用后将达到10:1以上。这对持续运营的GPUaaS玩家是长期利好,但也对GPU利用率和运营效率提出更高要求。
主要风险点:
- GPU价格下行风险:B200/B300大规模量产后,H100的折旧压力和残值风险将集中暴露,高杠杆玩家(CoreWeave)对此敏感度最高。
- 客户集中度风险:头部GPUaaS玩家的收入高度依赖少数大客户,超大模型厂商(OpenAI/Anthropic)若增加自建算力,会产生替代效应。
- 利率风险:债务扩张模式对利率变动敏感,高利率环境直接压缩债务扩张的经济性。
- 技术迭代风险:每一代新GPU的上市都会引发上一代的价格重置,资产折旧节奏快于传统数据中心基础设施。
- 地缘政策风险:出口管制范围若进一步收紧,对依赖NVIDIA GPU的非美GPUaaS玩家构成供给冲击。
数据口径说明:本文市场规模数据参考Synergy Research Group及公开分析师报告,CoreWeave财务数据来源于其IPO招股说明书及公开媒体报道,GPU现货租金参考CoreWeave官网历史定价及Vast.ai现货市场数据,中国市场数据来源于各公司官网及行业媒体公开披露。部分数据为市场估算,非官方口径,仅供参考。
数据来源
- CoreWeave S-1 招股说明书(2026年3月),SEC EDGAR
- Synergy Research Group,全球云基础设施市场季度报告,2025Q4
- Vast.ai GPU现货市场价格数据,2024-2026年历史记录
- NVIDIA FY2026财报及投资者日演示材料
- Lambda Labs官方博客:算力定价与市场透明度报告,2026年
- IDC Worldwide Cloud Infrastructure Market Forecast,2026
- 华为云官网昇腾算力云产品介绍,2026年
- 百度智能云千帆大模型平台官网,2026年
By m8 康哥。行业内部研究者视角,深耕产业链上下游。
站内延伸阅读
如果要把这篇文章放回 m8 的研究框架,可以继续沿着以下入口阅读:
常见问题
这篇文章属于 m8 的哪个研究入口?
这篇文章归入 AI产业链 主线,建议先从 AI产业链栏目 进入,再结合研究目录里的相邻专题一起看。
读完这篇后,下一步应该看什么?
优先继续看 AI产业链文章列表、AI产业链研究中心、GPU / 算力平台。这些入口能把单篇内容放回市场、行业和方法论框架里。
后续最需要跟踪哪些变量?
后续重点跟踪:AI capex、GPU/HBM/先进封装供给、服务器交付、软件变现和产业链利润分配是否兑现。
这篇内容可以直接当作投资建议吗?
不可以。m8 的文章用于整理公开信息、研究框架和风险变量,不构成个股买卖建议,也不替代个人的仓位管理和风险评估。
m8 会如何更新这类主题?
如果后续出现财报、政策、订单、资金流或估值假设的关键变化,m8 会在对应栏目和专题页继续补充更新,并通过内链把新旧文章串起来。