Llama 4 家族:Scout 与 Maverick 的技术定位

2025 年 4 月,Meta 正式发布 Llama 4 系列,旗舰为两款差异化产品——Scout(170 亿参数激活 / 1090 亿参数总量,16 个专家混合架构 MoE)和 Maverick(170 亿参数激活 / 4000 亿参数总量,128 个专家)。与前代 Llama 3.x 的稠密 Transformer 相比,Llama 4 全面转向 MoE,每次推理仅激活部分参数,在相同算力下显著提升吞吐效率。[1]

从基准测试数据看,Scout 在 MMLU 上约达 88%,在 MATH 数学推理集上约达 70%;Maverick 则在多模态任务(图文理解、长文本摘要)上进一步提升,接近但尚未完全超越 GPT-4o 的整体水平。[2] 值得注意的是,Meta 官方公布数据与第三方复现结果之间存在一定差距——这在模型发布生命周期中属常见现象,投资者在解读基准数字时应保留合理折扣。

模型 参数量(激活/总量) 架构 MMLU(估算) 开源许可 上下文窗口
Llama 4 Scout 17B / 109B MoE(16 专家) ~88% Llama 4 Community(可商用) 10M tokens
Llama 4 Maverick 17B / 400B MoE(128 专家) ~90%(估算) Llama 4 Community(可商用) 1M tokens
GPT-4.5(OpenAI) 未披露 稠密 Transformer(推测) ~90%(官方) 闭源 API 128K tokens
Gemini 2.0 Pro 未披露 未披露 ~89%(官方) 闭源 API 2M tokens

数据来源:Meta 官方技术报告、OpenAI 模型卡片、第三方 LMSYS Chatbot Arena;部分数字为估算,仅供参考。[1][2][3]

企业自部署经济模型:成本优势量化

开源大模型最核心的商业价值在于将按 token 付费的 API 支出转换为可摊薄的基础设施资本支出。以一家中型企业每月调用 10 亿 tokens 为基准场景,进行成本对比估算:

方案 单价估算 月均费用(10亿tokens) 年化费用 备注
GPT-4.5 API(输入) $75 / 1M tokens(估算) ~$75,000 ~$900,000 闭源,无法微调核心权重
Claude 3.7 Sonnet API $3 / 1M tokens ~$3,000 ~$36,000 闭源,数据不出云端
Llama 4 Scout 自部署(8×H100) 硬件折旧+电力,约$0.3-0.8/1M tokens(估算) ~$500-800 ~$6,000-9,600 数据完全私有,支持全参数微调
Llama 4 Scout 云端托管(推断服务商) $0.5-1.2 / 1M tokens(Together AI 等) ~$500-1,200 ~$6,000-14,400 无需自建运维,数据留在指定云

上述自部署成本为估算,受 GPU 利用率、电价、运维人力影响较大,实际场景可能有较大出入。[4]

核心结论:在 token 消耗量达到一定规模后,Llama 4 Scout 的自部署总拥有成本(TCO)可比 GPT-4.5 API 低 90% 以上。这一经济差距对金融、医疗、法律等数据敏感行业尤为显著——这些行业本就有合规驱动的私有化部署需求,开源模型同时满足了成本优化与数据主权两个诉求。

需要提示的风险是:自部署存在工程成本、模型维护、安全合规等隐性支出。对于规模较小或 AI 能力积累不足的企业,看似便宜的开源路线实际总成本未必低于 API 方案。

开源策略:护城河还是公益?

Meta 开源 Llama 系列的动机,市场存在两种解读:一是真正的技术民主化理念;二是竞争性开源——通过拉平基础模型能力,削弱 OpenAI、Google 在模型层的差异化,将战场转移到 Meta 真正具备优势的生态层(广告系统、社交数据、硬件终端)。

从战略逻辑看,后者更具说服力。Meta 的商业模式依赖于广告变现,其核心资产是 Facebook/Instagram/WhatsApp 的 30 亿+月活用户及随之积累的行为数据。大模型能力本身并非 Meta 的变现入口,但它是:

  • AI 广告系统的引擎:Llama 4 被深度集成进广告创意生成、受众建模、实时出价系统,直接提升广告 ROAS(广告支出回报率);
  • Meta AI 助手的底座:截至 2025 年底,Meta AI 月活用户已突破 6 亿,是全球最大的 AI 助手产品之一;[5]
  • Ray-Ban 智能眼镜的核心算法:硬件与模型深度绑定,构建 AI 硬件生态。

换言之,Meta 将基础模型作为成本中心开源,从而在上层的利润中心——广告、硬件、生态——中收割价值。这一策略的副产品是:大量企业客户采用 Llama 自部署,形成与 Meta 技术体系的深度绑定,未来围绕企业服务(微调支持、安全合规工具、模型托管)存在商业化空间。

对比分析:开源护城河的边界

Llama 4 的开源策略并非没有边界。以下几点值得机构投资者审慎评估:

1. 许可证条款的灰色地带:Llama 4 采用 Community License,允许商业使用,但对月活用户超过 7 亿的服务商(如微软、Google)设有额外条款限制,实质上将最大竞争对手排除在免费午餐之外。[1]

2. 能力差距仍存在:在代码生成、长链推理、函数调用稳定性等企业高价值场景,GPT-4.5 和 Claude 3.7 目前仍领先——尤其是 OpenAI 的 Codex 系列和 Anthropic 的工具调用能力,在实际工程落地中反馈更优。Llama 4 的优势集中于成本敏感、文本生成密集的场景。

3. 微调与 RAG 的工程门槛:开源模型的成本优势需以大量工程投入为前提。Meta 尚未提供像 OpenAI Fine-tuning API 那样成熟的托管微调服务,企业端的部署摩擦成本不可忽视。

4. 安全与合规的未知风险:Llama 4 的安全对齐相比 Anthropic Claude 透明度更低,在高监管行业(金融、医疗)的合规风险仍有待评估。

财务视角:AI 投入与变现的时间差

Meta 2025 年资本支出指引约为 600-650 亿美元,其中 AI 基础设施占据主导,较 2024 年的约 380 亿美元大幅提升。[6] 与此同时,Meta 2025 年全年营收约为 1800 亿美元(估算,基于管理层指引),净利润率约 35-40%——在科技巨头中属顶层水平。

AI 投入对 Meta 财务模型的影响体现在两个层面:短期,高 capex 带来折旧压力,对 GAAP 利润率有约 2-3 个百分点的稀释(估算);中期,AI 广告系统的效率提升直接体现在 ARPU(每用户平均收入)的增长,2024 年 Q4 Meta 的广告 ARPU 同比增长约 14%,部分可归因于 AI 系统升级。[6]

值得关注的是,Llama 开源本身对 Meta 直接财务贡献有限——真正的变现路径仍是广告。投资者若将 Meta 定价为 AI 模型公司,需谨慎区分基础模型能力提升与广告变现路径之间的传导链条。

Q:Llama 4 开源是否意味着 Meta 放弃了模型商业化?

并非如此。Meta 的商业化路径是模型开源加生态变现。开源是吸引开发者生态、降低竞争对手护城河、推动自身底层技术成为行业标准的策略工具。Meta 真正的商业变现依赖广告系统中的 AI 应用、Meta AI 助手产品,以及未来可能的企业服务(如 Llama API 付费微调、安全合规工具包)。

Q:Llama 4 自部署是否真的比 GPT-4.5 API 便宜 90%?

在 token 消耗规模足够大(通常月均 5 亿 tokens 以上)的场景下,单纯的推理成本确实可实现 90% 以上的节省。但完整的 TCO 需纳入 GPU 采购/租赁成本、工程师人力、运维保障、安全合规工具等隐性支出。对于中小规模企业,实际节省比例可能在 50-70% 区间(估算),而非宣传口径的 90%+。

Q:Meta AI 月活 6 亿是否可以直接与 ChatGPT 比较?

不宜直接对比。Meta AI 的 6 亿月活是基于其已有的 Facebook/Instagram/WhatsApp 流量入口自然分发的,用户深度使用粘性(如付费转化率、日均对话轮次)与 ChatGPT 付费用户基础存在结构性差异。这个数字更多反映分发渠道优势,而非产品力的胜出。

Q:Llama 4 是否会在企业市场替代 GPT-4.5?

部分替代已在发生,但全面替代在中短期内概率较低。GPT-4.5 在工具调用稳定性、长链任务规划、代码生成等企业核心场景仍具优势,加之 OpenAI 的企业销售、合规认证、SLA 保障体系相对成熟。Llama 4 更可能在成本敏感、文本密集、私有化部署诉求强的特定场景形成替代,而非全面夺取企业 AI 预算。

Q:Meta 高 capex 是否会持续压制利润率?

这是目前市场分歧最大的议题之一。管理层认为 AI 投入将在 2-3 年内通过广告效率提升实现回报,但折旧周期与变现节奏的错配在财报层面会持续体现。2026 年若 AI 广告 ARPU 提升加速,capex 压力将被更好消化;若宏观广告支出下滑,高 capex 对利润率的侵蚀将更为显著。

参考来源:[1] Meta AI, Llama 4 Technical Report, April 2025. [2] LMSYS Chatbot Arena Leaderboard, May 2025, lmsys.org/blog. [3] OpenAI, GPT-4.5 System Card, February 2025, openai.com. [4] Together AI Pricing Documentation, together.ai, accessed June 2026. [5] Meta Platforms Q4 2025 Earnings Call Transcript, January 2026. [6] Meta Platforms 2025 Annual Report (Form 10-K), February 2026, investor.fb.com.

免责声明:本文为基于公开资料的市场观察与分析,不构成任何投资建议、买卖推荐或目标价预测。投资者应独立判断、自行承担风险。

常见问题

这篇文章属于 m8 的哪个研究入口?

这篇文章归入 美股 主线,建议先从 美股栏目 进入,再结合研究目录里的相邻专题一起看。

读完这篇后,下一步应该看什么?

优先继续看 美股文章列表美股重点标的研究中心美股 AI 基建 / 半导体。这些入口能把单篇事件放回市场、行业和专题框架里,减少只看一篇文章造成的信息断层。

后续最需要跟踪哪些变量?

后续重点跟踪:财报指引、AI capex、利率预期、美元流动性和估值对盈利增速的容忍度。

这篇内容可以直接当作投资建议吗?

不可以。m8 的文章用于整理公开信息、研究框架和风险变量,不构成个股买卖建议,也不替代个人的仓位管理和风险评估。

m8 会如何更新这类主题?

如果后续出现财报、政策、订单、资金流或估值假设的关键变化,m8 会在对应栏目和专题页继续补充更新,并通过内链把新旧文章串起来。