2000 年,芝加哥大学会计学教授 Joseph Piotroski 在《Journal of Accounting Research》发表了一篇后来被引用 超过 4000 次的论文《Value Investing: The Use of Historical Financial Statement Information to Separate Winners from Losers》。论文提出一个看似朴素的问题:在低 PB(低账面/市值比)的便宜股票池中,如何区分真便宜和价值陷阱?[1]
Piotroski 的答案是 9 项基于会计报表的财务信号 — 每项满足得 1 分,不满足得 0 分,加总形成 0-9 分的 F-Score。原始论文回测显示,在 1976-1996 年美国市场低 PB 组中,F-Score ≥ 8 组合录得年化 +13.4% 市场调整收益,F-Score ≤ 1 组合 −9.6%,高低分差约 23pct[1]。这一发现被 Damodaran、AAII、CFA Institute 引入主流估值与质量教材[2][3][4]。
本文从定义、9 项信号详解、学术回测、A 股与美股双案例、与 Altman Z / Beneish M / Magic Formula 对比、失效场景、FAQ 七层展开。
一、F-Score 是什么:9 分质量筛选器的设计哲学
F-Score 的全名是 Piotroski Score 或 F_SCORE(论文中的变量名)。「F」代表 Fundamental(基本面)。这个评分系统的设计哲学有三个特点[1][2]。
第一,二元打分而非加权。每项信号要么 1 分要么 0 分,避免了主观加权的风险。这意味着模型简单到任何人都能用 Excel 一分钟算完。
第二,看变化方向而非绝对水平。9 项信号中 5 项是同比变化(ROA 改善、毛利率上升、资产周转率上升、流动比率上升、长期负债率下降)。Piotroski 的核心洞察是:便宜股票的关键不在于「现在多便宜」,而在于「基本面是改善还是恶化」。
第三,专为低 PB 池设计。原始论文明确说明,F-Score 在低 PB(账面/市值比最高 20%)股票中效果最强;放到全市场或成长股池子里效力大幅下降。这是 F-Score 与 Magic Formula、ROIC 等通用质量指标的关键差异[1][3]。
需要观察的是:F-Score 不是一个「选股得分」,而是一个 价值陷阱过滤器。低 PB 股票池历史上回报参差不齐(很多是基本面持续恶化的「便宜股」),F-Score 用基本面信号把池子里的两类公司分开:真便宜(财务向好)和价值陷阱(财务继续恶化)[1][5]。
二、9 项信号详解:盈利 4 + 杠杆/流动性 3 + 效率 2
9 项信号分为三个维度。每项满足条件得 1 分,不满足得 0 分。Piotroski (2000) 原文定义如下[1]。
| 维度 | # | 信号 | 计算公式 | 得 1 分条件 |
|---|---|---|---|---|
| 盈利能力(4) | 1 | ROA 为正 | 当期净利润 / 期初总资产 | > 0 |
| 2 | CFO 为正 | 当期经营性现金流 | > 0 | |
| 3 | ROA 同比改善 | 本期 ROA − 上期 ROA | > 0 | |
| 4 | CFO > 净利润(应计质量) | CFO − 净利润 | > 0 | |
| 杠杆与流动性(3) | 5 | 长期负债率下降 | 本期长期负债/总资产 − 上期长期负债/总资产 | < 0 |
| 6 | 流动比率上升 | 本期流动比率 − 上期流动比率 | > 0 | |
| 7 | 未增发普通股 | 本期流通股 − 上期流通股 | ≤ 0 | |
| 经营效率(2) | 8 | 毛利率上升 | 本期毛利率 − 上期毛利率 | > 0 |
| 9 | 资产周转率上升 | 本期资产周转率 − 上期资产周转率 | > 0 |
每项信号背后都有清晰的逻辑。ROA 为正意味着公司能赚钱;CFO 为正意味着赚的不只是账面利润;ROA 改善意味着盈利能力在提升;CFO > 净利润意味着应计质量高、没有用应收账款堆利润[1][2]。
杠杆与流动性维度更直接 — Piotroski 的逻辑是:处于低 PB 池的公司多数财务承压,降杠杆 + 增流动性 + 不增发 三项同时满足的公司,财务方向是修复的[1]。
经营效率两项捕捉的是经营改善的早期信号 — 毛利率上升说明产品定价能力恢复,资产周转率上升说明资产利用效率提升。两者同时出现往往领先于 ROA 改善 1-2 个季度[2][3]。
分数解读:8-9 分 = 财务强劲、5-7 分 = 平庸、0-4 分 = 财务恶化。Piotroski 建议买入 8-9 分组合,回避 0-2 分组合[1]。
三、原始论文回测:低 PB 池中的 23pct 利差
Piotroski (2000) 的核心回测覆盖 1976-1996 年美国市场全部上市公司,每年 4 月 30 日(财报披露完成后)按 PB 排序取最高 20%(即低 PB 组),约 14,043 个公司-年观测[1]。
| 分组 | 样本数 | 1 年期市场调整收益 | vs 基准(低 PB 整体 +7.5%) |
|---|---|---|---|
| F-Score = 0(最差) | 57 | −7.3% | −14.8pct |
| F-Score = 1 | 339 | −9.6% | −17.1pct |
| F-Score = 2-3 | 2196 | −1.4% ~ +1.5% | −9 ~ −6pct |
| F-Score = 4-5 | 5269 | +5.5% ~ +7.4% | −2 ~ 0pct |
| F-Score = 6-7 | 5089 | +9.4% ~ +11.3% | +2 ~ +4pct |
| F-Score = 8 | 895 | +13.2% | +5.7pct |
| F-Score = 9(最佳) | 198 | +13.4% | +5.9pct |
| 多空(多 F≥8 / 空 F≤1) | — | +23.0% | — |
这意味着两层结论。第一,在低 PB 这个「便宜池子」中,F-Score 系统性区分了 winners 和 losers,最高分组比最低分组年化高 23pct。第二,这个效应在 小盘股 + 低分析师覆盖股 中最强 — Piotroski 在论文 Table 6 中显示,小盘 + 低 ADR 覆盖子样本的多空收益达到 +39.7%[1]。
需要观察的是:F-Score 效应在过去 25 年被多个学术研究复制验证。Mohanram (2005) 把类似框架应用到高 PB(成长股)池子构建 G-Score;Mohr (2012) 在欧洲市场验证;Hyde (2018) 在亚太市场验证;CFA Institute 在 2020 年综述中将其列为 最 robust 的 anomaly 之一[2][4][5]。
四、案例一(美股):低 PB 价值修复 — 埃克森美孚 XOM
以 2021 年初的低 PB 美股 埃克森美孚(XOM) 为案例(用其 FY2020 vs FY2019 数据打分)[6]。2020 年 XOM 因油价暴跌全年净亏损 224 亿美元,但 2021 年油价 V 型反转,市场关心:用 F-Score 是否能在 2020 年底识别出后续修复?
| # | 信号 | FY2020 数据 | FY2019 对照 | 得分 |
|---|---|---|---|---|
| 1 | ROA > 0 | −6.9%(净亏损) | +5.3% | 0 |
| 2 | CFO > 0 | +143 亿(仍为正) | +295 亿 | 1 |
| 3 | ROA 同比改善 | −6.9% vs +5.3% | 恶化 | 0 |
| 4 | CFO > 净利润 | +143 亿 vs −224 亿 | 差 367 亿 | 1 |
| 5 | 长期负债率下降 | 16.8% vs 12.0% | 上升 | 0 |
| 6 | 流动比率上升 | 0.80 vs 0.79 | 微升 | 1 |
| 7 | 未增发普通股 | 42.32 亿 vs 42.35 亿 | 持平/微降 | 1 |
| 8 | 毛利率上升 | 14.9% vs 17.3% | 下降 | 0 |
| 9 | 资产周转率上升 | 0.51 vs 0.78 | 下降 | 0 |
| — | F-Score | — | — | 4 / 9 |
FY2020 末 XOM 的 F-Score 只有 4 分 — F-Score 在 2020 年底其实 不会推荐买入。这是 F-Score 的特性:它捕捉的是「已经在修复中」的公司,而不是「将要修复」的公司。XOM 的 FY2021 年报披露后(约 2022 年 2 月),F-Score 跳升至 8 分(ROA +10.5%、CFO 480 亿、毛利率从 14.9% 升至 26.3%、ROA 改善 +17.4pct),此时股价已从 41 美元涨到 75 美元[6]。
这意味着 F-Score 的应用方式是 季度滚动评分,而非一次性打分。当一只标的从 F = 4 跳升到 F = 8 的信号强度,远大于另一只标的常年保持 F = 7。前者是修复确立,后者是质量稳定但无 catalyst[1][3]。
五、案例二(A 股):高股息低 PB 央企 — 中国神华
以 中国神华(601088.SH) 的 FY2024 数据为案例(vs FY2023)[7]。神华长期处于低 PB(约 1.0-1.3 倍)、高股息(DR 8-10%)状态,是 A 股典型的「低 PB 央企」样本。
| # | 信号 | FY2024 数据 | FY2023 对照 | 得分 |
|---|---|---|---|---|
| 1 | ROA > 0 | +9.8% | +10.1% | 1 |
| 2 | CFO > 0 | +952 亿 | +1098 亿 | 1 |
| 3 | ROA 同比改善 | 9.8% vs 10.1% | 微降 | 0 |
| 4 | CFO > 净利润 | 952 亿 vs 587 亿 | CFO/NI = 1.62 | 1 |
| 5 | 长期负债率下降 | 4.2% vs 5.6% | 下降 | 1 |
| 6 | 流动比率上升 | 1.65 vs 1.52 | 上升 | 1 |
| 7 | 未增发普通股 | 198.7 亿股 vs 198.7 亿股 | 未增发 | 1 |
| 8 | 毛利率上升 | 32.4% vs 33.1% | 微降 | 0 |
| 9 | 资产周转率上升 | 0.52 vs 0.55 | 微降 | 0 |
| — | F-Score | — | — | 6 / 9 |
神华 F-Score = 6/9,处于「平庸偏上」区间。三个加分项很扎实:高 CFO 含量(CFO/净利润 = 1.62,应计质量极好)、降杠杆、不增发。三个失分项都是周期性原因 — 煤价从 2023 年高位回落,导致 ROA、毛利率、资产周转率均微降[7]。
需要观察的是:神华 6 分的解读应该结合 行业背景。煤炭板块整体处于价格回落期,6 分意味着神华在周期下行中财务韧性优于多数同行(同期兖矿能源 4 分、陕西煤业 5 分)。如果煤价企稳,神华下一年的得分大概率回到 7-8 分[7]。
这是 F-Score 在 A 股使用的一个适配技巧:把 F-Score 与同行业横向对比相结合,而不是单纯看绝对分数。低 PB 央企(电力、煤炭、银行)常年处在 5-7 分区间,跳升到 8-9 分往往是基本面拐点[5][7]。
六、与其他量化模型对比:定位与组合用法
F-Score 不是唯一的量化筛选模型。市场上常被一起提到的还有 Altman Z-Score(破产预测)、Beneish M-Score(盈利操纵检测)、Greenblatt Magic Formula(神奇公式)[2][3][8]。
| 模型 | 提出者/年份 | 目标 | 因子数 | 输出 | 最佳用法 |
|---|---|---|---|---|---|
| Piotroski F-Score | Piotroski / 2000 | 识别低 PB 池中的财务质量改善 | 9 项二元信号 | 0-9 分 | 低 PB 池过滤 |
| Altman Z-Score | Altman / 1968 | 预测 2 年内破产概率 | 5 个加权比率 | Z < 1.81 高风险 | 财务困境股回避 |
| Beneish M-Score | Beneish / 1999 | 检测盈利操纵 | 8 个加权比率 | M ≥ −1.78 警示 | 财务造假初筛 |
| Magic Formula | Greenblatt / 2005 | 便宜 + 好生意 | 2 个排名(EBIT/EV、ROIC) | 综合排名 | 全市场选股 |
四个模型实际上是 互补关系。Piotroski 自己在论文结论中指出,F-Score 应该被视为价值投资工具箱中的一个工具,而非完整选股系统[1]。机构常见的组合用法有三种[3][5][8]。
组合一:Magic Formula + F-Score。先用 Magic Formula 在全市场选出 50-100 只便宜好公司(高 ROIC + 高 EBIT/EV),再用 F-Score 过滤掉 ≤ 4 分的标的。Joel Greenblatt 在 2010 年的访谈中明确表示他后续策略加入了 F-Score 类的质量过滤[8]。
组合二:低 PB + F-Score + Altman Z。先按 PB 取最低 20%,再用 F-Score ≥ 7 选优质修复股,最后用 Altman Z > 1.81 排除潜在破产标的。这是 AAII(American Association of Individual Investors)官方 Piotroski Screen 的标准流程[3]。
组合三:F-Score + Beneish M。F-Score 看质量改善方向,Beneish M 看是否有人为操纵嫌疑。两者结合可以避免「F-Score 拿到 8 分但盈利操纵嫌疑高」的标的(如 2018-2019 年的康美药业、辉山乳业类公司)。
七、F-Score 的失效场景:周期顶、窗口公司、高成长
F-Score 不是万能。三类场景会显著失效[2][5]。
失效场景一:周期股顶部。周期高点 ROA 大幅改善、CFO 强劲、毛利率扩张、资产周转率上升 — 容易让公司打满 9 分。但 9 分往往出现在周期顶部,接下来就是周期下行。典型案例:2021 年航运(中远海控)、煤炭(陕西煤业)、化工(华鲁恒升)在景气高点都拿过 8-9 分,但随后 12-24 个月 ROA 大幅回落[7]。
应对方法:F-Score 与 ROIC 5 年滚动均值 结合 — 如果当年 ROIC 显著高于 5 年均值,可能是周期高点,F-Score 高分需要打折看。
失效场景二:会计窗口公司。CFO 改善可能来自延期付款给供应商(应付账款上升),毛利率改善可能来自一次性资产处置或会计政策变更。这类账面好看但本质未改善的公司,F-Score 会给出虚假高分[2][5]。
应对方法:F-Score 与 Beneish M-Score 结合 — 同时看 DSRI(应收账款指数)、AQI(资产质量指数)。如果 F-Score 高但 Beneish M 也高(≥ −1.78),需要质疑财务真实性[8]。
失效场景三:高成长公司。成长股早期 CFO 为负(用户/客户预付款不足以覆盖增长投入)、ROA 偏低(重资产 + 重研发)、流动比率因增发而下降 — F-Score 自然低分。但用 F-Score 否决高成长公司会错过亚马逊、特斯拉、Shopify 类机会。Piotroski 在原始论文中明确说明 F-Score 适用于 低 PB(价值股)池子,不适用于高 PB(成长股)池子[1]。
应对方法:成长股用 Mohanram G-Score(Mohanram 2005 年提出的高 PB 池版本质量评分,覆盖增长稳定性、现金转换、研发强度等 8 项信号),而不是 F-Score[5]。
八、操作要点:何时打分、看什么趋势
F-Score 的实操有四个要点[1][3][5]。
第一,年度打分为主,季度滚动为辅。原始论文用年报数据(4 月底披露完成后)。实操中可以季度滚动打分(TTM 数据),但要注意季度数据的季节性波动可能放大噪音。
第二,看趋势比看绝对分更重要。一只标的从 F = 4 跳升到 F = 8 的信号强度,远大于另一只标的常年保持 F = 7。前者是修复确立,后者是质量稳定但无 catalyst。
第三,必须叠加估值过滤。F-Score 高的优质公司如果 PB > 5、PE > 40,已经被市场充分定价,超额收益将大幅缩窄。原始论文的回测设定明确包含低 PB(最高 20%)前提[1]。
第四,组合而非单股。F-Score = 9 的单只股票仍可能跑输市场(噪音 + 黑天鹅),但 F-Score = 8-9 的 30-50 只股票等权组合在历史回测中显示出 稳定的超额收益。这是 Piotroski 模型适合 组合化使用 而非单股押注的原因[1][3][5]。
九、常见问题(FAQ)
Q1:Piotroski F-Score 是什么?为什么是 9 分?
Piotroski F-Score 是芝加哥大学会计学教授 Joseph Piotroski 在 2000 年发表的财务质量评分系统,由 9 项基于会计报表的二元信号(满足得 1 分,不满足得 0 分)相加而成,总分 0-9。9 项信号覆盖三个维度:盈利能力 4 项(ROA 为正、CFO 为正、ROA 同比改善、CFO > 净利润)、杠杆与流动性 3 项(长期负债率下降、流动比率上升、未增发股票)、经营效率 2 项(毛利率上升、资产周转率上升)。F-Score 设计的核心理念是:在便宜股票池中(低 PB),用基本面信号区分真便宜(财务向好)和价值陷阱(财务恶化)[1]。
Q2:Piotroski 原始论文的回测结果如何?
Piotroski (2000) 在 1976-1996 年美国市场,将低 PB 组(账面市值比最高 20%)按 F-Score 分层。低 PB 组整体一年期市场调整收益约 +7.5%;F-Score ≥ 8 组合录得 +13.4%,F-Score ≤ 1 组合 −9.6%,高低分差约 23pct。组合层面,做多高 F、做空低 F 的多空策略在 1976-1996 年录得年化约 23.0% 收益。后续学术研究(Mohr 2012、Hyde 2018 等)在欧洲、亚太、新兴市场重复验证,效应在小盘价值股中最强[1][4][5]。
Q3:F-Score 与 Altman Z-Score、Beneish M-Score、Magic Formula 的差异?
四个量化模型目标不同。Altman Z-Score(1968)预测破产概率,5 个比率加权;Beneish M-Score(1999)检测盈利操纵,8 个比率加权;Piotroski F-Score(2000)筛选质量改善方向,9 项二元信号;Joel Greenblatt Magic Formula(2005)筛选高 ROIC + 高盈利收益率的便宜好公司,2 个排名。F-Score 与 Magic Formula 常被组合使用:先用 Magic Formula 选便宜好公司,再用 F-Score 过滤财务恶化标的。F-Score 与 Altman Z 是互补关系(一个看质量改善方向、一个看破产风险)[2][3][8]。
Q4:F-Score 在 A 股有效吗?
学术研究显示 F-Score 在 A 股有效但存在三个适配问题。一是会计准则差异(CFO 口径与美国 GAAP 略有差异),二是国企比例高导致融资行为非市场化(增发信号需谨慎),三是 A 股小盘股流动性壁垒。Yu & Lou (2015) 对 1998-2014 年 A 股回测显示,低 PB 组 F ≥ 7 年化超额收益约 5-8%,弱于美国但仍显著。实操中建议把『未增发股票』信号放宽(很多优质央企会做配股或可转债融资)[5][7]。
Q5:F-Score 在哪些场景会失效?
三类场景显著失效。一是周期股顶部:周期高点 ROA 大幅改善、CFO 强劲、毛利率扩张容易让公司打满分,但接下来就是周期下行(如 2021 年航运、煤炭)。二是会计窗口公司:CFO 改善可能来自延期付款给供应商,毛利率改善可能来自一次性资产处置。三是高成长公司:成长股早期 CFO 为负、ROA 偏低,F-Score 自然低分,但用 F-Score 否决高成长公司会错过亚马逊型机会。F-Score 的最佳使用场景是稳定行业 + 低 PB 池子[1][2][5]。
方法论与数据来源
本文数据来源:① Piotroski, J. D. (2000) Value Investing: The Use of Historical Financial Statement Information to Separate Winners from Losers, Journal of Accounting Research, 38, 1-41;② Aswath Damodaran 课程 Investment Philosophies (NYU Stern) 价值投资章节;③ AAII Stock Investor Pro Piotroski Screen 官方文档;④ CFA Institute Research Foundation Anomaly 综述 (2020);⑤ Mohanram, P. (2005) Separating Winners from Losers among Low Book-to-Market Stocks using Financial Statement Analysis 与 Yu & Lou (2015) A 股 F-Score 实证;⑥ ExxonMobil FY2019-FY2021 10-K 与季度业绩公告;⑦ 中国神华 2023 年报与 2024 年报;⑧ Joel Greenblatt (2005) The Little Book That Beats the Market 与 Beneish (1999) The Detection of Earnings Manipulation。本文为基础概念教学,不构成投资建议。所有具体数字均可追溯至原始披露文件。
引用 [1] Piotroski (2000), Journal of Accounting Research 38, 1-41;[2] Damodaran, Investment Philosophies, NYU Stern;[3] AAII Stock Investor Pro Piotroski Screen 官方文档;[4] CFA Institute Research Foundation, Anomaly 综述 (2020);[5] Mohanram (2005) 与 Yu & Lou (2015) A 股 F-Score 实证;[6] ExxonMobil FY2019-FY2021 10-K;[7] 中国神华 2023-2024 年报;[8] Greenblatt (2005) The Little Book That Beats the Market 与 Beneish (1999) The Detection of Earnings Manipulation。
By m8 康哥。关注时效性资讯与跨市场综述。
免责声明:本文为基于公开资料的概念教学与方法论梳理,不构成任何投资建议、买卖推荐或目标价预测。投资者应独立判断、自行承担风险。所引用学术研究与机构数据仅作参照,不代表 m8 立场。
常见问题
这篇文章属于 m8 的哪个研究入口?
这篇文章归入 投资框架 主线,建议先从 投资科普栏目 进入,再结合研究目录里的相邻专题一起看。
后续最需要跟踪哪些变量?
后续重点跟踪:定义是否清楚、指标适用边界、公司案例是否可验证,以及这个框架在哪些市场环境下会失效。
这篇内容可以直接当作投资建议吗?
不可以。m8 的文章用于整理公开信息、研究框架和风险变量,不构成个股买卖建议,也不替代个人的仓位管理和风险评估。
m8 会如何更新这类主题?
如果后续出现财报、政策、订单、资金流或估值假设的关键变化,m8 会在对应栏目和专题页继续补充更新,并通过内链把新旧文章串起来。