字里行间的 Alpha · 用 AI 读懂财报预告

01 — 一个谜题

两家公司，利润都涨了 200%。
它们一样吗？

每年财报季，上市公司会先发一份“业绩预告”，告诉大家这季利润大概涨跌多少。假设有两家公司，预告利润都增长 200%——数字一模一样。但翻开它们各自写的“变动原因”，故事完全不同：

REAL

+200%

A 公司：真·赚钱

“主营产品量价齐升。”
核心生意越做越好——这种利润下个季度还会有。

FAKE

+200%

B 公司：一次性烟花

“出售子公司股权产生投资收益。”
卖了套房换的钱——下季度就没了，是放了一次烟花。

这就是“盈利质量”：同样的数字，一个是细水长流的真金，一个是一闪而过的烟花。区别藏在那段文字里，而不在数字里。

02 — 传统量化的盲区

机器只会算数，
读不懂人话。

几十年来，量化投资靠的是数字：市盈率、涨幅、成交量……可“盈利质量”这件事，数字上看 A、B 两家一模一样。传统模型把它们当成同一类，于是把烟花也当成了真金。

我们验证了这一点：单看“利润涨多少”这个数字去选股，几乎赚不到钱——因为涨得最猛的那一批里，混进了大量“假超预期”的烟花，把信号稀释没了。

真正值钱的信息，
是用文字写的。

03 — 让 AI 读潜台词

大模型，
刚好擅长读人话。

我们让一个大语言模型（AI）去读每一条业绩预告的“变动原因”，像一位资深财务分析师那样判断：这次利润增长，是真·经营改善，还是一次性的虚胖？

关键的一点：AI 只读文字，从不看股价。它给出的“质量分”和后来涨没涨完全无关——所以这不是“事后诸葛亮”，而是一个干净的、独立的判断。

我们一共让 AI 读了 53,525 条预告。它的判断有多准？拿两个完全不同的大模型分别读同一批，结论一致率高达 94%（统计学上的 κ=0.89，近乎完美）——说明这不是某个模型的玄学，而是文字里客观存在的信息。

深入一层 · 给较真的你：AI 到底输出了什么

对每条预告，模型（Qwen3.7-max，temperature=0，强制 JSON 输出）只读三样东西：预告类型、净利变动区间、以及那段“变动原因”原文，输出结构化字段：

driver（主营 / 一次性 / 低基数 / 混合）、sustainable∈[0,1]（可持续性）、real_beat（是否真改善）、onetime_ratio∈[0,1]（一次性占比）、tone∈[−1,1]。综合质量分 Q = z(sustainable) + z(−onetime) + real_beat。

跨模型一致性（qwen3.7-max vs deepseek-v4-pro，随机 600 条）：real_beat 一致率 94.3%、Cohen's κ=0.89；sustainable 相关 0.90、onetime 相关 0.80。标签是文本里客观可复现的信息，不依赖具体模型。

Interactive · 试试身手

你来当一次分析师

下面是真实业绩预告里的“变动原因”节选。读完，判断这是真金（可持续）还是烟花（一次性）。点完看 AI 怎么判。

案例 1 · 某公司预告净利 +38%~80%

“控股子公司进入强制清算阶段、公司丧失控制权，不再纳入合并报表并按公允价值计量；另一子公司解散并确认补偿金……整体给净利润带来正向影响。”

AI 判定：烟花 🎆　real_beat=false，可持续性 0.35。利润全来自子公司清算、公允价值变动、解散补偿——典型一次性损益，下季打回原形。

案例 2 · 某公司预告净利 +146%

“公司积极拓展信息技术服务业务，业务规模增加、销售净利率提高，带动归母净利润增长……”

AI 判定：真金 ✅　real_beat=true，可持续性 0.65。增长由主营业务规模与盈利能力驱动，属经营性改善，可持续。

案例 3 · 某公司预告扭亏为盈

“本期收到政府补助及税收返还较上年同期大幅增加；上年同期计提大额资产减值，本期无减值，致同比扭亏。”

AI 判定：烟花 🎆　政府补助不可持续 + 去年低基数（减值），并非主营改善。这类“扭亏”最容易骗人。

案例 4 · 某公司预告净利 +60%~85%

“报告期内公司新建产能逐步释放、下游订单饱满，主营产品销量同比大幅增长；规模效应叠加原材料成本回落，毛利率较上年同期提升。”

AI 判定：真金 ✅　real_beat=true，可持续性 0.7。量价齐升、毛利率改善，纯主营驱动——这是最“硬”的一类。

案例 5 · 某公司预告净利 +120%

“本期处置所持某上市公司股票取得较大投资收益，并收到地方政府土地拆迁补偿款，共同推高本期净利润。”

AI 判定：烟花 🎆　卖股票的投资收益 + 拆迁补偿，两笔都是一次性，与主营无关。数字越漂亮越要警惕。

已判断 0/5　·　与 AI 一致 0 次

04 — 意外的发现

市场短期追烟花，
长期才认真金。

把股票按 AI 的质量判断分开，跟踪它们之后两三个月的走势，出现了一个非常有意思的规律：

“烟花”股（红线）在前 1–2 个月反而涨得更猛——市场被亮眼的数字和重组故事吸引，一拥而上爆炒。但烟花总会熄灭：到第 60 天前后，它掉头向下。而 “真金”股（蓝线）不慌不忙、稳步上行，最终反超。

不同质量的预告之后的股价漂移曲线 — 图 1：公告后的累计超额收益。红线（一次性“烟花”）先冲高、约第 40 天见顶后反转；蓝线（真·经营改善）稳步走高，约第 52 天反超。这正是“短期奖励投机、长期奖励质量”。

用一句话说：A 股短期奖励投机，长期才奖励质量。看懂了这个时间差，机会就出现了。

05 — 一个简单的策略

只买“真金”，
拿够 60 天。

规则朴素到一句话：在发了利好预告、且被 AI 判为高质量的股票里，等权买入一篮子，持有约 3 个月。和“不挑质量全买”、以及“专买烟花”的两种做法对比：

15.3%

只买高质量利好
年化收益

5.8%

只买低质量“烟花”
年化收益

1.9%

同期沪深300
年化收益

高质量篮子的收益是烟花篮子的近 3 倍，且“质量越高、收益越高”一路单调。风险调整后的夏普比率 0.69 vs 0.37——质量过滤实实在在地起了作用。

不同策略的净值曲线 — 图 2：各策略的资金增长曲线（对数坐标）。蓝（高质量）稳居最上，红（低质量）明显落后，沪深300（点线）垫底。

06 — 会不会只是运气？

我们想尽办法
证明它是假的。

一个结果好看不算数——好的研究要反过来攻击自己。我们设了五道“拷问”，每一道都可能推翻结论。它全过了：

✓

随机对照（安慰剂）

随机乱选同样多的股票 200 次，真策略的收益超过其中 99% 以上。不是瞎蒙能蒙到的。

✓

样本外检验

用前几年定规则、后几年验证。规律不但没失效，反而在“没见过”的后半段更强——这和“过拟合会衰减”正好相反。

✓

换个 AI 重做

用第二个独立大模型重新打分，结论几乎一致（κ=0.89）。不是某个模型的偏好。

✓

防“AI 作弊”

只看 AI 训练截止之后才发生的事件——AI 不可能“记得”这些股票后来的涨跌，规律依然成立。

✓

扣掉已知的赚钱因素

用中国学界最严格的因子模型（CH-4）把市场、规模、价值、换手统统扣掉，超额收益依然显著（年化 9.8%，统计量 t=2.87）。

稳健性检验面板 — 图 4：（a）安慰剂——真策略落在随机分布的最右端；（b）持有期 20–120 天，真金始终强于烟花；（c）每个市值档里，真金都赢烟花。

不同因子模型下的超额收益 — 图 3：在四种风险模型下，“买真金、空烟花”的超额收益始终为正、且统计显著（蓝柱）。说明它不是已知赚钱因素的“换皮”。

深入一层 · 给较真的你：回归表与统计量

质量多空在各因子模型下的年化 alpha（Newey-West t）。对中国学界金标准 CH-4 仍显著，且市场/规模暴露≈0：

模型	Alpha(年化)	t
原始超额	8.8%	2.45
FF3+换手	10.9%	3.26
CH-3	9.2%	3.00
CH-4	9.8%	2.87
多头腿 vs CH-4	15.9%	7.54

Fama-MacBeth 横截面回归（被解释=60日超额，每+1个标准差对应的收益）。控制超预期/市值/BM/动量/换手后，质量仍是增量预测：

变量	系数(%/σ)	NW t
质量(合成 Q)	+1.05	3.34
超预期幅度	+1.15	3.48
对数市值	−1.80	−3.32
换手率	−1.50	−5.53

样本：47,691 个有效事件，2018–2026；多空腿市场 β=0.06、规模 β=−0.04（近乎中性）。

07 — 那，市场为什么会犯这个错？

最诚实的答案：
这仍是个谜。

通常这类“市场犯错”会有标准解释——比如散户太多、股票太冷门、没法做空所以纠不了错。我们一个个去测，结果……四个标准解释全都不成立：

✗不是“散户多/换手高”——高低换手的股票没区别
✗不是“小盘冷门难套利”——反而大盘股上效应最强
✗不是“不能做空”——能做空和不能做空的股票一个样
✗不是“没人研究”——分析师覆盖多少都不影响

错误定价无处不在，连大盘、热门、可做空的股票都要 60 天才反应过来。我们最合理的解读是：这是一种“信息处理”的迟钝——质量藏在文字里，读懂它需要花力气，所以市场处理得慢。

这恰恰是关键

这个 alpha 之所以存在，是因为信息难“读懂”，而不是难“交易”。而“读懂大量文字”正是大模型最擅长的事。这就是 AI 在这件事上的真正价值。

08 — 不吹牛的边界

它不是印钞机。

诚实地讲清楚它的局限，才是认真的研究：

· 只在一个市场、一段历史（A股 2018–2026）验证过，换个市场未必成立。
· 最干净的“多空”玩法需要做空，而 A 股做空受限，实盘要用股指期货近似对冲。
· 机制只是“排除了主流解释”，没能彻底证实“为什么”。
· 交易成本是估算的，真金白银实盘还会打折。

但这些不影响核心结论：这个信号是真实的、独立的、可复现的——它扛住了五道证伪拷问。

两家公司，利润都涨了 200%。它们一样吗？

机器只会算数，读不懂人话。

大模型，刚好擅长读人话。