AI × 量化研究 · 第二篇

AI 读文本,
到底加了多少? Does text help a machine that already reads the numbers?

一台已经会算市盈率、动量、市值的机器,再让它“读懂”财报里的文字——
这多出来的一点,到底值不值?我们较真地量了一量。

向下滚动
01 — 一个更刁钻的问题

不是“AI 能不能读文本”,
而是“读了,有没有用”。

上一篇我们证明了:让 AI 读业绩预告的文字、判断盈利质量,能预测股价。但有个更难、更诚实的问题没回答——

一个正经的量化模型,本来就吃了一堆数字因子(市值、估值、动量、换手、超预期幅度……)。很多文本信号其实和这些数字是重复的。那么:把 AI 读出来的文字特征,叠加到这台已经很强的数字机器上,还能不能再榨出新东西?

重复的信号不值钱。
只有增量才值钱。
02 — 实验台

17 个特征,
一台梯度提升树。

46,944 条业绩预告事件上,每条配齐两类特征:

12
数字特征
估值·技术·超预期
5
AI 文本特征
可持续/一次性/语气…
2020–26
滚动样本外
留 100 天防泄漏

用 LightGBM 预测公告后的超额收益,做一个干净的消融实验:只喂数字 vs 数字+文本,比样本外的预测力。规矩很严——只用过去训练、预测未来,训练和测试之间留缓冲带,杜绝“偷看答案”。

03 — 发现一

文本确实加了一点。

加上 AI 文本后,样本外预测力(IC)实打实地上了一个台阶:

消融实验 IC 对比
图 1:样本外 Rank IC。蓝/金为 20日/60日。“数字+文本”稳压“仅数字”;而“仅文本”几乎贴地。
Interactive · 拨一下开关

给模型「关掉 / 打开」AI 文本

0.040
样本外 IC(20日)
1.01
顶组组合夏普
1.60
多空夏普
这是不读文本的基线。点“数字+AI文本”看变化 →
深入一层 · 真实数字表
特征集IC(20日)IC(60日)
仅数字0.03990.0856
数字+文本0.05280.0932
仅文本0.00070.0094

分组消融(60日):去掉估值 IC 从 0.093 跌到 0.041(估值是骨架);去掉文本 0.093→0.086(这就是文本的增量 +0.0076)。

04 — 发现二(关键)

但文本单独几乎没用——
它靠“看人下菜碟”。

最有意思的反差:上面那张图里,“仅文本”的 IC 几乎是 0。也就是说,光凭 AI 的文字判断去选股,基本不灵。可它叠加到数字上又确实有用。怎么回事?

答案是交互:同一句“经营改善”,在大盘价值股小盘成长股里,含义完全不同。文本不是独立信号,而是一个“看数字情境下菜碟”的调节变量。SHAP 把每个文本特征的贡献拆开,49%–68% 都来自和数字特征的交互——最强的搭档正是市值和价值

SHAP 重要性与交互
图 3:(左) 特征重要性,蓝色为 AI 文本;(右) 每个文本特征的价值大半是“交互”(蓝)而非独立主效应(金)。
一句话

文本不是“替代”数字的新 alpha,而是“精修”数字的调味料——它告诉模型:这条数字信号,在这种公司身上要信几分

05 — 钱上看

夏普 1.60 → 1.85

把模型预测拿去真刀真枪建仓(持有60天、扣交易成本),多空组合的夏普从纯数字的 1.60 提到 1.85,多头组合也从 1.01 升到 1.09,双双远超沪深300。

组合净值曲线
图 2:顶组组合净值(对数轴)。全模型(蓝)稳压纯数字(金),两者都把沪深300(点)甩在身后。
深入一层 · 组合与张成回归
组合(60日,扣成本)年化夏普回撤
全模型 多空22.2%1.85−13.4%
纯数字 多空18.5%1.60−15.3%
全模型 顶组27.1%1.09−36.4%

全模型多空对 CH-4 因子的 alpha 为 19.1%/年(t=5.24)——但这主要是数字基座。张成回归(全模型~纯数字)显示,文本的纯增量收益 +4.9%/年,t=1.74(不显著)。这是最该诚实的一点。

06 — 是真的吗 & 它的边界

通过了证伪,
但我们不吹大。

安慰剂(通过)

把文本特征打乱重跑5次,增量消失:真文本 IC 高于全部 5 次打乱。增量来自真实文字信息,不是“多塞几列”的假象。

逐年(大体成立)

7 个样本外年份里,文本增量 5 年为正。

换模型(混合,如实报告)

对主模型 LightGBM 两个尺度都正;但随机森林(60日)、线性模型(20日)上没增量。它依赖模型能否吃下“交互”,不是放之四海皆准。

纯增量收益(边际)

剥离数字后,文本的独立收益 +4.9%/年但 t=1.74,统计上还不够硬。

逐年增量
图 4:逐年文本增量 IC。多数年份为正,2022(60日)、2024(20日)为负——不是全天候。
07 — 带走
AI 读出的文本,是给数字机器的
精修,不是替代
值得加,但别神化。

这篇研究最大的价值,是它的诚实和深度:它没有兜售一条暴利曲线,而是干净地量出了"AI 文本到底加了多少"——一个真实、温和、且靠交互起作用的增量。比起"AI 能不能读财报",更值得问的是:在什么样的数字情境下,软信息才真正变得重要。