AI 读文本，到底加了多少？· 多模态因子合成

01 — 一个更刁钻的问题

不是“AI 能不能读文本”，
而是“读了，有没有用”。

上一篇我们证明了：让 AI 读业绩预告的文字、判断盈利质量，能预测股价。但有个更难、更诚实的问题没回答——

一个正经的量化模型，本来就吃了一堆数字因子（市值、估值、动量、换手、超预期幅度……）。很多文本信号其实和这些数字是重复的。那么：把 AI 读出来的文字特征，叠加到这台已经很强的数字机器上，还能不能再榨出新东西？

重复的信号不值钱。
只有增量才值钱。

02 — 实验台

17 个特征，
一台梯度提升树。

在 46,944 条业绩预告事件上，每条配齐两类特征：

数字特征
估值·技术·超预期

AI 文本特征
可持续/一次性/语气…

2020–26

滚动样本外
留 100 天防泄漏

用 LightGBM 预测公告后的超额收益，做一个干净的消融实验：只喂数字 vs 数字+文本，比样本外的预测力。规矩很严——只用过去训练、预测未来，训练和测试之间留缓冲带，杜绝“偷看答案”。

03 — 发现一

文本确实加了一点。

加上 AI 文本后，样本外预测力（IC）实打实地上了一个台阶：

消融实验 IC 对比 — 图 1：样本外 Rank IC。蓝/金为 20日/60日。“数字+文本”稳压“仅数字”；而“仅文本”几乎贴地。

Interactive · 拨一下开关

给模型「关掉 / 打开」AI 文本

0.040

样本外 IC（20日）

1.01

顶组组合夏普

1.60

多空夏普

这是不读文本的基线。点“数字+AI文本”看变化 →

深入一层 · 真实数字表

特征集	IC(20日)	IC(60日)
仅数字	0.0399	0.0856
数字+文本	0.0528	0.0932
仅文本	0.0007	0.0094

分组消融(60日)：去掉估值 IC 从 0.093 跌到 0.041（估值是骨架）；去掉文本 0.093→0.086（这就是文本的增量 +0.0076）。

04 — 发现二（关键）

但文本单独几乎没用——
它靠“看人下菜碟”。

最有意思的反差：上面那张图里，“仅文本”的 IC 几乎是 0。也就是说，光凭 AI 的文字判断去选股，基本不灵。可它叠加到数字上又确实有用。怎么回事？

答案是交互：同一句“经营改善”，在大盘价值股和小盘成长股里，含义完全不同。文本不是独立信号，而是一个“看数字情境下菜碟”的调节变量。SHAP 把每个文本特征的贡献拆开，49%–68% 都来自和数字特征的交互——最强的搭档正是市值和价值。

SHAP 重要性与交互 — 图 3：(左) 特征重要性，蓝色为 AI 文本；(右) 每个文本特征的价值大半是“交互”(蓝)而非独立主效应(金)。

一句话

文本不是“替代”数字的新 alpha，而是“精修”数字的调味料——它告诉模型：这条数字信号，在这种公司身上要信几分。

05 — 钱上看

夏普 1.60 → 1.85。

把模型预测拿去真刀真枪建仓（持有60天、扣交易成本），多空组合的夏普从纯数字的 1.60 提到 1.85，多头组合也从 1.01 升到 1.09，双双远超沪深300。

组合净值曲线 — 图 2：顶组组合净值（对数轴）。全模型(蓝)稳压纯数字(金)，两者都把沪深300(点)甩在身后。

深入一层 · 组合与张成回归

组合(60日,扣成本)	年化	夏普	回撤
全模型多空	22.2%	1.85	−13.4%
纯数字多空	18.5%	1.60	−15.3%
全模型顶组	27.1%	1.09	−36.4%

全模型多空对 CH-4 因子的 alpha 为 19.1%/年(t=5.24)——但这主要是数字基座。张成回归(全模型~纯数字)显示，文本的纯增量收益 +4.9%/年，t=1.74（不显著）。这是最该诚实的一点。

06 — 是真的吗 & 它的边界

通过了证伪，
但我们不吹大。

✓

安慰剂（通过）

把文本特征打乱重跑5次，增量消失：真文本 IC 高于全部 5 次打乱。增量来自真实文字信息，不是“多塞几列”的假象。

✓

逐年（大体成立）

7 个样本外年份里，文本增量 5 年为正。

≈

换模型（混合，如实报告）

对主模型 LightGBM 两个尺度都正；但随机森林(60日)、线性模型(20日)上没增量。它依赖模型能否吃下“交互”，不是放之四海皆准。

≈

纯增量收益（边际）

剥离数字后，文本的独立收益 +4.9%/年但 t=1.74，统计上还不够硬。

逐年增量 — 图 4：逐年文本增量 IC。多数年份为正，2022(60日)、2024(20日)为负——不是全天候。

07 — 带走

AI 读出的文本，是给数字机器的
精修，不是替代。
值得加，但别神化。

这篇研究最大的价值，是它的诚实和深度：它没有兜售一条暴利曲线，而是干净地量出了"AI 文本到底加了多少"——一个真实、温和、且靠交互起作用的增量。比起"AI 能不能读财报"，更值得问的是：在什么样的数字情境下，软信息才真正变得重要。

不是“AI 能不能读文本”，而是“读了，有没有用”。

17 个特征，一台梯度提升树。