一台已经会算市盈率、动量、市值的机器,再让它“读懂”财报里的文字——
这多出来的一点,到底值不值?我们较真地量了一量。
上一篇我们证明了:让 AI 读业绩预告的文字、判断盈利质量,能预测股价。但有个更难、更诚实的问题没回答——
一个正经的量化模型,本来就吃了一堆数字因子(市值、估值、动量、换手、超预期幅度……)。很多文本信号其实和这些数字是重复的。那么:把 AI 读出来的文字特征,叠加到这台已经很强的数字机器上,还能不能再榨出新东西?
在 46,944 条业绩预告事件上,每条配齐两类特征:
用 LightGBM 预测公告后的超额收益,做一个干净的消融实验:只喂数字 vs 数字+文本,比样本外的预测力。规矩很严——只用过去训练、预测未来,训练和测试之间留缓冲带,杜绝“偷看答案”。
加上 AI 文本后,样本外预测力(IC)实打实地上了一个台阶:
| 特征集 | IC(20日) | IC(60日) |
|---|---|---|
| 仅数字 | 0.0399 | 0.0856 |
| 数字+文本 | 0.0528 | 0.0932 |
| 仅文本 | 0.0007 | 0.0094 |
分组消融(60日):去掉估值 IC 从 0.093 跌到 0.041(估值是骨架);去掉文本 0.093→0.086(这就是文本的增量 +0.0076)。
最有意思的反差:上面那张图里,“仅文本”的 IC 几乎是 0。也就是说,光凭 AI 的文字判断去选股,基本不灵。可它叠加到数字上又确实有用。怎么回事?
答案是交互:同一句“经营改善”,在大盘价值股和小盘成长股里,含义完全不同。文本不是独立信号,而是一个“看数字情境下菜碟”的调节变量。SHAP 把每个文本特征的贡献拆开,49%–68% 都来自和数字特征的交互——最强的搭档正是市值和价值。
文本不是“替代”数字的新 alpha,而是“精修”数字的调味料——它告诉模型:这条数字信号,在这种公司身上要信几分。
把模型预测拿去真刀真枪建仓(持有60天、扣交易成本),多空组合的夏普从纯数字的 1.60 提到 1.85,多头组合也从 1.01 升到 1.09,双双远超沪深300。
| 组合(60日,扣成本) | 年化 | 夏普 | 回撤 |
|---|---|---|---|
| 全模型 多空 | 22.2% | 1.85 | −13.4% |
| 纯数字 多空 | 18.5% | 1.60 | −15.3% |
| 全模型 顶组 | 27.1% | 1.09 | −36.4% |
全模型多空对 CH-4 因子的 alpha 为 19.1%/年(t=5.24)——但这主要是数字基座。张成回归(全模型~纯数字)显示,文本的纯增量收益 +4.9%/年,t=1.74(不显著)。这是最该诚实的一点。
把文本特征打乱重跑5次,增量消失:真文本 IC 高于全部 5 次打乱。增量来自真实文字信息,不是“多塞几列”的假象。
7 个样本外年份里,文本增量 5 年为正。
对主模型 LightGBM 两个尺度都正;但随机森林(60日)、线性模型(20日)上没增量。它依赖模型能否吃下“交互”,不是放之四海皆准。
剥离数字后,文本的独立收益 +4.9%/年但 t=1.74,统计上还不够硬。
这篇研究最大的价值,是它的诚实和深度:它没有兜售一条暴利曲线,而是干净地量出了"AI 文本到底加了多少"——一个真实、温和、且靠交互起作用的增量。比起"AI 能不能读财报",更值得问的是:在什么样的数字情境下,软信息才真正变得重要。