Mitsui 第 14 名提交方案

第 14 名解决方案：MITSUI&CO. 商品预测挑战赛 - Muurur

作者: Muurur
发布日期: 2026-01-25
竞赛排名: 14

总结

比赛的目标是按夏普比率（Sharpe ratio）随时间对金融资产类别进行排名。我在比赛早期建立了一个基于对数收益率的 Ridge 回归模型基线。经过对复杂非线性模型（Boosted Trees）和时间序列方法的广泛实验，我观察到这些方法未能 consistently 优于线性基线。因此，最终提交依赖于这个简单的基线。

特征选择 / 工程

使用的特征： 我只使用了一个特征：对数收益率（logarithmic returns）。
理由： 我选择这个特征是因为每当添加更多特征时，它会增加噪声而不是改善信号。由于我为每个 pair_id 训练了一个单独的模型，添加资产本身的信息似乎没有必要。
关键 Bug： 预测 pipeline 中的特征工程存在一个 bug，导致生成的收益率是过去的一天而不是当天。这是无意的，并且在回顾性回测中恶化了性能。

训练方法

算法： Scikit-learn Ridge 回归。
参数： 标准默认参数。
训练范围： 针对每个特定目标对，使用直到 date_id 1917 的所有可用对数收益率进行训练。我没有包含数据更新中的额外数据。

有趣发现

我进行了滚动回测（从 date_id 1000 开始训练完整可用数据集，评估 90 天后再重新训练），比较了 Ridge 方法与仅均值模型。

市场制度： 在 90 天的比赛窗口中，市场制度变化可能导致结果高度可变。
Ridge 与均值： 虽然均值模型稳定，但 Ridge 回归模型显示出更高的方差和更高的峰值。唯一产生一致正夏普比率的均值模型是计算所有可用数据的均值。
性能： 在市场数据的最后一年，Ridge 回归性能呈上升趋势，优于滚动均值基线。
混合方法： 将均值模型与 Ridge 回归结合削弱了 Ridge 模型的“高峰值”，同时并未抵消低谷。

模型执行时间

该方法极其简单且计算效率高。

指标	时间
训练时间	< 5 秒
推理时间	< 5 秒

Model Comparison Chart

附件资源

技术文档 (1).docx 文件大小：6.4 MB KAGGLE 获胜模型总结.docx 文件大小：199 KB

Mitsui 14th Place Submission