返回列表

Mitsui 14th Place Submission

685. MITSUI&CO. Commodity Prediction Challenge | mitsui-commodity-prediction-challenge

开始: 2025-07-24 结束: 2026-01-16 量化投资 数据算法赛
Mitsui 第 14 名提交方案

第 14 名解决方案:MITSUI&CO. 商品预测挑战赛 - Muurur

作者: Muurur
发布日期: 2026-01-25
竞赛排名: 14

总结

比赛的目标是按夏普比率(Sharpe ratio)随时间对金融资产类别进行排名。我在比赛早期建立了一个基于对数收益率的 Ridge 回归模型基线。经过对复杂非线性模型(Boosted Trees)和时间序列方法的广泛实验,我观察到这些方法未能 consistently 优于线性基线。因此,最终提交依赖于这个简单的基线。

特征选择 / 工程

  • 使用的特征: 我只使用了一个特征:对数收益率(logarithmic returns)。
  • 理由: 我选择这个特征是因为每当添加更多特征时,它会增加噪声而不是改善信号。由于我为每个 pair_id 训练了一个单独的模型,添加资产本身的信息似乎没有必要。
  • 关键 Bug: 预测 pipeline 中的特征工程存在一个 bug,导致生成的收益率是过去的一天而不是当天。这是无意的,并且在回顾性回测中恶化了性能。

训练方法

  • 算法: Scikit-learn Ridge 回归。
  • 参数: 标准默认参数。
  • 训练范围: 针对每个特定目标对,使用直到 date_id 1917 的所有可用对数收益率进行训练。我没有包含数据更新中的额外数据。

有趣发现

我进行了滚动回测(从 date_id 1000 开始训练完整可用数据集,评估 90 天后再重新训练),比较了 Ridge 方法与仅均值模型。

  • 市场制度: 在 90 天的比赛窗口中,市场制度变化可能导致结果高度可变。
  • Ridge 与均值: 虽然均值模型稳定,但 Ridge 回归模型显示出更高的方差和更高的峰值。唯一产生一致正夏普比率的均值模型是计算所有可用数据的均值。
  • 性能: 在市场数据的最后一年,Ridge 回归性能呈上升趋势,优于滚动均值基线。
  • 混合方法: 将均值模型与 Ridge 回归结合削弱了 Ridge 模型的“高峰值”,同时并未抵消低谷。

模型执行时间

该方法极其简单且计算效率高。

指标 时间
训练时间 < 5 秒
推理时间 < 5 秒

Model Comparison Chart

同比赛其他方案