685. MITSUI&CO. Commodity Prediction Challenge | mitsui-commodity-prediction-challenge
基于分组集成与推理时滞后混合的稳定商品预测方案
本方案基于表格模型的分组集成,并结合了推理时的滞后混合。
目标使用 target_pairs.csv 中的元数据(LME / JPX / US / FX)进行分组,每组使用受限的、与市场相关的特征集进行训练,以减少噪声。
最重要的性能提升来自于推理过程中对提供的标签滞后(1-4)的大量利用。
根据从 target_pairs.csv 的 pair 字段中提取的市场信息将目标分配给各组。
单一市场和跨市场目标分开处理,使每组能够专注于其主导的市场动态。
每组使用不同的特征子集,主要是与该市场相关的原始信号和聚合数据。
特征主要是横截面的,并按时间步计算:
所有特征都清理了 NaN/inf,并保守填充以避免泄漏。
对于每个目标,训练三个模型:
这些模型的预测在目标级别进行均匀平均。
在推理期间,提供的 label_lags_1 到 label_lags_4 被混合到预测中:
最终预测是模型输出和基于滞后信号的加权组合。
为了减少步长间的波动:
模型在训练数据的最近部分进行训练。
在适用的情况下使用时间序列分割,Leaderboard 一致性是模型选择的主要标准。
完整实现: https://www.kaggle.com/code/halilaka/notebook5da6d36740