返回列表

[9th Place] Model Predictions as Features

541. Playground Series - Season 3, Episode 10 | playground-series-s3e10

开始: 2023-03-07 结束: 2023-03-20 物理与天文 数据算法赛
[第9名] 将模型预测作为特征

[第9名] 将模型预测作为特征

作者: John Mitchell (MASTER) | 比赛排名: 第9名

感谢 Kaggle 举办了另一场精彩的比赛,特别感谢所有参与并分享模型的人。

我在这里的方法与 Gemstone Price 比赛中的方法大致相似,即我使用模型预测作为附加特征。不过,对于生成训练集的预测,我采取了一种更常规的方法,即简单地通过交叉验证来完成。具体来说,我选取了以下模型:

对于上述每个模型,我都生成了训练集(通过交叉验证)、测试集和原始数据集的预测结果。模型 1 的预测结果被视为一个新特征,模型 2-5 的预测结果也同样处理。这提供了额外的五个特征,我随后将其用于预测。

这五个模型使用扩展后的特征集重新运行,生成了我所谓的模型 1M、2M、3M 和 4M(没有 5M,因为结果与模型 5 的预测完全相同)。

我将这些模型与来自模型 1 的另一个提交文件(模型 1A)以及以下五个公共模型结合在一起:

因此,如果我们算一下,现在总共有 15 个模型可以集成:0, 1, 1A, 1M, 2, 2M, 3, 3M, 4, 4M, 5, 6, 7, 8, 9。

我尝试了两种方法。在 Gemstone 比赛中,简单的中位数效果很好,但在这里我发现一个非常宽松拟合的玻尔兹曼集成效果更好——其参数设定为模型权重总和约等于六个模型。

同比赛其他方案