[9th Place] Model Predictions as Features

[第9名] 将模型预测作为特征

作者： John Mitchell (MASTER) | 比赛排名： 第9名

感谢 Kaggle 举办了另一场精彩的比赛，特别感谢所有参与并分享模型的人。

我在这里的方法与 Gemstone Price 比赛中的方法大致相似，即我使用模型预测作为附加特征。不过，对于生成训练集的预测，我采取了一种更常规的方法，即简单地通过交叉验证来完成。具体来说，我选取了以下模型：

对于上述每个模型，我都生成了训练集（通过交叉验证）、测试集和原始数据集的预测结果。模型 1 的预测结果被视为一个新特征，模型 2-5 的预测结果也同样处理。这提供了额外的五个特征，我随后将其用于预测。

这五个模型使用扩展后的特征集重新运行，生成了我所谓的模型 1M、2M、3M 和 4M（没有 5M，因为结果与模型 5 的预测完全相同）。

我将这些模型与来自模型 1 的另一个提交文件（模型 1A）以及以下五个公共模型结合在一起：

因此，如果我们算一下，现在总共有 15 个模型可以集成：0, 1, 1A, 1M, 2, 2M, 3, 3M, 4, 4M, 5, 6, 7, 8, 9。

我尝试了两种方法。在 Gemstone 比赛中，简单的中位数效果很好，但在这里我发现一个非常宽松拟合的玻尔兹曼集成效果更好——其参数设定为模型权重总和约等于六个模型。

[第9名] 将模型预测作为特征