460. Tabular Playground Series - Oct 2021 | tabular-playground-series-oct-2021
大家好,
我的解决方案是公共和私有 AutoML 解决方案的组合,其中梯度提升模型(XGB、LGB、CAT、HGB)占据了重要地位。
正如 @olivrk 在他的解决方案中提到的那样,要在本次比赛中取得高分,关键的一点是结合一个或多个高效的神经网络(NN)模型。
我主要使用了 https://www.kaggle.com/kavehshahhosseini/tps-oct-2021-multi-input-neural-network,并进行了 25 次种子迭代,以使结果稳健。
最后一步包括通过伪标签重新训练主要模型(如果测试概率 < 0.05 => 目标值为 0;如果测试概率 >= 0.95 => 目标值为 1,并将测试行添加到训练集中),这增加了额外的 0.000X 性能提升。
我们会在 11 月的比赛见面吗?同样是 AUC 指标。
小提示:神经网络模型在这个新比赛中的表现要好得多。
祝好,
Mathurin