返回列表

3rd place solution

460. Tabular Playground Series - Oct 2021 | tabular-playground-series-oct-2021

开始: 2021-10-01 结束: 2021-10-31 药物研发 数据算法赛
第三名方案

第三名方案

作者: Mathurin Ache (Grandmaster) | 排名: 第3名 | 发布时间: 2021-11-01

大家好,

我的解决方案是公共和私有 AutoML 解决方案的组合,其中梯度提升模型(XGB、LGB、CAT、HGB)占据了重要地位。
正如 @olivrk 在他的解决方案中提到的那样,要在本次比赛中取得高分,关键的一点是结合一个或多个高效的神经网络(NN)模型。
我主要使用了 https://www.kaggle.com/kavehshahhosseini/tps-oct-2021-multi-input-neural-network,并进行了 25 次种子迭代,以使结果稳健
最后一步包括通过伪标签重新训练主要模型(如果测试概率 < 0.05 => 目标值为 0;如果测试概率 >= 0.95 => 目标值为 1,并将测试行添加到训练集中),这增加了额外的 0.000X 性能提升。

我们会在 11 月的比赛见面吗?同样是 AUC 指标。
小提示:神经网络模型在这个新比赛中的表现要好得多。

祝好,
Mathurin

同比赛其他方案