返回列表

#5 solution (and +141 from Public Leaderboard)

465. Tabular Playground Series - Nov 2021 | tabular-playground-series-nov-2021

开始: 2021-11-01 结束: 2021-11-30 内容安全 数据算法赛
#5 solution (and +141 from Public Leaderboard)

第5名方案(以及公共排行榜 +141 分)

作者:Andrewmatic | 发布时间:2021-12-01
  1. 我发现 MaxAbsScaler 对数据的转换效果优于 Robust / Standard 或 Power (Gauss) 缩放器。

  2. 一些三角函数略微改善了结果,例如 sin(f27)。

  3. 我使用了 Keras 神经网络,包含 4 个全连接层,单元数量较多(从 600 开始),并使用了较高的 dropout(0.3)和 swish 激活函数(效果优于 relu)。

  4. 选择正确的学习率和学习率调度器对于长时间的 epoch 训练和生成平滑的曲线非常重要。

  5. 当数据块的情况变得清晰后,我开始使用简单的 KFold(shuffle=False) 进行 10 次分割——这样正好使用一个数据块进行验证,九个数据块进行学习。

  6. SVM 后处理在一定程度上改善了结果(感谢 @ambrosm)。

  7. 当很明显顶部排名存在严重过拟合时,我就只是静待比赛结束了 :)

同比赛其他方案