465. Tabular Playground Series - Nov 2021 | tabular-playground-series-nov-2021
我发现 MaxAbsScaler 对数据的转换效果优于 Robust / Standard 或 Power (Gauss) 缩放器。
一些三角函数略微改善了结果,例如 sin(f27)。
我使用了 Keras 神经网络,包含 4 个全连接层,单元数量较多(从 600 开始),并使用了较高的 dropout(0.3)和 swish 激活函数(效果优于 relu)。
选择正确的学习率和学习率调度器对于长时间的 epoch 训练和生成平滑的曲线非常重要。
当数据块的情况变得清晰后,我开始使用简单的 KFold(shuffle=False) 进行 10 次分割——这样正好使用一个数据块进行验证,九个数据块进行学习。
SVM 后处理在一定程度上改善了结果(感谢 @ambrosm)。
当很明显顶部排名存在严重过拟合时,我就只是静待比赛结束了 :)