657. Playground Series - Season 5, Episode 6 | playground-series-s5e6
随着比赛尘埃落定,我们的最终结果——公开榜分数 0.38428 降至私有榜分数 0.38387——提供了一个清晰而宝贵的教训。本文将详细介绍我们的最终集成策略,但更重要的是,它将反思我们的历程如何验证了竞争对手 Ravi R 分享的关键建议:必须始终谨慎并相信自己的交叉验证(CV)分数。
我们的顶级解决方案不是一个简单的混合,而是一个结构化的 10 模型层级集成。我们手动将表现良好的公开提交方案分为三个不同的集群:
最终预测来自这三组代表之间精心调整的加权投票。事实证明,这种结构比我们测试的任何其他结构都更有效。
这个最终模型是数十次系统实验的结果。我们从简单的混合开始,演变为上述的层级结构,然后开始了漫长的“爬山”过程。我们精心调整参数(rank_points、weight_power),并进行单一的孤立模型交换,以找到最佳的 10 模型阵容。这段旅程告诉我们,集成化学性质非常敏感,简单地添加更高分的模型并不总能保证更好的结果。
我们的最终分数——公开榜 0.38428 和私有榜 0.38387——完美诠释了竞争对手 Ravi R 在比赛期间分享的建议。他明智地警告不要追逐那些没有稳固的交叉验证(CV)策略支持的、仅为了公开榜分数而做的混合方案。
由于我们集成的是公开提交方案,公开榜是我们唯一的验证形式。我们的整个优化过程,尽管方法严谨,但本质上是在针对那个特定的公开数据集微调我们的提交方案。私有分数的微小下降是经典的“震荡”,也是没有独立 CV 分数所付出的代价。我们的经历完美验证了 Ravi 的观点:公开榜是一个指南,而不是终极真理。
感谢社区为此提供的公开工作。祝大家 Kaggle 愉快!