返回列表

Public: 3rd -> Private: 22nd | Trust Your CV

657. Playground Series - Season 5, Episode 6 | playground-series-s5e6

开始: 2025-06-01 结束: 2025-06-30 作物智能识别 数据算法赛
公开榜:第 3 名 -> 私有榜:第 22 名 | 相信你的交叉验证 (CV)

公开榜:第 3 名 -> 私有榜:第 22 名 | 相信你的交叉验证 (CV)

作者:H. Buğra Eken
发布日期:2025-07-01

随着比赛尘埃落定,我们的最终结果——公开榜分数 0.38428 降至私有榜分数 0.38387——提供了一个清晰而宝贵的教训。本文将详细介绍我们的最终集成策略,但更重要的是,它将反思我们的历程如何验证了竞争对手 Ravi R 分享的关键建议:必须始终谨慎并相信自己的交叉验证(CV)分数。

我们的获胜策略概要

我们的顶级解决方案不是一个简单的混合,而是一个结构化的 10 模型层级集成。我们手动将表现良好的公开提交方案分为三个不同的集群:

  • 一个"精英"组,包含得分最高的模型。
  • 一个"优秀"组,由强大的互补模型组成。
  • 一个单独的"独立"模型,因其多样性而被选中,以覆盖其他模型的盲点。

最终预测来自这三组代表之间精心调整的加权投票。事实证明,这种结构比我们测试的任何其他结构都更有效。

优化历程

这个最终模型是数十次系统实验的结果。我们从简单的混合开始,演变为上述的层级结构,然后开始了漫长的“爬山”过程。我们精心调整参数(rank_pointsweight_power),并进行单一的孤立模型交换,以找到最佳的 10 模型阵容。这段旅程告诉我们,集成化学性质非常敏感,简单地添加更高分的模型并不总能保证更好的结果。

最终教训:“相信你的 CV"

我们的最终分数——公开榜 0.38428 和私有榜 0.38387——完美诠释了竞争对手 Ravi R 在比赛期间分享的建议。他明智地警告不要追逐那些没有稳固的交叉验证(CV)策略支持的、仅为了公开榜分数而做的混合方案。

由于我们集成的是公开提交方案,公开榜是我们唯一的验证形式。我们的整个优化过程,尽管方法严谨,但本质上是在针对那个特定的公开数据集微调我们的提交方案。私有分数的微小下降是经典的“震荡”,也是没有独立 CV 分数所付出的代价。我们的经历完美验证了 Ravi 的观点:公开榜是一个指南,而不是终极真理。

感谢社区为此提供的公开工作。祝大家 Kaggle 愉快!

同比赛其他方案