Public: 3rd -> Private: 22nd | Trust Your CV | 优胜方案

公开榜：第 3 名 -> 私有榜：第 22 名 | 相信你的交叉验证 (CV)

作者：H. Buğra Eken
发布日期：2025-07-01

随着比赛尘埃落定，我们的最终结果——公开榜分数 0.38428 降至私有榜分数 0.38387——提供了一个清晰而宝贵的教训。本文将详细介绍我们的最终集成策略，但更重要的是，它将反思我们的历程如何验证了竞争对手 Ravi R 分享的关键建议：必须始终谨慎并相信自己的交叉验证（CV）分数。

我们的获胜策略概要

我们的顶级解决方案不是一个简单的混合，而是一个结构化的 10 模型层级集成。我们手动将表现良好的公开提交方案分为三个不同的集群：

一个"精英"组，包含得分最高的模型。
一个"优秀"组，由强大的互补模型组成。
一个单独的"独立"模型，因其多样性而被选中，以覆盖其他模型的盲点。

最终预测来自这三组代表之间精心调整的加权投票。事实证明，这种结构比我们测试的任何其他结构都更有效。

优化历程

这个最终模型是数十次系统实验的结果。我们从简单的混合开始，演变为上述的层级结构，然后开始了漫长的“爬山”过程。我们精心调整参数（rank_points、weight_power），并进行单一的孤立模型交换，以找到最佳的 10 模型阵容。这段旅程告诉我们，集成化学性质非常敏感，简单地添加更高分的模型并不总能保证更好的结果。

最终教训：“相信你的 CV"

我们的最终分数——公开榜 0.38428 和私有榜 0.38387——完美诠释了竞争对手 Ravi R 在比赛期间分享的建议。他明智地警告不要追逐那些没有稳固的交叉验证（CV）策略支持的、仅为了公开榜分数而做的混合方案。

由于我们集成的是公开提交方案，公开榜是我们唯一的验证形式。我们的整个优化过程，尽管方法严谨，但本质上是在针对那个特定的公开数据集微调我们的提交方案。私有分数的微小下降是经典的“震荡”，也是没有独立 CV 分数所付出的代价。我们的经历完美验证了 Ravi 的观点：公开榜是一个指南，而不是终极真理。

感谢社区为此提供的公开工作。祝大家 Kaggle 愉快！

Public: 3rd -> Private: 22nd | Trust Your CV

公开榜：第 3 名 -> 私有榜：第 22 名 | 相信你的交叉验证 (CV)

我们的获胜策略概要

优化历程

最终教训：“相信你的 CV"

同比赛其他方案