[第9名] 简单且某种程度上稳定的方法

作者： Vadim Timakin (Competition Master)
比赛排名： 第9名

大家好！首先，我要感谢比赛的组织者，正是因为这次比赛，我离在17岁获得 Kaggle 比赛大师称号的目标更近了一步。

我在上一场比赛结束两周后才开始解决这次比赛，所以我像往常一样没有时间从头开始编写我的流程。我选择了这个笔记本作为基础。我花了两周时间尝试不同的实验方法。我试图将这个问题作为分割或检测问题来解决，我采用了预训练模型并将它们的头部替换为分类头。然而，这些想法都没有产生令人满意的排行榜分数。

与此同时，我在训练 Efficientnet3D。由于我没有很多的硬件资源和时间，我使用了较小的图像尺寸——224。与往常的建模或应用增强不同，我决定花时间检查我的解决方案有多稳定。作为一个实验，我决定在不同的随机种子上运行我的解决方案10次（在 RTX 3080 上训练不到3小时），这是我第一次在比赛中做这样的事情。在进行了5次这样的训练后，交叉验证（CV）的范围等于 [0.5, 0.54]，所以我中断了这个实验。距离比赛结束还有几天，我决定在更大的图像尺寸上训练模型，并以同样的方式检查这个解决方案的稳定性，所以我将图像大小从224切换到了384。这次5次训练后的 CV 范围大约是 [0.52, 0.55]，我觉得这很有趣，因为这应该意味着更大的图像尺寸会产生更好的稳定性。

最后，我选择了这5次训练（每次5折）的集成作为我的最终提交。它在公共排行榜上得分 0.66701，在私人排行榜上得分 0.60186，这分别比之前的提交（基于224图像尺寸的单次训练）高出 0.07 和 0.03。也许更大的图像尺寸会产生更高且更稳定的分数，但我没有时间去训练它。我只关注验证集，根本不看排行榜，我只提交了两个验证集表现最好的解决方案，这样我就不必去选择了。

我个人感到震动的原因在于，我验证集最好的解决方案同时也是（经测试）最稳定的方案。我尽我所能让它稳定，但我清楚地明白，仅仅使用随机预测也有可能得到同样的分数。

对于那些正在解决但最终没有获得奖牌的人，首先我对你们表示极大的尊重，其次我请求你们不要难过。我知道那种感觉，我曾经花了3个月解决一场比赛，但因为嘈杂的排行榜甚至没有获得奖牌。你可以在这里查看这个解决方案。那是我在16岁时写的，当时那是最好的解决方案。

祝你们在接下来的比赛中好运，我们那里见！

[9th] Simple and kinda stable approach

[第9名] 简单且某种程度上稳定的方法

同比赛其他方案