22th Place - Lessons learned from a beginner | 优胜方案

第22名 - 初学者的经验教训

作者: IgorMuniz (以及团队 Harold Team Brazil)
比赛排名: 第22名

首先恭喜所有的获奖者。我要感谢 Kaggle 举办这次比赛，这是我第一次能够全身心投入并赢得奖牌的比赛。

对我无效的方法

我们的解决方案基本上是分割模型的集成，并通过后处理去除掩码。

模型（每个模型6折）：

损失函数： BCE + Dice
* 这些模型使用了不同的图像尺寸进行训练 (320x480, 384x576, 512x512, 704x1056)

后处理：
寻找三元组阈值进行二值化，去除小掩码，然后对前两步后剩余的掩码再次进行二值化。所有这些都是利用所有6折的验证数据完成的。

得分情况：
CV: 0.6651
Public LB: 0.67556
Private LB: 0.66498

我对图像分割了解不多，所以这次比赛是一次很棒的学习经历。

我有一个更好的模型，得分为：

CV: 0.6681
Public LB: 0.66759
Private LB: 0.66824

为什么我没有选择它？因为第二个教训……

这让我能够将其与我目前拥有的相同的袋外数据进行比较。ResNet34-Unet + EfficientNetB2-Unet 的简单混合在 CV 上得到了 0.668。

但我读到一些 Kaggle 用户用这种方法效果不佳，我担心我的验证中存在泄漏，而且 Public LB 的分数更差。所以我放弃了这个想法……

我要感谢我的团队和所有以某种方式分享经验的人。

分享是一件很好的事情，但我认为应该在合适的时间进行。正如我所说，我是一个初学者，但我也是一个在这次比赛中通过阅读过去的比赛解决方案而努力工作的人。所以我认为每个人都可以做到同样的事情。