第一名解决方案及代码

更新：代码已在 GitHub 上发布

恭喜所有获胜者以及在榜单波动中幸存下来的参赛者。感谢 Kaggle 和主办方团队带来这场有趣的比赛。

除了一些技巧之外，几乎所有的提升都是通过模型集成实现的。因此，在这篇文章中，我将简要描述最后一周的分数提升轨迹。详细内容将通过代码分享。

通用设置

网络类型

主干网络

数据集

损失函数

优化器

数据增强

起初，我尝试训练一个好的单一网络。我花了两个星期努力提高和稳定 LB 分数，但失败了。

我认为 LB 分数不稳定的原因是分割性能较差。如果我们能有一个更强大的分割模型，就能减少分类性能较差的影响。

因此，我开始尝试训练好的纯分割模型。因为我可以使用分类模型过滤掉负样本预测，所以只需要正标签来训练。

从这时起，CV 和 LB 的相关性变得很好。我训练了几个具有不同主干网络、图像尺寸等的分割模型。

现在，分割部分已经足够好了。所以，我又增加了两个带分类头的模型。

为了利用分割模型的性能，我使用了前 K 个像素概率的平均值作为分类概率。

cls_probabilities = np.sort(mask_probabilities.reshape(4, -1), axis=1)
cls_probabilities = np.mean(cls_probabilities[:,-17500:], axis=1)