19th Place Solution - First Time With NFNets | 优胜方案

第19名方案 - 首次使用 NFNets

作者： Ertuğrul Demir | 比赛排名： 第19名

大家好，祝贺大家的辛勤工作。在开始之前，我想感谢我的队友 @pukkinming 、 @frtgnn 和 @divyansh22 的辛勤付出和投入。这场比赛对我们来说非常有趣，我们在过程中学到了很多。

同时也想感谢所有分享代码、想法、讨论、数据集等的参赛者。

在这个过程中，我们尝试了许多不同的想法，既有简单的也有复杂的，但我将分享一些关键点，以保持简洁：

预处理

我们尝试了几种架构，但主要在以下两种模型上取得了 CV（交叉验证）成功：

在获得稳定的 CV/LB（公开排行榜）相关性后，我们试图尽可能提高 CV 分数。首先，我们在训练图像上尝试了 ImageNet 预训练模型，用不同的损失函数、学习率调度器、优化器组合来测试它们的极限。

我们发现 Ranger 优化器收敛更快，而 SAM 优化器泛化能力更好。鉴于此，我们决定采用一种模型蒸馏的方式：先使用 Ranger，然后用 SAM 优化器进行微调以寻找极小值。

在最后几个小时，我们在决定提交哪个方案作为最佳选择。最终，我们选择了 CV 最高的集成模型，结果发现那确实是我们最好的私有排行榜提交。

我想说我们的 NfNet F3 模型给出了非常稳健的结果，帮助我们在榜单波动中幸存下来。有段时间我们几乎要放弃那个架构并继续前进，因为性能/时间的权衡问题。我想再次感谢我的队友对我对该模型的痴迷的耐心，以及忍受我关于它们的无尽改进想法 :)

我实际上分享了一个早期版本作为公共 notebook，我们的私有模型是稍作修改/预训练的版本，采用了更重的方法。你可以在这里查看代码：