491. Sorghum -100 Cultivar Identification - FGVC 9 | sorghum-id-fgvc-9
恭喜所有获奖者。感谢 Kaggle 和主办方团队举办了这场有趣的比赛。我要感谢我的队友 @SisuoLYU 和 @haogood666!
通过数据集分析,可以发现本题的数据存在以下分类难点:
最终,我们的训练尺寸为:1024x1024。我们将 png 格式转换为 jpeg 格式,节省了存储空间。感谢 @Mithil Salunkhe 在 此处 提供的开源 jpeg 数据。
在此提到,我们对训练集和测试集都进行了图像直方图均衡化预处理,改善了曝光图像的问题。在此非常感谢 @Jun-Ming Chen 的开源 Notebook LB 0.885 Sorghum Higher Accuracy。我们参考了其中的许多想法和建议。

基线: 初始调试是在 512x512 图像上训练的,使用 ResNet50 模型、CrossEntropyLoss、余弦重启学习率计划和 AdamW 优化器。
总结:
| 方法 | 分数提升 |
|---|---|
| 基线 (resnet50, 512x512) | 0.73 |
| 直方图均衡化 | +0.03 |
| Ibn-resnet50 | +0.05 |
| BNN-Neck | +0.005 |
| 最后 CNN 层步长改为 1 | +0.005 |
| Arcface (s=30, m=0.3) | +0.015 |
| Mixup | +0.01 |
| Cutmix | +0.005 |
| AWP 对抗训练 | +0.01 |
| 512x512 -> 1024x1024 | +0.04 |
| FGVC8 数据 | +0.03 |
| TTA (测试时增强) | +0.02 |
| 伪标签 | +0.01 |
| 总分 | ≈0.957 |
Ibn-resnet: IBN-Net 集成了 BN 和 IN,可以提高模型的学习能力和泛化能力。设计原则是:在网络浅层同时使用 IN 和 BN,在网络深层只使用