返回列表

3rd Place Solution

491. Sorghum -100 Cultivar Identification - FGVC 9 | sorghum-id-fgvc-9

开始: 2022-03-15 结束: 2022-05-30 作物智能识别 数据算法赛
季军解决方案
作者:Gu (团队成员: SisuoLYU, haogood666)
比赛排名:第3名

恭喜所有获奖者。感谢 Kaggle 和主办方团队举办了这场有趣的比赛。我要感谢我的队友 @SisuoLYU@haogood666

数据集

通过数据集分析,可以发现本题的数据存在以下分类难点:

  1. 不同类别之间存在高度的类间视觉相似性,细粒度分类难度大。
  2. 不同日期和一天中不同时间的户外图片光照差异很大,且存在许多曝光过度的图像。
  3. 训练集和测试集来自种植在两个不同田地的高粱,存在域适应问题。
  4. 随着生长时间的推移,植物的状态和高度都在变化。

最终,我们的训练尺寸为:1024x1024。我们将 png 格式转换为 jpeg 格式,节省了存储空间。感谢 @Mithil Salunkhe此处 提供的开源 jpeg 数据。

在此提到,我们对训练集和测试集都进行了图像直方图均衡化预处理,改善了曝光图像的问题。在此非常感谢 @Jun-Ming Chen 的开源 Notebook LB 0.885 Sorghum Higher Accuracy。我们参考了其中的许多想法和建议。

模型

模型架构图

基线: 初始调试是在 512x512 图像上训练的,使用 ResNet50 模型、CrossEntropyLoss、余弦重启学习率计划和 AdamW 优化器。

总结:

方法 分数提升
基线 (resnet50, 512x512) 0.73
直方图均衡化 +0.03
Ibn-resnet50 +0.05
BNN-Neck +0.005
最后 CNN 层步长改为 1 +0.005
Arcface (s=30, m=0.3) +0.015
Mixup +0.01
Cutmix +0.005
AWP 对抗训练 +0.01
512x512 -> 1024x1024 +0.04
FGVC8 数据 +0.03
TTA (测试时增强) +0.02
伪标签 +0.01
总分 ≈0.957

Ibn-resnet: IBN-Net 集成了 BN 和 IN,可以提高模型的学习能力和泛化能力。设计原则是:在网络浅层同时使用 IN 和 BN,在网络深层只使用

同比赛其他方案