返回列表

7th place solution

382. Plant Pathology 2020 - FGVC7 | plant-pathology-2020-fgvc7

开始: 2020-03-09 结束: 2020-05-26 作物智能识别 数据算法赛
第7名解决方案

第7名解决方案

作者:mr_t23 | 排名:第7名

我在这次比赛中使用的架构是 TResNet,它在 GPU 上提供了非常好的速度-精度-批次大小权衡。例如,我能够在输入分辨率为 600x600、批次大小为 64 的情况下进行训练,训练速度达到 90 张/秒,这使我能够快速高效地进行实验。

  • 作为损失函数,我使用了 软三元组损失 + 交叉熵。
  • 我在训练和推理中都使用了挤压裁剪配合 8向旋转 增强技术。
  • 我使用了类别平衡,给予 class1 更高的权重。如果不进行类别平衡,我就无法正确学习该特定类别,比赛的损失指标会给我带来巨大的惩罚。
  • 我使用伪标签稍微丰富了超小的训练集(将大约 60% 的测试集添加到了训练集中)。
  • 我使用了 EMA(指数移动平均)来进一步缩短训练时间并提供更好的结果。
  • 我的集成模型由不同的输入分辨率和不同的增强策略组成。

附言 1:
“不要相信 LB(排行榜),要相信你的 CV(交叉验证)”?
Kaggle 论坛上的每个人都在这么说,但事后看来,我的公开分数和私有分数之间存在很强的相关性。
如果我当时选择了公开分数最高的结果提交,我最终会获得第2名 :-)

附言 2:
测试集太小了,这给最终排名引入了太多的随机性和运气成分。

同比赛其他方案