返回列表

8th place solution

420. Cassava Leaf Disease Classification | cassava-leaf-disease-classification

开始: 2020-11-19 结束: 2021-02-18 作物智能识别 数据算法赛
第8名方案

第8名方案

作者: czy is not leaky
比赛排名: 第8名

感谢所有的Kaggle参赛者和组织者。我从这次比赛中学到了很多。

数据

  • 使用分层5折交叉验证(stratified 5-fold CV)在2020年的数据上进行训练和验证。

模型

  • EfficientNet B6 (使用 Noisy Student)
  • ResNeSt50
  • Vision Transformer (base patch16)

我最好的单模型是 EfficientNet B6,它在公共排行榜上得分0.903,在私人排行榜上得分0.8946。

数据增强

  • HorizontalFlip (水平翻转), Transpose (转置), VerticalFlip (垂直翻转)
  • HueSaturationValue (色调饱和度亮度调整)
  • CoarseDropout (粗粒度Dropout)
  • RandomBrightnessContrast (随机亮度对比度)
  • ShiftScaleRotate (平移缩放旋转)
  • RGBShift (RGB偏移)
  • Cutmix
  • Fmix
  • Snapmix
  • ISDA (隐式语义数据增强)
    https://arxiv.org/abs/2007.10538

Cutmix和Fmix的结合可以提升CV分数,但Snapmix会让训练变得不稳定,可能需要仔细调整超参数。因为时间原因我没有尝试ISDA,但我认为它可能会带来惊喜的效果。

损失函数

与其他损失函数相比,LabelSmoothing (参数设为0.1或0.2) 取得了最好的表现。

训练

  • 优化器:Adam, AdamW, AdamP, Ranger
  • 学习率调度器:CosineAnnealingWarmRestarts

推理

  • 8xTTA (转置, 翻转)
  • 集成 (简单的平均)

我在这次比赛中学到的最重要的事情就是永不放弃,因为不到最后谁也不知道结果。

最后,希望大家在下一场比赛中都能拿到金牌。感谢我的队长 YuBo 和我的女朋友 MingJun。

同比赛其他方案