返回列表

Gold medal - 12 place solution

363. Bengali.AI Handwritten Grapheme Classification | bengaliai-cv19

开始: 2019-12-19 结束: 2020-03-16 计算机视觉 数据算法赛
金牌方案 - 第12名解决方案

金牌方案 - 第12名解决方案

作者: Vlad Vaduva (队长), Adrian Iordache
比赛排名: 第12名

首先,我要感谢主办方举办了一场精彩的比赛。这真的非常有挑战性。我的团队取得了不错的成绩,这是我们获得的第一枚金牌,比这更重要的是,我们学到了很多有用的东西。

以下是我们解决方案的简要概述:

我们使用了3种不同类型的架构。

第一种架构详情:

  • 使用 MultilabelStratifiedKFold 创建了5折(最终预测时取平均值混合)
  • 图像大小:128x128
  • 数据增强:Cutmix (0.4) / Mixup (0.4),随机选择其中一种
  • 标签平滑
  • 优化器:Adam (lr=0.001, ReduceLROnPlateau(factor=0.8, patience=5))
  • 训练了100个 epoch
  • 一个包含186个结果的输出头,然后将结果拆分为3个 softmax
架构图1

第二种架构详情:

  • 使用 MultilabelStratifiedKFold 创建了5折(最终预测时取平均值混合)
  • 图像大小:原始图像尺寸
  • 数据增强:Cutmix (从 0.3, 0.4 ,0.5, 0.6, 0.7 中随机选择) + Cutout(max_holes=6, max_height=12, max_width=12, p=0.5 )
  • 标签平滑
  • 优化器:Adam (lr=0.001, ReduceLROnPlateau(factor=0.8, patience=5))
  • 训练了150个 epoch
架构图2

第三种架构详情

  • 使用 MultilabelStratifiedKFold 创建了2折(最终预测时取平均值混合)
  • 图像大小:300x300
  • 数据增强:Cutmix (从 0.3, 0.4 ,0.5, 0.6, 0.7 中随机选择) + Cutout(max_holes=6, max_height=12, max_width=12, p=0.5 )
  • 标签平滑
  • 优化器:Adam (lr=0.001, ReduceLROnPlateau(factor=0.8, patience=5))
  • 训练了150个 epoch
架构图3

最终的提交结果是这3种架构所有折次(共12折)预测结果的平均值,每折权重相同。

公开排行榜到私人排行榜的分数变化是 0.9784 -> 0.9507。

结论

最后,我可以说我们的解决方案没有使用任何袖里乾坤或不寻常的技巧,只是遵循了计算机视觉领域的最佳实践。

同比赛其他方案