返回列表

7-th place solution

346. Severstal; Steel Defect Detection | severstal-steel-defect-detection

开始: 2019-07-25 结束: 2019-10-24 缺陷检测 数据算法赛
第7名解决方案

第7名解决方案

作者: tugstugi, YuanXu
比赛排名: 第7名

我们的队友 xuyuan 和我之前参加过一次分割挑战赛,我们以为这次会稍微容易一些,所以在大约4、5周前才加入这场比赛。但这几周的时间不足以尝试很多东西。我们甚至没有足够的时间来正确训练一个分类器,所以我们坚持使用纯分割集成方法。

我们的最终集成包含了3个 EfficientNet UNet 模型:

  • 2折 EfficientNet-B7 UNet。在 256x384 分辨率下训练,使用了 mixup 和标签平滑。最好的公开分数是 0.91288。我们不知道私有分数,因为只提交了 csv 文件。在最终集成中,这些 B7 模型在全分辨率上进行了微调。
  • 1折 EfficientNet-B4 UNet。在 256x384 分辨率下训练,并在全分辨率上进行了微调。
  • 2折 EfficientNet-B0 UNet。在 256x384 分辨率下训练,并在全分辨率上进行了微调。最好的一折获得了公开分 0.91284 和私有分 0.89719。

对于集成,我们尝试了许多阈值。对于最终提交,我们使用了 [0.8, 0.99, 0.75, 0.75],这产生了 87, 0, 602, 111 张类别图像。另一个使用了 [0.8, 0.99, 0.78, 0.75] 的提交产生了 87, 0, 577, 111 张类别图像。这本来可以获得私有分 0.90819 和公开分 0.92016,这足以获得第二名。所以减少对类别3的预测似乎是一个技巧。

最小区域设置为 100,像素阈值为 0.3。

对我们有效的做法:

  • AdamW 配合 Noam 调度器
  • 使用 GitLab 流水线管理训练实验
  • Mixup 和标签平滑
  • 在全分辨率上进行微调
  • 随机采样器
  • 交叉熵损失

无效的做法:

  • SGD
  • SWA 在盐分比赛中效果很好,但在本次比赛中根本不起作用
  • 伪标签(在最后2、3天训练)
  • 训练分类器
  • 平衡采样器
同比赛其他方案