返回列表

4th place solution (2nd after LB cleaning)

338. APTOS 2019 Blindness Detection | aptos2019-blindness-detection

开始: 2019-06-28 结束: 2019-09-07 医学影像分析 数据算法赛
第4名方案(LB清洗后第2名)

第4名方案(LB清洗后第2名)

作者: Mykhailo Matviiv, Artur Ispiriants
比赛: APTOS 2019 Blindness Detection

恭喜大家在这次激动人心的比赛中取得优异成绩,也恭喜比赛圆满结束!

数据

我们使用了2015年训练数据集中的全尺寸图像来预训练我们的模型。仅基于旧数据训练的模型在公共LB上的得分约为0.73-0.75。

  • 当前比赛的训练集。
  • 以往比赛的测试集。

模型

总的来说,我们尝试了不同的架构,包括 se-resnext50、se-resnext101、densenet,但它们训练速度慢且表现不佳。唯一表现良好的神经网络架构是 EfficientNet,因此我们的最终解决方案包含多个 b3、b4 和 b5 网络。

  • B3 图像尺寸:300
  • B4 图像尺寸:460
  • B5 图像尺寸:456

预处理

我在训练模型之前裁剪了图像上的黑色背景,然后将其调整为所需的图像尺寸。@aispiriants 除了调整图像大小外,没有进行任何预处理。我也尝试过 Ben 的颜色预处理方法,但它没有提高分数,所以我在比赛中途停止了尝试。

数据增强

我们使用了很多增强手段,至少比我以前用过的都要多 :)

全部来自精彩的 albumentations 库:模糊、翻转、随机亮度对比度、平移缩放旋转、弹性变换、转置、网格畸变、色调饱和度明度、CLAHE(限制对比度自适应直方图均衡化)、粗粒度缺失。

训练

总体训练/提交流程非常简单:

  • 在旧数据上预训练(b3 约80个 epoch,b5 约15个 epoch)
  • 在当前比赛数据上训练(b3 约50个 epoch,b5 约15个 epoch)
  • 从训练过程中挑选表现最好的 epoch,并通过简单的平均进行融合。我们还使用了翻转作为 TTA(测试时增强)。

秘密武器 :)

我们对当前测试数据进行了伪标记,然后使用“训练集+伪标记测试集”再次对网络进行微调。这给了我们巨大的提升和很多动力,所以我们又重复了一轮伪标记,这又带来了一点提升。我们还对以往比赛的测试数据进行了伪标记,以增加训练数据集的大小,并以此微调了一些模型。

同比赛其他方案