返回列表

4th place solution

338. APTOS 2019 Blindness Detection | aptos2019-blindness-detection

开始: 2019-06-28 结束: 2019-09-07 医学影像分析 数据算法赛
第4名方案:最佳过拟合
作者:Qishen Ha (Grandmaster)
比赛:APTOS 2019 Blindness Detection
排名:第4名

我的提交结果

我最好的公共 LB 分数:0.842(快速提交,因此没有私人 LB 分数)。

我的最终提交 v1,公共 LB 0.838,私人 LB 0.932,基于我本地 CV 最好的 6 个模型。

我的最终提交 v2,公共 LB 0.840,私人 LB 0.933,在集成模型中引入了更多的差异性。

我最好的单模型,公共 LB 0.840,私人 LB 0.929,使用的是 EfficientNet-B7,输入尺寸为 224x224。

预处理

从灰度图裁剪 (训练和预测均使用)

这个功能在这里分享(在页面中搜索关键字 crop_image_from_gray,感谢 @ratthachat 的分享!)

Crop From Gray Example

应用图像类型 (仅用于训练)

我利用图像边界的亮度,对训练集(2015和2019)中的每张图像应用图像类型处理。

在下图中从左到右依次为:Type_0Type_1Type_2

Image Types

将所有图像转换为 Type 2 (仅用于训练)

Transform to Type 2

数据增强

在将所有图像裁剪并调整为 type_2 后,我对这些图像进行了重度增强处理:

Dihedral(翻转), RandomCrop(随机裁剪), Rotation(旋转), Contrast(对比度), Brightness(亮度), Cutout, PerspectiveTransform(透视变换), Clahe。

模型

我发现由于训练集规模较小,在大分辨率图像上训练大模型更容易过拟合。因此,我的策略是:小模型配合高分辨率 / 大模型配合低分辨率。

  • EfficientNet-B7 (224x224) LB 0.840
  • EfficientNet-B6 (240x240) LB 0.832
  • EfficientNet-B5 (256x256) LB 0.831
  • EfficientNet-B4 (320x320) LB 0.826
  • EfficientNet-B3 (352x352) *LB 不详
  • EfficientNet-B2 (376x376) LB 0.828

LB 分数来源于 5折测试 x 8 次翻转 TTA(测试时增强)。

尽管公共 LB 分数有所不同,但所有这些模型的本地 5折 CV 分数都在 0.933 左右。

↑ 我的最终提交 v1 就是简单地对这些模型取平均。

最终提交 v2 是基于 v1,将 B2 和 B3 模型替换为在 Ben 预处理数据上训练的一个 B7 和一个 B5(图像类型处理以及其他技巧也同样应用了)。

  • EfficientNet-B7 (224x224 Ben's) LB 0.834
  • EfficientNet-B5 (256x256 Ben's) LB 0.
同比赛其他方案