我的提交结果

我最好的公共 LB 分数：0.842（快速提交，因此没有私人 LB 分数）。

我的最终提交 v1，公共 LB 0.838，私人 LB 0.932，基于我本地 CV 最好的 6 个模型。

我的最终提交 v2，公共 LB 0.840，私人 LB 0.933，在集成模型中引入了更多的差异性。

我最好的单模型，公共 LB 0.840，私人 LB 0.929，使用的是 EfficientNet-B7，输入尺寸为 224x224。

预处理

这个功能在这里分享（在页面中搜索关键字 crop_image_from_gray，感谢 @ratthachat 的分享！）

我利用图像边界的亮度，对训练集（2015和2019）中的每张图像应用图像类型处理。

在下图中从左到右依次为：Type_0，Type_1，Type_2。

在将所有图像裁剪并调整为 type_2 后，我对这些图像进行了重度增强处理：

Dihedral（翻转）, RandomCrop（随机裁剪）, Rotation（旋转）, Contrast（对比度）, Brightness（亮度）, Cutout, PerspectiveTransform（透视变换）, Clahe。

我发现由于训练集规模较小，在大分辨率图像上训练大模型更容易过拟合。因此，我的策略是：小模型配合高分辨率 / 大模型配合低分辨率。

EfficientNet-B7 (224x224) LB 0.840
EfficientNet-B6 (240x240) LB 0.832
EfficientNet-B5 (256x256) LB 0.831
EfficientNet-B4 (320x320) LB 0.826
EfficientNet-B3 (352x352) *LB 不详
EfficientNet-B2 (376x376) LB 0.828

LB 分数来源于 5折测试 x 8 次翻转 TTA（测试时增强）。

尽管公共 LB 分数有所不同，但所有这些模型的本地 5折 CV 分数都在 0.933 左右。

↑ 我的最终提交 v1 就是简单地对这些模型取平均。

最终提交 v2 是基于 v1，将 B2 和 B3 模型替换为在 Ben 预处理数据上训练的一个 B7 和一个 B5（图像类型处理以及其他技巧也同样应用了）。