返回列表

24th Place Solution

396. SIIM-ISIC Melanoma Classification | siim-isic-melanoma-classification

开始: 2020-05-27 结束: 2020-08-17 医学影像分析 数据算法赛
第24名方案

第24名方案

作者:R Guo
发布时间:2020-08-18

相信你的交叉验证(CV)

我在参加完 Panda 比赛后加入了这场竞赛,结果让我感到惊讶。
这里最重要的事情应该是你的交叉验证(CV)。始终相信它。公开测试集中单个正样本会对公开排行榜(Public LB)产生 0.0064 的影响,而且这种影响在集成和选择过程中很可能会累积。
我使用了 @cdeotte 的 JPEG 文件以及他的三层分层 CV(triple stratifed CV)。这些帮助我快速开始训练并建立了一个强大的 CV。感谢他的出色工作。

最佳单模型

我使用 PyTorch 和 2 块 RTX2080 显卡来生成结果,并且没有使用元数据(meta data)。
最佳单模型是在 512x512 分辨率下的 EfficientNet-b5。我首先在 2019 年的数据上训练模型,分为 8 个类别。然后我使用 2020+2018/2017 年的数据对其进行微调。这种方法在 CV 上提升了 0.01,在私人排行榜(Private LB)上提升了 0.005,但在公开排行榜上没有提升。
数据增强包括:图像压缩、翻转、平移旋转缩放、色调饱和度明度、随机亮度对比度、CutOut。
该模型在 CV 上达到了 0.944(TTA 之前),在私人排行榜上达到了 0.9447-0.9462(不同的平均方法)。遗憾的是我选了最低的那个。xD。

模型集成

我将该模型与我之前的一些模型进行了集成。其中大多数都过拟合了。
集成模型在私人排行榜上的得分为 0.9452-0.9492。我又一次做出了错误的选择。xD。

同比赛其他方案