424. RANZCR CLiP - Catheter and Line Position Challenge | ranzcr-clip-catheter-line-classification
祝贺所有的获奖者,并感谢组织者举办了这次比赛!
我们的策略基于 @hengck23 提出的三阶段训练方法,并由 @yasufuminakama 在公共笔记本中初步实现。我们还训练了一个分割器,以便在第 1 和第 2 阶段为未标注数据或外部数据提供伪标注。我们在最终推理中没有使用该分割器。
简而言之,我们的训练流程如下:
[交叉验证 / 公共排行榜 / 私有排行榜]
基础多阶段训练,TTA (resnet200d): 0.96606/0.97020/0.97328
+分割器: 0.96742/0.97323/0.97389
(+4种不同架构的集成: 0.97101/0.97430/0.97515)
+伪标签(NIH): 0.96918/0.97335/0.97455
+8种不同训练设置的集成,无 TTA: 0.97215/0.97386/0.97611
+通过逻辑回归确定集成系数: 0.97228/0.97434/0.97624
我们在分割和分类中都使用了 sin 在以下笔记本中提出的数据增强方法。我们将图像大小设置为 720 像素。
https://www.kaggle.com/underwearfitting/resnet200d-public-benchmark-2xtta-lb0-965
问题设置
架构: DeepLabV3+
编码器主干网络:
图像大小: 720x720
损失函数: BCEWithLogitsLoss + DiceLoss + RecallLoss
训练步骤
分类任务中使用的分割掩码是由集成分割器生成的,该分割器是 10 个预训练分割器(5 折 x 2 个主干网络)的集成。虽然我们发现标注中存在一些噪声,但它们仍然比我们的分割器输出更具信息量。因此,我们仅将预测的分割掩码用于未标注数据和外部数据,并将真实标注用于已标注数据。
对于分类,我们采用了以下笔记本中提出的