448. SIIM-FISABIO-RSNA COVID-19 Detection | siim-covid19-detection
大家好,
这是一场非常有趣且充满挑战的比赛,祝贺所有的获奖者,也非常感谢组织者举办这次比赛!
我们参加这次比赛的时间比较晚,这是我的第一次目标检测比赛,因此是一个很好的学习机会。与 @pheadrus、@theoviel 和 @onodera 组队对我来说是一次很棒的经历。
我们的最终方案相当简单,尽管我们尝试了许多不同的方法但未获成功,而其他顶尖团队却成功实现了这些方法。在这份总结中,我们将更多地关注我们的方案与其他团队的不同之处,因为大部分内容都非常相似。
我们的架构类似于 Heng 的想法,因为它在最后两层包含一个辅助分割头。为了增加多样性,我们训练了一堆模型(和图像尺寸),最终在集成中使用了以下模型,并应用了水平翻转 TTA:
Pheadrus 使用了比赛中大多数人使用的常规预处理方法。
Theo 的模型使用了一种不同的预处理技术(自动去除填充 & 在归一化之前裁剪到第1和第99百分位数),以及一个用于“阴性”类的辅助二分类头。
Theo 的预处理:窗宽窗位调整 & 去除填充
分类模型概览。Phaedrus 的模型不使用不透明度头。
除了 Theo 的模型,我还训练了 b4、b5 和 b6 模型。它们对 CV(交叉验证)分数有一点帮助。
@onodonera 构建了一堆 yolov5 (384) 模型,而 @phaedrus 使用了 yolov5 (768)。我们的两次提交中,一次使用了前者,另一次使用了后者,并做了一些其他修改。我们也许应该花更多时间训练更多样化的检测模型。
我们得分 0.619 的提交使用了 @pheadrus 的模型进行检测,@theoviel 的模型用于两项分类任务,以及 @pheadrus 的模型用于研究目标。
我们的另一次提交——我们原以为会表现更好——也包括了我的二分类模型,并使用了 @onodera 的检测模型。
我们对分类模型使用了幂平均集成 (p=2),并通过将检测模型的预测值乘以二分类模型预测值的 0.1 次方来校准预测。虽然这带来了 <0.001 的提升。