返回列表

26th Place Solution : Brief Writeup

448. SIIM-FISABIO-RSNA COVID-19 Detection | siim-covid19-detection

开始: 2021-05-18 结束: 2021-08-09 医学影像分析 数据算法赛
第26名方案:简要总结

第26名方案:简要总结

作者: Mr_KnowNothing (团队成员: Phaedrus, Theo Viel, ONODERA)
发布时间: 2021年8月10日

大家好,
这是一场非常有趣且充满挑战的比赛,祝贺所有的获奖者,也非常感谢组织者举办这次比赛!

简介

我们参加这次比赛的时间比较晚,这是我的第一次目标检测比赛,因此是一个很好的学习机会。与 @pheadrus@theoviel@onodera 组队对我来说是一次很棒的经历。

概览

我们的最终方案相当简单,尽管我们尝试了许多不同的方法但未获成功,而其他顶尖团队却成功实现了这些方法。在这份总结中,我们将更多地关注我们的方案与其他团队的不同之处,因为大部分内容都非常相似。

解决方案

4类分类 (4-class Classification)

我们的架构类似于 Heng 的想法,因为它在最后两层包含一个辅助分割头。为了增加多样性,我们训练了一堆模型(和图像尺寸),最终在集成中使用了以下模型,并应用了水平翻转 TTA:

  • @pheadrus : v2m (512), b5 (512), b5 (640), v2m (768), v2m + pl (512)
  • @theoviel : v2s (512), v2m (512)

Pheadrus 使用了比赛中大多数人使用的常规预处理方法。
Theo 的模型使用了一种不同的预处理技术(自动去除填充 & 在归一化之前裁剪到第1和第99百分位数),以及一个用于“阴性”类的辅助二分类头。

proc

Theo 的预处理:窗宽窗位调整 & 去除填充

model

分类模型概览。Phaedrus 的模型不使用不透明度头。

2类分类 (2-class classification)

除了 Theo 的模型,我还训练了 b4、b5 和 b6 模型。它们对 CV(交叉验证)分数有一点帮助。

检测 (Detection)

@onodonera 构建了一堆 yolov5 (384) 模型,而 @phaedrus 使用了 yolov5 (768)。我们的两次提交中,一次使用了前者,另一次使用了后者,并做了一些其他修改。我们也许应该花更多时间训练更多样化的检测模型。

最终提交

我们得分 0.619 的提交使用了 @pheadrus 的模型进行检测,@theoviel 的模型用于两项分类任务,以及 @pheadrus 的模型用于研究目标。
我们的另一次提交——我们原以为会表现更好——也包括了我的二分类模型,并使用了 @onodera 的检测模型。

我们对分类模型使用了幂平均集成 (p=2),并通过将检测模型的预测值乘以二分类模型预测值的 0.1 次方来校准预测。虽然这带来了 <0.001 的提升。

对我们无效的尝试

  • 在 CovidX 数据上进行分类任务的预训练
  • 对公开测试集进行伪标签用于分类
  • 使用肺部检测模型进行预处理对某些模型有帮助,但对整体混合效果没有提升
  • 针对“非典型”和“不确定”类别使用单独的分类器
  • 我们从 BimCV、Ricord
同比赛其他方案