返回列表

28th Place - Quick writeup - Improving the baseline

404. RSNA STR Pulmonary Embolism Detection | rsna-str-pulmonary-embolism-detection

开始: 2020-09-10 结束: 2020-10-26 医学影像分析 数据算法赛
第28名方案 - 快速总结 - 改进基线

第28名方案 - 快速总结 - 改进基线

作者:Rob Mulla | 发布时间:2020-10-27

我要感谢我出色的队友 @aerdem4@drhabib@cateek@proletheus。这是一次极具挑战性的比赛,我很高兴能与团队合作并讨论各种想法。同时也要感谢主办方和获胜者!我相信顶尖的解决方案将造福医生和受肺栓塞影响的患者。

虽然我们最好的提交方案是基于截止日期前一周发布的“基线”内核,但这多少有些苦乐参半。如此高分的内核发布得这么晚,确实令人失望——我知道这让很多团队(包括我们)感到沮丧。我们团队原本一直在研究其他的端到端模型和基于3D的模型。我承担了改进基线模型的任务,作为我们的备选方案。

这最终演变成了一场工程挑战,我们需要在有限的推理时间内平衡海量的数据——同时不能超出GPU或本地内存的限制。另一个挑战是推理时间似乎随机波动。一次提交可能在7小时内完成,但另一次几乎相同的提交可能会超过9小时并失败。

我们的方案与公共内核的区别:

  • 在第一阶段模型中,用 EfficientNet B6 代替了 B0。
  • 更改了推理循环,以整合所有10个(5折 x 2)第一阶段模型的预测结果。
  • 对第二阶段的预测结果进行了5次平均。
  • 修改了代码,使其在推理期间仅预测私有测试集,并使用了离线计算的公开测试集预测结果。
  • 修改了代码,使第一阶段预测时数据加载器只循环一次,而不是两次。
  • Ahmet 使用了一些技巧来调整第二阶段模型以获得额外的提升,包括修改损失函数。

无效的尝试:

  • 在第一阶段模型中使用 ResNext101,尽管它的 CV 分数略高。
  • 在第二阶段模型中使用并行的 GRU + LSTM。

我们的解决方案也符合规定的标准,不应出现标签预测冲突的情况。如果忽略这些限制,我们最好的提交原本可以获得 0.177 的私有排行榜分数,但为了遵守规则,我们没有选择它。

我还想个人感谢 Z by HP 和 NVIDIA 为我提供 Z8 台式机,我在这次挑战中充分利用了它。

同比赛其他方案