575. RSNA 2023 Abdominal Trauma Detection | rsna-2023-abdominal-trauma-detection
感谢RSNA和Kaggle主办这场比赛,也祝贺所有获奖者和参与者。
我采用了一个2.5维度的处理流程,同时训练了分类和分割任务。
我使用了TotalSegmentator的3D掩码数据,并重新训练了一个针对肝脏、脾脏、肠道、肾脏和身体的2D模型。DICOM图像被重缩放至(1, 1, 5)的间距,并与5通道掩码一起存储。
每个训练周期中,我首先从重缩放后的数组中采样N=14帧,然后使用身体掩码过滤掉手部或其他无关区域。我还利用器官掩码来限制Z轴空间,因为不含目标器官的切片包含的有价值信息较少。
我使用了集成了金字塔视觉变换器V2(Pyramid Vision Transformer V2)和MaxViT编码器的Unet模型。变换器模型在性能上显著优于卷积模型,特别是在外渗目标的检测上。
基于2D掩码的预训练有效促进了模型收敛。模型采用了6个分类头进行预测。可能缺少RNN层是我未能达到顶尖团队性能的主要原因。
我使用了与评估指标权重相同的交叉熵损失(CE Loss)。
| 编码器 | CV得分 | LB得分 |
|---|---|---|
| pvt-b2 | 0.3783 | 0.41 |
| pvt-b3 | 0.3750 | 0.41 |
| pvt-b4 | 0.3786 | 0.40 |
| maxvit_t | 0.3810 | 0.42 |
| 集成模型 | 0.3570 | 0.40 |
| 带尺度调整的集成 | 0.3530 | 0.39 |