作者： sheep（steamedsheep）
发布时间： 2023年10月23日
比赛排名： 第4名

RSNA 2023腹部创伤检测比赛第四名解决方案

感谢RSNA和Kaggle主办这场比赛，也祝贺所有获奖者和参与者。

概述

我采用了一个2.5维度的处理流程，同时训练了分类和分割任务。

我使用了TotalSegmentator的3D掩码数据，并重新训练了一个针对肝脏、脾脏、肠道、肾脏和身体的2D模型。DICOM图像被重缩放至(1, 1, 5)的间距，并与5通道掩码一起存储。

每个训练周期中，我首先从重缩放后的数组中采样N=14帧，然后使用身体掩码过滤掉手部或其他无关区域。我还利用器官掩码来限制Z轴空间，因为不含目标器官的切片包含的有价值信息较少。

我使用了集成了金字塔视觉变换器V2（Pyramid Vision Transformer V2）和MaxViT编码器的Unet模型。变换器模型在性能上显著优于卷积模型，特别是在外渗目标的检测上。

基于2D掩码的预训练有效促进了模型收敛。模型采用了6个分类头进行预测。可能缺少RNN层是我未能达到顶尖团队性能的主要原因。

我使用了与评估指标权重相同的交叉熵损失（CE Loss）。

代码仓库 https://github.com/iseekwonderful/RSNA-2023-Abdominal-Trauma-Detection-4th-Place-Code.git