返回列表

2nd Place Solution

672. RSNA Intracranial Aneurysm Detection | rsna-intracranial-aneurysm-detection

开始: 2025-07-28 结束: 2025-10-14 医学影像分析 数据算法赛
```html 2nd Place Solution - 第二名解决方案

第二名解决方案

副标题:快速 2D 三轴 ROI 提取 + 3D 多任务分割与分类
作者:Pengcheng Shi (及团队)
发布日期:2025-10-15
竞赛排名:第 2 名

感谢 @evancalabrese、RSNA 和 Kaggle 组织了这次颅内动脉瘤检测竞赛!特别感谢那些富有洞察力的讨论(尤其是 @honglihang 关于多帧 DICOM 分析的详细帖子),帮助我们更深入地理解了竞赛数据。

概述

我们的方法侧重于简单性和通用性,以处理这个以分类为中心的任务中多样化的数据。关键要素包括:

  • 第一阶段:使用 nnU-Net 2D 分割模型进行快速 2D 三轴 ROI(感兴趣区域)提取,以高效裁剪二元血管区域,并在本地所有训练病例上进行了验证。
  • 第二阶段:基于 nnU-Net 的 3D 多任务学习(血管和动脉瘤分割 + 分类),并进行了增强,如交叉注意力池化、模态 4 类头以及针对稀有类的针对性过采样。所有数据调整为统一的 224x224x224;使用了包括左右翻转和标签交换在内的重度 TTA(8 倍)。

完全构建在开源 nnU-Net 框架之上——非常感谢 @fabianisensee 及其团队提供了稳健的 3D 分割基线。

推理经过速度优化(仅编码器 + 分类头),在 2 个 T4 GPU 上运行保守的集成模型大约需要 9 小时。

团队介绍

我们是由算法工程师和博士研究人员组成的团队:来自上海 Medical Image Insights 的 Pengcheng Shi、Yan Lu 和 Jiawei Chen,以及来自苏黎世大学 (UZH) 的 Kaiyuan Yang 和 Houjing Huang。Kaiyuan Yang、Houjing Huang 和 Pengcheng Shi 也是 MICCAI TopCoW (链接) / TopBrain (链接) 挑战赛的组织者,这些挑战赛基准测试了 Willis 环 (CoW) 和全脑血管解剖结构的分割。我们大多数人都是 Kaggle 的新手(我们的背景是 MICCAI 赛事),我们注意到的区别在于:Kaggle 强调数据整理、资源限制下的效率以及扁平化的指标(这里是纯分类,没有定位/分割分数)。在 TopCoW 摘要预印本中,我们之前曾探索过 TopCoW 分割模型利用 CoW 解剖结构定位动脉瘤的潜力,这启发了我们当前解决方案中的许多想法。

数据处理挑战

Kaggle 数据的多样性(间距、模态、多帧 DICOM)需要大量的预处理。多帧问题很棘手——我们的 DICOM 经验有限,且测试集删除了某些字段,导致 dicom2nifti 失效。我们切换到 pydicom,通过切片形状映射间距(例如,<45 切片 → 5mm),并训练了一个特定于 T2 的方向分类器进行校正。这耗费了时间,但确保了完整的测试覆盖率。在最终推理中没有使用 try-except 回退到 0.5 预测——最大化了鲁棒性。

我们使用了翻转 TTA 和多折模型集成来增加模型的鲁棒性。有希望的结果表明,公开排行榜的提升带来了私有排行榜的一致改进。

第一阶段:2D 三轴 ROI 提取

为了高效裁剪二元血管区域:

  • 从迭代血管 ROI 数据中每个轴采样 3 个切片(1/4, 1/2, 3/4 位置)→ 总共 9 个切片。
  • 在滑动窗口上训练 nnU-Net 2D 配置以进行裁剪分割。
  • 推理:将滑动窗口补丁合并到批处理维度中,既提高了速度又增强了鲁棒性。
  • 本地测试:100% 正确处理了所有训练病例。
Stage 1 Diagram

这一阶段对于在各种数据上快速、通用地进行 ROI 提取至关重要。

第二阶段:3D 多任务学习

通过调整大小为 224x224x224 统一了所有间距/模态。

架构:带有多个任务头(血管/动脉瘤分割 + 分类)的 nnU-Net 3D。

增强功能

  • 交叉注意力池化在收敛速度上超过了平均池化。
  • 模态分类头增强了训练稳定性。
  • 推理:仅转发编码器和分类头以减少延迟。
  • 数据增强:左右翻转并交换分类和分割的标签及掩码,有效地使数据集大小翻倍。 Vessel Flip Augmentation 左:原始血管解剖分割掩码 | 右:水平翻转并交换标签后的增强掩码
  • 动脉瘤掩码是通过模型推理和基于动脉瘤中心点的手动 refinement 迭代生成的。
  • 13 类血管分割使用中心点距离热图 refine 了动脉瘤掩码。
  • 对稀有类进行了过采样,并为分类和分割分配了更高的交叉熵权重。
  • 血管和动脉瘤分割稳定了分类收敛。
  • TTA:8 倍(翻转;在输出上交换左/右标签)。
  • 最终提交:由于平台限制,我们减少了模型数量,并在 2×T4 GPU 上运行了保守的两折集成,以防止超时(运行时间约 9 小时)。 Stage 2 Diagram

训练细节

基于 nnU-Net 默认设置,从头开始训练。

损失函数:带有动脉瘤中心热图加权的 CE(交叉熵)。

增强:标准 nnU-Net(旋转、缩放、噪声)+ 自定义左右翻转和标签交换。

外部数据

  • TopCoW 训练数据及其外部测试集:链接(注:LargeIA 数据集未包含在训练中。)
  • TopBrain 标注:链接

训练数据标注和修正

  • 动脉瘤分割掩码:结合挑战数据 csv 中提供的中心位置和轻度手动标注,迭代标注并训练我们自己的动脉瘤分割模型。
  • 提供的 RSNA 动脉瘤标注包含少数混淆左右侧动脉瘤、床突上 vs 床突下 ICA 动脉瘤以及其他位置标签混淆的病例,如果发现则进行了手动修正。
  • 血管分割掩码通过合并提供的 cow-seg 掩码与 TopCoW 和 TopBrain 标注进行定制;少数困难病例,特别是 T2 和 T1-post(某些 T1-post 甚至有动脉流空效应),进行了手动修正。

结果与洞察

消融实验

实验配置 公开榜分数 私有榜分数 备注
基线 0.84407 0.81268 • 第一版分割标注数据
• 100 Epoch, Fold 0
• 调整大小 224×224×224
• cls_modality
基线 + TTA 4x 0.87056 0.82508 • 第一版分割标注数据
• 100 Epoch, Fold 0
• 调整大小 224×224×224
• cls_modality
• 测试时增强 4x
改进数据 + TTA 4x 0.88832 0.85718 • 改进的分割标注数据
• 100 Epoch, Fold 0
• 调整大小 224×224×224
• cls_modality
• 测试时增强 4x
改进数据 + TTA 8x 0.89805 0.86228 • 改进的分割标注数据
• 带有标签交换的左右数据增强
• 100 Epoch, Fold 0
• 调整大小 224×224×224
• cls_modality
• 测试时增强 8x
改进数据 + TTA 8x + 集成 0.90035 0.86727 • 改进的分割标注数据
• 带有标签交换的左右数据增强
• 100 Epoch, Fold 0 + 250 Epoch, Fold 1 (集成)
• 调整大小 224×224×224
• cls_modality
• 测试时增强 8x

关键技术洞察

  • ROI 提取:我们的第一阶段,2D 三轴 ROI 提取显著提高了推理速度。
  • 血管分割:结合血管分割明显增强了动脉瘤分割和分类性能。
  • 噪声处理:我们的噪声处理技术在公开数据集上表现更有效。
  • 数据集偏移:移除 0.5 预测回退揭示了公开榜和私有榜之间存在一致的 3-4% 性能差距。这表明两个测试集之间异常病例的分布存在差异。

性能演变

  • 在所有实验迭代中观察到了一致的性能提升。
  • 最佳结果:"改进数据 + TTA 8x + 集成" 获得了 0.90035(公开榜,第 1 名)和 0.86732(私有榜,第 2 名)。

致谢

感谢 Medical Image Insights 和 UZH 提供的计算支持,感谢 Bjoern Menze 和 Helmut Horten 基金会提供的资金支持。我们感谢 RSNA/Kaggle 主办方、nnU-Net 开发者和论坛贡献者。

代码可用性

参考文献

  • Isensee, F., Jaeger, P. F., Kohl, S. A., Petersen, J., & Maier-Hein, K. H. (2021). nnU-Net: a self-configuring method for deep learning-based biomedical image segmentation. Nature Methods, 18(2), 203-211.
  • Yang, Musio, Ma, et al. "Benchmarking the CoW with the TopCoW Challenge: Topology-Aware Anatomical Segmentation of the Circle of Willis for CTA and MRA." arXiv (2025): arXiv-2312
```
同比赛其他方案