```html 2nd Place Solution - 第二名解决方案

第二名解决方案

副标题：快速 2D 三轴 ROI 提取 + 3D 多任务分割与分类
作者：Pengcheng Shi (及团队)
发布日期：2025-10-15
竞赛排名：第 2 名

感谢 @evancalabrese、RSNA 和 Kaggle 组织了这次颅内动脉瘤检测竞赛！特别感谢那些富有洞察力的讨论（尤其是 @honglihang 关于多帧 DICOM 分析的详细帖子），帮助我们更深入地理解了竞赛数据。

概述

我们的方法侧重于简单性和通用性，以处理这个以分类为中心的任务中多样化的数据。关键要素包括：

第一阶段：使用 nnU-Net 2D 分割模型进行快速 2D 三轴 ROI（感兴趣区域）提取，以高效裁剪二元血管区域，并在本地所有训练病例上进行了验证。
第二阶段：基于 nnU-Net 的 3D 多任务学习（血管和动脉瘤分割 + 分类），并进行了增强，如交叉注意力池化、模态 4 类头以及针对稀有类的针对性过采样。所有数据调整为统一的 224x224x224；使用了包括左右翻转和标签交换在内的重度 TTA（8 倍）。

完全构建在开源 nnU-Net 框架之上——非常感谢 @fabianisensee 及其团队提供了稳健的 3D 分割基线。

推理经过速度优化（仅编码器 + 分类头），在 2 个 T4 GPU 上运行保守的集成模型大约需要 9 小时。

团队介绍

我们是由算法工程师和博士研究人员组成的团队：来自上海 Medical Image Insights 的 Pengcheng Shi、Yan Lu 和 Jiawei Chen，以及来自苏黎世大学 (UZH) 的 Kaiyuan Yang 和 Houjing Huang。Kaiyuan Yang、Houjing Huang 和 Pengcheng Shi 也是 MICCAI TopCoW (链接) / TopBrain (链接) 挑战赛的组织者，这些挑战赛基准测试了 Willis 环 (CoW) 和全脑血管解剖结构的分割。我们大多数人都是 Kaggle 的新手（我们的背景是 MICCAI 赛事），我们注意到的区别在于：Kaggle 强调数据整理、资源限制下的效率以及扁平化的指标（这里是纯分类，没有定位/分割分数）。在 TopCoW 摘要预印本中，我们之前曾探索过 TopCoW 分割模型利用 CoW 解剖结构定位动脉瘤的潜力，这启发了我们当前解决方案中的许多想法。

数据处理挑战

Kaggle 数据的多样性（间距、模态、多帧 DICOM）需要大量的预处理。多帧问题很棘手——我们的 DICOM 经验有限，且测试集删除了某些字段，导致 dicom2nifti 失效。我们切换到 pydicom，通过切片形状映射间距（例如，<45 切片 → 5mm），并训练了一个特定于 T2 的方向分类器进行校正。这耗费了时间，但确保了完整的测试覆盖率。在最终推理中没有使用 try-except 回退到 0.5 预测——最大化了鲁棒性。

我们使用了翻转 TTA 和多折模型集成来增加模型的鲁棒性。有希望的结果表明，公开排行榜的提升带来了私有排行榜的一致改进。

第一阶段：2D 三轴 ROI 提取

为了高效裁剪二元血管区域：

从迭代血管 ROI 数据中每个轴采样 3 个切片（1/4, 1/2, 3/4 位置）→ 总共 9 个切片。
在滑动窗口上训练 nnU-Net 2D 配置以进行裁剪分割。
推理：将滑动窗口补丁合并到批处理维度中，既提高了速度又增强了鲁棒性。
本地测试：100% 正确处理了所有训练病例。

这一阶段对于在各种数据上快速、通用地进行 ROI 提取至关重要。

第二阶段：3D 多任务学习

通过调整大小为 224x224x224 统一了所有间距/模态。

架构：带有多个任务头（血管/动脉瘤分割 + 分类）的 nnU-Net 3D。

增强功能：

交叉注意力池化在收敛速度上超过了平均池化。
模态分类头增强了训练稳定性。
推理：仅转发编码器和分类头以减少延迟。
数据增强：左右翻转并交换分类和分割的标签及掩码，有效地使数据集大小翻倍。 左：原始血管解剖分割掩码 | 右：水平翻转并交换标签后的增强掩码
动脉瘤掩码是通过模型推理和基于动脉瘤中心点的手动 refinement 迭代生成的。
13 类血管分割使用中心点距离热图 refine 了动脉瘤掩码。
对稀有类进行了过采样，并为分类和分割分配了更高的交叉熵权重。
血管和动脉瘤分割稳定了分类收敛。
TTA：8 倍（翻转；在输出上交换左/右标签）。
最终提交：由于平台限制，我们减少了模型数量，并在 2×T4 GPU 上运行了保守的两折集成，以防止超时（运行时间约 9 小时）。

训练细节

基于 nnU-Net 默认设置，从头开始训练。

损失函数：带有动脉瘤中心热图加权的 CE（交叉熵）。

增强：标准 nnU-Net（旋转、缩放、噪声）+ 自定义左右翻转和标签交换。

外部数据：

TopCoW 训练数据及其外部测试集：链接（注：LargeIA 数据集未包含在训练中。）
TopBrain 标注：链接

训练数据标注和修正：

动脉瘤分割掩码：结合挑战数据 csv 中提供的中心位置和轻度手动标注，迭代标注并训练我们自己的动脉瘤分割模型。
提供的 RSNA 动脉瘤标注包含少数混淆左右侧动脉瘤、床突上 vs 床突下 ICA 动脉瘤以及其他位置标签混淆的病例，如果发现则进行了手动修正。
血管分割掩码通过合并提供的 cow-seg 掩码与 TopCoW 和 TopBrain 标注进行定制；少数困难病例，特别是 T2 和 T1-post（某些 T1-post 甚至有动脉流空效应），进行了手动修正。

结果与洞察

消融实验

实验配置	公开榜分数	私有榜分数	备注
基线	0.84407	0.81268	• 第一版分割标注数据 • 100 Epoch, Fold 0 • 调整大小 224×224×224 • cls_modality
基线 + TTA 4x	0.87056	0.82508	• 第一版分割标注数据 • 100 Epoch, Fold 0 • 调整大小 224×224×224 • cls_modality • 测试时增强 4x
改进数据 + TTA 4x	0.88832	0.85718	• 改进的分割标注数据 • 100 Epoch, Fold 0 • 调整大小 224×224×224 • cls_modality • 测试时增强 4x
改进数据 + TTA 8x	0.89805	0.86228	• 改进的分割标注数据 • 带有标签交换的左右数据增强 • 100 Epoch, Fold 0 • 调整大小 224×224×224 • cls_modality • 测试时增强 8x
改进数据 + TTA 8x + 集成	0.90035	0.86727	• 改进的分割标注数据 • 带有标签交换的左右数据增强 • 100 Epoch, Fold 0 + 250 Epoch, Fold 1 (集成) • 调整大小 224×224×224 • cls_modality • 测试时增强 8x

关键技术洞察

ROI 提取：我们的第一阶段，2D 三轴 ROI 提取显著提高了推理速度。
血管分割：结合血管分割明显增强了动脉瘤分割和分类性能。
噪声处理：我们的噪声处理技术在公开数据集上表现更有效。
数据集偏移：移除 0.5 预测回退揭示了公开榜和私有榜之间存在一致的 3-4% 性能差距。这表明两个测试集之间异常病例的分布存在差异。

性能演变

在所有实验迭代中观察到了一致的性能提升。
最佳结果："改进数据 + TTA 8x + 集成" 获得了 0.90035（公开榜，第 1 名）和 0.86732（私有榜，第 2 名）。

致谢

感谢 Medical Image Insights 和 UZH 提供的计算支持，感谢 Bjoern Menze 和 Helmut Horten 基金会提供的资金支持。我们感谢 RSNA/Kaggle 主办方、nnU-Net 开发者和论坛贡献者。

代码可用性

训练和推理代码：GitHub 链接
推理演示：Kaggle Notebook
最终提交推理：Kaggle Notebook
第一阶段模型检查点：Kaggle Models
第二阶段模型检查点：Kaggle Models

参考文献

Isensee, F., Jaeger, P. F., Kohl, S. A., Petersen, J., & Maier-Hein, K. H. (2021). nnU-Net: a self-configuring method for deep learning-based biomedical image segmentation. Nature Methods, 18(2), 203-211.
Yang, Musio, Ma, et al. "Benchmarking the CoW with the TopCoW Challenge: Topology-Aware Anatomical Segmentation of the Circle of Willis for CTA and MRA." arXiv (2025): arXiv-2312

2nd Place Solution