17th place with 16 submissions :)
16次提交获得第17名 :)
作者: khyeh (Grandmaster) | 比赛排名: 第17名
感谢比赛主办方和Kaggle举办这次比赛!祝贺所有获奖者!
[方案概览]
1. 验证集划分:
- 使用患者ID(patient id)划分训练集和验证集,处理训练和标注CSV文件,为后续步骤创建交叉验证(CV)折数。
2. 利用部分标注图像:
- 我训练了一个 EfficientNet-b4 分割模型,在像素级别预测4种导管+背景的位置:ETT(气管插管)、NGT(鼻胃管)、CVC(中心静脉导管)和 Swan Ganz 导管。
3. 训练多样化的分类模型
- 模型选择:resnet200d, seresnet200d, efficient b5。
- 将步骤2的袋外预测作为额外的5个通道,与原始图像合并为6通道输入 (+0.005 cv)。
- 使用来自 @ttahara 的多头方法 (+0.002 cv)。
- 使用来自 @ammarali32 的预训练优秀权重 (+0.005 cv)。
- 图像尺寸设为 640。
4. 简单平均
[基础模型表现 (cv/public lb/private lb)]
- resnet200d-640(含导管预测,重度增强):0.96386 / 0.969 / 0.970
- seresnet152d-640(含导管预测,重度增强):0.96158 / 0.967 / 0.969
- efficientnetb5-640(含导管预测,重度增强):0.96136 / 0.964 / 0.968
- resnet200d-640(不含导管预测,轻度增强):0.9614 / 0.959 / 0.967
- 上述4个模型的融合结果:0.968 / 0.971 / 0.973
[无效尝试]
- 在分割模型中预测11个标签+背景,并将其作为多通道输入添加到步骤3中(效果不佳)。