第 11 名解决方案 - ECG 图像数字化
第 11 名解决方案
基于多尺度方法和网格点对齐的心电图图像数字化技术解决方案
概述
本解决方案旨在通过结合导联减少、先进网络架构、SNR 感知损失函数和后期处理网格对齐的简化流程,来提高心电图 (ECG) 信号的信噪比 (SNR)。
在第一阶段,我们采用了 hengck23 的优秀 notebook,但基于 x 和 y 方向等间距原则,通过迭代细化对生成的网格点进行了位置优化。随后,我们的主要精力投入到第二阶段。
-
导联线裁剪策略 (Lead Wire Cropping Strategy)
- 我们从标准的 12 导联 ECG 中裁剪出 4 条长导联线。
- 这减少了计算开销并加快了验证周期。
- 完整 Lead II 导联 (Lead II full) 作为评估策略有效性的参考。
- 裁剪后的图像保留了临床相关信息,同时允许使用更大的神经网络。
-
SNR 感知损失函数 (SNR-Aware Loss Function)
- 训练目标中加入了基于 SNR 的损失项。
- 该损失直接优化信号质量,贡献了约 1.6 dB 的 SNR 提升。
-
骨干架构升级 (Backbone Architecture Upgrade)
- 我们将 ResNet34 替换为 ConvNeXt Large 进行特征提取。
- 由于更好的表示能力,这一变化带来了 0.6 dB 的 SNR 增益。
-
迭代网格点对齐 (Iterative Grid Point Alignment)
- 后期处理步骤使用迭代间距校正算法细化检测到的网格点。
- 该方法对于局部失真较小的 ECG 类型 3、4、11 和 12 特别有效。
- 类型 6 也有 minor 改进。
- 支持类型的平均 SNR 提升:0.35 dB。
-
多尺度和多模型集成 (Multi-Scale and Multi-Model Ensemble)
- 训练和推理期间使用三种输入尺寸:(2200, 1700), (6600, 1700), (4400, 3400)。
- 采用多种架构:ConvNeXt Large, EfficientNet, U-Net。
-
有效策略 (Effective Strategies)
- 更大的骨干网络(例如 ConvNeXt Large)
- SNR 感知损失函数
- 迭代网格对齐(适用于类型 3, 4, 6, 11, 12)
- 多尺度训练和模型集成
-
无效策略 (Ineffective Strategies)
- 广泛的数据生成,基于 CycleGAN 的风格迁移。
- 我们使用关系式 I + III = II 和 AVF + AVR + AVL = 0 来校正输出导联信号值,但不幸的是,SNR 实际上下降了。
竞赛页面
PhysioNet ECG Image Digitization