第 11 名解决方案 - ECG 图像数字化

第 11 名解决方案

基于多尺度方法和网格点对齐的心电图图像数字化技术解决方案

作者: zx2 (团队 leader), Star, zacarioli

发布日期: 2026-01-27

竞赛排名: 第 11 名

概述

本解决方案旨在通过结合导联减少、先进网络架构、SNR 感知损失函数和后期处理网格对齐的简化流程，来提高心电图 (ECG) 信号的信噪比 (SNR)。

在第一阶段，我们采用了 hengck23 的优秀 notebook，但基于 x 和 y 方向等间距原则，通过迭代细化对生成的网格点进行了位置优化。随后，我们的主要精力投入到第二阶段。

导联线裁剪策略 (Lead Wire Cropping Strategy)
- 我们从标准的 12 导联 ECG 中裁剪出 4 条长导联线。
- 这减少了计算开销并加快了验证周期。
- 完整 Lead II 导联 (Lead II full) 作为评估策略有效性的参考。
- 裁剪后的图像保留了临床相关信息，同时允许使用更大的神经网络。
SNR 感知损失函数 (SNR-Aware Loss Function)
- 训练目标中加入了基于 SNR 的损失项。
- 该损失直接优化信号质量，贡献了约 1.6 dB 的 SNR 提升。
骨干架构升级 (Backbone Architecture Upgrade)
- 我们将 ResNet34 替换为 ConvNeXt Large 进行特征提取。
- 由于更好的表示能力，这一变化带来了 0.6 dB 的 SNR 增益。
迭代网格点对齐 (Iterative Grid Point Alignment)
- 后期处理步骤使用迭代间距校正算法细化检测到的网格点。
- 该方法对于局部失真较小的 ECG 类型 3、4、11 和 12 特别有效。
- 类型 6 也有 minor 改进。
- 支持类型的平均 SNR 提升：0.35 dB。
多尺度和多模型集成 (Multi-Scale and Multi-Model Ensemble)
- 训练和推理期间使用三种输入尺寸：(2200, 1700), (6600, 1700), (4400, 3400)。
- 采用多种架构：ConvNeXt Large, EfficientNet, U-Net。
有效策略 (Effective Strategies)
- 更大的骨干网络（例如 ConvNeXt Large）
- SNR 感知损失函数
- 迭代网格对齐（适用于类型 3, 4, 6, 11, 12）
- 多尺度训练和模型集成
无效策略 (Ineffective Strategies)
- 广泛的数据生成，基于 CycleGAN 的风格迁移。
- 我们使用关系式 I + III = II 和 AVF + AVR + AVL = 0 来校正输出导联信号值，但不幸的是，SNR 实际上下降了。

竞赛页面 PhysioNet ECG Image Digitization

11th Place Solution

第 11 名解决方案

基于多尺度方法和网格点对齐的心电图图像数字化技术解决方案

概述

导联线裁剪策略 (Lead Wire Cropping Strategy)

SNR 感知损失函数 (SNR-Aware Loss Function)

骨干架构升级 (Backbone Architecture Upgrade)

迭代网格点对齐 (Iterative Grid Point Alignment)

多尺度和多模型集成 (Multi-Scale and Multi-Model Ensemble)

有效策略 (Effective Strategies)

无效策略 (Ineffective Strategies)

同比赛其他方案