返回列表

11th Place Solution

686. PhysioNet - Digitization of ECG Images | physionet-ecg-image-digitization

开始: 2025-10-21 结束: 2026-01-22 医学影像分析 数据算法赛
第 11 名解决方案 - ECG 图像数字化

第 11 名解决方案

基于多尺度方法和网格点对齐的心电图图像数字化技术解决方案

作者: zx2 (团队 leader), Star, zacarioli

发布日期: 2026-01-27

竞赛排名: 第 11 名

概述

本解决方案旨在通过结合导联减少、先进网络架构、SNR 感知损失函数和后期处理网格对齐的简化流程,来提高心电图 (ECG) 信号的信噪比 (SNR)。

在第一阶段,我们采用了 hengck23 的优秀 notebook,但基于 x 和 y 方向等间距原则,通过迭代细化对生成的网格点进行了位置优化。随后,我们的主要精力投入到第二阶段。

  1. 导联线裁剪策略 (Lead Wire Cropping Strategy)

    • 我们从标准的 12 导联 ECG 中裁剪出 4 条长导联线。
    • 这减少了计算开销并加快了验证周期。
    • 完整 Lead II 导联 (Lead II full) 作为评估策略有效性的参考。
    • 裁剪后的图像保留了临床相关信息,同时允许使用更大的神经网络。
  2. SNR 感知损失函数 (SNR-Aware Loss Function)

    • 训练目标中加入了基于 SNR 的损失项。
    • 该损失直接优化信号质量,贡献了约 1.6 dB 的 SNR 提升。
  3. 骨干架构升级 (Backbone Architecture Upgrade)

    • 我们将 ResNet34 替换为 ConvNeXt Large 进行特征提取。
    • 由于更好的表示能力,这一变化带来了 0.6 dB 的 SNR 增益。
  4. 迭代网格点对齐 (Iterative Grid Point Alignment)

    • 后期处理步骤使用迭代间距校正算法细化检测到的网格点。
    • 该方法对于局部失真较小的 ECG 类型 3、4、11 和 12 特别有效。
    • 类型 6 也有 minor 改进。
    • 支持类型的平均 SNR 提升:0.35 dB。
  5. 多尺度和多模型集成 (Multi-Scale and Multi-Model Ensemble)

    • 训练和推理期间使用三种输入尺寸:(2200, 1700), (6600, 1700), (4400, 3400)。
    • 采用多种架构:ConvNeXt Large, EfficientNet, U-Net。
  6. 有效策略 (Effective Strategies)

    • 更大的骨干网络(例如 ConvNeXt Large)
    • SNR 感知损失函数
    • 迭代网格对齐(适用于类型 3, 4, 6, 11, 12)
    • 多尺度训练和模型集成
  7. 无效策略 (Ineffective Strategies)

    • 广泛的数据生成,基于 CycleGAN 的风格迁移。
    • 我们使用关系式 I + III = II 和 AVF + AVR + AVL = 0 来校正输出导联信号值,但不幸的是,SNR 实际上下降了。
同比赛其他方案