SenNet + HOA 血管分割竞赛第12名解决方案

SenNet + HOA - 人体血管3D分割竞赛第12名解决方案

作者： Igor PI
排名： 第12名
发布时间： 2024年2月12日
框架： TensorFlow

背景

该解决方案是作为由Common Fund细胞衰老网络（SenNet）计划与人类器官图谱（HOA）合作组织的血管分割竞赛的一部分而实现的。

竞赛概览页面：SenNet + HOA - Hacking the Human Vasculature in 3D

竞赛数据集：数据集链接

非常感谢组织者提供的这次机会！

概述

框架 — TensorFlow
数据管道 — 2D, ROI, 调整尺寸 (1024x704), tfrecord
模型 — 几乎是经典的U-net（详情见下文）

解决方案在两个notebook中呈现：

免责声明

该解决方案开发于2023年12月，在圣诞老人新年礼物之前，最终帮助700多名参赛者跃升至0.8以上分数。我带着0.567分排在第238位开始了假期。一周后当我再次打开排行榜时，我已经下降了超过150个名次！而这仅仅是个开始！;）我又在这个方法上花了一周时间。我必须承认，由于提高分数让我在排名中越来越靠后，我并没有太大热情继续。

最终，通过增加图像尺寸和进行少量架构改进，我达到了0.636的结果，我开始寻找其他方法（见下文失败的尝试章节）。

数据准备

所有数据（除了kidney_3_dense标签）都用作训练数据。图像包含大量无用的信息区域。为了减少这些区域，使用统计方法对图像进行预处理以提取ROI。

def apply_roi(image, label=None):
    """
    排除无用的图像区域
    """
    # 移除标准差低的行和列
    row_mask = image.std(axis=1) > 0.22
    clmn_mask = image.std(axis=0) > 0.22
    
    # 清理这种方法产生的噪声并获取可靠的区域
    row_mask = cleaning_mask(row_mask)
    clmn_mask = cleaning_mask(clmn_mask)
    
    image = image[row_mask, :][:, clmn_mask]
    label = label[row_mask, :][:, clmn_mask] if isinstance(label, np.ndarray) else None
    
    # 记录填充区域的大小以便后续正确恢复
    row_pad = (row_mask.argmax(), row_mask[::-1].argmax())
    clmn_pad = (clmn_mask.argmax(), clmn_mask[::-1].argmax())
    
    return image, label, (row_pad, clmn_pad)

def cleaning_mask(mask):
    """
    从噪声掩码中选择可靠区域
    """
    # 如果边框从第一个元素开始或在最后一个元素结束
    mask[0] = False
    mask[-1] = False
    
    # 获取边框边缘
    frames = np.nonzero(mask[:-1] != mask[1:])[0]
    # 获取边框长度
    delta = frames[1:] - frames[:-1]
    # 获取最大长度边框的索引
    max_solid_block_begin = np.argmax(delta)
    # 其他都是垃圾数据
    garbage = np.delete(frames, [max_solid_block_begin, max_solid_block_begin + 1])
    # 清理掩码
    for a, b in zip(garbage[::2], garbage[1::2]):
        mask[a + 1:b + 1] = False
    
    return mask

接下来，所有图像都被调整为1024x704的统一尺寸。实验从384x256尺寸开始，随着尺寸增加，结果如预期般改善。1024x704是未导致OOM错误的最大尺寸。处理后的图像示例如下。