数据集

我们选择了 Nvidia Dali，它可以使用 GPU 解码 dicom 图像文件，并生成了 uint16 位的 png 文件。我们没有使用更复杂的裁剪算法，而是使用了 cv2.connectedComponentsWithStats，它效果很好且速度快。

图像尺寸：1536*896

交叉验证策略：StratifiedGroupKFold 5折交叉验证

负样本策略：下采样 35%~50% 的负样本

具有 LIGHT 和 HEAVY 不同级别的数据增强策略：

def mixup_augmentation(x:torch.Tensor, yc:torch.Tensor, alpha:float = 1.0):
    """
    执行 Mixup 增强的函数
    """
    assert alpha > 0, "Alpha 必须大于 0"
    assert x.shape[0] > 1, "需要超过 1 个样本才能应用 mixup"

    lam = np.random.beta(alpha, alpha)
    rand_idx = torch.randperm(x.shape[0])
    
    mixed_x = lam * x + (1 - lam) * x[rand_idx, :]
    yc_j, yc_k = yc, yc[rand_idx]

    return mixed_x, yc_j, yc_k, lam

def get_transforms_16bit(data, img_size, normalize_mean, normalize_std):
    if data == 'train':
        return Compose([
            ToFloat(max_value=65535.0),
            RandomResizedCrop(img_size[0], img_size[1], scale=(0.8, 1), ratio=(0.45, 0.55), p=1), 
            HorizontalFlip(p=0.5),
            VerticalFlip(p=0.5),
            ShiftScaleRotate(rotate_limit=(-5, 5), p=0.3),
            RandomBrightnessContrast(brightness_limit=(-0.1,0.1), contrast_limit=(-0.1, 0.1), p=0.5),
            JpegCompression(quality_lower=80, quality_upper=100, p=0.3),
            Affine(p=0.3),
            ToTensorV2(),
            ])
        
    elif data == 'valid':
        return Compose([
            ToFloat(max_value=65535.0),
            Resize(img_size[0], img_size[1]),
            ToTensorV2(),
        ])

伪标签：我们简单地将 Vindr 数据用作外部数据集，并使用了几乎相同的数据处理方法。