GIRYN团队第11名解决方案 - Google Research 识别凝结尾迹以减少全球变暖竞赛

GIRYN团队第11名解决方案

竞赛: Google Research 识别凝结尾迹以减少全球变暖
排名: 第11名 (Private LB: 0.71059)
发布时间: 2023年8月18日
团队成员: 5人

摘要 [TLDR]

加权集成（通过Optuna优化权重）
多阶段长期训练（70-100个epoch）
伪标签（时间切片 = 1-4, 6-8）
SWA [3]
TTA d4 / FlipTransforms [4]
图像尺寸放大2倍

建模方法

我们使用 human_pixel_masks 作为真实标签。我们尝试了多种方式整合 human_individual_labels，但未能取得改进。我们没有尝试对这些标签进行平均并训练软标签。我们的集成中包含了一个模型，该模型计算所有单个掩码的损失，并将损失最大的一个作为辅助损失包含进来。

我们尝试利用时间信息改进单一模型，但未能超越2D设置，因此转而创建一个使用不同编码器和解码器的多样化集成。我们使用了不同的CNN和Transformer作为骨干网络，也有一些模型使用了Transformer解码器（UNetFormer）。

我们进行了许多实验，以利用额外时间段形式的额外数据，以便以某种方式整合这些信息，即使不是直接建模。最终对伪标签设置有效的方法（既能改进单一模型又能为集成增加多样性）如下：

平衡批次，保持½伪标签样本和½真实样本
对伪标签数据应用强增强，对真实数据应用轻到中等增强
将伪标签样本与真实样本进行Mixup混合

训练设置

优化器：AdamW
学习率：1.0e-3 或 1.0e-4
调度器：余弦衰减，2个epoch热身
数据增强：翻转 / 随机缩放裁剪 / RandAugment / Mixup / Mosaic
混合损失：BCE / Dice / Focal

CV策略

对于大多数实验，我们使用了主办方提供的分割方式，即在整个训练数据上训练，并在 validation.csv 上进行评估。早期我们进行了一些KFold实验，但OOF CV被高估，且在保留集(validation.csv)上的CV分数表现不佳。

评估

我们使用了两种变体，根据真实标签(256x256)进行评估：
i) 模型输出放大2倍尺寸 --> interpolate(256, mode='nearest') --> 计算Dice分数
ii) 模型直接输出256尺寸

注：我们的大多数实验使用了(i)，尽管我们认为第二种无需插值的设置更可靠

架构 / 骨干网络

最终集成

`CV: 0.7026` / `Public LB: 0.71868` / `Private LB: 0.71059`

骨干网络	架构	CV	TTA	伪标签	Mixup
efficientnet-b7	Unet (SMP)	0.6428	是	否	是
tf_efficientnet_b8	Unet++ (Timm)	0.6704	否	否	是
tf_efficientnet_b8	Unet++ (Timm)	0.6752	是	否	是
maxvit_small_tf_512	Unet (Timm)	0.6677	否	否	是
convnext_base	Unet++ (Timm)	0.6618	否	是	是
convnext_large	Unet (Timm)	0.6670	否	是	是
timm-resnest200e	Unet	0.6869	是	否	否
timm-resnest200e	Unet	0.6853	是	否	是
timm-resnest200e	Unet	0.6885	是	是	是
convnext_large_384_in22ft1k	UnetFormer	0.6788	是	否	是
tf_efficientnet_b6	UnetFormer	0.6532	否	否	否
eva02_large_patch14_448	Unet	0.6542	是	否	否
convnext_large_384_in22ft1k	UnetFormer	0.6841	是	否	是

该集成方案是我们的最佳CV分数 / 最佳Public LB（第6名） 和 最佳Private LB（第11名）。

无效尝试

使用ConvLSTM、UTAE、3D-Unets来利用其他时间切片信息
使用t-2, t-1, t切片进行后处理
不同的图像分辨率（384, 768, 1024）

致谢

我们要感谢主办方和Kaggle团队组织了这场有趣的研究竞赛。我们也感谢所有在讨论和笔记本中分享想法的Kagglers。

使用的库

[1] Timm https://github.com/huggingface/pytorch-image-models [2] segmentation_models.pytorch (SMP) https://github.com/qubvel/segmentation_models.pytorch [3] SWA实现 https://github.com/izmailovpavel/contrib_swa_examples [4] ttach https://github.com/qubvel/ttach

11th Place Solution Write-up

GIRYN团队第11名解决方案

摘要 [TLDR]

建模方法

训练设置

CV策略

评估

架构 / 骨干网络

`CV: 0.7026` / `Public LB: 0.71868` / `Private LB: 0.71059`

无效尝试

致谢

使用的库

团队GIRYN

同比赛其他方案

11th Place Solution Write-up

GIRYN团队第11名解决方案

摘要 [TLDR]

建模方法

训练设置

CV策略

评估

架构 / 骨干网络

CV: 0.7026 / Public LB: 0.71868 / Private LB: 0.71059

无效尝试

致谢

使用的库

团队GIRYN

同比赛其他方案

`CV: 0.7026` / `Public LB: 0.71868` / `Private LB: 0.71059`