返回列表

11th Place Solution Write-up

567. Google Research - Identify Contrails to Reduce Global Warming | google-research-identify-contrails-reduce-global-warming

开始: 2023-05-10 结束: 2023-08-09 双碳与可持续发展 数据算法赛
GIRYN团队第11名解决方案 - Google Research 识别凝结尾迹以减少全球变暖竞赛

GIRYN团队第11名解决方案

竞赛: Google Research 识别凝结尾迹以减少全球变暖
排名: 第11名 (Private LB: 0.71059)
发布时间: 2023年8月18日
团队成员: 5人

摘要 [TLDR]

  • 加权集成(通过Optuna优化权重)
  • 多阶段长期训练(70-100个epoch)
  • 伪标签(时间切片 = 1-4, 6-8)
  • SWA [3]
  • TTA d4 / FlipTransforms [4]
  • 图像尺寸放大2倍

建模方法

我们使用 human_pixel_masks 作为真实标签。我们尝试了多种方式整合 human_individual_labels,但未能取得改进。我们没有尝试对这些标签进行平均并训练软标签。我们的集成中包含了一个模型,该模型计算所有单个掩码的损失,并将损失最大的一个作为辅助损失包含进来。

我们尝试利用时间信息改进单一模型,但未能超越2D设置,因此转而创建一个使用不同编码器和解码器的多样化集成。我们使用了不同的CNN和Transformer作为骨干网络,也有一些模型使用了Transformer解码器(UNetFormer)。

我们进行了许多实验,以利用额外时间段形式的额外数据,以便以某种方式整合这些信息,即使不是直接建模。最终对伪标签设置有效的方法(既能改进单一模型又能为集成增加多样性)如下:

  • 平衡批次,保持½伪标签样本和½真实样本
  • 对伪标签数据应用强增强,对真实数据应用轻到中等增强
  • 将伪标签样本与真实样本进行Mixup混合

训练设置

  • 优化器:AdamW
  • 学习率:1.0e-3 或 1.0e-4
  • 调度器:余弦衰减,2个epoch热身
  • 数据增强:翻转 / 随机缩放裁剪 / RandAugment / Mixup / Mosaic
  • 混合损失:BCE / Dice / Focal

CV策略

对于大多数实验,我们使用了主办方提供的分割方式,即在整个训练数据上训练,并在 validation.csv 上进行评估。早期我们进行了一些KFold实验,但OOF CV被高估,且在保留集(validation.csv)上的CV分数表现不佳。

评估

我们使用了两种变体,根据真实标签(256x256)进行评估:
i) 模型输出放大2倍尺寸 --> interpolate(256, mode='nearest') --> 计算Dice分数
ii) 模型直接输出256尺寸

注:我们的大多数实验使用了(i),尽管我们认为第二种无需插值的设置更可靠

架构 / 骨干网络

最终集成

CV: 0.7026 / Public LB: 0.71868 / Private LB: 0.71059

骨干网络 架构 CV TTA 伪标签 Mixup
efficientnet-b7 Unet (SMP) 0.6428
tf_efficientnet_b8 Unet++ (Timm) 0.6704
tf_efficientnet_b8 Unet++ (Timm) 0.6752
maxvit_small_tf_512 Unet (Timm) 0.6677
convnext_base Unet++ (Timm) 0.6618
convnext_large Unet (Timm) 0.6670
timm-resnest200e Unet 0.6869
timm-resnest200e Unet 0.6853
timm-resnest200e Unet 0.6885
convnext_large_384_in22ft1k UnetFormer 0.6788
tf_efficientnet_b6 UnetFormer 0.6532
eva02_large_patch14_448 Unet 0.6542
convnext_large_384_in22ft1k UnetFormer 0.6841

该集成方案是我们的最佳CV分数 / 最佳Public LB(第6名)最佳Private LB(第11名)

无效尝试

  • 使用ConvLSTM、UTAE、3D-Unets来利用其他时间切片信息
  • 使用t-2, t-1, t切片进行后处理
  • 不同的图像分辨率(384, 768, 1024)

致谢

我们要感谢主办方和Kaggle团队组织了这场有趣的研究竞赛。我们也感谢所有在讨论和笔记本中分享想法的Kagglers。

团队GIRYN

同比赛其他方案