567. Google Research - Identify Contrails to Reduce Global Warming | google-research-identify-contrails-reduce-global-warming
这是一场非常棒的比赛,感谢组织者和我的团队。过去的3个月并不轻松,但很高兴最终一切都很值得。
我们很早就意识到,较重的模型和较长的训练在此效果良好,因此我们主要使用如effnet_v2_large及更重的骨干网络进行实验。最终解决方案包括:
使用4块A6000 GPU进行训练大约需要一周时间(大部分训练时间用于创建高质量的伪标签)。
在我们发现某些几何增强方法(例如垂直翻转)效果不佳后,将其从增强流程中移除。此外,4TTA验证与常规验证之间的相关性并不完美,因此在训练期间使用4TTA进行验证,这在比赛初期带来了显著提升。
关于数据划分,我们使用了组织者提供的划分方式。
原始数据集(包含20,519条记录,每条记录有8张图像)对于U-Net类模型来说已经相当大,但我们希望进一步扩展。因此,我们通过训练3个模型,每个模型进行4折交叉验证,共进行2轮,为整个数据集创建伪标签。下图说明了这一思路:

然后我们使用采样器来训练最终模型:50%原始数据,50%软伪标签。
此处很多方法效果不佳,因此我们添加了一些简单技巧来改进流程,包括: