作者：Ivan Panshin（GRANDMASTER）
排名：第4名
发布日期：2023-08-20

第四名解决方案

这是一场非常棒的比赛，感谢组织者和我的团队。过去的3个月并不轻松，但很高兴最终一切都很值得。

概述

我们很早就意识到，较重的模型和较长的训练在此效果良好，因此我们主要使用如effnet_v2_large及更重的骨干网络进行实验。最终解决方案包括：

使用4块A6000 GPU进行训练大约需要一周时间（大部分训练时间用于创建高质量的伪标签）。

在我们发现某些几何增强方法（例如垂直翻转）效果不佳后，将其从增强流程中移除。此外，4TTA验证与常规验证之间的相关性并不完美，因此在训练期间使用4TTA进行验证，这在比赛初期带来了显著提升。

关于数据划分，我们使用了组织者提供的划分方式。

原始数据集（包含20,519条记录，每条记录有8张图像）对于U-Net类模型来说已经相当大，但我们希望进一步扩展。因此，我们通过训练3个模型，每个模型进行4折交叉验证，共进行2轮，为整个数据集创建伪标签。下图说明了这一思路：

然后我们使用采样器来训练最终模型：50%原始数据，50%软伪标签。

此处很多方法效果不佳，因此我们添加了一些简单技巧来改进流程，包括：

推理内核 链接

训练代码GitHub仓库 链接