作者： ts
发布时间： 2023-08-10
比赛排名： 第8名

总结

引言

我们的团队要感谢组织者和Kaggle举办这次比赛。同时，我想对我们的杰出队友@cnumber和@yukiokumura1的贡献表示衷心感谢，他们的努力对我们的最终成绩起到了至关重要的作用。

我们的主要策略是结合使用多种模型，并使用软标签和伪标签。

在比赛初期，我们主要尝试结合使用smp和timm库，但在比赛中期，我们开始使用OneFormer。

OneFormer表现最佳。
单模型OneFormer（dinat-l）的私有排行榜得分：0.70204
交叉验证中holdout dice分数：effnet b7: 0.671，OneFormer(dinat-l): 0.693。

模型分辨率如下：（推理设置）

OneFormer	effnetb7, b8	MaxViT-Tiny, Base	resnetrs	nfnetf5
1024	640	512	512	640

训练时使用软标签（所有标注者标签的平均值）。我们还为部分模型引入了伪标签。当两者结合使用时，会在0到7时间帧的图像上随机进行训练，其中仅对第4时间帧使用软标签，其余情况均使用伪标签。

为了最大化集成性能，我们在交叉验证环境中使用Optuna进行优化。这使我们能够高效地验证最佳模型组合。

使用伪标签的影响（当使用伪标签训练时，effnet b7: 0.685，OneFormer(dinat-l): 0.695） *伪标签是每个模型在holdout上训练结果的平均值。

然而，OneFormer的提升相对有限。
一个假设是，伪标签可能带来知识蒸馏的效果。当骨干网络达到一定强度时，这种效果的影响可能会达到上限。