Public/Private 第3名方案分享

作者：tereka (Grandmaster) | 队友：@ks2019
比赛：Hotel-ID to Combat Human Trafficking 2022 - FGVC9
排名：第3名

感谢主办方、竞争对手以及我的队友 @ks2019。
这是一场非常棒的比赛！
以下是我们团队的方案总结。

总结

建模

模型	数据	图像尺寸	Public 分数	Private 分数
Swin Large	比赛数据	512	0.587	0.584
ConvNeXt XLarge	比赛数据 + 外部数据	384	0.662	0.656
Swin Large	比赛数据 + 外部数据	384	0.659	0.657
EfficientNetB7 + DOLG	比赛数据 + 外部数据	448(stride1)	0.644	0.639
ConvNeXt XLarge	比赛数据 + 外部数据	512	0.677	0.672
ResNet200D + DOLG	比赛数据 + 外部数据	640	0.651	0.654
EfficientNetB6 + DOLG	比赛数据 + 外部数据	640	0.635	0.642
EfficientNetV2S + DOLG	比赛数据 + 外部数据	1024	0.645	0.642
EfficientNetV2M + DOLG	比赛数据 + 外部数据	896	0.666	0.666

我们使用了 FGVC9 和 FGVC8 的比赛数据，但 FGVC8 没有比赛标签。
我们使用伪标签技术为这些数据标注了标签。

首先，我们对 FGVC9 训练集和 FGVC8 数据集使用了 KNN 匹配。
如果阈值小于 0.5，这些数据会被用于训练。

接下来，我们调整了标签。FGVC8 拥有相同的酒店列表。
我使用了平均聚合方法。

我使用 Logits（逻辑斯谛）进行预测，因为测试集有遮罩，但训练集没有遮罩。
我认为匹配训练集和测试集很困难，所以我决定比较 KNN 和 Logits 的效果。
在我的实验中，Logits 的效果优于 KNN。

我的推理时间大约为 2 小时。