返回列表

Public/Private 3rd Solution

490. Hotel-ID to Combat Human Trafficking 2022 - FGVC9 | hotel-id-to-combat-human-trafficking-2022-fgvc9

开始: 2022-03-16 结束: 2022-05-30 内容安全 数据算法赛
Public/Private 第3名 方案分享

Public/Private 第3名 方案分享

作者:tereka (Grandmaster) | 队友:@ks2019
比赛:Hotel-ID to Combat Human Trafficking 2022 - FGVC9
排名:第3名

感谢主办方、竞争对手以及我的队友 @ks2019
这是一场非常棒的比赛!
以下是我们团队的方案总结。

总结

  • ArcFaceSubcenter + Dynamic Margin(动态间隔)
  • 多种主干网络(Swin, ConvNeXt, ResNet200D, EfficientNet 等)
  • 使用外部数据(FGVC8)
  • 使用 Logits(逻辑斯谛)进行预测

建模

模型 数据 图像尺寸 Public 分数 Private 分数
Swin Large 比赛数据 512 0.587 0.584
ConvNeXt XLarge 比赛数据 + 外部数据 384 0.662 0.656
Swin Large 比赛数据 + 外部数据 384 0.659 0.657
EfficientNetB7 + DOLG 比赛数据 + 外部数据 448(stride1) 0.644 0.639
ConvNeXt XLarge 比赛数据 + 外部数据 512 0.677 0.672
ResNet200D + DOLG 比赛数据 + 外部数据 640 0.651 0.654
EfficientNetB6 + DOLG 比赛数据 + 外部数据 640 0.635 0.642
EfficientNetV2S + DOLG 比赛数据 + 外部数据 1024 0.645 0.642
EfficientNetV2M + DOLG 比赛数据 + 外部数据 896 0.666 0.666

伪标签

我们使用了 FGVC9 和 FGVC8 的比赛数据,但 FGVC8 没有比赛标签。
我们使用伪标签技术为这些数据标注了标签。

首先,我们对 FGVC9 训练集和 FGVC8 数据集使用了 KNN 匹配。
如果阈值小于 0.5,这些数据会被用于训练。

接下来,我们调整了标签。FGVC8 拥有相同的酒店列表。
我使用了平均聚合方法。

预测

我使用 Logits(逻辑斯谛)进行预测,因为测试集有遮罩,但训练集没有遮罩。
我认为匹配训练集和测试集很困难,所以我决定比较 KNN 和 Logits 的效果。
在我的实验中,Logits 的效果优于 KNN。

我的推理时间大约为 2 小时。

无效尝试

  • 使用 Hotel50K 数据集
  • 梯度检查点
同比赛其他方案