返回列表

2nd solution

490. Hotel-ID to Combat Human Trafficking 2022 - FGVC9 | hotel-id-to-combat-human-trafficking-2022-fgvc9

开始: 2022-03-16 结束: 2022-05-30 内容安全 数据算法赛
第二名方案

第二名方案

作者:wanghao
比赛排名:第2名

感谢主办方组织这次挑战赛。

掩码处理

统计测试集中掩码大小和位置的平均值和方差。在训练中使用这些统计值生成掩码。

数据预处理

使用 50k+fgvc9 数据集

  • 数据清洗
    计算所有数据的 MD5 值,删除 MD5 相同但类别不同的数据,保留 fgvc9 中的数据(共保留 45,769 个类别)。
  • 方向调整
    使用方向模型,将图像旋转为正向朝上。

训练步骤

步骤 1.
训练所有数据(10~20 轮)

步骤 2.
在 fgvc9 的 3116 个类别数据上进行微调(40轮)(提升约 0.03)

损失函数

因为同一酒店 ID 的图像差异很大,包含卧室、浴室等不同场景,所以我们使用 sub-center Arcface(k=3, Dynamic Margin)作为损失函数。

预测

在我的实验中,使用 logits 和检索方式的结果差异很小,所以我选择了更方便的 logits 作为预测方式。

模型

主干网络 输入尺寸 公榜分数 私榜分数
swin-base-384 384 0.707 0.688
swin-large-384 384 0.704 0.692
eca_nfnet_l1 576 0.700 0.688
efficientNetV2-l 480 / /
efficientNet-b5 576 / /
ensemble / 0.732 0.717

无效尝试

使用 fgvc8 数据进行伪标签训练。

同比赛其他方案