401. Google Landmark Recognition 2020 | landmark-recognition-2020
我们要感谢所有组织者带来了这场非常激动人心的比赛。
祝贺所有完成比赛的人以及获奖者。
我们训练了基于 CosFace 的全局特征模型。
设置与我们在 retrieval2020 中的模型几乎相同(参见 https://www.kaggle.com/c/landmark-retrieval-2020/discussion/175472)
此外,我们尝试了 MutualNet 论文中的“原地知识蒸馏”以有效地训练多尺度图像特征。
所有模型都采用了这一方法。
我们尝试了 HOW 描述符作为全局特征模型的替代方案。
HOW 通过 ASMK 将基于 CNN 的局部描述符聚合为单个全局描述符。
我们训练了一个基于 ResNet50 的 HOW 描述符模型(我们的 PyTorch 实现),并获得公共分数 = 0.5284(私有分数 = 0.5044)。
我们的最终提交之一基于全局余弦相似度和 ASMK 相似度的混合,这取得了最好的公共分数 = 0.6298。然而,另一种仅使用全局特征的方法获得了更好的私有分数。
| 最终提交 | 私有分数 | 公共分数 |
|---|---|---|
| 全局特征 | 0.5983 | 0.6271 |
| 全局 + HOW ASMK | 0.5960 | 0.6298 |