401. Google Landmark Recognition 2020 | landmark-recognition-2020
首先,恭喜获得前排的团队!!! 🎉🎉🎉🎉🎉🎉🎉 他们取得的成就令人难以置信!
今年的 Landmark Retrieval 和 Recognition 挑战赛是我第一次参加的 ML 比赛。我已经有一年没碰过任何与 ML 相关的东西了,所以这次经历让人耳目一新。
不幸的是,我参加 Retrieval 比赛的时间较晚(结束前 8 天),并且只有大约 2 周的时间兼职参与这次比赛。我在这次比赛中学到了很多。如果明年还有地标挑战赛,我会打得更好!
另外,我要感谢 @keetar 带来的启发——他仅用 Colab Pro 取得的成绩向我展示了,即使是在数据量如此巨大的高难度比赛中,你也不需要昂贵的硬件就能参与竞争。他那篇 出色的分享 是我决定参加 Recognition 赛道的唯一原因。
0.271 和 0.277 模型的加权集成,然后就拿了银牌,哈哈哈 😆😆😆 我也尝试了使用 Places365 VGG 模型进行一些过滤,但没起作用。我意识到我在 Discussion 区灌水太多了,所以我长话短说:
我在 Cleaned GLDv2 数据集上训练了一个带有 GeM (p=3) + ArcFace 的 ResNet152V2,以及一个带有 GAP + ArcFace 全局描述符的 EffNetB6。可惜没时间训练到完全收敛 ☹️☹️☹️
对于 ArcFace,我从一个较小的 margin 开始(即 1e-3),并在每个 Cosine LR 周期结束时逐渐增加,直到 0.31。对我来说,用固定的 margin 训练更难。
训练硬件:仅使用 Colab Pro!
我只是使用了一个在 Open Images V4 上训练的公开目标检测器 FastRCNN+InceptionResNetV2 来进行非地标移除。这在公开 LB 上带来了大约 +0.005 的提升。
因为我开始得晚(结束前约 2 周),没有足够的时间进行实验,所以我使用了 Data Echoing 技术来加速训练 约 20%。
标准的重排序流程:检索步骤(使用 KNN)+ 非地标移除(如上所述)+ 局部描述符提取(使用基线 DELG 模型)+ RANSAC。
在推理过程中,我只使用了索引嵌入!我没有时间为训练样本生成嵌入。
我没时间完成的事情: