4th place solution and experience sharing

397. Google Landmark Retrieval 2020 | landmark-retrieval-2020

开始: 2020-06-30 结束: 2020-08-17 计算机视觉数据算法赛

第4名解决方案与经验分享

第4名解决方案与经验分享

作者： peanut, louis
比赛排名： 第4名

大家好，这是我们简短的解决方案总结：

我们尝试过且有效的方案

数据增强： 例如随机裁剪和旋转。使用 AutoAugmentation 效果显著。
主干网络： 由于资源限制，使用了 Resnest200 和 Resnet152。
预训练： ImageNet 预训练和 Softmax 预训练有助于收敛。
损失函数： 基于角度的损失函数，例如 ArcFace。
标签平滑
余弦学习率与热身
更大的输入尺寸： 我们尝试了 224、336、448 和 560。我们最终选择 448 作为输入尺寸，因为它的性价比更高。较小的输入尺寸会导致分数下降。

我们尝试过但无效的方案

EfficientNet B7： 我们在 PyTorch 中训练了 B7 并将其转换为 TF savedmodel 格式，但最终因 笔记本超时 而失败。
其他得分较低的大型主干网络： SEResNext, APolyNet, FishNet, HRNet。
损失函数中的其他超参数： 例如更大或更小的 margin。
AdaBN
DCN

我们尚未尝试的方案

更大的主干网络： 例如 Resnest269。
看起来 B7 在这里有效。也许我们将模型从 PyTorch 转换为 TensorFlow 的方式导致了提交过程中的高时间成本。
像基线模型所做的那样的多尺度输入。
EMA (指数移动平均)
KD (知识蒸馏)

训练好的模型将在几天内上传。谢谢。

同比赛其他方案

1st place solution summary

2nd place solution summary

[Update] 3rd place solution

5th place solution write-up

8th place solution