返回列表

4th place solution (brief summary)

495. Image Matching Challenge 2022 | image-matching-challenge-2022

开始: 2022-04-04 结束: 2022-06-02 计算机视觉 数据算法赛
第4名方案(简要总结)

第4名方案(简要总结)

作者:Jin Niu (团队: Bottleneck) | 比赛排名:第4名

感谢主办方组织了这场有趣的比赛!我们团队的所有成员都来自土木工程专业,在比赛前几乎没有图像匹配的相关知识,因此从零开始对我们来说既充满挑战又非常有趣。比赛主办方提供了宝贵的学习资料(问题定义、对应关系过滤和学习匹配论文),让我们这些初学者能够快速上手。能获得第四名真是让我们喜出望外。😄

总结

我们的方法完全基于预训练模型,且未对这些模型进行任何微调。由于计算资源不足,我们一开始便专注于现有方法的集成策略。

我们的工作参考了以下Notebook(衷心感谢论文和Notebook的作者!)

我们合并了不同方法获得的所有匹配关键点,并使用MAGSAC计算基础矩阵。过程大致如下:

  1. 提取多尺度图像的匹配关键点
    将图像对调整为不同尺度并应用匹配方法。
  2. 重缩放关键点
    将关键点的坐标重新缩放到原图像中的位置。
  3. 合并所有关键点
  4. 计算基础矩阵
模型 缩放策略
loftr 将长边长度缩放至 1000, 1200, 1400 + 调整高宽比
superglue 将长边长度缩放至 1200, 1600, 2000, 2800 + 调整高宽比
dkm 将图像像素缩放至 346800 + 保持高宽比

由于SuperGlue有严格的许可限制,不允许用于赢取奖金,但允许在比赛中用于获得更好的排名,因此在进入前五名后,我们采取了两种路线:

  1. 集成 LoFTR, SuperGlue 和 DKM
    最佳私有分数:0.853(未被选为最终提交)
    https://www.kaggle.com/gufanmingmie/imc-2022-final-ensemble

  2. 集成 LoFTR, QuadTree 和 DKM(排除 SuperGlue)
    最佳私有分数:0.843

最终选为提交的最佳私有分数:0.852,集成方案为 LoFTR, QuadTree, SuperGlue 和 DKM。

同比赛其他方案