4th Public LB 0.852 -> 6th Private LB 0.850

第4名 Public LB 0.852 -> 第6名 Private LB 0.850

作者: Igor Lashkov (Master), Isamu (Grandmaster)
比赛: Image Matching Challenge 2022

我们的团队衷心感谢 Kaggle 工作人员、Google Research 和 CVPR 2022 主办了这场激动人心的比赛，也感谢所有在这里竞争、分享精彩讨论和代码的参赛者。祝贺所有参与者！

这是我第一次联合参加 Kaggle 比赛。特别感谢 @yamsam 的辛勤和高效的团队合作！我们真的很享受这次比赛！

不幸的是，最后我们没有选择正确的、分数最高的提交结果。我们的 Private Score 本可以达到 0.852，但选择了错误的版本（0.850）。有时候，这种事情确实会发生……

概述

我们的解决方案基于不同预训练模型的集成以及一系列技巧来达到最终分数。我们使用 np.concatenate 来合并来自不同模型的匹配结果。我想大多数参加这次比赛的 Kagglers 都使用了类似的方法。

我们测试的所有预训练模型包括：QuadTreeAttention, Loftr, SE2-Loftr, MatchFormer, DKM, SuperGlue, Patch2Pix, PDCNet, SGM, ASLFeat 和 AdaLam。
我们最终的提交包括 QTA、Loftr、DKM 和 SuperGlue。

当 QuadTreeAttention 得分为 0.812/0.817（Public/Private）时，我们感到非常震惊。仅凭单一模型就几乎接近金牌区。而且现在比赛结束时，你可以仅使用一个模型就获得银牌。

我们使用的 QuadTreeAttention 模型

https://www.kaggle.com/code/igorlashkov/imc-2022-baseline-quadtreeattention-0-812-0-817

我们的模型及其独立最佳得分：

模型	图像尺寸	无 TTA Public/Private	有 TTA Public/Private
QuadTreeAttention	1024	0.812/0.817	0.815/0.818
Loftr	1120	0.777/0.786	0.783/0.790
SuperGlue	1600	0.716/0.717	0.786/0.777
DKM	(672, 896)	0.735/0.748	0.744/0.757
Patch2Pix	1024	0.629/0.608	–
SGM	原始图像尺寸	0.464/0.427	–
PDCNet	原始图像尺寸	0.573/0.566	–
ASLFeat+AdaLam	原始图像尺寸	0.576/0.578	–
SE2-Loftr	1120	0.761/0.772	–
MatchFormer	1120	0.774/0.783	–

我们用于 F 矩阵计算（cv2.findFundamentalMat）的参数：

ransacReprojThreshold = 0.24
confidence = 0.999999 
max iterations = 100 000

第4名 Public LB 0.852 -> 第6名 Private LB 0.850

概述

我们使用的 QuadTreeAttention 模型

同比赛其他方案