495. Image Matching Challenge 2022 | image-matching-challenge-2022
我们的团队衷心感谢 Kaggle 工作人员、Google Research 和 CVPR 2022 主办了这场激动人心的比赛,也感谢所有在这里竞争、分享精彩讨论和代码的参赛者。祝贺所有参与者!
这是我第一次联合参加 Kaggle 比赛。特别感谢 @yamsam 的辛勤和高效的团队合作!我们真的很享受这次比赛!
不幸的是,最后我们没有选择正确的、分数最高的提交结果。我们的 Private Score 本可以达到 0.852,但选择了错误的版本(0.850)。有时候,这种事情确实会发生……
我们的解决方案基于不同预训练模型的集成以及一系列技巧来达到最终分数。我们使用 np.concatenate 来合并来自不同模型的匹配结果。我想大多数参加这次比赛的 Kagglers 都使用了类似的方法。
我们测试的所有预训练模型包括:QuadTreeAttention, Loftr, SE2-Loftr, MatchFormer, DKM, SuperGlue, Patch2Pix, PDCNet, SGM, ASLFeat 和 AdaLam。
我们最终的提交包括 QTA、Loftr、DKM 和 SuperGlue。
当 QuadTreeAttention 得分为 0.812/0.817(Public/Private)时,我们感到非常震惊。仅凭单一模型就几乎接近金牌区。而且现在比赛结束时,你可以仅使用一个模型就获得银牌。
https://www.kaggle.com/code/igorlashkov/imc-2022-baseline-quadtreeattention-0-812-0-817
我们的模型及其独立最佳得分:
| 模型 | 图像尺寸 | 无 TTA Public/Private | 有 TTA Public/Private |
|---|---|---|---|
| QuadTreeAttention | 1024 | 0.812/0.817 | 0.815/0.818 |
| Loftr | 1120 | 0.777/0.786 | 0.783/0.790 |
| SuperGlue | 1600 | 0.716/0.717 | 0.786/0.777 |
| DKM | (672, 896) | 0.735/0.748 | 0.744/0.757 |
| Patch2Pix | 1024 | 0.629/0.608 | – |
| SGM | 原始图像尺寸 | 0.464/0.427 | – |
| PDCNet | 原始图像尺寸 | 0.573/0.566 | – |
| ASLFeat+AdaLam | 原始图像尺寸 | 0.576/0.578 | – |
| SE2-Loftr | 1120 | 0.761/0.772 | – |
| MatchFormer | 1120 | 0.774/0.783 | – |
我们用于 F 矩阵计算(cv2.findFundamentalMat)的参数:
ransacReprojThreshold = 0.24
confidence = 0.999999
max iterations = 100 000