返回列表

47th Place Solution: A Novel Transparent Scene Trick!

611. Image Matching Challenge 2024 - Hexathlon | image-matching-challenge-2024

开始: 2024-03-25 结束: 2024-06-03 计算机视觉 数据算法赛
第47名方案:一种新颖的透明场景技巧!

第47名方案:一种新颖的透明场景技巧!

作者: Chainey(排名 48)
发布日期: 2024-06-11

感谢主办方举办本次比赛!我们在比赛中学习到了很多!

我们在处理玻璃杯以外的其他类别时,方法和之前差别不大;但我们犯了一个错误,导致非玻璃杯类别在公开排行榜(LB)出现过度拟合,[LB: 11, PB: 47]。然而,我们针对玻璃杯类别的技术是新颖的,取得了很大提升。下面是我们方法的流程图。

流程图

透明场景技巧

通过实验我们发现,构建旋转矩阵的关键在于确定每张图像之间的相对位置关系。我们假设具有更多匹配特征点的图像彼此更接近。然而,匹配特征点最多的两张图像并不一定相邻。我们需要寻找一种全局最优的排列方式

相对位置关系图

我们将确定一组图像相对位置的问题转化为闭环图搜索算法问题。匹配特征点更多的图像更可能相邻。另外,由于照片是围绕物体拍摄的,排序后的第一张和最后一张图像也应相邻。

闭环图示意

在实验过程中,我们结合了最小生成树(MST)深度优先搜索(DFS)来寻找最优解。MST 是一种在图中以最小总边权值连接所有顶点而不形成环的树结构,常用的算法有 Kruskal。通过 MST,我们可以找出连接所有节点的最小代价方式。DFS 是一种图遍历算法,使用递归或栈沿一条分支深入直到叶节点,然后回溯到其他分支,直到遍历完所有节点。DFS 可用于搜索可能路径或检查图中是否存在环。综上,MST 用于寻找最短路径,而 DFS 用于在最短路径上施加闭环约束。

实验结果

物体类别 交叉验证(CV)
玻璃杯 0.601
玻璃圆柱体 0.783
物体类别 公开排行榜 (LB) 私有排行榜 (PB)
+MST&DFS +0.03 +0.02

下面是我们的代码:

代码图示

同比赛其他方案