498. Foursquare - Location Matching | foursquare-location-matching
感谢 Kaggle 和 Foursquare 举办了这场比赛。这是一个有趣且充满挑战的比赛。我们的团队并不知道数据泄露的存在,但我们的解决方案很可能受到了它的影响。我们的最终方法是对 XGBoost、CatBoost 和一个基于语言模型的神经网络的加权平均。这是我们团队与其他参赛者分享的解决方案有所不同的一些事情的简要总结。
Kosuke 的候选生成是我们解决方案的主要组成部分之一。最终,我们在每个 id 使用 25 个候选者的情况下达到了 0.97675 的最大 IoU。
后处理提升了我们在排行榜上的分数。我们从图中创建了一个软邻接矩阵,其中节点是地点,边是匹配概率。首先,我们使用预测概率大于 0.5 的边找到所有存在的 1 跳路径(这等同于大多数公开笔记本中使用的后处理方法)。然后,我们使用预测概率大于 0.9 的边找到所有存在的 2 跳路径。我们对 3、4 和 5 跳路径分别重复此操作,阈值分别为 0.95、0.998 和 0.999。最后,如果两个地点之间存在至少一条这样的 n 跳路径,我们就预测这两个地点是匹配的。