LB #3 Solution

LB #3 解决方案

作者：Steven Yin & Ryan Zheng
发布时间：2020-06-12

各位 Kagglers 好，
很抱歉这么晚才发布我们的解决方案。我和队友从以下几个方面总结了我们的方案：

数据

我们要指出的另一个技巧是使用 GridSearch（网格搜索），以本地验证分数为基准，搜索每个弱学习器的最佳权重。

我们发现测试图像按以下顺序排序：

序列 ID --> 地点 --> 时间戳 --> 图像尺寸

因此，测试裁剪图像按照上述逻辑被分类为片段。在预测时，自然采用了按片段预测的方式。具体来说，对于每个片段，我们平均所有图像的预测概率来计算最终标签；然后该标签被分配给该片段下的所有图像。

我们尝试了多种方法来解决类别不平衡问题。例如，我们使用了论文《Class-Balanced Loss Based on Effective Number of Samples》中指出的有效样本数计算的类别权重，但没有奏效。我们还尝试了 BBN Network，但未能运行成功。最后，我们仍然使用了由每个类别的 1 / # of images 计算的常规类别权重。

这基本上就是我们团队在本次比赛中获得第 3 名的解决方案。我们希望向其他团队学习，尤其是第 1 名和第 2 名的团队。如果这两个团队的成员碰巧看到了我的帖子，请给我留言，以便我发送邮件或微信消息与你们联系。

谢谢，
Steven Yin & Ryan Zheng