返回列表

LB #3 Solution

380. iWildCam 2020 - FGVC7 | iwildcam-2020-fgvc7

开始: 2020-03-09 结束: 2020-05-26 农业遥感 数据算法赛
LB #3 解决方案

LB #3 解决方案

作者:Steven Yin & Ryan Zheng
发布时间:2020-06-12

各位 Kagglers 好,
很抱歉这么晚才发布我们的解决方案。我和队友从以下几个方面总结了我们的方案:

  • 数据
  • 预处理/增强方法
  • 模型
  • 预测技术
  • 类别不平衡
  • 细粒度特征

数据

  1. 我们使用了官方检测结果提供的动物裁剪图像进行训练。尝试了 64x64 和 224x224 两种裁剪尺寸,结果 224x224 的效果更好;
  2. 一些原始边界框非常倾斜,我们尝试扩展这些倾斜的边界框使其近似正方形,并将其调整为 224x224;

预处理方法

  1. 我们尝试了多种增强方法,从传统的物理增强到光学技术。我们最终采用的增强方法是“水平翻转”和“CLAHE/对比度受限的自适应直方图均衡化”。
  2. 增强是在训练过程中即时应用的;

模型

模型 Public LB Private LB
EfficientNet 0.835 0.823
ResNet152 0.794 0.815
NTS with ResNet50 0.837 0.841
NTS with ResNext50 0.840 0.850
最终集成模型 = 6个NST模型 + EfficientNet 0.843 0.848

我们要指出的另一个技巧是使用 GridSearch(网格搜索),以本地验证分数为基准,搜索每个弱学习器的最佳权重。

预测技术

我们发现测试图像按以下顺序排序:

序列 ID --> 地点 --> 时间戳 --> 图像尺寸

因此,测试裁剪图像按照上述逻辑被分类为片段。在预测时,自然采用了按片段预测的方式。具体来说,对于每个片段,我们平均所有图像的预测概率来计算最终标签;然后该标签被分配给该片段下的所有图像。

类别不平衡

  1. 我们尝试了多种方法来解决类别不平衡问题。例如,我们使用了论文《Class-Balanced Loss Based on Effective Number of Samples》中指出的有效样本数计算的类别权重,但没有奏效。我们还尝试了 BBN Network,但未能运行成功。最后,我们仍然使用了由每个类别的 1 / # of images 计算的常规类别权重。

细粒度特征

  1. 我们使用了一个 SOTA 网络 NTS,它由 Navigator(导航器)、Teacher(教师)和 Scrutinizer(检查器)组成。

总结

这基本上就是我们团队在本次比赛中获得第 3 名的解决方案。我们希望向其他团队学习,尤其是第 1 名和第 2 名的团队。如果这两个团队的成员碰巧看到了我的帖子,请给我留言,以便我发送邮件或微信消息与你们联系。

谢谢,
Steven Yin & Ryan Zheng

同比赛其他方案