382. Plant Pathology 2020 - FGVC7 | plant-pathology-2020-fgvc7
这个方案主要基于这个 Kernel,做了一些小的改动,比如在调整大小时保持长宽比(600x850),并且使用了全部训练数据而没有进行交叉验证;增加了翻转(0, H, V, HV)的 TTA(测试时增强)。
我对 B5、B6、B7 和 IRv2 都进行了这样的操作。最好的单模型是 IRv2,Public LB 得分为 0.981,集成后的得分为 0.984。
然后加入了伪标签,单模型 IRv2 达到了 0.984,集成模型达到了 0.988。
没有使用花哨的数据增强或损失函数,我也没有处理数据不平衡问题。尽管如此,我最终还是 Public 和 Private 榜单上都拿到了很多高分。但是很难挑选出最好的一个,因为我没有验证集,而且测试集和训练集都很小。
所以我拿了 Public 上最好的提交,然后从前100名最好的提交中随机选了一个 :)。结果那个随机选的最终比我的最佳 Public 提交还要好。
另外,我错过了 30+ 个比我现在分数更好的提交 :D