382. Plant Pathology 2020 - FGVC7 | plant-pathology-2020-fgvc7
恭喜大家。非常感谢 Kaggle 和组织者举办这场精彩的比赛。特别感谢我的队友 @aziz69 和 @datadote。
我们一直担心过拟合问题。虽然不知道最终是否按计划奏效,但我还是想分享一下我们的解决方案。:)
实际上,我做了很多实验,但无法一一写下来。(使用 CycleGAN 生成图像消耗了太多资源。)
我想分享一个失败的实验。我想解决数据不平衡的问题,于是使用了额外的数据来生成多种病害的数据。
[PlantPathology Apple Dataset]
https://www.kaggle.com/piantic/plantpathology-apple-dataset
最终,我生成了 224、512、1024 尺寸的图像。即使在我这双“拙眼”看来,512 和 1024 的图像似乎也无法使用。我挑选了一些有用的,但也只有几百张。而且当我用它进行训练时,分数反而更低,所以我没有采用它。
我分享一些生成的图像: