483. Happywhale - Whale and Dolphin Identification | happy-whale-and-dolphin
祝贺所有的获奖者。感谢 Happywhale 和 Kaggle 举办这次比赛。
非常感谢 Lex Toumbourou 和 Jan bre 的分享,我从他们重要的工作 [Happywhale - Effnet B6 fork with Detic crop] 和 backfintfrecords 数据集开始入手。在比赛中尝试了许多实验,最终在模型上只有三个显著的改进。
这是一个包含上述 3 个实现的训练笔记本:https://www.kaggle.com/code/liuzhangzhen/happywhale-bodydataset-training
最后,两个集成步骤帮助将 Public LB 提升到 0.858:
鳍 和 身体,使用 yolov5x6 训练 10 折,通过 b0rev256 测试然后选出最好的 5 折,选择最好的 1 折用于训练,所有其他用于 TTA。(结果:巨大的努力但只有轻微的改进,也许应该更仔细地检查数据集并去除噪声)
随机选择 500 张 2 张图片和 55 张图片作为新鲸鱼(约 11%,与 LB 百分比相同)作为验证数据集,并使用所有其他数据进行训练。(结果:证明验证数据集与 LB 相关且有用)
选取 4000+ 张置信度 > 0.95 且所有其他目标置信度 < 0.65 的样本。
基础笔记本 + 50% 的旋转、剪切、平移、缩放。(结果:轻微改进)
动态边界,全连接层前的批归一化层,全连接层添加 L2 归一化,冻结 BN(结果:显著改进)
候选模型:(最终 7-8 个模型用于鳍和身体)