#36 place solution

第36名解决方案

作者：liuzhangzhen (Master) | 比赛：Happywhale and Dolphin Identification

祝贺所有的获奖者。感谢 Happywhale 和 Kaggle 举办这次比赛。

非常感谢 Lex Toumbourou 和 Jan bre 的分享，我从他们重要的工作 [Happywhale - Effnet B6 fork with Detic crop] 和 backfintfrecords 数据集开始入手。在比赛中尝试了许多实验，最终在模型上只有三个显著的改进。

主要模型改进

1. 动态边界：Public LB +0.02（感谢 Landmark 团队分享的解决方案，论文地址：https://arxiv.org/abs/2010.05350）
经过测试发现最佳边界范围是 0.05-0.6。但是训练变得困难（损失容易变成 NaN），需要降低学习率。
2. 批归一化：Public LB +0.02（感谢 Heng，讨论帖：https://www.kaggle.com/competitions/happy-whale-and-dolphin/discussion/315129）
在全连接层之前添加 Batch normalization 层，为全连接层添加 L2 normalization。
3. 冻结 BN (FreezeBN)：Public LB +0.01（感谢 Balaji，讨论帖：https://www.kaggle.com/competitions/happy-whale-and-dolphin/discussion/309582）
这对 EfficientB6 和 B5 有效，但对 B7 无效（损失总是变成 NaN）。

最后，两个集成步骤帮助将 Public LB 提升到 0.858：

鳍和身体，使用 yolov5x6 训练 10 折，通过 b0rev256 测试然后选出最好的 5 折，选择最好的 1 折用于训练，所有其他用于 TTA。（结果：巨大的努力但只有轻微的改进，也许应该更仔细地检查数据集并去除噪声）

随机选择 500 张 2 张图片和 55 张图片作为新鲸鱼（约 11%，与 LB 百分比相同）作为验证数据集，并使用所有其他数据进行训练。（结果：证明验证数据集与 LB 相关且有用）

选取 4000+ 张置信度 > 0.95 且所有其他目标置信度 < 0.65 的样本。

基础笔记本 + 50% 的旋转、剪切、平移、缩放。（结果：轻微改进）

动态边界，全连接层前的批归一化层，全连接层添加 L2 归一化，冻结 BN（结果：显著改进）

候选模型：（最终 7-8 个模型用于鳍和身体）

Effv1: b7 768 Adam (使用 TPUv3-8), b7 608 Adam (Colab), b6 640 Adam (Colab), b5 640 Adam (Colab), b6 480 Adam (Colab), + 一些 SGD 模型 (例如: b7 640)