第12名解决方案
第12名解决方案
作者: JIANJIAN (Master) | 比赛排名: 第12名 | 发布日期: 2019-09-08
恭喜大家,我非常高兴能获得我的第一枚金牌!以下是我的解决方案。
模型
- efficientnet-b5
- efficientnet-b6
我的最终提交包含了80%的回归模型和20%的分类模型。
数据预处理与增强
我使用了两组 data_crop 增强方法:
- 裁剪黑色背景并保持纵横比缩放至 320x320。
- 随机添加黑色背景到图像并缩放至 288x288。
两种裁剪方法均使用了:左右翻转、上下翻转、随机角度旋转、随机擦除、随机模糊、亮度偏移、颜色偏移、色调偏移和高斯噪声。
训练策略
- 在2015年数据上进行预训练,并在2019年数据上进行微调。感谢 DrHB @drhabib,我从你的方法中获得了启发。
- 5折交叉验证(选择准确率最高的两到三折进行提交)。
- 微调时应保留预训练时的优化器参数,这对我来说有很大帮助。
- TTA(测试时增强)*2。
- 阈值:[0.5, 1.5, 2.5, 3.5]。
- 分类模型使用投票法进行集成。
伪标签
使用伪标签让我的 LB 分数从 0.840 提升到了 0.842,但我担心过拟合,所以我只给了伪标签模型非常低的权重。事实证明,我错了。
总结
- 好的预训练非常有帮助。
- 伪标签既诱人又危险,但值得一试。
- 坚持到最后一刻!!!💪