第5名方案
第5名方案
作者:tereka (Grandmaster) | 比赛排名:第5名
感谢主办方和各位参赛者。
对我来说,这是一场非常有趣的比赛。
太长不看版 (TL;DR)
- EfficientDetB3 5折交叉验证 -> 对10张测试图像进行伪标签
- EfficientDetB5 全量训练(EMA) -> 多尺度训练预测(1280,768,1024+4Flip) 得分 0.766
- EfficientDetB5 全量 + EfficientDetB4 全量 + EfficientDetB5 全量(含伪标签) 公开榜得分 0.7752
解决方案
第一阶段
使用 EfficientDetB3 对10张测试图像进行伪标签处理。
测试图像是“测试源”,我想从中获取测试源的知识。
第二阶段
在第二阶段,我使用了 EMA(指数移动平均)作为集成技术。
- AdamW 100轮 (epoch) 图像大小 640 批次大小 4(用于 BN 参数调整)
- AdamW 40轮 (epoch) 图像大小 1024 批次大小 1(BN 层冻结)
使用余弦退火。
数据增强:
- Mixup
- Mosaic
- Scale (缩放)
- Hue (色调)
- Random Brightness (随机亮度)
- Cutout
- GridMask
第三阶段
预测
EfficientDetB5 全量 + 多尺度预测(768, 1024, 1280 * 4Flip) -> 对所有测试集进行伪标签生成。
伪标签
训练参数如下:
- EfficientDet B5 图像尺寸 1024
- 轮数 5
- 使用 EMA
- 混合精度训练 (AMP)
模型集成
使用 WBF (加权框融合) 集成以下模型:
EfficientDetB5 全量 + EfficientDetB4 全量 + EfficientDetB5 全量(含伪标签)
为何成绩下滑?
- 阈值调整失败。(在私有榜单中,较低的阈值效果更好)
当设置阈值为 0.1 时,分数达到了 0.695。但我没能选中该方案。
- 使用了更重的数据增强以提高鲁棒性。