第10名解决方案
第10名解决方案
作者: YuryBolkonsky (Grandmaster) 及团队成员 @sggpls, @vzaguskin, @igorkrashenyi
发布日期: 2021-08-19
感谢团队 @sggpls、@vzaguskin、@igorkrashenyi 的辛勤工作。
预处理
在比赛开始时,我们尝试了不同的方法(使用所有通道、仅使用 0、2、4 通道,使用 vstack 和不使用)。最终,最好的选择是仅使用 0、2、4 通道并结合 vstack。
我们还对图像尺寸进行了大量实验,发现更高的分辨率可以提高结果(512x512 和 640x640)。
数据增强:
- HorizontalFlip(水平翻转), VerticalFlip(垂直翻转)
- ShiftScaleRotate(平移缩放旋转)
- RandomResizedCrop(随机裁剪缩放,比例 0.9)
- IAAAdditiveGaussianNoise(高斯噪声,比例 0.15)
此外,在训练期间我们尝试了 mixup 和 fmix,两者的表现差不多。我们也尝试在 mixup 期间增加信号强度,虽然有效,但并非总是如此。
训练
有效的方法
- 大模型(efficientnet_b7, efficientnet_v2m, resnet200d, nfnet_f3 等)
- Mixup
- 大分辨率 (640x640)
- 伪标签
- 推理时的 TTA4(测试时增强)
- OOF Stacking(袋外堆叠)
无效的方法
- 将通道打乱作为增强手段
- 用于分割通道的连体网络
- 结合 on/off 信号的 LSTM 架构
- VOLO 模型(难以训练,需要调整参数)
LB(排行榜)简化路线图
- b0 单模 0.74+ LB
- b0 OOF 0.77+ LB
- v2m OOF 0.775+ LB
- 融合 0.785+ LB
- 伪标签 0.795 + LB
感谢所有参与者、组织者和主办方 的辛勤工作,以及在数据泄露后恢复比赛所付出的努力。