448. SIIM-FISABIO-RSNA COVID-19 Detection | siim-covid19-detection
我在这次比赛中学到最多的是如何对抗过拟合。
Efficientnetv2m + yolom tta LB 6.27 PB 6.13
Efficientnetv2m + yolox tta LB 6.29 PB 6.15
我使用了 efficientnetv2m + efficientnetb3 + yolom + yolox 以增加多样性,但 LB 仍为 6.29,PB 为 6.15。
在六月最后一周,我浏览了比赛的讨论区,我认为本次比赛的关键在于利用多任务数据以获得更好的性能。
因此,我给自己设定的目标是定制模块,利用目标检测框中的信息来辅助分类,反之亦然。
我很快复现了 Hengck 的代码,但令人沮丧的是,无论我对代码做一点什么改动,结果都会变得很差。我尝试将 AUX head 附加到不同的 block,尝试多输出、梯度累积,但由于我犯了缺乏数据增强的错误,导致整个七月我几乎寸步难行。
这主要是因为起初我以为自己在使用 TIMM 库时犯了错。所以我仔细阅读了 TIMM 中 EfficientnetV2 的实现,并将其与原始实现进行了对比,我还重温了 NAS(神经网络搜索)的概念和思想,这真的受益匪浅。
在七月底,我终于克服了这个问题,其实只是通过仔细微调了一下数据增强。
我的解决方案详情已提交在代码中。
分类任务中的数据增强以及 Yolox 的超参数远未调整到最佳状态。
标签平滑和 Mixup 还没来得及添加,也许下次比赛我会充分尝试一下。
下次我会尝试更多的无监督方法和不同的 Block 架构。
当我遇到瓶颈时,我搜索了许多资源并在讨论区发了两个帖子,非常感谢每一条回复和建议。
同时也想感谢所有提供建议和为开源做出贡献的人,没有这些我很难学到任何东西。