第12名解决方案

作者： Inoichan (Grandmaster)
比赛排名： 第12名 (金牌)

首先，非常感谢 Kaggle 和主办方举办了如此有趣的比赛，并祝贺所有获奖者。

我很高兴能在这场精彩的比赛中获得单人金牌。我很感激 Kaggler 到目前为止与我的组队。我从他们那里学到了很多，才得以赢得这枚金牌。我也感谢 Kaggle 社区。讨论区和代码区总是分享着大量的知识，顶尖团队在比赛结束后也会分享他们出色的解决方案。没有这些，我不可能有现在的成长。谢谢。

概览

classification_detection_model (1)

详情如下。

研究级别和 ‘none’ 类

在第一个月里，我很难获得好的 CV 分数。经过近 100 次实验，我发现数据增强并不合适，当我将增强方式改为 @haqishen 在 RANZCR 解决方案中展示的方法时，CV 分数大幅提升。
https://www.kaggle.com/haqishen/ranzcr-1st-place-soluiton-cls-model-small-ver

包含 'none' 的 5 分类效果总是比 4 分类 + 单独处理 'none' 要好。使用 sigmoid + bce 比 softmax + ce 效果更好。

研究级别最佳单模型是 EffnetV2L ATfL6，CV 0.4248 / LB 0.463 / PB 0.430 (LB/PB 是在图像级别使用 ‘none 1 0 0 1 1’ 计算的)。

Swin transformer 的得分稍低，但对集成有贡献。

除了 Yolo，我还使用了几个 mmdet 模型，如概览图所示。
最佳模型是 Cascade RCNN Res2Net101，CV 0.0897 / LB 0.094 / PB 0.096。

WBF (th=0.5) 集成将分数提升至 LB 0.098 / PB 0.101。

检测置信度校准如下：

det_conf = det_conf * (1 - none)**0.5

<a href="https://www.kaggle.com/inoueu1/siim-sub145-lp-c2-effv2m-l-p-swin-mmdet?scriptVersionId=70843218" target="_