7th place solution

第7名方案

作者： K_mat
比赛排名： 第7名

感谢组织者举办这次有趣的挑战，也祝贺所有享受这次挑战的人！
我参加这次比赛是为了学习CNN。这就是为什么我没有个人GPU（我的工作是在Google Colab上进行的）并且没有使用任何预训练/预定义模型的原因，但这给了我很多知识和经验。

方法概述

我的大部分解决方案都写在我的Kernel中。概览如图所示。

两阶段（检测和分类）
验证：按书名进行分组分割。
-> 这个结果给了我域适应的想法，但除了伪标签外，其他尝试都徒劳无功。

流程图

检测

架构：CenterNet（输入：512x512，输出：128x128）
数据增强：裁剪、亮度、对比度、水平翻转
TTA（翻转）& 集成

由于缺乏机器资源，我想使用浅层模型（比Resnet34小），因此我专注于CNN层的特定分辨率。考虑到物体的大小，64x64或32x32很重要，而小于16x16对我的模型来说是无用的。最终，我得到了一个非常准确的模型，IoU约0.90，F1(IoU>0.5)约0.98，F1(center)约0.99。

我也尝试过……

带有LSTM的语言模型
-> 改进非常小
像DANN这样的域适应方法
-> 伪标签效果更好。

再次感谢大家！

第7名方案

方法概述

检测

分类

我也尝试过……

同比赛其他方案