返回列表

7th place solution

345. Kuzushiji Recognition | kuzushiji-recognition

开始: 2019-07-18 结束: 2019-10-14 计算机视觉 数据算法赛
第7名方案

第7名方案

作者: K_mat
比赛排名: 第7名

感谢组织者举办这次有趣的挑战,也祝贺所有享受这次挑战的人!
我参加这次比赛是为了学习CNN。这就是为什么我没有个人GPU(我的工作是在Google Colab上进行的)并且没有使用任何预训练/预定义模型的原因,但这给了我很多知识和经验。

方法概述

我的大部分解决方案都写在我的Kernel中。概览如图所示。

  • 两阶段(检测和分类)
  • 验证:按书名进行分组分割。
    -> 这个结果给了我域适应的想法,但除了伪标签外,其他尝试都徒劳无功。

流程图

检测

  • 架构:CenterNet(输入:512x512,输出:128x128)
  • 数据增强:裁剪、亮度、对比度、水平翻转
  • TTA(翻转)& 集成

由于缺乏机器资源,我想使用浅层模型(比Resnet34小),因此我专注于CNN层的特定分辨率。考虑到物体的大小,64x64或32x32很重要,而小于16x16对我的模型来说是无用的。最终,我得到了一个非常准确的模型,IoU约0.90,F1(IoU>0.5)约0.98,F1(center)约0.99。

分类

  • 架构:Resnet基础(输入:64x64),物体的长宽比和大小在FC层拼接
  • 数据增强:裁剪、擦除、亮度、对比度
  • TTA(大小、亮度)& 集成
  • 伪标签

分类模型一点也不独特。我本想尝试其他模型和增强方法。

我也尝试过……

  • 带有LSTM的语言模型
    -> 改进非常小
  • 像DANN这样的域适应方法
    -> 伪标签效果更好。

再次感谢大家!

同比赛其他方案