返回列表

3rd place solution

363. Bengali.AI Handwritten Grapheme Classification | bengaliai-cv19

开始: 2019-12-19 结束: 2020-03-16 计算机视觉 数据算法赛
第三名方案

第三名方案

作者: phalanx, earhian, spongebob, JIANJIAN, baigou

恭喜大家取得优异的成绩。

以下是我们团队的方案总结。

Pipeline Image

数据集

  • 预训练:通过水平翻转和垂直翻转进行三倍身份增强。
  • 图像分辨率:137 x 236。

模型

针对已见字形和未见字形

  • (phalanx) 编码器 -> Gem池化 -> 批归一化 -> 全连接层
  • (earhian) 编码器 -> 平均池化 -> 批归一化 -> Dropout -> 全连接层

ArcFace

  • 编码器 -> 平均池化 -> 1D卷积 -> 批归一化
  • 缩放参数 s:32(训练), 1.0(测试)
  • 间隔参数 m:0.5

堆叠

  • 卷积 -> ReLU -> Dropout -> 全连接层

数据增强

  • Cutmix
  • 平移、缩放、旋转、剪切

训练

  • 已见字形:使用预训练数据集训练已见字形模型,然后使用原始数据集进行微调。
  • ArcFace 和未见字形:使用原始数据集训练针对已见字形的预训练模型。
  • 将 softmax 替换为 pc-softmax
  • 损失函数:负对数似然。
  • SGD 优化器配合余弦退火。
  • 随机加权平均。

推理

ArcFace

  • 计算训练集和测试集嵌入特征之间的余弦相似度。
  • 阈值:训练集和验证集嵌入特征之间最小的余弦相似度。
同比赛其他方案