第三名方案
第三名方案
作者: phalanx, earhian, spongebob, JIANJIAN, baigou
恭喜大家取得优异的成绩。
以下是我们团队的方案总结。
数据集
- 预训练:通过水平翻转和垂直翻转进行三倍身份增强。
- 图像分辨率:137 x 236。
模型
针对已见字形和未见字形
- (phalanx) 编码器 -> Gem池化 -> 批归一化 -> 全连接层
- (earhian) 编码器 -> 平均池化 -> 批归一化 -> Dropout -> 全连接层
ArcFace
- 编码器 -> 平均池化 -> 1D卷积 -> 批归一化
- 缩放参数 s:32(训练), 1.0(测试)
- 间隔参数 m:0.5
堆叠
- 卷积 -> ReLU -> Dropout -> 全连接层
数据增强
训练
- 已见字形:使用预训练数据集训练已见字形模型,然后使用原始数据集进行微调。
- ArcFace 和未见字形:使用原始数据集训练针对已见字形的预训练模型。
- 将 softmax 替换为 pc-softmax。
- 损失函数:负对数似然。
- SGD 优化器配合余弦退火。
- 随机加权平均。
推理
ArcFace
- 计算训练集和测试集嵌入特征之间的余弦相似度。
- 阈值:训练集和验证集嵌入特征之间最小的余弦相似度。