363. Bengali.AI Handwritten Grapheme Classification | bengaliai-cv19
我们感谢 Bengali.AI 和 Kaggle 为这次比赛付出的努力,并祝贺所有的获胜者。你们有趣的发现、新颖的方法、对问题、数据集以及评估指标的深刻理解给我们留下了深刻的印象。
我们的解决方案相对直接,与一些顶尖的解决方案有相似之处。
我们将训练集中的 1295 个字形称为 ID(字典内,in-dictionary),将测试集中未知的字形称为 OOD(字典外,out-of-dictionary)。第一步是训练 Arcface 模型并计算这 1295 个字形各自的特征中心。然后,我们可以根据测试图像到每个字形中心的最小特征距离来判断它是 ID 还是 OOD。在我们获得第4名的提交中,我们将分类阈值设置为 0.15(余弦距离),这是在本地估算得出的。在进行 ID/OOD 分类后,我们仅将 Arcface 模型应用于 ID 集,并通过字形类别确定组件类别。对于 OOD 集,我们训练了另一组单头和三头组件模型,并仅将其应用于 OOD 集。