463. chaii - Hindi and Tamil Question Answering | chaii-hindi-and-tamil-question-answering
恭喜获得奖牌的获胜者们!同时也感谢所有为这场比赛做出贡献的人!
很高兴我在这次比赛中获得了我的第二枚银牌,这是我第一次参加多语言类型的比赛(也许我有机会拿金牌😆)。我有效的解决方案几乎都来自于新的翻译数据、集成方法以及使用不同数据训练的多样化模型。
Logits 平均(就像几乎大家做的那样)
Logits 总和投票:
这种方法是为具有不同分词器的不同预训练模型设计的。我为单个样本选择前 3 个不同的预测答案,保留跨度分数,然后将来自不同模型的所有跨度分数相加,最后获得排名第一的答案作为最终结果。
这两种方法在私有/公共排行榜上的得分相似。
此外,我还尝试了一些其他方法,但没有获得更好的结果。因为我没有自己的训练 GPU,也没有做足够的实验,我的队友做了😨。所以我将其列出供大家参考,希望有所帮助:
预训练模型:
不同的模型结构:
集成方法:
离线翻译模型: