22nd place solution with codes

第22名方案分享（含代码）

作者：jionie | 比赛排名：第22名

恭喜所有获胜者，也感谢我的队友们！又拿银牌了😂。

我们的方案总结如下：

后处理：正如 Firas 的 kernel 所示，我们应用了这种后处理方法，它帮助我们逆向还原了一些样本。这个后处理将我们的单模型分数从 0.716 提升到了 0.724。感谢 Firas 发现了这个后处理的思路！
模型集成：我们训练了 3 组使用不同随机种子的 roberta-base 模型，一个 albert-large 模型和一个 xlnet-base 模型。我们计算了 token 级别的偏移量和 word 级别的偏移量。获得 logits 后，我们将 token 级别的 logits 转换为 word 级别的 logits（使用 word 内部 token 的最大概率作为 word 的概率），然后我们对所有模型的 word 级别 logits 取平均以获得 word 级别的边界框，接着我们将 roberta-base 视为基础模型，并从起始和结束的 words 中进一步选择起始和结束的 tokens。
伪标签：通过使用原始数据集进行伪标签训练，我们对 roberta-base 和 albert-large 进行了 2 轮伪标签训练。roberta-base 的 CV 分数从 0.722 提升至 0.724，albert-large 的 CV 分数从 0.720 提升至 0.722。至于 xlnet-base，因为 JianJian 的服务器挂了😂，我们没时间训练它。