26 place solution

第26名方案

作者：Takamichi Toda | 比赛：Google Quest Challenge

恭喜所有的获奖者！也感谢主办方！
这次比赛对我来说非常非常困难，但幸运的是我获得了第26名。
在此分享我学到的知识。

我使用了 Huggingface Transformer 并自定义了模型的头部。

如你所见，我模仿了 Jigsaw 比赛第一名的方案。

BERT-base-cased、BERT-base-uncased 和 XLNet-base-case 使用该头部结构的权重比例为 2:4:4。

我添加了类别 token，如下所示：

[CLS] [CATEGORY_TOKEN] question_title [SEP] question_body [SEP] ansewr [SEP]

这使我的 CV（交叉验证分数）提高了 0.05。

我阅读了这篇讨论。
我计算了公分母并对预测值进行了分箱。
使用类似 OptimizeRounder 的特征进行了优化分箱。

谢谢！！

第26名方案