362. Google QUEST Q&A Labeling | google-quest-challenge
恭喜所有的获奖者!也感谢主办方!
这次比赛对我来说非常非常困难,但幸运的是我获得了第26名。
在此分享我学到的知识。
我使用了 Huggingface Transformer 并自定义了模型的头部。
如你所见,我模仿了 Jigsaw 比赛 第一名的方案。
BERT-base-cased、BERT-base-uncased 和 XLNet-base-case 使用该头部结构的权重比例为 2:4:4。
我添加了类别 token,如下所示:
[CLS] [CATEGORY_TOKEN] question_title [SEP] question_body [SEP] ansewr [SEP]
这使我的 CV(交叉验证分数)提高了 0.05。
我阅读了这篇讨论。
我计算了公分母并对预测值进行了分箱。
使用类似 OptimizeRounder 的特征进行了优化分箱。
谢谢!!