返回列表

🏅 Best single models 🏅

387. Jigsaw Multilingual Toxic Comment Classification | jigsaw-multilingual-toxic-comment-classification

开始: 2020-03-23 结束: 2020-06-22 内容安全 数据算法赛
🏅 最佳单模型 🏅

🏅 最佳单模型 🏅

作者:Henrique Mendonça (Grandmaster) | 发布时间:2020-06-23

我想知道周围最好的单模型有哪些。

从各种总结文章来看,大多数人的 XLM-R 模型得分似乎在 0.942* 左右,并且严重依赖模型集成、后处理和其他技巧(这并不是要贬低他们惊人的成就)。

无论如何,我想分享一个使用了伪标签和知识蒸馏技术的单模型(包含权重和代码),它的 LB 得分为 0.9475(在应用了来自 @christofhenkel 的硬编码乘数后达到了 0.9487,感谢!)。

不幸的是,我们没能像其他人那样成功进行集成,也没有事先探索语言修饰符。对于第一次接触 NLP 的我来说,这次比赛是一次非常棒的学习经历 :D

对我来说,主要的收获是过度依赖伪标签似乎让模型融合变得更加困难(知识蒸馏似乎加剧了这个问题)。我花了很长时间才意识到这一点,但这为接下来的比赛吸取了教训。等我有更多时间时,我会扩展我的报告,但请告诉我您的想法!(如果可以的话,请分享您的模型)

干杯!

同比赛其他方案