387. Jigsaw Multilingual Toxic Comment Classification | jigsaw-multilingual-toxic-comment-classification
恭喜获胜者!
感谢 Kaggle 团队、组织者,以及那些富有教育意义和趣味的 Notebooks(特别感谢 @riblidezso, @shonenkov, @jazivxt )。
这是我第一次参加 NLP 比赛,在这里我接触了 NLP 领域的 SOTA 模型(从 GloVe/FastText + LSTMs -> Transformer -> BERT -> XLM-ROBERTa,这是一段激动人心的旅程)。
拿到金牌对我来说太不真实了(我是前10名中掉落名次最多的人),但无论如何,我很高兴能拿到我的银牌(这是我目前唯一的奖牌 😃 )。
正如我现在所看到的,我在第二步的集成上过拟合了,没能找到好的交叉验证(CV)策略。