496. U.S. Patent Phrase to Phrase Matching | us-patent-phrase-to-phrase-matching
首先,我们的团队 (@K.T., @Taro_pan, @S.Kota, @Java_is_a_sparrow, @mipypf) 对主办方组织如此激动人心的比赛表示最深切的感谢。感谢所有相关的工作人员。
我想借此机会感谢我最好的队友 (@K.T., @Taro_pan, @S.Kota, @Java_is_a_sparrow) !
| 提交编号 | CV | 集成系数确定方法 | Public LB | Private LB |
|---|---|---|---|---|
| 148a | 0.8518 | ridge (14个模型) | 0.8502 | 0.8641 |
| 153 | 0.8520 | optuna 权重搜索 (15个模型) | 0.8506 | 0.8638 |
使用 anchor 和 score 进行 MultilabelStratifiedKFold 分折
https://www.kaggle.com/code/abhishek/creating-folds-properly-hopefully-p
https://www.kaggle.com/competitions/us-patent-phrase-to-phrase-matching/discussion/315220
https://www.kaggle.com/code/hannes82/pppm-deberta-v3-large-closing-the-cv-lb-gap/notebook
BCEWithLogitsLoss
我们尝试了几种不同的损失函数,但最终选择了 BCEWithLogitsLoss,因为它的 CV 预测分布最为合理。
在本次比赛中,经常会出现某些 Fold CV 分数极低的现象。
https://www.kaggle.com/competitions/us-patent-phrase-to-phrase-matching/discussion/319237
因此,当这种现象出现时,有必要调整学习率和调度器。