485. NBME - Score Clinical Patient Notes | nbme-score-clinical-patient-notes
首先,感谢竞赛主办方举办这次比赛,也感谢我的队友 (@ryuichigt)。感谢优秀的 Notebooks 和讨论,我学到了很多,并以此完成了我的最终解决方案。
为了最大化 CV 分数,我们融合了以下六个模型。每个模型都使用了 MLM(掩码语言模型)、伪标签、AWP(对抗权重扰动)、数据增强,并训练了 10 折交叉验证中的 5 折以及全部数据,从结果生成的 50% 训练数据 OOF 中构建了我们的 CV。由于时间限制,最终提交使用了这六个模型中的部分权重(fold 0, 1, 2, 3, 4, all)。Notebook 链接
| 实验编号 | Hugging Face 模型 | CV | PubLB (5/10folds+all) |
PriLB (5/10folds+all) |
最终提交 使用权重 |
|---|---|---|---|---|---|
| 107 | deberta-v3-large | 0.8925 | 0.8931 | 0.8929 | 4/10folds+all |
| 092 | deberta-v2-xlarge | 0.8914 | 0.8930 | 0.8911 | 3/10folds+all |
| 106 | deberta-large | 0.8913 | 0.8922 | 0.8925 | 2/10folds+all |
| 102 | deberta-v2-xlarge | 0.8925 | 0.8928 | 0.8940 | 3/10folds+all |
| 101 | deberta-large | 0.8907 | 0.8918 | 0.8934 | 4/10folds |
| 104 | deberta-v2-large | 0.8921 | 0.8925 | 0.8920 | 2/10folds+all |
AWP (Adversarial Weight Perturbation)