返回列表

1st solution

485. NBME - Score Clinical Patient Notes | nbme-score-clinical-patient-notes

开始: 2022-02-01 结束: 2022-05-03 临床决策支持 数据算法赛
第1名解决方案

第1名解决方案

作者: currypurin, Ryuichi
比赛: NBME - Score Clinical Patient Notes

首先,感谢竞赛主办方举办这次比赛,也感谢我的队友 (@ryuichigt)。感谢优秀的 Notebooks 和讨论,我学到了很多,并以此完成了我的最终解决方案。

方案总结

为了最大化 CV 分数,我们融合了以下六个模型。每个模型都使用了 MLM(掩码语言模型)、伪标签、AWP(对抗权重扰动)、数据增强,并训练了 10 折交叉验证中的 5 折以及全部数据,从结果生成的 50% 训练数据 OOF 中构建了我们的 CV。由于时间限制,最终提交使用了这六个模型中的部分权重(fold 0, 1, 2, 3, 4, all)。Notebook 链接

实验编号 Hugging Face 模型 CV PubLB
(5/10folds+all)
PriLB
(5/10folds+all)
最终提交
使用权重
107 deberta-v3-large 0.8925 0.8931 0.8929 4/10folds+all
092 deberta-v2-xlarge 0.8914 0.8930 0.8911 3/10folds+all
106 deberta-large 0.8913 0.8922 0.8925 2/10folds+all
102 deberta-v2-xlarge 0.8925 0.8928 0.8940 3/10folds+all
101 deberta-large 0.8907 0.8918 0.8934 4/10folds
104 deberta-v2-large 0.8921 0.8925 0.8920 2/10folds+all
NBME Model PipeLine 003

有效的技巧

同比赛其他方案