519. Feedback Prize - English Language Learning | feedback-prize-english-language-learning
首先,我要感谢比赛主办方和Kaggle,并祝贺所有获奖者。
我还要感谢所有在各种讨论中提供有用信息的Kagglers。
我一直在努力争取Solo Gold(单人金牌),很高兴终于赢得了它。
我的解决方案是各种DeBERTa模型和RAPIDS SVR的集成。
我参考了 @cdeotte 关于RAPIDS SVR的优秀笔记,非常感谢。
https://www.kaggle.com/code/cdeotte/rapids-svr-cv-0-450-lb-0-44x
准备了两种类型的文本数据,一种是将 \n 转换为 [BR],另一种则没有。
在转换为 [BR] 的文本数据上训练的模型在Public和Private榜单上的得分都更高。
我使用了按目标分层的 MultiLabelStratifiedKFold 5折交叉验证。
骨干网络:
池化层:
从以下模型中提取特征并训练了SVR。
使用 Nelder-Mead 方法按目标调整权重。
带有 GPR(高斯过程回归)的集成拥有最高的Private得分,但因为Public得分不高而未被选中。(public:0.437852 / private:0.433646)