12th Place Solution

第12名解决方案

作者：hiro (Master) | 排名：第12名 | 发布时间：2022-11-30

首先，我要感谢比赛主办方和Kaggle，并祝贺所有获奖者。
我还要感谢所有在各种讨论中提供有用信息的Kagglers。
我一直在努力争取Solo Gold（单人金牌），很高兴终于赢得了它。

概述

我的解决方案是各种DeBERTa模型和RAPIDS SVR的集成。
我参考了 @cdeotte 关于RAPIDS SVR的优秀笔记，非常感谢。
https://www.kaggle.com/code/cdeotte/rapids-svr-cv-0-450-lb-0-44x

准备了两种类型的文本数据，一种是将 \n 转换为 [BR]，另一种则没有。
在转换为 [BR] 的文本数据上训练的模型在Public和Private榜单上的得分都更高。

我使用了按目标分层的 MultiLabelStratifiedKFold 5折交叉验证。

骨干网络：

池化层：

从以下模型中提取特征并训练了SVR。

使用 Nelder-Mead 方法按目标调整权重。

带有 GPR（高斯过程回归）的集成拥有最高的Private得分，但因为Public得分不高而未被选中。(public:0.437852 / private:0.433646)