44th place solution

519. Feedback Prize - English Language Learning | feedback-prize-english-language-learning

开始: 2022-08-30 结束: 2022-11-29 智能评测数据算法赛

第44名方案

第44名方案

作者： Кеша Хумонен, Андрей Устинов

概述

我们的解决方案是岭回归和支持向量回归的集成模型。该模型基于8个微调后的DeBERTa模型和2个经典机器学习算法的预测结果进行训练，采用了10折交叉验证，并使用 Optuna 进行了优化（见图1）。

Figure 1: Our solution scheme

分数如下表所示：

样本	分数
交叉验证	0.44355
公开测试集	0.43845
私有测试集	0.435586

我们的代码

点击此处查看代码

有效的方法：

非常仔细的10折交叉验证，并为每个目标字段设置独立的系数。
DeBERTa模型的混合使用。
加入一些经典机器学习方法（即使使用了基于DeBERTa的特征）。
自动权重调整。

无效的方法：

手工设计和半自动特征（尽管其中一些还不错）。
句子嵌入（特别是对于 vocabulary 评分）。

重要引用：

致谢：

我的队友 Andrey Ustinov。
所有那些发布高分Notebook的伟大且受人尊敬的人（即使这导致了排行榜的“大洗牌”）。

团队成员：

同比赛其他方案

1st Place Solution

2nd solution (back-translation & rank-loss)

3rd Place Solution - Congratulations New Competition Grandmaster Amed!

4th place solutioin

5th place solution