返回列表

44th place solution

519. Feedback Prize - English Language Learning | feedback-prize-english-language-learning

开始: 2022-08-30 结束: 2022-11-29 智能评测 数据算法赛
第44名方案

第44名方案

作者: Кеша Хумонен, Андрей Устинов

概述

我们的解决方案是岭回归和支持向量回归的集成模型。该模型基于8个微调后的DeBERTa模型和2个经典机器学习算法的预测结果进行训练,采用了10折交叉验证,并使用 Optuna 进行了优化(见图1)。

Figure 1: Our solution scheme

分数如下表所示:

样本 分数
交叉验证 0.44355
公开测试集 0.43845
私有测试集 0.435586

我们的代码

点击此处查看代码

有效的方法:

  • 非常仔细的10折交叉验证,并为每个目标字段设置独立的系数。
  • DeBERTa模型的混合使用。
  • 加入一些经典机器学习方法(即使使用了基于DeBERTa的特征)。
  • 自动权重调整。

无效的方法:

  • 手工设计和半自动特征(尽管其中一些还不错)。
  • 句子嵌入(特别是对于 vocabulary 评分)。

重要引用:

致谢:

  • 我的队友 Andrey Ustinov。
  • 所有那些发布高分Notebook的伟大且受人尊敬的人(即使这导致了排行榜的“大洗牌”)。

团队成员:

同比赛其他方案