5th Place Solution

第五名解决方案

作者： heng (Grandmaster)
队友： hookman, sayoulala
发布时间： 2024-07-04
竞赛排名： 第 5 名

非常感谢 Kaggle 及主办方组织这场精彩的比赛。

虽然结果有点意外，但我们最终在这次比赛中获得了相对理想的成绩：LB 第 3 名 / PB 第 5 名。

在此，我要感谢我的队友 @hookman 和 @sayoulala 的付出，以及社区中许多高质量的 Notebook 和大家在讨论中提供的线索，如下所示：

社区讨论 499959 https://www.kaggle.com/competitions/learning-agency-lab-automated-essay-scoring-2/discussion/499959 社区讨论 501202 https://www.kaggle.com/competitions/learning-agency-lab-automated-essay-scoring-2/discussion/501202 参考 Notebook: aes2-tuning-ensemble https://www.kaggle.com/code/batprem/aes2-tuning-ensemble

昨天我研究了社区中分享的解决方案，发现我们的方案确实有一些共同点。我们很幸运，分数没有下滑太多。

我们的做法

使用 StratifiedKFold 将仅限 Kaggle 的数据（5 个提示）划分为 kaggle-only-train 和 kaggle-only-valid。
在 persuade2.0 数据（7 个提示）+ kaggle-only-train 上微调（非 MLM）deberta 模型（small/base/large）。
加载上一步的权重，在 kaggle-only-train 上训练，并在 kaggle-only-valid 上验证。
与 LGB 混合（直接 fork 了最佳 LB Notebook），deberta 模型权重 0.9，LGB 权重 0.1，得分 PB 0.837，LB 0.827。