返回列表

18th place solution

519. Feedback Prize - English Language Learning | feedback-prize-english-language-learning

开始: 2022-08-30 结束: 2022-11-29 智能评测 数据算法赛
第18名方案

第18名方案

首先,我要感谢 Kaggle 和主办方举办了如此有趣的比赛。同时,我要祝贺所有的获奖者。虽然我没能获得单人金牌,但我从这次比赛中学到了很多。

1. 概述(与其他方案大致相同)

我的方案是结合了伪标签的21个模型的加权平均集成,并使用了 Nelder-Mead 优化方法。这与其他方案大同小异。我的独创性在于将 \n 替换为 [Chapter]。这使 CV 提高了 0.0015。在此讨论中,我将详细展示我的 CV 和 Private LB(私有排行榜)之间的关系。

1.1 配置

配置图

1.2 CV 与 LB 的关系

CV与LB关系图

1.3 各模型的 CV 和得分

※ pseudo1 和 2 将在下一章解释
※ 顺序按 Private LB 得分从高到低排列

实验编号 模型 伪标签1 伪标签2 伪标签数据集 K折 CV Private LB Public LB
214deberta v3 large-仅 FB140.44670.43780.4404
123deberta v3 large-FB1 + Commonlit40.44670.43790.4402
200deberta v3 large-仅 FB140.44710.43810.4396
250deberta v3 large---150.44700.43820.4410
161deberta v3 large-FB1 + Commonlit40.44720.43830.4401
102deberta base-FB1 + Commonlit40.44830.43870.4386
201deberta base-仅 FB140.45030.43900.4399
163deberta base-FB1 + Commonlit40.45050.4390