返回列表

14th place solution / Single model with different random_states Voting + blending

455. Tabular Playground Series - Sep 2021 | tabular-playground-series-sep-2021

开始: 2021-09-01 结束: 2021-09-30 保险科技 数据算法赛
第14名方案 / 单模型不同随机状态 Voting + Blending

第14名方案 / 单模型不同随机状态 Voting + Blending

作者:Martynov Andrey
比赛排名:第14名

核心思路是使用具有相同参数但 random_state 不同的同一模型作为 VotingClassifier 的估计器。这个想法在这个 notebook 中有详细描述。这是提高单模型分数的关键。

首先有两个使用传统方法的 notebook:LGBM 模型 得分为 0.81802,CatBoost 模型得分为 0.81751

使用 单模型投票 后,分数提升至 0.81839LGBM 单模型投票)和 0.81816CatBoost 单模型投票)。

结果按权重 [0.7, 0.3] 进行平均,得分为 0.81846

随后将其与 mlanhenke 分享的 [TPS-09] Simple Blend & Stacking (XGB, LGBM, CATB) 提交结果进行融合,分数变为 0.81854

接着我修改了 Ivan Kontic[004-2o] lightGBM colsample TPS-sep-2021 notebook(感谢分享!),原分数为 0.81835,通过 单模型投票 将分数提升至 0.81845

按权重 [0.7, 0.3] 进行融合后,最终得分为 0.81868(Private LB 0.81752)。名次下降了3位,个人认为是因为有 +62, +37 和 +15 分的队伍存在。

对我来说,主要成果是验证了单模型投票的想法在分类任务中确实有效。

祝贺获胜者,并感谢 Edrick Kesuma 和其他许多人提供的有趣讨论和有用的想法。

非常感谢所有为 One model Voting 点赞的人,这是我获得的第一个银牌 😊

  • 部分 notebook 是在本地 PC 上执行的,因此上述分数可能与分享的 notebook 略有不同。
同比赛其他方案