455. Tabular Playground Series - Sep 2021 | tabular-playground-series-sep-2021
核心思路是使用具有相同参数但 random_state 不同的同一模型作为 VotingClassifier 的估计器。这个想法在这个 notebook 中有详细描述。这是提高单模型分数的关键。
首先有两个使用传统方法的 notebook:LGBM 模型 得分为 0.81802,CatBoost 模型得分为 0.81751。
使用 单模型投票 后,分数提升至 0.81839(LGBM 单模型投票)和 0.81816(CatBoost 单模型投票)。
结果按权重 [0.7, 0.3] 进行平均,得分为 0.81846。
随后将其与 mlanhenke 分享的 [TPS-09] Simple Blend & Stacking (XGB, LGBM, CATB) 提交结果进行融合,分数变为 0.81854。
接着我修改了 Ivan Kontic 的 [004-2o] lightGBM colsample TPS-sep-2021 notebook(感谢分享!),原分数为 0.81835,通过 单模型投票 将分数提升至 0.81845。
按权重 [0.7, 0.3] 进行融合后,最终得分为 0.81868(Private LB 0.81752)。名次下降了3位,个人认为是因为有 +62, +37 和 +15 分的队伍存在。
对我来说,主要成果是验证了单模型投票的想法在分类任务中确实有效。
祝贺获胜者,并感谢 Edrick Kesuma 和其他许多人提供的有趣讨论和有用的想法。
非常感谢所有为 One model Voting 点赞的人,这是我获得的第一个银牌 😊