返回列表

15th place solution

536. Playground Series - Season 3, Episode 7 | playground-series-s3e7

开始: 2023-02-14 结束: 2023-02-27 数据算法赛
第15名方案

第15名方案

作者: Martynov Andrey | 排名: 第15名

恭喜所有的获奖者!👍

我的解决方案:

  • 代码:
    PS-3-7 EDA CV weights optimizer

  • 交叉验证 (CV):
    30折分层交叉验证(30 folds stratified)。编写CV函数时包含了完整的分类报告和5个图表,用于比较不同的解决方案。

  • 集成学习:
    我认为这是该解决方案的主要特点。集成是在每一折中进行的,并优化了权重。我使用了一个称之为“Averager”的类——这是一个包含fit和predict方法的类,用于为给定的N个解决方案寻找最优权重。我以后打算继续使用它。具体代码请见notebook。

  • 模型:
    3个回归器 + 3个分类器 (XGB, CAT, LGB) + 随机森林

  • 特征工程:

在notebook中,我收集了CV和LB(Leaderboard)的进度数据,并制作了对比表格和图表,这对选择最终提交结果有很大帮助。

CV and LB Progress

非常感谢每一位阅读我这微不足道作品的人!

同比赛其他方案