536. Playground Series - Season 3, Episode 7 | playground-series-s3e7
恭喜所有的获奖者!👍
我的解决方案:
交叉验证 (CV):
30折分层交叉验证(30 folds stratified)。编写CV函数时包含了完整的分类报告和5个图表,用于比较不同的解决方案。
集成学习:
我认为这是该解决方案的主要特点。集成是在每一折中进行的,并优化了权重。我使用了一个称之为“Averager”的类——这是一个包含fit和predict方法的类,用于为给定的N个解决方案寻找最优权重。我以后打算继续使用它。具体代码请见notebook。
模型:
3个回归器 + 3个分类器 (XGB, CAT, LGB) + 随机森林
特征工程:
无
在notebook中,我收集了CV和LB(Leaderboard)的进度数据,并制作了对比表格和图表,这对选择最终提交结果有很大帮助。
非常感谢每一位阅读我这微不足道作品的人!