返回列表

11th Place Solution - Simplicity (Luck) Is All You Need

559. GoDaddy - Microbusiness Density Forecasting | godaddy-microbusiness-density-forecasting

开始: 2022-12-16 结束: 2023-06-16 销量与需求预测 数据算法赛

第11名解决方案 - 简洁(运气)足矣

作者:Yu Wu (nightsh4de)
发布时间:2023-06-17 08:29:14 UTC
最后更新:2023-06-20 21:45:49 UTC
比赛排名:第11名

首先,感谢Kaggle社区提供的丰富且有益的讨论和笔记。同时,感谢Kaggle和GoDaddy举办本次比赛。

我的代码已发布于GitHub,基于VADIM KAMAEV的公开笔记。

在本次比赛中,我的思路是在不使模型过于复杂的前提下,持续提升我的CV(交叉验证)和PB(公共排行榜)分数。

验证(CV)

我使用最近5个月的数据进行验证。在最终提交中,我采用了验证分数最高的模型之一。

模型

与公开笔记相同,我使用Catboost回归器来堆叠LightGBM、XGBoost和CatBoost模型。并对大量超参数进行了调整。

特征工程

我没有做太多新颖的特征工程,仅使用了公开笔记中的技术。

但我对超参数进行了大量调整。

融合提交

我使用了不同的模型超参数和不同的特征(即不同的diff、max、mean等设置)来生成大量提交。我从中选出最好的4个(或3个)提交,使用加权平均创建一个融合提交。根据公共排行榜选择的最佳融合结果作为我最终提交之一。最终,在私有排行榜上,融合提交的分数略优于最佳CV模型。

同比赛其他方案