559. GoDaddy - Microbusiness Density Forecasting | godaddy-microbusiness-density-forecasting
首先,感谢Kaggle社区提供的丰富且有益的讨论和笔记。同时,感谢Kaggle和GoDaddy举办本次比赛。
我的代码已发布于GitHub,基于VADIM KAMAEV的公开笔记。
在本次比赛中,我的思路是在不使模型过于复杂的前提下,持续提升我的CV(交叉验证)和PB(公共排行榜)分数。
我使用最近5个月的数据进行验证。在最终提交中,我采用了验证分数最高的模型之一。
与公开笔记相同,我使用Catboost回归器来堆叠LightGBM、XGBoost和CatBoost模型。并对大量超参数进行了调整。
我没有做太多新颖的特征工程,仅使用了公开笔记中的技术。
但我对超参数进行了大量调整。
我使用了不同的模型超参数和不同的特征(即不同的diff、max、mean等设置)来生成大量提交。我从中选出最好的4个(或3个)提交,使用加权平均创建一个融合提交。根据公共排行榜选择的最佳融合结果作为我最终提交之一。最终,在私有排行榜上,融合提交的分数略优于最佳CV模型。