559. GoDaddy - Microbusiness Density Forecasting | godaddy-microbusiness-density-forecasting
感谢主办方举办这次非常有意思的比赛。这是一个预测真实未来的时间序列预测问题,解决过程非常有趣。我了解到美国是一个非常大且多元化的国家。
仅使用LightGBM,包含32个特征
倍数预测
将目标设定为预测月份与上个月数据的倍数关系。
目标平滑
由于数据中存在大量异常值,我通过对目标值及其前后各三个月的中位数进行平滑处理。
预测1-6个月后的模型
我分别创建了多个模型来预测1-6个月后的数据。
3个月的平均值
将预测月份及其前后各一个月的倍数取平均值,这样更准确。
将2020年的人口数据转换为2021年
因为是离散值,所以进行四舍五入到整数
我的笔记本已发布在下方(链接已移除)。
```