559. GoDaddy - Microbusiness Density Forecasting | godaddy-microbusiness-density-forecasting
我的第一个解决方案使用了全局线性乘数,我为每个月份和预测跨度分别选择了优化SMAPE的系数。
第二个解决方案基于SVR。你可以在此查看我的notebook:Super Fast RAPIDS SVR
由于`microbusiness_density`可以通过`active`和`county population`计算得出,我在模型中将`active`作为目标标签。在验证时,我使用过去12个月的数据来计算每个预测范围的SMAPE。为了简化开发,我只关注每个算法相对于基准(使用最后一个值)的提升。例如,用最后一个值预测3个月后的SMAPE为2.717,如果我的算法得分为2.617,则相对于基准提升了0.10。
SVR在每个预测周期的提升如下:
| 预测周期 | SMAPE提升(12个月平均) |
|---|---|
| 1 | 0.0171 |
| 2 | 0.0611 |
| 3 | 0.1555 |
| 4 | 0.2621 |
| 5 | 0.3524 |
| 6 | 0.4750 |
正如你所看到的,提升并不显著。但我在尝试的其他所有算法(包括GBDT)中,SVR的效果是最好的。
注: