返回列表

Giba RAPIDS SVR Solution

559. GoDaddy - Microbusiness Density Forecasting | godaddy-microbusiness-density-forecasting

开始: 2022-12-16 结束: 2023-06-16 销量与需求预测 数据算法赛
Giba的RAPIDS SVR解决方案

Giba的RAPIDS SVR解决方案

作者:Giba(Kaggle Grandmaster)
发布时间:2023年3月15日

我的第一个解决方案使用了全局线性乘数,我为每个月份和预测跨度分别选择了优化SMAPE的系数。

第二个解决方案基于SVR。你可以在此查看我的notebook:Super Fast RAPIDS SVR

由于`microbusiness_density`可以通过`active`和`county population`计算得出,我在模型中将`active`作为目标标签。在验证时,我使用过去12个月的数据来计算每个预测范围的SMAPE。为了简化开发,我只关注每个算法相对于基准(使用最后一个值)的提升。例如,用最后一个值预测3个月后的SMAPE为2.717,如果我的算法得分为2.617,则相对于基准提升了0.10。

SVR在每个预测周期的提升如下:

预测周期 SMAPE提升(12个月平均)
1 0.0171
2 0.0611
3 0.1555
4 0.2621
5 0.3524
6 0.4750

正如你所看到的,提升并不显著。但我在尝试的其他所有算法(包括GBDT)中,SVR的效果是最好的。

除此之外,我祝愿所有投入时间参加这次比赛的人好运!😉

注:

  • notebook V1使用sklearn SVR,耗时4607秒
  • notebook V2使用RAPIDS SVR,耗时136秒(快了34倍💪)
同比赛其他方案