376. COVID19 Global Forecasting (Week 5) | covid19-global-forecasting-week-5
我们利用时间序列和地理特征训练了具有分位数回归功能的 LGBM 模型,用于短期预测。长期预测则使用了激进的 1 周平均值平滑处理。由于小规模地点数量众多,必须对前 30 个国家/州进行手动调整。
将特征重新缩放并四舍五入到小数点后 1-2 位,以减少过拟合。
我首先搜索了公开的美国县级人口统计数据(年龄、收入、人口密度、COVID19 封锁信息等)。虽然找到了一些有用的来源,但我没有时间进行清洗和合并。我使用的唯一外部数据是每个地点的地理编码经纬度坐标。
针对每个目标/分位数/预测滞后分别训练了单独的模型,使用了基于地点的 5 折交叉验证,并基于 Pinball Loss 进行早停。模型仅被训练用于预测接下来的 1-14 天。
Y[t] * 0.66 + Y[t-1] * 0.33)