返回列表

4th Place Neural Network Solution

376. COVID19 Global Forecasting (Week 5) | covid19-global-forecasting-week-5

开始: 2020-05-04 结束: 2020-05-11 健康管理与公共卫生 数据算法赛
第四名神经网络解决方案

第四名神经网络解决方案

作者:Ahmet Erdem (Grandmaster)
比赛排名:第 4 名

我认为我们建立的模型对于本次疫情来说太迟了,无法发挥作用。它们有望(但也可能并不希望)被用于下一次疫情。因此,我希望构建一个可复用的机器学习解决方案。到目前为止,它的表现还不错,但现在下定论还为时过早。无论如何,我想趁还没忘记细节之前把它解释清楚。我有两个 Notebook,一个用于训练,一个用于推理:

这是一个基于过去两周数据训练的 CNN 模型。在之前的 COVID-19 竞赛中,我的神经网络模型随时间推移出现了发散。我从错误中吸取了教训,这次不想再使用递归预测。我为未来的每一天都训练了不同的模型。以下是模型架构:

模型架构图

一些有效的技巧:

  • ReLU 上的累积和:作为最后一层,这保证了预测值非零,且分位数始终保持顺序。
  • 直接使用 Pinball Loss 训练:在初始轮次中,我训练了 0.15、0.50 和 0.85 分位数。然后在后期的轮次中使用实际的分位数(0.05、0.50、0.95)进行训练。如果不这样做,模型会过早变得保守,并陷入局部最小值。
  • Bagging:每天使用 5 个神经网络模型进行 Bagging 以减少随机性。
  • 平滑预测:对每一天 n 的预测进行平滑处理:y(n) = 0.2*y(n-1) + 0.6*y(n) + 0.2*y(n+1)
  • 整数化:将预测值四舍五入为整数。这可能对零病例的预测有一点帮助。
同比赛其他方案