569. Playground Series - Season 3, Episode 20 | playground-series-s3e20
感谢本次竞赛的组织方和参与者!
受ambrosm的帖子启发,季度同比增幅显示,COVID影响期间为2020年第二、三、四季度以及2021年第一季度。
我进一步细化到月度同比增幅,可以看出受影响最严重的月份是2020年3月至8月,排放量下降了两位数。这意味着2020年对应的第八至第三十二周属于异常值!从2020年9月起,下降幅度收窄至个位数,可以认为此时COVID的影响相较于之前几个月已不明显,可视为进入恢复期。

基于以上分析,将训练数据集划分为两部分:
受KACPER RABCZEWSKI的帖子启发,该帖子的思路是将2020年的排放数据调整至2019年与2021年的平均水平。
我按以下步骤进行了转换:

选择周编号小于等于48的样本用于训练,这与2022年测试集的周范围保持一致。
选择3个特征(纬度、经度、周编号),这些特征均无缺失值。


根据AMBROSM的讨论主题,我将结果乘以常数1.07。
根据CHUN FU的代码笔记本,修复了经度等于29.321处的错误。