返回列表

16th place - Hybrid model

474. Tabular Playground Series - Jan 2022 | tabular-playground-series-jan-2022

开始: 2022-01-01 结束: 2022-01-31 销量与需求预测 数据算法赛

第16名 - 混合模型

作者:Samuel Cortinhas
发布时间:2022-02-01

今天早上醒来,我发现自己在排行榜上跃升了277名,最终进入了前2%!考虑到在参加这次 TPS(Tabular Playground Series)之前,我的时间序列知识几乎为零,我确实感到有点震惊。

你可以在这里找到我的完整 Notebook,所以我不会重复我所做的所有事情,因为大多数想法都借鉴自其他人。

不过,我有几个自己尝试的想法,没看到其他人尝试过:

  • 一阶傅里叶特征 - 引用 @teckmengwong 个人资料中的一句话:“如果它走起路来像正弦波,叫起来也像正弦波,那你就可以把它当作正弦波来处理。”
  • 混合模型 + 网格搜索 - 由于数据集具有强烈的季节性模式,混合模型非常适合。我添加了一个网格搜索函数来微调模型的参数,然后将这些模型集成在一起。
  • 人均 GDP - 当这个特征提高了我的公共 LB 分数时,我很兴奋,但当我深入研究时,发现普通 GDP 与目标特征的相关性(略)高一些。我最终没有使用人均 GDP,但尝试的过程很有趣。

最后,我想感谢 Kaggle 社区;感谢所有分享想法、Notebook 和数据集的人。我很享受从大家那里学到这么多东西。

特别感谢:
@carlmcbrideellis, @ambrosm, @lucamassaron, @adamwurdits, @vpallares, @mfedeli, @fergusfindley, @teckmengwong, @vad13irt, @remekkinas

期待下一场 TPS 比赛!

同比赛其他方案