返回列表

My solution was public from the beginning

356. NFL Big Data Bowl | nfl-big-data-bowl-2020

开始: 2019-10-09 结束: 2020-01-06 赛事预测 数据算法赛
我的方案从一开始就是公开的

我的方案从一开始就是公开的

作者:Ahmet Erdem (Grandmaster) | 比赛排名:第 8 名

抱歉用了这个标题党,但这确实有 90% 是真的。我的方案基本上是这两个内核的结合:

第一个内核来自化学竞赛。我在本次比赛中使用了几乎相同的模型。在球员与跑卫交互特征上使用 Conv1D 和全局池化,而不是原子交互特征。唯一的区别是这次我有两个子模型:跑卫与队友子模型,以及跑卫与对手子模型。

第二个是我开源实现的“留一特征法”。我使用 LOFO 来了解原始特征和生成特征的整体重要性。我还针对不同的赛季分别运行了 LOFO。这让我能够非常快速地判断哪些特征的重要性随时间推移保持稳定。我首先在 LightGBM 上针对目标 MAE 运行 LOFO,然后从我的神经网络(NN)中移除或替换这些特征。通过这种方式,我既受益于 LightGBM 的速度,又通过两个模型进行了双重验证,尽管我最终提交时只使用了神经网络模型。

由于我是该代码库(https://github.com/aerdem4/lofo-importance)的作者,我正在寻找在本次比赛中尝试过它的人的反馈。请告诉我您使用 lofo-importance 的任何正面或负面经验。欢迎任何建议。

同比赛其他方案