537. 1st and Future - Player Contact Detection | nfl-player-contact-detection
非常感谢主办方和 Kaggle 团队组织这次比赛。此外,我们也要感谢所有参赛者。我们很享受这次比赛并撰写了我们的解决方案。
我要感谢团队成员 @bamps53、@nyanpn 和 @kmat2019,他们拥有分析任务的顶尖才能。我可以与他们讨论并享受比赛的乐趣。
简单的解决方案大纲见附图。
在第一阶段,我们通过多个 CNN 预测接触。在第二阶段,将 CNN 预测结果、追踪数据和头盔数据聚合,并创建特征输入到 GBDT(梯度提升决策树)中。最后,我们计算 5 个模型的平均值,并针对球员-球员和球员-地面接触分别优化阈值。
详情请参阅 https://www.kaggle.com/competitions/nfl-player-contact-detection/discussion/391719。我们可以获得 Endzone 和 Sideline 的预测值。
即将推出。
我们排除了距离 > 3 的球员-球员对,剩下的约 88 万行数据用于训练第二阶段模型。在推理时,我们将距离 > 3 的对赋值为 0,仅预测剩余数据。
因为我们的 CNN 预测非常强,前 30 个重要特征中超过 90% 是 CNN 相关特征。以下是我们创建的部分特征。
我们训练了四个不同第一阶段 CNN 组合的 GBDT 模型。我们还添加了一个 NN 模型(上图中的 "camaro2"),并计算这 5 个模型的简单平均值。预测