返回列表

18th place solution : 2d-cnn / 1d-cnn / XGB / 1d-cnn

537. 1st and Future - Player Contact Detection | nfl-player-contact-detection

开始: 2022-12-05 结束: 2023-03-01 运动员表现 数据算法赛
第18名方案:2d-cnn / 1d-cnn / XGB / 1d-cnn

第18名方案:2d-cnn / 1d-cnn / XGB / 1d-cnn

作者: Thomas, Chen Lin, zh
比赛排名: 第18名

首先,我要感谢本次比赛的主办方以及我的队友:@chenlin1999@hanzhou0315

摘要

我们的解决方案由4个阶段组成:

  1. 2d-cnn:该模型预测每名球员是否发生接触以及该球员是否在地面上。
  2. 1d-cnn:此阶段旨在利用时序性对第1阶段的预测进行平滑处理。
  3. XGB:在此阶段,我们将球员之间的接触进行关联。
  4. 1d-cnn:此阶段旨在利用时序性对第3阶段的预测进行平滑处理。

验证方法

我们选择了按 game_play 分层的5折交叉验证:该策略似乎与LB(排行榜)最相关且最直观。我们的最终解决方案CV得分为:0.77174,LB得分为:0.77004,公共LB为:0.76219。

阶段1:2d-cnn

在这个阶段,很容易对数据过拟合,因此我们只训练了2个epoch。我们在最终提交中使用了timm模型:efficientnetv2_rw_s 和 convnext_base_in22k。

输入由Endzone和Sideline的2张RGB图像组成,然后我们将特征连接起来进行预测。为了给该模型添加监督信息,我们使用了从表格数据中创建的特征。这与这里的方法有点类似。

模型架构图

阶段2:1d-cnn

这是一个简单的CNN,包含5层,卷积核大小为3。为了确保时间一致性,我们按 ["game_play","nfl_player_id","step"] 进行了排序。

阶段3:XGB

这是类似 @columbia2131 的XGB模型,我们添加了前一阶段的特征。

阶段4:1d-cnn

这是一个简单的CNN,包含5层,卷积核大小为3。为了确保时间一致性,我们按 ["game_play","nfl_player_id_1","nfl_player_id_2","step"] 进行了排序。

最终结果

阶段1 阶段2 阶段3 阶段4 CV 公共LB 私有LB
0.65 0.645 0.645
0.718 0.715 0.716
0.731 0.729 0.725
0.771 0.762