537. 1st and Future - Player Contact Detection | nfl-player-contact-detection
首先,我要感谢本次比赛的主办方以及我的队友:@chenlin1999 和 @hanzhou0315
我们的解决方案由4个阶段组成:
我们选择了按 game_play 分层的5折交叉验证:该策略似乎与LB(排行榜)最相关且最直观。我们的最终解决方案CV得分为:0.77174,LB得分为:0.77004,公共LB为:0.76219。
在这个阶段,很容易对数据过拟合,因此我们只训练了2个epoch。我们在最终提交中使用了timm模型:efficientnetv2_rw_s 和 convnext_base_in22k。
输入由Endzone和Sideline的2张RGB图像组成,然后我们将特征连接起来进行预测。为了给该模型添加监督信息,我们使用了从表格数据中创建的特征。这与这里的方法有点类似。
这是一个简单的CNN,包含5层,卷积核大小为3。为了确保时间一致性,我们按 ["game_play","nfl_player_id","step"] 进行了排序。
这是类似 @columbia2131 的XGB模型,我们添加了前一阶段的特征。
这是一个简单的CNN,包含5层,卷积核大小为3。为了确保时间一致性,我们按 ["game_play","nfl_player_id_1","nfl_player_id_2","step"] 进行了排序。
| 阶段1 | 阶段2 | 阶段3 | 阶段4 | CV | 公共LB | 私有LB |
|---|---|---|---|---|---|---|
| ✓ | 0.65 | 0.645 | 0.645 | |||
| ✓ | ✓ | 0.718 | 0.715 | 0.716 | ||
| ✓ | ✓ | ✓ | 0.731 | 0.729 | 0.725 | |
| ✓ | ✓ | ✓ | ✓ | 0.771 | 0.762 |