5th place solution

第5名解决方案

作者： Tamo (队友: Takashi Someya, nomorevotch, fuumin621)
比赛： NFL Player Contact Detection

感谢主办方和 Kaggle 举办了如此有趣的比赛。我也要感谢所有的参赛者和队友（@takashisomeya @nomorevotch @fuumin621）带来的美好时光。

我们的解决方案由两个阶段组成：NN（神经网络）和 GBDT（梯度提升决策树）。我们将详细介绍具体细节。

■ 第一阶段：NN 部分概述

使用以下追踪数据：

如果球员是 G（地面），则用 -1 填充 distance 和 XXXX_2 的值。
same_team 和 different_team 是标志，用于判断球员是否属于相同/不同的队伍。
G_flag 表示球员-地面对的标志。

在通道方向上拼接以下三项：
- 头盔周围裁剪的 +-1 帧视频画面。
- 头盔 bbox 掩码
图像大小：
- 球员-球员对：裁剪尺寸 = max(平均 bbox 宽度, 平均 bbox 高度) * 3
- 球员-地面对：裁剪尺寸 = max(bbox 宽度, bbox 高度) * 3
- 将裁剪后的图像调整为 128x128。

我们使用了至少包含一帧距离 < 2 的连续帧。
（此时数据可能包含距离 > 2 的帧。）

在训练和推理过程中，以不同的步长截取连续帧 (N)。
训练：无重复帧 (stride == N)
推理：有重复帧 (stride < N，重复帧的结果取平均值。)

使用以下数据增强方法：

整体 NN 模型架构如下：