A simple approach based on baseline notebooks (6th place solution)

基于基线Notebook的简单方法（第6名方案）

作者： kmizunoster | 排名： 第6名 | 点赞数： 29

感谢主办方举办了一场非常有趣的比赛，感谢我的队友（@yasushiyui 和 @kotaiizuka）的付出，以及所有一起努力的Kagglers。特别感谢 @its7171，他是优秀基线Notebook的作者。

虽然已经有很多优秀的顶级解决方案分享了，但我们想分享我们的方案，作为一个例子，展示如何仅通过对基线进行少量调整就能提高分数。
如果您注意到任何问题或想了解更多细节，请随时发表评论。

摘要

基本上，我们使用了基线Notebook的处理流程。
与公开排行榜第1名的解决方案类似，为了利用时间信息，我们将三个相邻帧转换为灰度图，并在通道方向上进行组合。我们认为这个想法对于我们的解决方案进入公开金牌区至关重要。
我们应用了比赛中常用的技术（高分辨率图像、修改损失函数、自定义数据增强、集成、TTA等）。

下图显示了该技术的流程。为了利用时间信息并使用与RGB图像输入相同的处理流程，我们将三个相邻图像转换为灰度图，并在通道方向上进行组合。大多数实验使用 time_stride=1。在最后一次提交中，我们分别集成了使用 time_stride=1、2 和 3 训练的模型，以利用更长的时间信息。

下表显示了基线Notebook和我们主要实验的设置及得分。
我们公开LB最佳（0.784）的模型未被选为最终提交，因为它几乎超过了时间限制。

ID	描述	模型	验证集 AP	LB
1	tito 的基线同比赛其他方案 Team Hydrogen: 1st place solution 2nd Place Solution public 3rd place solution Public 4th place solution Our (frustrated) approach