第4名解决方案：Steven Signal

作者: Gleb (Grandmaster), KurzyukovAndrey, Mikhail Kulyabin
比赛: SETI Breakthrough Listen - E.T. Signal Search
排名: 第4名

简介

首先，我们要感谢主办方和Kaggle团队举办这次比赛。我们相信，总有一天AI将为探索宇宙开辟一条广阔的道路。

此外，我们要特别指出以下项目：

太长不看版 (TLDR)

结合了MSDA和Focal Loss的分类集成模型。使用了2种模型类型：nf-regnetb1 和 HRNet18。利用带有引导层（guide layer）的空间序列来保留ABACAD信息。

我们的大部分实验都是在原始分辨率上进行的（出于图像/秒速度的考虑）。在最后几周，我们将图像尺寸扩大到了当前大小。

数据增强（在批次上进行，手写代码结合部分kornia库）：

交叉验证划分 15k / 45k，CV分数与LB相关。

我们认为MSDA是该解决方案的关键部分之一。

MixUp：用于所有批次，alpha=2。但是，混合包含异常的任何标签都会导致异常标签。标签和置换后的标签是相同的。这样做是为了不让神经网络受到混合异常带来的损失惩罚。所以可以说这根本不是MixUp。
CutMix：用于所有批次，参数来自官方实现。但是，混合发生在两个独立的子批次中：第一个仅包含异常批次，第二个包含其余部分。这是由于无法区分帧内信号的位置。所以可以说这根本不是CutMix。

我们尝试了AugMix等其他技术，但随着图像尺寸的增大，很难扩大图像处理速度。因此，我们最终只使用了批次级别的增强。

使用的模型：timm nf-regnetb1（我们的轻量级模型），timm HRNet18（较大的模型）。这种选择是随机的，但我们觉得RegNet的理念是正确的，而且HRNet看起来是这次比赛的一个好选择。

nf-regnetb1的训练时间约为7小时，HRNet约为24小时（4xV100）。

TTA（测试时增强）：翻转，乘数，有时添加高斯噪声(mean=0, std=[0,.