10th Place solution

450. SETI Breakthrough Listen - E.T. Signal Search | seti-breakthrough-listen

开始: 2021-05-10 结束: 2021-08-18 物理与天文数据算法赛

第10名解决方案

第10名解决方案

作者： YuryBolkonsky (Grandmaster) 及团队成员 @sggpls, @vzaguskin, @igorkrashenyi
发布日期： 2021-08-19

感谢团队 @sggpls、@vzaguskin、@igorkrashenyi 的辛勤工作。

预处理

在比赛开始时，我们尝试了不同的方法（使用所有通道、仅使用 0、2、4 通道，使用 vstack 和不使用）。最终，最好的选择是仅使用 0、2、4 通道并结合 vstack。

我们还对图像尺寸进行了大量实验，发现更高的分辨率可以提高结果（512x512 和 640x640）。

数据增强：

HorizontalFlip（水平翻转）, VerticalFlip（垂直翻转）
ShiftScaleRotate（平移缩放旋转）
RandomResizedCrop（随机裁剪缩放，比例 0.9）
IAAAdditiveGaussianNoise（高斯噪声，比例 0.15）

此外，在训练期间我们尝试了 mixup 和 fmix，两者的表现差不多。我们也尝试在 mixup 期间增加信号强度，虽然有效，但并非总是如此。

训练

有效的方法

大模型（efficientnet_b7, efficientnet_v2m, resnet200d, nfnet_f3 等）
Mixup
大分辨率 (640x640)
伪标签
推理时的 TTA4（测试时增强）
OOF Stacking（袋外堆叠）

无效的方法

将通道打乱作为增强手段
用于分割通道的连体网络
结合 on/off 信号的 LSTM 架构
VOLO 模型（难以训练，需要调整参数）

LB（排行榜）简化路线图

b0 单模 0.74+ LB
b0 OOF 0.77+ LB
v2m OOF 0.775+ LB
融合 0.785+ LB
伪标签 0.795 + LB

感谢所有参与者、组织者和主办方 的辛勤工作，以及在数据泄露后恢复比赛所付出的努力。

同比赛其他方案

1st Place Solution

2nd Place Solution

3rd place solution (Triplet Attention)

4th Place Solution. Steven Signal

5th place solution