返回列表

10th Place solution

450. SETI Breakthrough Listen - E.T. Signal Search | seti-breakthrough-listen

开始: 2021-05-10 结束: 2021-08-18 物理与天文 数据算法赛
第10名解决方案

第10名解决方案

作者: YuryBolkonsky (Grandmaster) 及团队成员 @sggpls, @vzaguskin, @igorkrashenyi
发布日期: 2021-08-19

感谢团队 @sggpls@vzaguskin@igorkrashenyi 的辛勤工作。

预处理

在比赛开始时,我们尝试了不同的方法(使用所有通道、仅使用 0、2、4 通道,使用 vstack 和不使用)。最终,最好的选择是仅使用 0、2、4 通道并结合 vstack。

我们还对图像尺寸进行了大量实验,发现更高的分辨率可以提高结果(512x512 和 640x640)。

数据增强:

  • HorizontalFlip(水平翻转), VerticalFlip(垂直翻转)
  • ShiftScaleRotate(平移缩放旋转)
  • RandomResizedCrop(随机裁剪缩放,比例 0.9)
  • IAAAdditiveGaussianNoise(高斯噪声,比例 0.15)

此外,在训练期间我们尝试了 mixup 和 fmix,两者的表现差不多。我们也尝试在 mixup 期间增加信号强度,虽然有效,但并非总是如此。

训练

有效的方法
  1. 大模型(efficientnet_b7, efficientnet_v2m, resnet200d, nfnet_f3 等)
  2. Mixup
  3. 大分辨率 (640x640)
  4. 伪标签
  5. 推理时的 TTA4(测试时增强)
  6. OOF Stacking(袋外堆叠)
无效的方法
  1. 将通道打乱作为增强手段
  2. 用于分割通道的连体网络
  3. 结合 on/off 信号的 LSTM 架构
  4. VOLO 模型(难以训练,需要调整参数)

LB(排行榜)简化路线图

  • b0 单模 0.74+ LB
  • b0 OOF 0.77+ LB
  • v2m OOF 0.775+ LB
  • 融合 0.785+ LB
  • 伪标签 0.795 + LB

感谢所有参与者、组织者和主办方 的辛勤工作,以及在数据泄露后恢复比赛所付出的努力。

同比赛其他方案