524. G2Net Detecting Continuous Gravitational Waves | g2net-detecting-continuous-gravitational-waves
大家好!
首先,感谢 EGO 举办了这场激动人心的比赛!同时,祝贺所有的获奖者!
在我的实验中,预处理(normalize 函数)的效果优于功率谱图。它在 CV/LB 上将分数提高了约 +0.02。对信号进行归一化后,在时间轴上取平均值。最终的形状为 (360, 360)。
生成样本是提高分数最关键的部分。仅凭单一模型,我就能在 LB 上获得 0.761 的分数。
简而言之,信号深度(sqrtSX / h0)影响巨大。我生成了 10 万个样本(5 万正样本,5 万负样本),并在 10 到 100 之间均匀采样信号深度。cosi 参数在 (-1, 1) 之间均匀采样。
| 信号深度 | LB 分数 |
|---|---|
| 10 ~ 50 | 0.73x ~ 0.74x |
| 10 ~ 80 | 0.75x |
| 10 ~ 100 | 0.761 |
此外,我在数据增强上花了很多时间。以下是列表:
or mixup首先,我尝试搜索各种主干网络(effnet, nfnet, resnest, convnext, vit-based),发现 convnext 在 CV 和 LB 分数上表现最好。在选择了基准主干网络后,我尝试自定义主干层(例如大卷积核 & 池化尺寸,具有不同卷积核尺寸的多卷积主干),以便有效地检测持续时间长的信号,但它们并没有对性能产生积极影响。
集成中使用的大多数模型是 convnext-xlarge,但每个模型都使用了不同的变量(例如数据增强、模拟样本等)进行训练,还有一个模型使用了 eca-nfnet-l2 和 efficientnetv2-xl。每个模型都在不同的数据集上训练,LB 分数看起来很可靠,所以我根据 LB 分数调整了集成权重。
我选择了两个最好的 LB 提交(LB 0.768 PB 0.771)。而我未选择的最好 PB 是 0.778(LB 0.766)(混合了我所有的实验)。
convnext 系列主干网络pair 意味着配对(相应的噪声和信号)必须在同一折中。cosi == 0
cosi 也是决定信噪比 (SNR) 的关键参数。我生成了更多 cosi 为 0 的样本,但分数反而下降了。