第 12 名解决方案 - BirdCLEF 2025

比赛： BirdCLEF 2025
排名： 第 12 名
作者： YuYagi
队友： zone0906
发布日期： 2025-06-08

第 12 名解决方案

我想向 BirdCLEF 2025 竞赛的组织者表示诚挚的感谢，同时也感谢所有慷慨分享过往比赛出色解决方案的 competitors。

我也深深感谢我的队友 @zone0906 为我们共同付出的所有努力。参加这次竞赛是一次不可思议的学习经历。

概述

我们的解决方案由三种不同的 pipeline 类型组成的集成，以及总共 12 个转换为 OpenVINO 的 SED 模型。

训练是在所有 train_audio（监督）数据和 train_soundscapes（伪标签）数据上进行的，具体 pipeline 如下所述。

受 BirdCLEF 2023 第 3 名解决方案的启发，我们训练了沿频率轴应用注意力的 SED 模型。
未进行本地验证；所有来自 BirdCLEF+ 2025 的可用数据均用于训练。
检查点平均 (Checkpoint Soups)
- 我们对第 30-50 个 epoch 的权重进行了平均用于提交，避免了早停中的人为偏差，并缓解了稀有类上的 macro-AUC 不稳定性。
EMA (衰减 = 0.999)
加权批采样器 (Weighted Batch Sampler)
- 样本加权方法与 BirdCLEF 2023 第一名解决方案相同。
数据增强
- 对于原始波形 (Raw Waveform)：
  - Gain, GainTransition, AddGaussianNoise, AddGaussianSNR, 时间移位 (Time Shifting)
  - 带有最大标签的 MixUp
    - 应用 MixUp 时，结果标签设置为两个原始标签的最大值
- 对于梅尔频谱图 (Mel Spectrogram)：
  - SpecAugment
  - MixUp
- 梅尔频谱图参数
  - sample_rate = 32,000
  - window_size = 2048
  - hop_length = 512
  - fmin = 20
  - fmax = 16,000
  - mel_bins = 512
损失函数：二元交叉熵 (BCE)
随机 5 秒裁剪，避开人声片段（由此代码检测到的片段）
将次要标签与主要标签同等对待。

对于第 2 次迭代，伪标签由以下集成（3 个 seeds）生成：

在第二阶段‑A 中训练的模型： mixnet_s, regnety_008, resnet34d, seresnext26t_32x4d, tinynet_a.in1k, convnextv2_nano.fcmae_ft_in22k_in1k_384
在第二阶段‑B 中训练的模型： resnet18.a1_in1k

然而，由于公共排行榜和私有排行榜的分数在第 2 次迭代中都下降了，我们没有继续下去。
尽管如此，为了增加集成的多样性，我们将这些模型包含在最终提交中。

受 BirdCLEF 2024 第 7 名解决方案的启发，我们仅针对训练集中样本数为 100 或更少的类训练模型。
训练所有参数没有带来改进；相反，我们冻结了在所有类上预训练的骨干网络，仅在这些少数类上训练 SED 头部——这被证明是成功的。
在提交时，我们将这个少数类头部附加到全类模型上，并仅将其输出用于稀有类。
尽管共享骨干网络，推理时间几乎没有增加，我们在公共和私有排行榜上都取得了更高的分数。

我们应用了跨相邻 chunk 的加权移动平均和文件级平均概率，方法与 (BirdCLEF 2024 第 6 名后处理) 相同。这使得公共和私有排行榜分数都提高了约 0.07–0.08。

最终提交是以下模型的集成。（公共排行榜：0.904, 私有排行榜：0.918）

模型集 1：第二阶段‑A (1 次迭代) + 少数类头部
- mixnet_s (3 个 seeds)
- tinynet_a.in1k (3 个 seeds)
- regnety_008 (3 个 seeds)
模型集 2：第二阶段‑A (2 次迭代) + 少数类头部
- mixnet_s (1 个 seed)
- tinynet_a.in1k (1 个 seed)
- regnety_008 (1 个 seed)
模型集 3：第二阶段‑B (2 次迭代)
- resnet18.a1_in1k (1 个 seed)

人声分离代码 https://www.kaggle.com/code/kdmitrie/bc25-separation-voice-from-data BirdCLEF 2023 第 3 名解决方案 https://www.kaggle.com/competitions/birdclef-2023/discussion/414102 BirdCLEF 2024 第 6 名后处理 https://www.kaggle.com/competitions/birdclef-2024/discussion/511527 BirdCLEF 2024 第 7 名解决方案 https://www.kaggle.com/competitions/birdclef-2024/discussion/511540