489. BirdCLEF 2022 | birdclef-2022
感谢康奈尔鸟类学实验室和 Kaggle 主办这场有趣的比赛。我还要感谢我的队友 @truonghoang 和 @gwanghan,感谢他们在比赛期间的出色团队合作。
我们的解决方案是 1 个 SED(声音事件检测)模型和 1 个梅尔频谱图分类模型的集成,它们在私有排行榜上的得分分别为 0.76 和 0.77。集成后我们的得分为 0.79。
NoiseInjection(max_noise_level=0.04, sr=SAMPLE_RATE),
PitchShift(max_range=3, sr=SAMPLE_RATE),
RandomVolume(limit=4),
if oof_prob[primary_bird] > 0.5:
target[primary_bird] = 1.0
elif prob[primary_bird] > 0.1:
target[primary_bird] = 0.9975
elif prob[primary_bird] > 0.01:
target[primary_bird] = 0.5
else:
target[primary_bird] = 0.2
if oof_prob[secondary_bird] > 0.5:
target[secondary_bird] = 0.9975
elif oof_prob[secondary_bird] > 0.1:
target[secondary_bird] = 0.8
else:
target[secondary_bird] = 0.0025
我们发现公共排行榜的分数对阈值非常敏感,每个模型的最佳阈值差异很大,因此在集成中进行加权平均并没有带来太大的提升。我们最终将它们的概率相乘,并将测试集中置信度最高的前 33% 设为 True,其余设为 False。
P/S:祝贺我勤奋的队友 @truonghoang 成为 Competition Master。