返回列表

3rd rank solution

414. INGV - Volcanic Eruption Prediction | predict-volcanic-eruptions-ingv-oe

开始: 2020-10-12 结束: 2021-01-06 地球科学 数据算法赛
第3名解决方案

第3名解决方案

作者:Hiroyuki
发布时间:2021-01-30

首先,我要感谢 INGV 和 Kaggle 举办了这次比赛。
这是我第一次参加 Kaggle 比赛,很高兴能获得第三名。
同时,我很抱歉这么晚才在讨论区发布这篇文章,而且我的想法组织得还不够完善。

在比赛的大部分时间里,我一直在纠结验证集分数和公开榜单分数之间的差异。
直到最后(截止日期前2天),我才注意到测试数据有两种类型:一种与训练数据相似(A型),另一种则不相似(B型)。
通过对抗验证,这一点清晰地显现了出来。
我分别对 A 型和 B 型数据进行了评估。

针对 A 型数据

特征:

  • 按对数尺度汇总的频谱

算法:KNN 回归器

针对 B 型数据

特征:

  • 按对数尺度汇总的频谱
  • 0.8-3.5 Hz 和 3.5-8.0 Hz 频率的变异(标准差、偏度和峰度)
  • 传感器值的最大值、平均值、标准差

算法:Light GBM

非常乐意接受任何建议或提问。

同比赛其他方案