545. IceCube - Neutrinos in Deep Ice | icecube-neutrinos-in-deep-ice
推理(普通集成,0.978):https://www.kaggle.com/code/chihantsai/ens-gnn-v4-5-2-and-lstm-v8-and-tformer-v18-up300
推理(分组集成,0.975):https://www.kaggle.com/code/chihantsai/ens-group-gnn-v4-5-2-and-lstm-v8-and-tformer-v17
详见:https://www.kaggle.com/competitions/icecube-neutrinos-in-deep-ice/discussion/402880
详见:https://www.kaggle.com/competitions/icecube-neutrinos-in-deep-ice/discussion/402880#2227949
损失函数:
自定义交叉熵损失通过添加邻近区域损失来增强回归任务训练效果。邻近损失的权重如下图所示,灵感来自 此讨论。
我们认为自定义交叉熵损失能覆盖比原始交叉熵损失更大的区域,这使得我们能够将球面划分为更多类别。
训练步骤:
参考自:https://www.kaggle.com/code/shujun717/1-solution-lstm-cnn-transformer-1-fold/notebook
训练步骤:
批次657、658、659的验证分数:
| 模型 | 验证分数 |
|---|---|
| LSTM | 0.9899 |
| SAKT | 0.9927 |
| GNN | 0.9927 |
| Transformer | 0.9869 |
我使用线性拟合的结果和元数据将事件分为6组:
group1: aux=False的脉冲数 ≥ 300 且 天顶角(线性拟合预测) ≥ π/2 (~1%)
group2: aux=False的脉冲数 ≥ 300 且 天顶角(线性拟合预测) < π/2 (~1.58%)
group3: aux=False的脉冲数 < 300, 天顶角(线性拟合预测) ≥ π/2 且 aux=False的脉冲全部在垂直弦上 (~6.03%)
group4: aux=False的脉冲数 < 300, 天顶角(线性拟合预测) < π/2 且 aux=False的脉冲全部在垂直弦上 (~11.34%)
group5: aux=False的脉冲数 < 300, 天顶角(线性拟合预测) ≥ π/2 且 aux=False的脉冲在多个弦上 (~21.67%)
group6: aux=False的脉冲数 < 300, 天顶角(线性拟合预测) < π/2 且 aux=False的脉冲在多个弦上 (~58.37%)
可以观察到不同组别的验证分数差异很大,且每个模型在不同组别上表现各异。这符合逻辑:大气μ子总是从上往下运动,因此天顶角(线性拟合预测) < π/2 的情况更容易包含噪声。此外,位于垂直弦上的aux=False脉冲更可能包含噪声。同时,具有更多脉冲的事件预测效果更好。
为提升结果,我们对每个组使用不同的集成权重,使验证分数和排行榜分数均提升0.003(达到0.975)。我们进一步根据附加标准将事件分为13组,使验证分数和排行榜分数再提升0.001(达到0.974,私有分数0.975)。
或许使用MLP进行集成能获得更好结果,但遗憾的是我们没有足够时间研究此方法。
附注: 我的英语不够流利,如果解释不够清楚,请随时告知。