617. LEAP - Atmospheric Physics using AI (ClimSim) | leap-atmospheric-physics-ai-climsim
大家好,感谢大家在比赛中的辛勤付出。
@jerrylin 感谢组织这次比赛。我知道这一定很艰难,但我相信正是 благодаря您的真诚奉献直到最后的检查,我们才能走到这一步。
祝贺所有排名靠前并取得好成绩的人。与你们一起比赛很愉快,你们都是很好的激励。
致我的队友 @bamps53 和 @kmat2019,很有趣,我也学到了很多。非常感谢。
另外,我很高兴在本次比赛中晋升为 Grandmaster。@kmat2019 也成为了 Grandmaster。恭喜!!
每个团队成员都构建了自己的神经网络模型。
在获得 Camaro 模型的预测后,我们创建了几个特征输入到 GBDT 回归器中。这些回归器优化了模型的预测。虽然这个第二阶段可以应用于其他模型,但我们只将其应用于 Camaro 模型,因为 Pao 和 Kmat 模型缺乏验证数据集。
最终预测是通过这些预测的加权平均计算得出的。
feature1 = feature1_original * a1 + b1 (a1 和 b1 是可训练参数)features_level0 = concat([seq_features_level0, dense_level0(scalar_features)])(input - mean(input)) / std(input)ptend_q0002_0-27 的预测替换为 -1 * input / 1200ptend_q0002_0-26 的预测替换为 -1 * input / 1200| 实验 | 批次大小 | 架构 | 维度 | 损失 | 公共 LB | 私有 LB | 公共 LB (2 阶段) | 私有 LB (2 阶段) |
|---|---|---|---|---|---|---|---|---|
| 1 | 256 | ConvTransformer | 256 | Huber2 | 0.78468 | 0.78176 | 0.78504 | 0.78199 |
| 2 | 1024 | ConvTransformer | 384 | Huber2 | 0.78418 | 0.78131 | 0.78451 | 0.78159 |
| 3 | 512 | Transformer n_layer=8 | 256 | Huber2 | 0.78545 | 0.78154 | 0.78572 | 0.78154 |
| 4 | 768 | ConvTransformer x 2 | 256 | Huber4 | 0.78395 | 0.78122 | 0.78427 | 0.78141 |
| 5 | 768 | Transformer n_layer=6 | 256 | Huber8 | 0.78245 | 0.77951 | 0.78255 | 0.77957 |
| 集成 (1+2+3+4) | 0.79025 | 0.78694 | ||||||
| 集成 (1+2+3+4+5) | 0.78998 | 0.78685 |
如图 6-1 所示,Kmat 部分包括:
-input/1200)x[z] - x[z-1](x - x_mean(axis=0)) / x_std(axis=0)(x - x_mean(axis=(0,1))) / x_std(axis=(0,1))(log_x - log_x_mean(axis=(0,1))) / log_x_std(axis=(0,1))(x - x_mean(axis=0)) / x_std(axis=0)
我们要队 capaomat(第 3 名)的最终提交是三名成员预测的集成。部分 Camaro 预测(ptend_q0001, q0002, q0003)通过第二阶段进行了优化。分数提升小于 0.0004。神经网络建模占主导地位。
为了防止过拟合,我们使用了少量来自原始输入和第一阶段预测的特征。模型提供了 State_t, state_q, ptend_q, future_state_q 特征以及 future_state_q2 与 q3 的比率。
(参考论文图表:液云占总云的比例随温度的变化)
我们采用 lightGBM 来预测每个层级的 ptend_q。具体来说,我们训练了模型并更新了各个层级的预测。在 CPU 上训练所有 91 个模型耗时不到 20 分钟。
作为最终提交,我们混合了以下 9 个模型。我们的解决方案取得了以下结果:
| 实验 | 公共 LB | 私有 LB | 权重 1 | 权重 2 |
|---|---|---|---|---|
| Camaro1_v2 | 0.78504 | 0.78199 | 3.0 | 3.0 |
| Camaro2_v2 | 0.78451 | 0.78159 | 3.0 | 3.0 |
| Camaro3_v2 | 0.78572 | 0.78154 | 3.0 | 3.5 |
| Camaro4_v2 | 0.78427 | 0.78141 | 3.0 | 2.0 |
| Camaro5_v2 | 0.78255 | 0.77957 | 3.0 | 1.0 |
| Pao1 | 0.78139 | 0.77770 | 1.0 | 0.5 |
| Pao2 | 0.78252 | 0.77864 | 3.0 | 2.0 |
| Pao3 | 0.77985 | 0.77801 | 1.0 | 0.5 |
| Kmat1 | 0.78120 | 0.77647 | 3.0 | 1.5 |
| 集成 with weight1 (私有最佳) | 0.79026 | 0.78810 | ||
| 集成 with weight2 (最终提交) | 0.79048 | 0.78792 |