670. NeurIPS - Ariel Data Challenge 2025 | ariel-data-challenge-2025
具有概率输出层的神经网络
感谢组织者和我的 Kaggle 伙伴们举办了一场非常有趣的比赛。我从一开始的目标就是改进我在 Ariel 2024 中的神经网络解决方案(当时获得了铜牌)。我没有走基于物理的建模路线(许多其他人在这方面表现出色),而是专注于完善概率神经网络方法。
核心模型是一个在 TensorFlow/Keras 中构建的双输入 Conv1D 神经网络。一个分支处理 FGS1 信号,另一个分支处理 AIRS 信号:
这两个分支被拼接成一个共享表示,结合了互补信息。与标准回归模型的关键区别在于概率输出层:模型不是预测每个波长的单个值,而是输出所有 283 个波长的均值和不确定性。
输出定义为基于拉普拉斯的混合分布,包含 15 个分量 × 283 个波长。密集层的参数被分为:
稳定性技巧:
TensorFlow Probability 的 DistributionLambda 随后构建完整的混合模型。这种设置让网络能够学习期望值和不确定性,这是挑战的核心。
预处理流程相当直接:
对于每个分段,将其均值与“未遮挡”部分(分段外部)进行比较。当我在原下降沿旁边添加分段瞬态的逆(穹顶)时,获得了意外的提升——模型受益于明确看到这两种对比模式。
进一步的增益来自于结合不同长度的分段,因此最终模型使用了多分段数据(粗 + 细)。
损失是带有波长加权的负对数似然 (NLL):
总的来说,开发一种能够提供竞争性分数的方法令人满意,最重要的是,它可以适应其他需要不确定性估计的数据集。再次感谢组织者和社区——这是一次很棒的学习经历。