626. NeurIPS - Ariel Data Challenge 2024 | ariel-data-challenge-2024
当我参加这次竞赛时,我从一种经典的拟合方法开始进行信号重建。令人惊讶的是,与我测试的其他模型相比,它的表现非常好。这种方法有几个优点:它在噪声数据中表现稳定,相对容易实现,并提供了一种构建可靠置信区间的方法。
该方法主要包括两个步骤:数据去趋势和凌日模型拟合。
在这一步中,我们识别凌日断点,屏蔽凌日阶段,并对剩余数据拟合二次多项式。这种参数化提供了一个模型,描述了没有行星凌日情况下的恒星通量。来自该模型的去趋势数据将用于下一步(见图)。
Erf 函数进行凌日参数化:我发现误差函数非常适合捕捉过渡区域,并通过其垂直偏移提供凌日深度的估计。拟合模型由两个符号相反的误差函数组成,分别代表凌日的入凌和出凌。即使数据去趋势不完美,它也非常稳定。拟合误差经过缩放,以确保置信区间覆盖约 99% 的情况。
下一步是关于测试对光谱的敏感性。
预测每个单独波长点的凌日深度可能会产生噪声,因此考虑了两种预测场景:
如果两种场景在特定的 p 值阈值内保持一致,我使用包含波长的结果 (2) 进行预测。否则,我依赖合并数据场景 (1)。