返回列表

19th Place Solution

670. NeurIPS - Ariel Data Challenge 2025 | ariel-data-challenge-2025

开始: 2025-06-26 结束: 2025-09-24 物理与天文 数据算法赛
第 19 名解决方案

第 19 名解决方案

作者: Olly Powell (专家)
排名: 第 19 名
发布日期: 2025-09-29

使用 LGBM 模型进行曲线拟合以校正和估计误差

非常感谢组织者,以及我的其他参赛者带来了一场有趣且充满挑战的比赛。我非常欣赏这些挑战,即使它们不在我的直接研究领域内。跨学科的问题解决以及更普遍的经验教训对我来说是无价的。

我的最终解决方案是仔细曲线拟合、在波长和时间上进行分箱,然后在波长上进行插值,并使用嵌套 LGBM 模型来改进拟合估计,以及估计不确定性。

完整的训练和推理代码笔记本在 GitHub 上,链接这里

曲线拟合的第一阶段如下所示。在这里,我为每个行星拟合了一条“基线”曲线,针对的是时间分箱和波长平均的信号。我只依赖一个断点。凌日外部分和完全遮挡部分共享相同的线性项。我认为在这个阶段拟合不需要完美,只需要一致,并能优雅地处理边缘情况,因为我稍后会尝试用 boosting 模型纠正任何不足之处。

曲线拟合第一阶段示例

然后我利用中心点、断点和线性校正项生成了 13 个更多特定波长的拟合。这些后来经过插值以填充所有 283 个预测。我使用这 13 个拟合的特征生成了基于 LGBM 的校正,以及第二个具有嵌套数据拆分的 LGBM 模型来估计不确定性。我还使用了 batman 模型 仅用于曲线拟合,为 LGBM 模型生成额外特征。

LGBM 模型特征示意图

再次感谢,希望下次见到大家。

同比赛其他方案