667. NeurIPS - Open Polymer Prediction 2025 | neurips-open-polymer-prediction-2025
我们在 2025 年 NeurIPS 开放聚合物预测竞赛中获得了第 5 名,采用的方法混合了机器学习和物理洞察。任务是预测五种聚合物属性:玻璃化转变温度 (Tg)、自由体积分数 (FFV)、热导率 (Tc)、密度和回转半径 (Rg)。我们没有依赖一个大型模型,而是逐步构建,使得某些预测可以支持其他预测。
我们从 FFV 和 Tc 开始。这些属性背后有更多的数据,并且与其余属性强关联,所以它们感觉是自然的起点。通过训练模型集成,我们获得了足够稳定的预测结果,可以馈送到后续阶段。这样,我们可以利用聚合物属性相互连接的事实,而不是将每个属性视为孤立存在。
Tg 结果是真正的挑战。它的数据稀疏,普通的 ML 模型往往难以泛化。我们的突破在于将这些 ML 预测与基于物理的模型及其数学表达式相结合。这种组合不仅使 Tg 预测符合物理意义,而且在排行榜上排名更高。如果没有这一步,我们可能不会进入前 5 名。
我们将同样的想法应用于密度和 Rg。来自 FFV 和 Tc 的预测被传递下去,我们调整输出以处理分布偏移并减少偏差。虽然这并没有有助于结果的提升,但它有助于保持稳定性。
我们的特征提取方法也有助于获得高分。除了捕捉化学模式的结构特征外,我们还添加了与聚合物行为相关的分子描述符和指数。经过一些简单的清理和缩放后,这些特征为模型提供了坚实且平衡的聚合物图景。
验证是另一个关键因素。我们使用分组交叉验证来避免泄漏,并依赖折外预测来指导调优。这种设置给了我们值得信赖的反馈,并确保训练期间的改进实际反映在最终分数上。
总而言之,我们的成功源于将物理与 ML 相结合,分层构建预测,并保持严格的验证。这种混合证明足够强大,足以将我们带入竞赛的顶层。