667. NeurIPS - Open Polymer Prediction 2025 | neurips-open-polymer-prediction-2025
副标题:从第 407 名到第 20 名:聚合物属性预测中的特征工程、分层交叉验证和目标特定集成
感谢组织这次比赛。我在 revisiting 早期机器学习心态的同时编写了代码。因为公共榜(Public LB)基于测试集的 8%,我预料到会有排名震荡(shake-up),因此专注于加强交叉验证(CV)。这帮助我从第 407 名移动到了第 20 名。
最终提交:CV = 0.0436, 公共榜 = 0.065, 私有榜 = 0.085
最终特征集:1,072 列。
逐步添加能改善 CV 和 LB 的模型。权重按每个目标自动确定。
| 目标 | 模型权重 |
|---|---|
| Tg | xgb=0.789, knn=0.112, cat=0.052, hist=0.039, et=0.008, lgb=0.000 |
| FFV | xgb=0.385, hist=0.273, lgb=0.218, knn=0.123, cat=0.000, et=0.000 |
| Tc | lgb=0.643, et=0.167, hist=0.108, cat=0.082, xgb=0.000, knn=0.000 |
| Density | cat=0.327, xgb=0.256, et=0.213, lgb=0.147, hist=0.058, knn=0.000 |
| Rg | cat=0.401, et=0.250, xgb=0.196, lgb=0.094, hist=0.058, knn=0.000 |
其他调整会降低性能,因此未使用。