527. Playground Series Season 3, Episode 1 | playground-series-s3e1
首先——感谢这次有趣的比赛,以及大家分享的优秀公开方案和贡献!👍
这将是一个简短的总结,但也许有些人对解决方案中包含的特征工程(FE)/模型等感兴趣。
我在参加这次比赛的同时还在进行其他比赛,时间并不多,但参加这次比赛主要是为了在这个特定的数据集上尝试一些新版本的框架。
最终我选择了 AutoGluon 框架及其表格预测器来完成任务。
论文参考:“AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data” - https://arxiv.org/abs/2003.06505
在特征工程(FE)部分,我使用了一个公开的 Notebook https://www.kaggle.com/code/dmitryuarov/ps-s3e1-coordinates-key-to-victory,在此感谢原作者!
AutoGluon 训练出的解决方案是一个加权集成模型,它包含了许多经过 8 折交叉验证训练的常见架构,例如 XGBoost、LightGBM、CatBoost、随机森林(RF)、神经网络(NN)等。此外,它还使用了自举聚合和堆叠技术——本次使用了 3 层堆叠。
最终的本地交叉验证(CV)分数为 0.5006。
就是这样!🙂