520. Tabular Playground Series - Nov 2022 | tabular-playground-series-nov-2022
大家好,感谢这次比赛,我们在处理这个数据集的过程中度过了一段美好的时光。我将跟随 @alexryzhkov 的脚步,解释一下我们团队的解决方案。
我们采用了大量的集成学习,结合了不同的模型架构和特征。最终的融合模型包括:
我们使用了:XGBoost, LightGBM, LightAutoML, Keras, 以及 Weights and Biases 等。
根据我的经验,这是一场奇怪的比赛,因为几乎没有数据分析环节,我觉得这更像是不管三七二十一直接尝试直到成功。就我个人而言,我花了太多时间试图从头开始做事,而不是阅读他人的作品。
使用实验跟踪工具非常重要,它对保存 oof 预测和验证假设非常有帮助。要非常开放地学习所需的新事物,AutoML 就是一个很好的例子。
特别感谢我的队友,我很享受团队合作,没有比拥有一个共同的“敌人”更好的学习方式了,哈哈。
如果你觉得这篇帖子有帮助,请务必点赞提供见解的笔记本:
LightAutoML NN Happiness https://www.kaggle.com/code/mikhailkuz/lightautoml-nn-happiness 5k features not a problem for LightAutoML https://www.kaggle.com/code/alexryzhkov/5k-features-not-a-problem-for-lightautoml TPSNov22 EDA which makes sense https://www.kaggle.com/code/ambrosm/tpsnov22-eda-which-makes-sense Stacking with scipy minimize https://www.kaggle.com/code/pourchot/stacking-with-scipy-minimize