543. March Machine Learning Mania 2023 | march-machine-learning-mania-2023
首先,我要感谢Raddar提供的优秀公开代码,以及Kaggle主办这场精彩的竞赛并提供了出色的平台。我也从其他Kaggler那里学到了很多,谢谢大家!
这是我第三年参加March Madness竞赛。根据我之前的经验,我决定采用一种保守的方法,通过集成多种模型来实现。
在特征选择方面,我使用了Raddar公开笔记中的特征。我创建了两组特征:一组包含Team Quality特征,另一组不包含。对于某些模型,我移除了Team Quality特征。
我使用了五种不同的模型:LGBM、逻辑回归、CatBoost、XGB和SVM。然而,由于SVM训练太慢,我将其舍弃。我将剩余四个模型的输出结果等权重结合。虽然我最初使用交叉验证来衡量每个模型的性能,并在去年的比赛中使用各模型输出的加权平均,但发现这种方法效果不佳。因此,今年我决定采用等权重以避免过拟合。
过去,覆盖所有1-4和13-16种子队的做法对我来说效果不好。因此,今年我只覆盖了1-2和14-15种子队。此外,我没有给1号和2号种子队99%的胜率,而是采取了保守策略,分别给予95%和90%的胜率。
总的来说,我相信这种方法和上帝的巨大保佑帮助我在5年后赢得了Kaggle的第一个奖项和金牌!
```