481. March Machine Learning Mania 2022 - Men’s | mens-march-mania-2022
首先,我要感谢比赛主办方、Kaggle 团队(@addisonhoward)和 @jeffsonas 组织了这场比赛。
我也要祝贺 @amirghazi 获得冠军,并鼓励那些因一两个名次或几场比赛而错失榜首或奖牌的朋友们。
这是我第一次参加这项比赛,必须说这真的很有趣。这也是我第一次建立篮球预测模型。过去我有一些经验,曾使用线性回归/其他回归模型以及跨赛季的各种数据/元数据,为欧洲足球主客队的全场/半场进球数建立模型(通常很容易过拟合,而简单的模型往往随着时间/赛季的推移表现更好)。
无论如何,我参加了 @zachmayer 在 Datacamp 上的课程,从中获得了这次比赛的基本思路和动力。
我的第5名解决方案 Python 代码可以在这里找到。
我只使用了比赛主办方提供的一部分数据。
我使用了当前的种子排名、历史胜率统计以及前几个赛季的比赛场次,这些数据可以反映球队在比赛中的深入程度。
使用了 CatBoostClassifier,目标函数为 Logloss,并包含了一些类别特征。
仅使用最近2个可用赛季的数据进行验证;我没有在初始排行榜上进行任何提交。
我的目标不是赢得金牌。我只是尝试建立一个好的模型,最初主要通过比较我与 @raddar 和 @zachmayer 的排行榜位置来判断我的表现;后来则是与 @koki25ando 、 @fritzcremer 和 @dynamic24 进行比较。