返回列表

4th Place Solution

428. March Machine Learning Mania 2021 - NCAAW | ncaaw-march-mania-2021

开始: 2021-02-25 结束: 2021-04-05 赛事预测 数据算法赛

第4名方案

作者:AndrewBurkard | 排名:第4名

各位 Kaggle 用户好,

这是我的解决方案代码:https://www.kaggle.com/aburkard/4th-place-solution

我使用普通最小二乘法(OLS)回归来预测分差,主要包含三个特征:

  • 得分效率边际差(对近期比赛赋予更高权重)
  • 造犯规效率差
  • 三分球效率差

其中的效率评级是 KenPom 风格的评级,针对对手和节奏进行了调整。这些评级可以通过线性回归计算得出,其中特征是球队 ID 的独热编码矩阵。我尝试了几种不同的评级以及它们之间的交互作用,但在留一法交叉验证后,这些特征给出了最好的分数。

然后,我拟合了一个逻辑回归模型,输入为预测的分差以及与得分效率边际计算的均方残差(未加权)的交互项。这样做的意图是,那些 KenPom 评级在比赛中更具可预测性的球队表现更稳定,因此我们希望预测“更强”球队获胜的概率更高。

同比赛其他方案