428. March Machine Learning Mania 2021 - NCAAW | ncaaw-march-mania-2021
各位 Kaggle 用户好,
这是我的解决方案代码:https://www.kaggle.com/aburkard/4th-place-solution
我使用普通最小二乘法(OLS)回归来预测分差,主要包含三个特征:
其中的效率评级是 KenPom 风格的评级,针对对手和节奏进行了调整。这些评级可以通过线性回归计算得出,其中特征是球队 ID 的独热编码矩阵。我尝试了几种不同的评级以及它们之间的交互作用,但在留一法交叉验证后,这些特征给出了最好的分数。
然后,我拟合了一个逻辑回归模型,输入为预测的分差以及与得分效率边际计算的均方残差(未加权)的交互项。这样做的意图是,那些 KenPom 评级在比赛中更具可预测性的球队表现更稳定,因此我们希望预测“更强”球队获胜的概率更高。