返回列表

5th Place Submission

601. March Machine Learning Mania 2024 | march-machine-learning-mania-2024

开始: 2024-02-27 结束: 2024-04-09 赛事预测 数据算法赛
第五名方案 - March Machine Learning Mania 2024

背景

大家好,我叫Stefan,是一名来自布鲁克林的18岁高中生。我有一些机器学习背景(我参加了一年的课程并在此后自行学习),但发现在本次比赛中我的ML经验几乎没有用到。

提交结果

  • 排行榜得分:0.05563
  • 排行榜排名:第5名

提交信息

我使用Ken Rom的AdjEM数据对男子球队进行初步预测,使用Massey的Power评分对女子球队进行预测。我进行计算时假设每场70个possessions,并假设正态分布以计算概率。

在我的成功提交中,我使用了9作为男子比赛的标准误差,12作为女子比赛的标准误差。

计算t分数以预测分布(将AdjEM换算为70个possessions):
$$\frac{0.7 \times (AdjEM_1 - AdjEM_2)}{\sigma_{M}}$$

对于女子数据,我使用Massey评分,并采用与男子评分相同的逻辑(使用Pwr代替AdjEM,并考虑主场优势):
$$\frac{0.7 \times (Pwr_1 - Pwr_2 + hfa)}{\sigma_{M}}$$

在我的成功提交中,我只模拟了50个Bracket,并未对任何预测进行手动修改。

有趣的是,提交更多Bracket反而会降低我的提交表现。我的假设是,因为在本次提交中只模拟了50个Bracket,预测误差恰好更准确地匹配了实际结果的误差——我模拟的Bracket结果似乎以与实际比赛相同的方式偏离预期结果。这是我备选提交的策略,我惊讶它居然效果这么好。

特别感谢KenPom和Massey提供的评分,@jaredcross提供的模拟代码,以及Kaggle举办如此精彩的比赛!

作者:Stefan Weigl‑Bosker
发布日期:2024‑04‑23
同比赛其他方案