返回列表

6th Place Solution

480. March Machine Learning Mania 2022 - Womens | womens-march-mania-2022

开始: 2022-02-19 结束: 2022-04-04 赛事预测 数据算法赛
第6名解决方案

第6名解决方案

作者:Joe Cook-Shugart
发布时间:2022年4月5日

连续第三年,在预测中采取激进策略在女子比赛中的效果远好于男子比赛。考虑到过去十年女子篮球相比男子篮球缺乏相对的平衡性,这也许并不令人惊讶。

我使用了一个完全基于XGBoost的模型,并花费了大量时间进行超参数调整,以优化我的交叉验证(CV)结果。

  • 训练CV中的目标特征是胜分差。

  • 准确度衡量标准是平均绝对误差。

  • 基于最终让分盘口的历史胜率被用来将胜分差映射为获胜概率。

  • 激进覆盖 #1:将任何获胜概率 >= 92.5% 的比赛映射为 99% 的可能性。这差点在 NC State/Notre Dame 的比赛中害了我,但 Raina Perez 成了我的英雄!我没有做具体的计算,但如果我将其设置为 99.999%,我可能会进入前5名。老实说,我宁愿不去做这个计算,因为如果我的粗略假设是真的,那可能会让我太痛苦 :)

  • 激进覆盖 #2:在第一轮中,所有1号种子和2号种子都被设定为 99.9% 的获胜可能性,3号种子被设定为 99% 的可能性。

  • 激进覆盖 #3:所有1号种子在第二轮对阵8/9号种子时,都被设定为 99% 的获胜可能性。在最后一刻,我决定不对2号种子对阵7/10号种子的情况这样做——考虑到 Iowa 和 Baylor 都输了,这相对来说是幸运的。

最终,最终止步于前5名之外,主要是因为 UConn 打进了冠军赛,因为我的模型认为他们在对阵 NC State 和 Stanford 时处于劣势。吸取的教训:下个赛季我需要实施一个 Geno Auriemma(UConn传奇教练)手动覆盖!

同比赛其他方案