648. March Machine Learning Mania 2025 | march-machine-learning-mania-2025
对于今年的 March Madness 竞赛,我想采用一种高风险、高回报的方法。首先,我需要一个良好的基线——最好贴近博彩公司赔率,因为博彩公司/拉斯维加斯既有手段也有动力设定准确的赔率。幸运的是,@kaito510 在这里提供了一个极好的基线,以至于这部分甚至不需要做任何集成学习就能完成。我使用了没有任何修正的版本,因为默认情况下,该笔记本已经包含了对博彩公司赔率的偏离,形式是对德雷克大学 vs 密苏里大学比赛的修正。
第二部分是在此基线之上增加投注。增加投注可以通过不同的方式 approached——有些方式优于其他方式——这取决于你的目标是什么(例如,铜牌、银牌、金牌等)。我将目标设定为优化进入前 8 名的概率。为了实现这一点,我认为最好的方式是进行集中且去相关的投注。
所谓“集中”,是指仅在少数几场比赛上偏离基线。集中化非常有利于最大化达到特定 Brier 损失阈值的概率,在这种情况下,最佳比赛数量为一场(忽略风险承受能力灵活性的一些损失)。然而,对于本次竞赛,人们不仅仅想优化 Brier 损失阈值,而是想优化排名阈值。虽然两者相关,但优化 Brier 损失忽略了竞赛的对抗性方面。
这就是去相关发挥作用的地方。我不想要德雷克大学 - 密苏里大学的修正,因为如果那场爆冷发生,我可能会与许多相似(相关)的解决方案竞争。人们应该尝试与他人下不同的注,这样如果一个人幸运的话,成功的机会不会因其他以相关方式幸运的人而受到损害。换句话说,定位在结果空间中的稀疏区域是有利的。
在假设你知道哪些投注可能流行的情况下,与其他集中投注去相关是相当直接的。但我认为思考非集中投注——即稀释型投注——也是很有用的。许多人,无论有意还是无意,在使用博彩公司赔率作为参考时都会采用稀释型投注。为了与稀释型投注去相关,必须将投注扩展到多个维度,但这会以牺牲集中化为代价,因为一维(非零)向量之间的余弦相似度幅值始终为 1。
我推测大多数稀释型投注要么提升热门方,要么提升冷门方,这很方便,因为这样只需两个维度即可实现充分的去相关。为了去相关,人们应该修正一个热门方和一个冷门方,使他们各自赢得比赛。
最后一步是决定承担多少风险,以最大化达到 desired 排名阈值的概率。在这里,我只能靠猜测,因为我没有办法计算这个。我想我参加 2023 年 editions 的经历可能帮助塑造了我的直觉。
基于对所需风险的粗略估计,我选择投注两场第一轮比赛:圣玛丽学院 (CA) 战胜 范德堡大学,以及 麦克尼斯州立大学 战胜 克莱姆森大学。
最后注: 如果我没有撤销 goto-conversion 笔记本中的德雷克大学投注,我本可以赢得竞赛。但我没有遗憾,因为包含这个投注将超过我个人的风险承受能力。