601. March Machine Learning Mania 2024 | march-machine-learning-mania-2024
首先,非常感谢 Kaggle 和主办方为我们提供本次参赛机会。
我的主要思路如下——将当前球队的实力(公开可用的各体育机构的排名)映射到 538 历史评级,并仅使用它们通过 ELO 公式计算概率。
当前排名反映了参赛球队的真实实力,使用多个排名可以增加多样性。538 评级只是一个稳固的数值集合,在进一步使用 ELO 公式时进行映射。
为实现 2 个多样化提交,我使用了在之前的 MMLM 竞赛中讨论过的策略。预测按如下方式替换:
\[ (p,1-p)\;\rightarrow\;(0.64,\;0.36)\;\backslash\;(0.36,\;0.64) \] 当男性 \(p>0.77\) 且女性 \(p>0.7\) 时,在一种提交中执行上述替换,另一种提交则相反。该方法最初是为了在 log‑loss 指标下获得更高的排行榜名次,所以我不太确定它在新指标下是否仍是最优选择。
我对女子和男子各模拟了 10 万个 bracket,并手动剔除低种子队夺得冠军的 bracket,最终得到约 9.9 万(女子)和 9.5 万(男子)的 bracket。Notebook 可在此处查看。
感谢 @lennarthaupts 提供的模拟代码,该代码被我用于 tournament 模拟。同时感谢 @roberthatch 创建的实时跟踪 notebook,帮助我们在线查看得分。