538 abuse — solo cash gold solution | 优胜方案

538 滥用 — 独行现金金牌方案

作者：Yurnero

竞赛排名：7

首先，非常感谢 Kaggle 和主办方为我们提供本次参赛机会。

主要思路

我的主要思路如下——将当前球队的实力（公开可用的各体育机构的排名）映射到 538 历史评级，并仅使用它们通过 ELO 公式计算概率。

当前排名反映了参赛球队的真实实力，使用多个排名可以增加多样性。538 评级只是一个稳固的数值集合，在进一步使用 ELO 公式时进行映射。

提交策略

为实现 2 个多样化提交，我使用了在之前的 MMLM 竞赛中讨论过的策略。预测按如下方式替换：

\[ (p,1-p)\;\rightarrow\;(0.64,\;0.36)\;\backslash\;(0.36,\;0.64) \] 当男性 \(p>0.77\) 且女性 \(p>0.7\) 时，在一种提交中执行上述替换，另一种提交则相反。该方法最初是为了在 log‑loss 指标下获得更高的排行榜名次，所以我不太确定它在新指标下是否仍是最优选择。

我对女子和男子各模拟了 10 万个 bracket，并手动剔除低种子队夺得冠军的 bracket，最终得到约 9.9 万（女子）和 9.5 万（男子）的 bracket。Notebook 可在此处查看。

数据使用

男子 538 球队评级数据集（女子 538 球队评级）
ESPN 排名
KenPom
Massey
SM（男子与女子）
JSokol（男子与女子）

鸣谢

感谢 @lennarthaupts 提供的模拟代码，该代码被我用于 tournament 模拟。同时感谢 @roberthatch 创建的实时跟踪 notebook，帮助我们在线查看得分。

查看比赛主页 March Machine Learning Mania 2024

538 abuse — solo cash gold solution

538 滥用 — 独行现金金牌方案

主要思路

提交策略

数据使用

鸣谢

同比赛其他方案