返回列表

7th Place Solution and my first Gold and that too Solo one !

430. March Machine Learning Mania 2021 - NCAAM | ncaam-march-mania-2021

开始: 2021-02-25 结束: 2021-04-06 赛事预测 数据算法赛
第7名解决方案:我的第一枚金牌,而且是单人获得的!

第7名解决方案:我的第一枚金牌,而且是单人获得的!

作者: Kamal
发布时间: 2021-04-07

大家好,
首先恭喜所有参加这次比赛的朋友。这是我在 Kaggle 的第一枚单人金牌。
该模型中使用的方案如下:

1. 三个数据集的特征工程

  • MRegularSeasonCompactResults
  • MRegularSeasonDetailedResults
  • MMasseyOrdinals

2. 特征计算

  • 胜率%(按所有地点和全部计算)
  • 负率%(按所有地点和全部计算)
  • 得分差(胜利得分 - 失利得分)
  • 根据相对得分计算相对得分
  • 按赛季和球队汇总所有结果
  • 根据 MRegularSeasonDetailedResults 计算分差
  • 根据 MRegularSeasonDetailedResults 计算胜率% 和负率%
  • last14days_stats_T1:根据胜场数统计 day > 118 的数据
  • last21days_stats_T1
  • 基于上述表格的统计列
  • MOR_127_128:基于 MMasseyOrdinals,筛选条件为 MMOrdinals.RankingDayNum == 127 和 MMOrdinals.RankingDayNum == 128
  • MOR_50_51:逻辑同上
  • MOR_15_16
  • 合并上述三个结果,并从中找出最大值和统计列

3. 使用的模型

I. LightGBM 分类器

  • GroupKFold(n_splits=4)
  • CV 平均分: 0.5590, 标准差: 0.0167

II. XGB

  • tree method gpu_hist
  • learning rate .14

III. GroupKFold(n_splits=4)

4. 合并结果

根据两个模型合并结果。

我试图保持我的方法简单。

致以此致
Kamal

同比赛其他方案