第7名解决方案:我的第一枚金牌,而且是单人获得的!
第7名解决方案:我的第一枚金牌,而且是单人获得的!
作者: Kamal
发布时间: 2021-04-07
大家好,
首先恭喜所有参加这次比赛的朋友。这是我在 Kaggle 的第一枚单人金牌。
该模型中使用的方案如下:
1. 三个数据集的特征工程
- MRegularSeasonCompactResults
- MRegularSeasonDetailedResults
- MMasseyOrdinals
2. 特征计算
- 胜率%(按所有地点和全部计算)
- 负率%(按所有地点和全部计算)
- 得分差(胜利得分 - 失利得分)
- 根据相对得分计算相对得分
- 按赛季和球队汇总所有结果
- 根据 MRegularSeasonDetailedResults 计算分差
- 根据 MRegularSeasonDetailedResults 计算胜率% 和负率%
- last14days_stats_T1:根据胜场数统计 day > 118 的数据
- last21days_stats_T1
- 基于上述表格的统计列
- MOR_127_128:基于 MMasseyOrdinals,筛选条件为 MMOrdinals.RankingDayNum == 127 和 MMOrdinals.RankingDayNum == 128
- MOR_50_51:逻辑同上
- MOR_15_16
- 合并上述三个结果,并从中找出最大值和统计列
3. 使用的模型
I. LightGBM 分类器
- GroupKFold(n_splits=4)
- CV 平均分: 0.5590, 标准差: 0.0167
II. XGB
- tree method gpu_hist
- learning rate .14
III. GroupKFold(n_splits=4)
4. 合并结果
根据两个模型合并结果。
我试图保持我的方法简单。
致以此致
Kamal