返回列表

A 10th Place Experiment

678. Playground Series - Season 5, Episode 11 | playground-series-s5e11

开始: 2025-11-01 结束: 2025-11-30 信贷风控 数据算法赛
第十名实验

第十名实验

副标题:测试了 @Tilii 和 @CDeotte 的两个想法
作者:Gerald Schwartz
发布日期:2025-12-01

本次竞赛是对 @Tilii@CDeotte 两个想法的测试。创建不相关的模型,不要害怕在模型中删除列。谈到特征工程,有太多不同的方法可以尝试。我主要使用了 @CDeotte 的想法。本质上,我和竞赛中排名在我上下的人做了许多相同的特征生成。我创建了大约 24 个具有各种特征的模型,并尝试仅使用 ROC 分数而不是 LB 分数来组装它们。我有 24 个模型,其中只有 3 个与其他模型相关。最好的集成是使用 hillclimbers 程序,包括这 3 个相关模型。结果如下所示:

待集成的模型 (共 24 个)

模型名称 分数 备注
xgb_pseudo_recip0.92781最佳独立模型
xgb_pseudo0.92780
lgb_pseudo_recip0.92777
AG30.92772
xgb_new0.92770
xgb_base_ln_0.92765940.92766
lgb_0.9276450.92765
lgb_del10.92762
AG20.92761
RealTD10.92760
cat_20.92758
cat_base0.92750
TD_Essembly20.92749
RealTD20.92746
TD_Essembly0.92739
xgboost0.92734
cat_TD0.92732
ydf0.92716
xgb_base_ln_0.92691350.92691
xgb_0.92691690.92690
ag0.92456
lgb_del20.87601
xgb_drop_debt_to_income_ratio0.87436
xgb_drop_employment_status0.82128

hill climbing 过程

[数据准备成功完成] - [启动 hill climbing]

迭代 添加模型 最佳权重 最佳 ROC AUC 分数
1AG30.500.92810
2ag0.070.92813
3RealTD10.160.92816
4xgb_base_ln_0.92691350.080.92817
5lgb_del20.010.92817
6xgb_drop_employment_status0.010.92818
7xgb_new-0.120.92819
8lgb_del10.090.92819
9xgboost-0.070.92820
10xgb_pseudo0.060.92820
11TD_Essembly2-0.070.92820
12cat_20.020.92820
13cat_TD-0.040.92820
14xgb_0.9269169-0.020.92821
15cat_base0.020.92821
16xgb_base_ln_0.9276594-0.030.92821
17lgb_pseudo_recip0.030.92821
18lgb_0.927645-0.030.92821
19RealTD20.020.92821
20TD_Essembly-0.020.92821
21AG2-0.010.92821

最终获得了第 10 名。

同比赛其他方案