返回列表

8th Place Solution

619. Playground Series - Season 4, Episode 7 | playground-series-s4e7

开始: 2024-06-30 结束: 2024-07-31 保险科技 数据算法赛
第 8 名解决方案

第 8 名解决方案

作者: Yosef Lachman
发布日期: 2024-08-01
竞赛排名: 第 8 名
团队成员: Yosef Lachman, Moshe Grama, Shmuel Asher

对于我们的最终模型,我们使用了具有以下参数的 CatBoostClassifier:

model = cb.CatBoostClassifier(
    iterations=30000,
    learning_rate=0.02,
    random_strength=0.1,
    depth=8,
    loss_function='Logloss',
    eval_metric='AUC',
    leaf_estimation_method='Newton',
    random_state=1,
    subsample=0.9,
    bootstrap_type='Bernoulli',
    task_type='GPU'
)

我们还在提交中使用了 目标反转 (target reversals) 方法。

GPU 设置

我们在训练过程中使用了两块 GPU:

NVIDIA GeForce RTX 4060 - 我个人电脑的 GPU,用于初始模型训练和测试阶段,速度较慢但有时得分更高。
NVIDIA A100 - 由巴伊兰大学 (Bar-Ilan University) 提供,这块 GPU 使我们能够高效处理模型所需的大型数据集和大量迭代。

交叉验证与结果

我们采用了 10 折 StratifiedKFold 交叉验证方法,每折运行 30,000 次迭代。这种方法确保了我们的模型在不同数据子集上具有鲁棒性和泛化能力。以下是每折的最佳迭代次数和相应的 ROC-AUC 分数:

折数 (Fold) 最佳迭代次数 (Best Iteration) ROC-AUC 分数
Fold 119,1860.895919
Fold 219,4310.896413
Fold 317,6590.895431
Fold 415,6560.896021
Fold 516,0380.895603
Fold 618,1250.895498
Fold 714,0440.895487
Fold 814,5090.895475
Fold 915,5850.895458
Fold 1015,2680.895620

总训练时间为 15 小时。所有折的平均 ROC-AUC 分数为 0.895693。

我们很享受参与这次比赛,并期待未来更多的比赛。

另外,热烈祝贺 Ravi RamakrishnanMinato Namikaze第一名精彩获胜方案

同比赛其他方案