8th Place Solution

第 8 名解决方案

作者： Yosef Lachman
发布日期： 2024-08-01
竞赛排名： 第 8 名
团队成员： Yosef Lachman, Moshe Grama, Shmuel Asher

对于我们的最终模型，我们使用了具有以下参数的 CatBoostClassifier：

model = cb.CatBoostClassifier(
    iterations=30000,
    learning_rate=0.02,
    random_strength=0.1,
    depth=8,
    loss_function='Logloss',
    eval_metric='AUC',
    leaf_estimation_method='Newton',
    random_state=1,
    subsample=0.9,
    bootstrap_type='Bernoulli',
    task_type='GPU'
)

我们还在提交中使用了目标反转 (target reversals) 方法。

GPU 设置

我们在训练过程中使用了两块 GPU：

NVIDIA GeForce RTX 4060 - 我个人电脑的 GPU，用于初始模型训练和测试阶段，速度较慢但有时得分更高。
NVIDIA A100 - 由巴伊兰大学 (Bar-Ilan University) 提供，这块 GPU 使我们能够高效处理模型所需的大型数据集和大量迭代。

交叉验证与结果

我们采用了 10 折 StratifiedKFold 交叉验证方法，每折运行 30,000 次迭代。这种方法确保了我们的模型在不同数据子集上具有鲁棒性和泛化能力。以下是每折的最佳迭代次数和相应的 ROC-AUC 分数：

折数 (Fold)	最佳迭代次数 (Best Iteration)	ROC-AUC 分数
Fold 1	19,186	0.895919
Fold 2	19,431	0.896413
Fold 3	17,659	0.895431
Fold 4	15,656	0.896021
Fold 5	16,038	0.895603
Fold 6	18,125	0.895498
Fold 7	14,044	0.895487
Fold 8	14,509	0.895475
Fold 9	15,585	0.895458
Fold 10	15,268	0.895620

总训练时间为 15 小时。所有折的平均 ROC-AUC 分数为 0.895693。

我们很享受参与这次比赛，并期待未来更多的比赛。

另外，热烈祝贺 Ravi Ramakrishnan 和 Minato Namikaze 的第一名精彩获胜方案。

原文链接 /competitions/playground-series-s4e7/writeups/technology-management-biu-8th-place-solution

第 8 名解决方案

GPU 设置

交叉验证与结果

同比赛其他方案