619. Playground Series - Season 4, Episode 7 | playground-series-s4e7
大家好,
我非常感谢 Kaggle 提供的 Playground 系列竞赛 episode。我要感谢所有 fellow 参与者以及我的团队成员 @arunklenin 成功组建了团队。我也想赞扬 @uryednap @tilii7 @optimistix 在整个月的竞赛过程中带来的激烈且健康的竞争。
以下是我们本次任务的方案:
StratifiedKFold(n_splits = 5, shuffle = True, random_state =42)我们采用了如下所示的 3 步训练过程:
| 模型阶段 | 包含模型 | 模型训练选项和策略 |
|---|---|---|
| 阶段 1 模型 | 1. LightGBM (手动) 2. LAMA lgb 3. Catboost 4. Denselight NN 和 MLP 5. Tab-Resnet 6. Tab-Transformer 7. Autoint |
* 完整训练数据 * 基于先前投保 (2 个模型)、车辆损坏 (2 个模型)、先前投保 + 车辆损坏 (4 个模型) 的组件模型 |
| 阶段 2 模型 | 1. LightGBM (手动) 2. LAMA lgb 3. Catboost 4. Denselight NN 和 MLP 5. Tab-Resnet 6. Tab-Transformer 7. Autoint |
* 完整训练数据 * 基于先前投保 (2 个模型)、车辆损坏 (2 个模型)、先前投保 + 车辆损坏 (4 个模型) 的组件模型 |
| 阶段 3 模型 | XgBoost | * 来自阶段 1 和 2 模型选项的选定 OOF 预测 |
这可以可视化如下:

我们已经公开了我们的单一模型和一些选定的堆叠和混合。欢迎使用以下的 Kernels 和数据集:
| Kernel/ 数据集 | 内容 | 链接 |
|---|---|---|
| PlaygroundS4E07-ModelPP | * 所有组件模型的 OOF 分数 * 最终堆叠器模型的数据准备 |
https://www.kaggle.com/code/ravi20076/playgrounds4e07-modelpp |
| PlaygroundS4E07-ModelCollation | * 单一模型和一些混合及堆叠 | https://www.kaggle.com/datasets/ravi20076/playgrounds4e07modelcollation |
| PlaygroundS4E07- | * 来自选定私人实验的堆叠示例 * 包含 train-original 和 test-original 之间重复项的后处理数据集,用于反转标签 |
https://www.kaggle.com/datasets/ravi20076/playgrounds4e07privatefiles |
祝大家一切顺利,学习愉快!
此致,
Ravi Ramakrishnan