622. Playground Series - Season 4, Episode 8 | playground-series-s4e8
这是我第一次使用 AutoGluon,我必须承认我享受它的简单性和出色的性能。在这篇文章中,我将解释我的方法。
在数据处理方面,我考虑了三种情况。
在模型方面,我构建了几个模型。下表总结了我的结果。
| 模型 | 模型数量 | 最差 CV 分数 | 最佳 CV 分数 | 集成 CV 分数 |
|---|---|---|---|---|
AutoGluon |
20 | 0.98512 | 0.98525 | - |
LightGBM |
9 | 0.98423 | 0.98477 | 0.98484 |
XGBoost |
7 | 0.98417 | 0.98485 | 0.98488 |
TensorFlow |
6 | 0.98383 | 0.98401 | 0.98452 |
请注意,上述结果基于 10 折交叉验证策略。
在集成方面,我做了以下操作:
0.62 x AutoGluon (最佳模型) + 0.38 x AutoGluon of (LightGBM 集成,XGBoost 集成,TensorFlow 集成)
上述集成在 10 折交叉验证中获得了 0.98527 的 CV 分数。
最后,我使用 IsotonicRegression 校准了预测结果,这使得 10 折 CV 分数提高了 0.00003。
我运行了一些实验,试图优化阈值来确定标签,但我没有找到一致的结果。