返回列表

4th Place Solution for the Regression with an Abalone Dataset

606. Playground Series - Season 4, Episode 4 | playground-series-s4e4

开始: 2024-04-01 结束: 2024-04-30 生命科学 数据算法赛
第4名方案 - 回归任务:阿巴伦数据集

第4名方案 - 回归任务:阿巴伦数据集(Abalone)

作者: Bertan Pank

发布时间: 2024-05-01

竞赛排名: 第4名

得票数: 13

Reaction: SURPRISE (1 人表示惊讶)

我的方法非常简单明了,以下是我对该方案的具体改进:

  • OpenFE(自动化特征工程)
  • 目标变量对数变换(对目标进行 log 变换以优化 RMSLE)
  • AutoGluon(使用自定义的 RMSLE 评估指标,仅使用基于树的模型)
  • 与该笔记本的预测结果进行50% 对 50% 平均

说实话,我没有料到这个方案会取得如此好的成绩。根据我目前的观察,AutoGluon 在数据量达到 5 万到 6 万左右的数据集上表现尤为突出。

同比赛其他方案