返回列表

9th Place Solution

534. Playground Series - Season 3, Episode 6 | playground-series-s3e6

开始: 2023-02-07 结束: 2023-02-20 定价与促销 数据算法赛
第9名方案

第9名方案

作者:Brendan Moore | 排名:第9名

我的第9名方案简述可以在附件链接中找到。

这是一个使用 autogluon 的简单 AutoML 方法,将原始数据包含在训练循环中,但不包含在交叉验证中,最终成为了我本地交叉验证得分最高的方案。

  • 我使用了 5 折分层 K 折交叉验证(StratifiedKFold),类别为价格/平方米的三个组(约 10/平方米、约 100/平方米和约 1000/平方米)。
  • 我尝试对这三组进行多类分类,但最终并没有改善模型效果。
  • 在我的实验中,特征工程、对少数类(约 10/1000/平方米)的过采样以及对多数类(约 100/平方米)的欠采样也无助于提高本地交叉验证分数。

在代码笔记本中,我列出了对我有效和无效的方法。与其他一些高分方案不同,我无法通过单一模型获得很高的本地交叉验证分数。

同比赛其他方案