返回列表

1st place simple solution

351. Categorical Feature Encoding Challenge | cat-in-the-dat

开始: 2019-08-23 结束: 2019-12-09 数据算法赛
第一名简单方案
作者:kanopri | 发布时间:2019-12-12

第一名简单方案

我思考了很久是否要发布我的解决方案,因为它可能并不比其他复杂的方案更好。

但它真的非常简单,而且表现很好。它更像是一个基线模型。我希望你能从中有所收获。: )

我的做法:

  • 删除 bin_0 特征
  • 对 ord 特征进行序数编码
  • 对其他特征进行独热编码
  • 使用带有 ‘liblinear’ 求解器的逻辑回归
  • 使用 optuna 调整参数 C

除了 optuna 之外,我在比赛开始时就做了这些事情。我在最后一天调整了参数 C,并且一次性训练了模型,而不是使用 K折交叉验证。这让我的分数提高到了 0.80850。

我是机器学习的新手,这是我第一次参加比赛。感谢 Kaggle 和所有参与这次比赛的人。我从你们那里学到了很多,这比排名更重要。感谢你们的分享!

同比赛其他方案