返回列表

#4 solution - simple model WITHOUT CV ;-)

547. Playground Series - Season 3, Episode 13 | playground-series-s3e13

开始: 2023-04-18 结束: 2023-05-01 临床决策支持 数据算法赛

第四名解决方案 - 不使用交叉验证的简单模型 ;-)

作者: mateuszgrzyb.pl

发布日期: 2023-05-03

得票数: 10票

比赛排名: 第4名

大家好。抱歉这么晚才贴出代码。以下是我的方法总结。

如果考虑到目标变量的水平数量,这个数据集相当小,因此我假设:

  • 使用少量折叠的交叉验证并不是一个好主意
  • 梯度提升树/神经网络 + 错误的验证方式 = 过拟合

我取而代之的方法是:随机森林 + OOB分数(以避免对具有如此多水平的数据进行分割) + Optuna。

结果(OOB、公共排行榜、私有排行榜)呈现出完美的相关性。

同比赛其他方案