返回列表

Top 29 Using Baseline

547. Playground Series - Season 3, Episode 13 | playground-series-s3e13

开始: 2023-04-18 结束: 2023-05-01 临床决策支持 数据算法赛

使用基线模型获得前29名的经验分享

作者:eryawww | 发布时间:2023-05-02 | 排名:23

大家好!
我认为排行榜的波动是可以预测的,并且可以通过对抗性验证来观察。虽然我知道会有波动,但我没有避免它的策略。

令我相当震惊的是,我的CatBoost基线模型在私有排行榜上得到了0.49890的分数,而在公共排行榜上为0.35651。它基本上直接拟合了数据,没有任何特征工程和预处理。
这是关于这个基线模型的链接

我最好的提交是我幸运挑选出的结果,它是通过集成方法我的发散策略中的最佳提交产生的。幸运的是,我没有将那个基础模型包含在我的集成中。事实证明非常有效,我放入集成中的最佳CSV文件在私有排行榜上得分0.481,最终提升到0.502。

这种发散策略包括:

  1. 医学方法,由Tanoi提出
  2. 聚类工程,由belati提出
  3. 降维技术,由tetsu213提出

真是非常棒的经历!我期待下一场比赛。

同比赛其他方案