返回列表

5. place solution

568. ICR - Identifying Age-Related Conditions | icr-identify-age-related-conditions

开始: 2023-05-11 结束: 2023-08-10 基因组学与生物信息 数据算法赛

第五名解决方案

作者:Cihat Emre Çeliker(MASTER)
竞赛排名:第5名
发布时间:2023年8月11日 17:17:13(北京时间)
最后更新:2023年8月11日 19:28:14(北京时间)

考虑到 inevitable 的变动,我几个月前提交了一些基础解决方案,然后忘记了比赛的事。早上朋友祝贺我时,我感到很惊讶。

代码链接

主要要点:

  1. 为每个Alpha、Beta、Gamma、Delta训练模型,并将这些概率堆叠作为特征。
  2. 为每个特征创建了lgbm插补模型,即使在训练数据中没有缺失值。
  3. 使用RepeatedStratifiedKFold(n_splits=5, n_repeats=5)结合基础的catboost模型。

注意:移除插补模型并未影响分数,因此主要优势在于堆叠希腊字母特征。

在此解决方案之后,我尝试了暴力特征工程和其他建模方法,但它们在公共排行榜上帮助不大,因此我将其作为最终提交。

同比赛其他方案