返回列表

7th Place Solution

568. ICR - Identifying Age-Related Conditions | icr-identify-age-related-conditions

开始: 2023-05-11 结束: 2023-08-10 基因组学与生物信息 数据算法赛

第七名解决方案

作者:Manthan Bhagat

排名:第7名

投票数:15票

发布时间:2023年8月11日

在比赛初期提交了几次后,我没有继续投入,因为预计会有大的变动。但现在这对我而言是个积极的变动(独自获得金牌)😅。

我的提交细节

  • 用0填充缺失数据
  • 使用希腊值进行5折多标签分层抽样
  • EJ是类别型变量,因此使用了标签编码
  • 对Beta、Gamma和Delta也进行标签编码
  • 所有模型都使用多分类CatBoost分类器

我发现Beta、Gamma和Delta具有很高的预测能力,但这些特征仅存在于训练数据中。因此,我利用其他所有特征,通过5折策略预测编码后的Beta、Gamma和Delta值,然后将这些预测特征与其他给定特征一起用于预测多分类Alpha。最后将Alpha的概率转换为二元概率:将B、D、G的概率相加来预测类别1,使用A的概率来预测类别0。

就这样。

谢谢

同比赛其他方案