返回列表

30th Place Solution for the ICR - Identifying Age-Related Conditions Competition

568. ICR - Identifying Age-Related Conditions | icr-identify-age-related-conditions

开始: 2023-05-11 结束: 2023-08-10 基因组学与生物信息 数据算法赛

ICR识别年龄相关条件竞赛第30名解决方案

作者:Daikon99
排名:第30名
发布时间:2023年8月16日

在竞赛截止当天,我收到了朋友发来的消息,查看排行榜后发现我获得了第30名,这令我感到十分意外。

在比赛初期提交了几次结果后,我就转去参加HuBMAP竞赛了,所以原本没有期待能获奖。

背景

解决方案

我并没有做特别复杂的处理。

我使用了这个优秀的notebook:https://www.kaggle.com/code/datafan07/icr-simple-eda-baseline,在此感谢https://www.kaggle.com/datafan07的贡献。

该notebook的私有分数为0.37816,已达到银牌水平。

我仅对其中的分层K折交叉验证部分进行了修改,使数据分割时也考虑EJ特征。

在阅读了这个讨论(https://www.kaggle.com/competitions/icr-identify-age-related-conditions/discussion/411632)后,我意识到在分割数据时还需要考虑性别因素。

greeks = pd.merge(train[['Id', 'EJ']], greeks, on='Id')

for train_index, val_index in skf.split(train, greeks.iloc[:, 1:-1]):

通过这一修改,私有分数从0.37816提升到了0.37426。

同比赛其他方案