568. ICR - Identifying Age-Related Conditions | icr-identify-age-related-conditions
在竞赛截止当天,我收到了朋友发来的消息,查看排行榜后发现我获得了第30名,这令我感到十分意外。
在比赛初期提交了几次结果后,我就转去参加HuBMAP竞赛了,所以原本没有期待能获奖。
我并没有做特别复杂的处理。
我使用了这个优秀的notebook:https://www.kaggle.com/code/datafan07/icr-simple-eda-baseline,在此感谢https://www.kaggle.com/datafan07的贡献。
该notebook的私有分数为0.37816,已达到银牌水平。
我仅对其中的分层K折交叉验证部分进行了修改,使数据分割时也考虑EJ特征。
在阅读了这个讨论(https://www.kaggle.com/competitions/icr-identify-age-related-conditions/discussion/411632)后,我意识到在分割数据时还需要考虑性别因素。
greeks = pd.merge(train[['Id', 'EJ']], greeks, on='Id')
for train_index, val_index in skf.split(train, greeks.iloc[:, 1:-1]):
通过这一修改,私有分数从0.37816提升到了0.37426。