517. Open Problems - Multimodal Single-Cell Integration | open-problems-multimodal
感谢主办方以及在公开笔记本和讨论区分享想法的每一个人。我也需要积累分析单细胞数据的经验,这次比赛帮助我获得了很多知识,将成为一段宝贵的经历。
我是一名研究生,这是我第一次参加 Kaggle 比赛。如果我的笔记本组织得不够清晰,或者你想了解更多其他信息,可以在下方评论或给我发送私信。由于我没有很好地控制时间,最终的计划没有完成并提交。
我的重点放在了特征工程上,一些方法如 DCA、Magic、TruncatedSVD、FA、LDA 等可以在最终结果中产生积极的影响。关于交叉验证部分,我是按批次划分数据的,但我认为这对 Private 分数来说不是一个好方法。关于集成部分,我选择的模型包括 NN、Lightgbm、Catboost、Xgboost 和 Kernel ridge(对于 citeseq 使用的是 ridge)。
因为特征工程的部分组织得不够好,我现在只分享在单模型中得分最高的 NN 模型结构,尽管最终的 TruncatedSVD 参数稍微做了一些改动。查看模型代码。