返回列表

1st Place Solution Summary

517. Open Problems - Multimodal Single-Cell Integration | open-problems-multimodal

开始: 2022-08-15 结束: 2022-11-15 基因组学与生物信息 数据算法赛
第一名解决方案总结

第一名解决方案总结

首先,感谢组织者、Kaggle 管理团队以及所有与我一起参赛的选手。
由于我需要积累分析单细胞数据的经验,这次比赛对我来说是一次极佳的历练。

下面我将介绍我的解决方案概览。

Multiome

模型概览

Multiome Model Overview

输入预处理

Multiome Input Preprocessing

目标预处理

Multiome Target Preprocessing

基于 tSVD 的插补方法:

  1. 使用 tSVD 对数据进行降维。
  2. 然后,将数据转换回原始空间。
  3. 将转换后的数值复制到原始数据中为 0 的部分。

模型结构

Multiome Model

输出后处理与损失函数

Multiome Postprocessing 1 Multiome Postprocessing 2

在推理阶段,模型输出五个预测目标数据的平均值。

CITEseq

模型概览

CITEseq Model Overview

输入预处理

CITEseq Input Preprocessing

在 CITEseq 中选择重要基因时,计算每个批次的相关系数,并仅选择在许多批次中具有高相关性的基因。
基因是从与目标蛋白和通路相关的基因中选出的。
我使用 Reactome 作为通路数据库。

目标预处理

CITEseq
                </div>
            </div>
        </div>

        
        <div class=
同比赛其他方案