返回列表

GraphAttention solution approach

587. Stanford Ribonanza RNA Folding | stanford-ribonanza-rna-folding

开始: 2023-09-07 结束: 2023-12-07 基因组学与生物信息 数据算法赛

GraphAttention 解决方案方法

大家好,感谢斯坦福大学举办这场比赛!
也许有人会觉得我的工作很有趣。
时间不足是我最大的问题,但毕竟这是我第一枚奖牌,虽然是银牌,但我真的很开心。

  1. 将RNA序列预处理为图:
    1.1. 使用Eternafold包提取二级结构。
    1.2. 对核苷酸进行独热编码(OHE)→ 节点特征
    1.3. 用作边特征 → [磷酸二酯键, 碱基配对(包括标准配对或摆动配对), BPPS]
  2. 我的最终解决方案是:
    2.1. 使用随机游走作为位置编码。
    2.2. 架构:
    组合方式:
    局部注意力 → GraphTransformer。
    全局注意力 → 注意力编码器。
    20层深度神经网络(192隐藏维度),增加隐藏维度对我而言并无帮助。

这些研究对我帮助很大:
https://arxiv.org/abs/2009.03509
https://arxiv.org/abs/2205.12454

3.
默认划分训练集和验证集(10%的SN过滤器=1)
训练过程中使用信噪比≥0.8的RNA序列

最终提交时仅使用单个模型的预测结果,没有出现卡顿,这可能会提升预测质量,正如我之前所说,时间不足是主要问题。

代码仓库:https://github.com/cerenov94/ribonanzaRNA
使用工具:
Pytorch Geometric, Graphein

同比赛其他方案