电磁生物环境与医学先进诊疗技术实验室

基于基因组罕见变异的疾病基因关联云计算资源


罕见变异通常指人类基因组中次等位基因频率(minor allele frequency,MAF)小于1%的位点,并与多种复杂性状的遗传机制相关。相较于常见变异(MAF大于5%),罕见变异对疾病的影响更大,遗传效应更高,还可以解释复杂性状/疾病中更多的缺失遗传力。研究表明,罕见变异与许多性状和疾病相关,分析罕见变异可以更深入地了解与疾病相关的遗传机制,从而促进个性化治疗方法的开发和早期干预。新一代测序技术和英国生物样本库(UK Biobank,UKBB)等大型队列研究为研究罕见变异提供了大量数据。同时,研究人员开发了适合罕见变异的基于基因/区域的关联研究方法,通过分析整个基因/区域内的位点关联信号,从而提高检验功效。这些数据和方法大大增加了罕见变异关联研究的数量。然而,迄今为止尚未有系统收集罕见变异关联的研究。

课题组近日在Nucleic Acids Research发表了题为RAVAR: a curatedrepository for rare variant–trait associations的数据库文章。该文章介绍了名为RAVAR(RAre VariantAssociation Repository)的数据库,免费提供从245篇研究论文中手工收集的95047条基于罕见变异关联条目。

南京医科大学生物医学工程与信息学院电磁生物环境与医学先进诊疗技术实验室教授曹晨与博士生邵梦婷为文章的共同第一作者。RAVAR是目前第一个提供基于罕见变异关联云资源的数据库,具备多种交互式页面,包括查找、搜索、可视化和下载等功能。用户可以在搜索页面检索感兴趣的变异,基因或性状,每个页面都提供了关联条目的详细信息。下载页面提供数据库收录的所有关联条目的完整表格,包括所有基因与性状的详细信息,以及245篇研究论文的详细信息。RAVAR还提供反馈页面,研究人员可以提交遗漏的关联数据或任何使用过程中的反馈。



图1. RAVAR数据库的概述。(A)图示RAVAR数据库收集、处理、呈现数据的三个步骤。(B)RAVAR数据库提供不同的页面,包括搜索、下载、可视化等功能。



图2. RAVAR数据库的不同页面展示。(A)性状页面:包括性状的详细信息和相关研究文献数据。(B)基因查询页面:以TRMT13为例,提供基因的详细信息及对应关联条目。(C)变异查询页面:以rs43997339为例,提供变异的详细信息及对应关联条目。(D)研究文献页面:以PMID为34375979的文献为例,提供该文献中涉及到的性状详细信息。(E)搜索页面:提供四种搜索途径,包括性状、基因、变异和文献。

论文信息:

RAVAR: a curated repository for rarevariant–trait associations

Chen Cao*,†, Mengting Shao,Chunman Zuo, Devin Kwok, Lin Liu, Yuli Ge, Zilong Zhang, Feifei Cui, MingshuaiChen, Rui Fan, Yijie Ding, Hangjin Jiang, Guishen Wang, Quan Zou*



(撰稿/邵梦婷;审核/曹晨)