电磁生物环境与医学先进诊疗技术实验室

基于多种基因关联方法的疾病-基因关联云平台


全基因组关联分析(GWAS)和复杂疾病遗传机制的解析对于精准医学的发展具有重要意义。海量的GWAS汇总统计数据作为遗传研究的基础资源,需要经过严格的统计推断才能转化为具有生物学意义的结果。然而,单一的分析方法往往难以全面捕获复杂的遗传结构,并且常常受到假阳性信号的干扰。如何在数以千计的GWAS数据集中高效、准确地挖掘致病基因并解析其生物学功能,是后GWAS时代面临的重大挑战。

近日,南京医科大学生物医学工程与信息学院电磁生物环境与医学先进诊疗技术实验室的顾宁教授、曹晨教授与唐冉冉副教授团队合作,针对疾病基因关联中单一方法局限性和结果可重复性差的问题,构建了基于多种基因关联方法的疾病基因关联云平台GENEasso(图1)。该平台通过整合7种代表性的基因关联统计方法——包括基于表达介导的TWAS方法和基于GWAS信号聚合的分析策略——对8226个GWAS数据集进行了全面分析,评估了不同统计框架下基因关联信号的一致性和可靠性。

1 GENEasso数据库构建流程

基于大规模的数据整合,平台进一步融合了组织特异性富集与人种分层分析的多维功能模块,构建了包含超过71万条高置信度基因-疾病关联的云资源库。其中包括大量心血管相关 GWAS 数据(如心血管疾病、心肌梗死、心力衰竭、房颤等),为心血管疾病的致病基因挖掘提供了可靠资源。相比于传统单一方法,GENEasso的多方法交叉验证进一步提升了心血管相关候选基因的可信度,为心血管病理机制研究基因药物靶点挖掘奠定基础。与传统的单一分析工具相比,GENEasso平台通过多重交叉验证有效降低了假阳性率,显著提高了候选基因的生物学可信度。同时,用户不仅可以查询特定基因的关联信息,还可以上传自有数据进行在线分析与比对。

本研究的共同第一作者为工信院的姜韬、邵梦婷、王俊杰及吴朋泽,顾宁教授、曹晨教授、唐冉冉副教授为该研究的共同通讯作者。

该研究成果已被《Nucleic Acids Research》期刊接收并在线发表。文章题为《GENEasso: a curated resource of credible disease–gene associations across complex diseases from GWAS summary statistics》,文章访问地址为:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkaf1097/8306943


撰稿/邵梦婷; 图片/邵梦婷; 审核/曹晨