学术分享

您现在的位置:首页 > 学术分享
复杂、大型的基因组分析将更简单

最近,欧洲生物信息学研究所(EMBL-EBI)的研究人员开发出一种新的方法,可研究多重基因变异对不同性状的影响。这种新算法发表在最近的《Nature Methods》杂志,能够同时对多达500,000个人和许多特征,进行遗传分析。

基因与疾病之间的一对一关系比较简单,相比之下,基因和特异性状之间的关系则更为复杂。全基因组关联研究(GWAS)表明,许多遗传因素对任何给定的特征起作用,但科学家们刚刚开始探索“特定遗传变异如何影响健康和疾病”。 发现这些联系的两个主要统计学挑战包括:分析许多不同遗传变异与多个性状之间的关联,并充分利用来自大型队列(包括成千上万个个体)研究的数据。

EMBL-EBI研究组组长Oliver Stegle解释说:“确定引起表型或特征的遗传变异,是非常具有挑战性的,一般我们通过逐一分析每种表型和每个变体,达到这个目的。但我们所用的模型过于简单,因此不能解开遗传变异与疾病表型之间复杂的依赖关系。”直到现在,可让我们研究很多不同变体共同作用的复杂模型,涉及到很多的计算,运行一次复杂查询,将需要一年的时间。

Oliver说:“这项研究的突破在于,我们能够对许多变体和表型进行综合分析,速度等同于现有的方法。”研究人员在来自公共数据库的两项研究的数据中,测试了他们的算法,并将结果与现有的先进工具进行比较。他们对四个脂肪相关性状(LDL和HDL胆固醇水平、C反应蛋白、甘油三酯)的研究证明,这种新方法显著更快,并可以在驱动它们的遗传学方面,来解释大部分的性状。

Oliver说:“我们希望能够从两个方向探讨这些问题。一方面,我们想研究一个单基因中的所有变体,它们可能参与一个特定脂质性状的调控。另一方面,我们要探讨更大一组血脂水平的综合影响。”

使用这种新的方法,GWAS研究人员可以同时探索一个基因的几个变体,同时将它们与几种相关表型进行比较。这使得我们更容易确定哪些基因——或基因上的位置,参与了特定的功能,如调节血脂。Oliver说:“这项工作重要的一点在于,它提高了统计能力,并为人们提供必需的工具,在非常大的队列中分析多个特征。我们的算法可以用来研究五十万个人——迄今为止这都是不可能的。”

EMBL-EBI副主任Ewan Birney指出,目前,人们使用多变量方法分析一个或多个表型,但只能同时研究一个变体。Oliver这种新方案是一个真正的进步,因为它可以让你在同一时间做两件事情。

这种新算法为基因组学提供了急需的方法,使大型、复杂的基因组分析,变得更易于管理和实用性。Ewan Birney表示:“这种方法——称为mSet,提供了一种原则性的方法,检测多基因变异和特征群之间的统计关系。这些方法将帮助研究人员确定,我们生物学的哪些具体方面是遗传的,并进一步阐明我们无数生物学过程背后的遗传学机制。”