世界上最大、最完整的人类基因组数据库刚刚上线。
英国生物银行,一个有关健康、基因组和其他生物数据的信息资源库,于11月30日发布了50万名英国志愿者的全基因组序列。世界各地的研究人员都可以申请访问这些缺乏可识别细节的数据,并利用它们来探索健康和疾病的遗传基础。
?
人类变异的来源可以通过探查遗传密码来揭示。图片来源:peter summers/getty
英国生物银行首席执行官rory collins在新闻发布会上表示:“当科学家想知道从生活方式、环境、基因到疾病的途径是什么时,他们不会去谷歌了,而是去英国生物银行。”
2021年,英国生物银行曾公开20万名英国志愿者的全基因组数据,供全世界科学家研究使用。这项耗资2亿英镑的研究由生物医学研究基金惠康基金会、英国政府和几家制药公司资助,作为回报,这些公司在数据广泛发布前9个月便获得了数据。
此前,英国生物银行公布的遗传信息包括整个“外显子组”——每个外显子组占基因组的2%,负责编码蛋白质,以及分布在基因组中的85万个常见的单碱基dna变异。后者的信息为将健康和基因联系起来的全基因组关联研究(gwas)提供了动力。
但是,当研究人员寻找遗传与疾病或其他性状之间的关联时,大多数“位点”出现在基因组的非编码区域,这些区域在外显子组序列中缺失,并且在现有的全基因组数据中仅以低分辨率覆盖。英国埃克塞特大学人类遗传学家michael weedon说,全基因组还允许研究人员发现非常罕见的突变,这些突变往往比全基因组数据中包含的常见变异对某个性状的影响更大。“我们希望罕见的变异能让我们对生物学有更多的了解”。
事实已经证明了这一点。在11月20日发布的预印本文章中,weedon团队挖掘了英国生物银行公开的首批20万个完整基因组数据,并发现了29种罕见的dna变异,这些变异与高达7cm的身高差异有关,并且在以前的基因研究中从未被发现。
weedon表示,最终,研究人员将需要50多万个完整基因组来全面绘制罕见基因变异与健康之间的关系,这是获得数百万个样本的良好开端。
一项由美国政府资助的名为“我们所有人”的研究,计划最终公布100万或更多美国人的全基因组和健康数据。此前,这项工作已经公布了25万个基因组,但直到8月份才开始接受非美国研究人员的数据研究申请。研究人员表示,像“我们所有人”这样的数据库也将有助于确认与英国生物银行相关数据发现的联系。
根据英国生物银行之前公开的20万个基因组数据了解到的情况,芬兰赫尔辛基大学统计遗传学家andrea ganna还不相信这些数据能带来多大的回报。许多由全基因组研究发现的非编码变异与通过gwas已经发现的突变非常接近。
ganna说,尽管如此,完整的基因组序列可能会帮助研究人员更准确地绘制出疾病与结构变异之间的联系,如缺失、多余或翻转的dna片段。
collins认为,英国生物银行已经发表了9000多篇论文,最新发表论文的真正影响在一段时间内可能还不清楚。“我想,我们会惊讶地发现,有很多东西是我们甚至没有想到的。”
米乐app官网下载的版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。