近日,中国热带农业科学院热带作物品种资源研究所研究员王鹏联合上海应用技术大学博士王飞,提出了评价基因组组装连续性的cc ratio(contig/染色体对数比例)指标,建立了基因组组装质量评价的建议指标体系。该体系覆盖连续性、完整性、准确性、杂合性、细胞器基因组等五个方面、共十四项指标,解决了基因组领域长期以来没有全面、统一的组装质量评价体系的问题。相关论文以封面文章的形式,在国际知名杂志trends in genetics上发表。
论文以封面文章的形式在trends in genetics发表。 中国热科院供图
基因组学是国际热门学科,然而关于如何科学、全面地评价基因组组装质量,长期以来学界颇有争论。自人类基因组计划完成以来,学者们提出了多项指标,却始终没有广泛认可的基因组组装质量评价体系。
作者分析了n50在评价组装连续性中的局限性,以及busco指标在评价基因组完整性时的问题,指出了基因组项目中广泛存在的对于组装准确性、尤其是组装结构上的准确性的忽略。此外,线粒体、叶绿体等细胞器基因组是真核生物基因组不可缺少的一部分,且杂合性是真核基因组中普遍存在的问题,当前多数基因组项目也缺乏对这些方面质量的评价。基于这些原因,作者建立了一套质量评价体系,为基因组组装质量评价建立了标准。
王鹏为第一兼通讯作者,王飞为共同通讯作者。该工作得到了中央级公益性科研院所基本科研业务费和国家重点研发计划的支持。(来源:中国科学报 张晴丹)
相关论文信息: