如何利用泛基因组来深度发掘一个物种?

如题所述

第1个回答  2022-06-25

大豆是一种非常重要的油料和蛋白质来源。为了研究其基因组多样性,需要构建高质量的泛基因组。作者denovo组装了26个代表性的大豆,同时对2898个大豆进行了重测序,结合之前发表的基因组,构建了一个graph-base genome,并且进行相应的分析,得到了许多二代测序不能被发现的遗传变异。通过研究SV和转录组的变化,可以更好的发掘性状背后的基因。

使用2898个重测序,每个13x,获得了31M个SNP;并且构建进化树,将2898个accession分成6个大类。组装结果都还是很好的,见下图。重复序列的占比也都比较稳定,在55%左右,基因数目也比较恒定。

定义了softcore gene(存在于25个个体中的基因家族)、dispensable gene(存在于2个个体中的)、private gene(只存在于1个个体中的),结果比例如下图。虽然dispensable gene和private gene的个数多,但是在单个样品中比例不高。可以看出core gene和softcore gene在50%左右,dispensable gene为50%左右。

core gene有更高的domain比例,同时π和dn/ds也比较低,说明core gene更保守,这个很容易解释。

SV也可以分为core,softcore,dispensable,private。发现重复区域中富含SV。
构建了一个图基因组,然后使用图基因组,来鉴定sv。precision、recall和F1分别为0.94,0.75,0.83。还是一个比较高的检测效力。

建立了一个pan-genome,为后续的研究提供了很好的基础。

这是一篇经典的文章,里面内容很丰富很详实,值得多读几遍。里面涉及了一些功能的内容,由于我对这块不熟悉,就没有去解读了。大家如果想继续了解,可以去阅读原文。

参考文献
Liu Y , Du H , Li P , et al. Pan-Genome of Wild and Cultivated Soybeans[J]. Cell, 2020, 182(1).

相似回答