【中国科技网】中科院海洋所构建完成长牡蛎染色体水平基因组和变异图谱

  科技日报记者?王健高 通讯员?王敏

  4月6日,记者从中国科学院海洋研究所获悉,由该所张国范研究组独立完成的论文《长牡蛎染色体水平基因组和变异图谱构建》近日在国际知名期刊《分子生态资源》在线发表。亓海刚副研究员为论文第一作者,李莉研究员和张国范研究员为通讯作者。

  张国范介绍,该研究首次构建了长牡蛎染色体水平基因组和贝类中第一张包含SNP、INDEL和CNV的综合序列变异图谱,发现长牡蛎基因组中存在高比例的长片段重复序列,CNV结构变异可导致个体间平均21%的区域差异,更新了长牡蛎基因组资源和对基因组复杂性的认知。

图1:长牡蛎基因组序列图谱

  长牡蛎俗称太平洋牡蛎,是世界重要的养殖贝类,具有重要的经济和生态价值。张国范研究组长期从事贝类养殖和育种相关工作,并一直致力于牡蛎基因资源挖掘和分子育种研究。2012年在Nature发表的牡蛎第一张基因组图谱得到广泛应用,引领并开启了水产物种基因组学相关研究。张国范研究组之后一直对牡蛎基因资源进行维护和更新。随着新一代测序技术的普及和对长牡蛎染色体水平基因组需求的增加,研究组于2019年正式启动长牡蛎染色体水平基因组构建工作。

图2:长牡蛎基因组变异图谱

  本研究利用高覆盖第三代测序(PacBio,~200×)结合HIC技术,并利用遗传连锁图谱进行辅助,对一个中国青岛的长牡蛎进行从头组装,获得基因组总长度为587M,包含10条染色体水平scaffold序列,ContigN50达到3.1M,ScaffoldN50达到60M,组装完整性和连续性均有较大提高。发现基因组中高比例的长片段重复在基因进化中发挥了重要作用,同时也是导致之前基于二代测序技术组装的长牡蛎基因组碎片化的主要原因。基于495个野生长牡蛎的重测序数据分析,构建了长牡蛎综合变异图谱,包含480万个高质量SNP,60万个INDEL和4.9万个CNV。张国范表示,这些新的数据资源对牡蛎比较基因组学、分子育种和适应进化等研究具有重要意义。

  美国南加州大学Dennis Hedgecock教授团队成员Xiaoshen Yin博士对该基因组进行了分析,发现和连锁图谱一致性达到90%以上,明显的组装错误不到0.1%,肯定了其较高的组装质量(Yin et al, 2020)。

 


附件下载: