清华大学深圳研究生院黄来强教授共同主持完成世界首个兰花全基因组测序

发表《自然•遗传》封面文章获特别推介

  清华新闻网11月28日电 11月24日,清华大学深圳研究生院生命与健康学部生物医药研究中心、深圳市基因与抗体治疗重点实验室和健康科学与技术国家重点实验室(筹)主任黄来强教授团队与国家兰科中心主任刘仲健教授团队等合作在国际顶尖学术期刊Nature Genetics(《自然•遗传》)在线发表了题为The genome sequence of the orchid Phalaenopsis equestris(兰科植物小兰屿蝴蝶兰的全基因组序列)的论文,公布世界首个兰科植物全基因组序列及分析结果。同时本文被选定为Nature Genetics期刊封面文章并将于近期印刷出版。

  这是“兰花基因组计划”取得的最新重大研究成果,由清华大学深圳研究生院黄来强教授和国家兰科植物种质资源保护中心暨深圳市兰科植物保护研究中心(简称国家兰科中心)刘仲健教授共同发起和主导,联合中国科学院植物研究所、台湾成功大学、比利时根特大学、深圳华大基因研究院、华南农业大学林学院等多个研究机构组成的国际团队合作攻关完成。黄来强教授和刘仲健教授等为本论文的共同通讯作者;黄来强教授的清华大学博士后蔡晶(与国家兰科中心刘仲健教授联合培养指导)、清华大学博士生刘可为等为共同第一作者。

  本研究论文(Article长文)受到Nature杂志社各种形式的重点推介。在11月18日提前一周面向在Nature杂志社注册登记的全球媒体的新闻发布中,将本文选为亮点文章(Press Release Featured Highlights)撰文推介。论文上线发表后,本文题要被配图登在Nature Genetics主页的头条位置;选为Nature子刊亮点(Research Journal Highlights) 登在Nature网站。

  Nature Genetics(《自然•遗传》,或译《自然•遗传学》),创刊于1992年,近5年影响因子平均34.21,是Nature著名的子刊。

图为小兰屿蝴蝶兰。

  兰科植物(兰花)作为植物界种类最丰富的家族之一,是植物多样性保护的旗帜物种,素有“植物界大熊猫”之称。兰花具有纷繁复杂的形态和特性,独特的吸引昆虫完成传粉的机制,吸引了自达尔文以来无数的演化生物学家和植物学家对兰花进行大量细致的观察和研究。全世界大量的兰花爱好者也沉醉于这个至今仍不断有新物种发现的植物大家族。然而兰花生物多样性及进化的遗传基础,是哪些基因导致兰花演化出如此丰富的多样性,一直是悬而未决的问题。

  本研究选取具有代表性和重要园艺价值的小兰屿蝴蝶兰进行全基因组测序,经过数年的努力,克服了高杂合度等技术难题,完成了整基因组序列的组装和分析,获得了高精度的基因组序列图谱和大量的基因信息。

图为景天酸光合作用代谢(CAM)途径及基因进化图。

  上半部分为暗反应、下半部分为光反应代谢途径,五角星表示该基因家族曾发生过重复或丢失。CA: carbonic anhydrase碳酸酐酶;CC: Calvin Cycle卡尔文循环;PEP: phosphoenolpyruvic acid磷酸烯醇丙酮酸;PEPC: phosphoenolpyruvate carboxylase磷酸烯醇丙酮酸羧化酶;PPCK: phosphoenolpyruvate carboxykinase磷酸烯醇丙酮酸羧化激酶;MDH: malate dehydrogenase苹果酸脱氢酶;ME: malic enzyme苹果酸酶;PPDK: pyruvate phosphate dikinase丙酮酸磷酸双激酶。

  基因预测显示,小兰屿蝴蝶兰具有29,431个蛋白编码基因。有趣的是这些蛋白编码基因的平均内含子长度达到2,922碱基对,这一长度显著超过了迄今为止所有植物基因组中平均内含子长度,进一步分析发现蝴蝶兰内含子中的大量的转座元件是蝴蝶兰超长内含子的主要原因。在基因组杂合区域,自交不亲和途径的相关基因尤为富集,这些基因对进一步揭示兰花自交不亲和机制将极有助益。

  本研究搜索全基因组序列得到342个同时涵盖其他七个单子叶和双子叶物种的单拷贝直系同源基因家族。基于这些基因家族进行演化时间推算的结果显示蝴蝶兰和其他单子叶植物的分歧时间为距今1.351±0.17亿年以前。另外,分析蝴蝶兰基因组中的重复基因间的同义替换率,发现蝴蝶兰在距今7,557(7,150-8,073)万年前也就是白垩纪古近纪交界前不久经历了一次全基因组重复, 这次兰花特有的古多倍化事件以及随后发生的兰科植物大规模辐射演化奠定了兰科植物发育成为被子植物第二大科的基础。

  与水稻、拟兰芥等碳三代谢植物,以及玉米、高粱等碳四代谢植物不同,小兰屿蝴蝶兰属于景天酸代谢附生植物。景天酸代谢途径是对干旱或附生环境的一种适应性光合作用代谢途径。该代谢途径大大提高了植物对水的利用率。本研究也是首次对景天酸代谢植物进行的全基因组测序。通过对景天酸代谢途径的六个关键基因家族的分析,发现其中四个基因家族在蝴蝶兰中发生了特异的基因重复和丢失。这些基因重复和丢失事件很可能在兰花中景天酸代谢途径的演化有重要贡献。

  MADS-box基因家族是调控植物发育尤其是花的发育的重要基因,而兰花尤其以它特殊的花形态著称。本研究分析了蝴蝶兰中的MADS-box基因家族的分布和演化,发现了多个在兰花中特异扩增和分化的几类MADS-box基因。这些兰花特有的MADS-box基因很可能对高度特化的兰花形态发育发挥重要作用。

  本研究获得的蝴蝶兰全基因组序列图谱是世界上第一个完成测序和分析的兰科植物和景天酸代谢(CAM)植物的全基因组,并揭示其许多重要特性,具有重大深远的科学意义和应用价值。本研究成果填补了植物基因组研究的多个空白,对全球基因组科学作出了重大贡献,将为世界上其它相关研究提供全新的起点和平台。全世界的大量兰花由于非法采集和生境破坏而濒临灭绝。兰花基因组的公布将使得全基因组水平对濒危兰花多样性和演化进行探索和研究得以实现,为兰花保护提供重要的理论依据和指南。同时,兰花全基因组序列也将为兰花遗传工程育种研究提供重要资源和基础,对于加速兰科植物保护、兰花品种创新、推进兰花相关产业链的发展和提升我国在生物学、碳汇研究、生物多样性以及环境气候变迁等领域的研究水平具有重大的意义。

  附 Nature Genetics原文链接:

  http://www.nature.com/ng/journal/vaop/ncurrent/full/ng.3149.html

  http://dx.doi.org/10.1038/ng.3149

供稿:深圳研究生院 编辑:襄桦

2014年11月28日 21:19:27  清华新闻网

更多 ›图说清华

最新更新