推动国内外学术交流 助力科研成果推广

期刊论文、出版出书、评职称学术咨询

社会认可、全国通用、升职加薪的通行证

鞘翅目昆虫线粒体基因组研究进展

来源:SCI期刊网 分类:农业论文 时间:2022-04-27 09:49 热度:

  摘要: 鞘翅目( Coleoptera) 是世界上最具多样性的类群,具有很高的生态和形态多样性,这些多样性吸引了很多进化生物学家和分类学家的关注。随着分子生物学的发展,分子生物学技术广泛应用于鞘翅目系统学的研究,但随着研究的深入,简单的分子片段已经不能满足研究的需求,需要发掘更新的分子标记。近年来,线粒体全基因组已经成为鞘翅目分子系统学研究中很重要的分子标记之一,并广泛地应用于鞘翅目昆虫各个阶元的研究中。本文就鞘翅目线粒体全基因组的概况、研究进展及存在问题进行了总结和讨论。目前,鞘翅目线粒体基因组的研究主要包括物种线粒体基因组组成与结构、分子系统学和分子进化等方面。线粒体基因组在解决系统发育和进化方面表现出了很多的优越性,然而也存在着一些缺点,如序列难获得、基因类型单一、各基因进化速率不同、应用较局限等。

鞘翅目昆虫线粒体基因组研究进展

  关键词: 鞘翅目; 分子系统学; 线粒体全基因组; 分子标记; 分子进化; 高级阶元

  鞘翅目( Coleoptera) 通称甲虫,属昆虫纲有翅亚纲、全变态类。它是世界上最具多样性的类群,目前已知 39 万多种( Zhang,2013) ,据估算该目的种类可能会超过 300 万种( Hammond,1994; degaard, 2000; Bouchard et al.,2009; 聂瑞娥和杨星科, 2013) 。甲虫由于物种丰富,分布广泛,具有很高的生态和形态多样性,这些多样性吸引了很多进化生物学 家 和 分 类 学 家 的 关 注 ( Crowson, 1960; Lawrence and Newton,1982; Farrell,1998; Hunt et al.,2007; Lawrence et al.,2011) 。

  随着分子生物学知识和技术的积累与发展,分子系统学的技术广泛应用于昆虫系统学研究中。系统学家已将生物信息大分子看作重要的演化依据,人们在不断寻找新的、具有良好检测功能的分子标记作为检测、描述并解释生物在分子水平多样性及其演化规律的工具。其中所涉及的分子标记主要有核基 因 ( 如: 28S rRNA,18S rRNA,ITS 及 EF-1α 等) 和 线 粒 体 基 因 ( COI,COII,Cytb,ND5,16S rRNA 及 12S rRNA) 。然而,随着研究的深入,简单的分子片段已经不能满足研究的需求,因此,分子标记也不断地被发掘,已经深入到转录组和基因组水平。近年来,线粒体基因组在鞘翅目中的研究也越来越普遍,本文就鞘翅目线粒体全基因组的概况、研究进展及存在问题进行总结和讨论。

  1 鞘翅目线粒体基因组概述

  1. 1 鞘翅目线粒体基因组的结构

  线粒体广泛存在于昆虫体内,它在控制昆虫的新陈代谢、生命周期、凋亡、病害等方面起着重要作用。细胞内线粒体的位置常处于需要 ATP 的结构附近或者处于细胞进行氧化作用所需要的燃料附近,如昆虫的飞行肌中和卵内。鞘翅目昆虫的线粒体基因组和其他昆虫一样为闭合双链,大小一般为 14 257 ~ 21 628 bp 之间( Bae et al.,2004; Kim et al.,2013) ,包含 2 个核糖体 RNA( rRNA) 、22 个转运 RNA( tRNA) 和 13 个编码蛋白质的基因以及 1 个非编码的控制区( control region,CR) ( 图 1) 。

  1. 2 鞘翅目线粒体基因组的特点昆虫线粒体全基因组具有很多进化方面的特征,包括长度的多样性( Boyce et al.,1989) 、tRNA 反密码 子 的 突 变 或 特 殊 二 级结 构 ( Steinberg and Cedergren,1994; Eddy,2002) 、非典型起始密码子 ( Lavrov et al.,2000; Shelffield et al.,2008) 、碱基组成的偏好性( Gibson et al.,2004; Gowri-Shankar and Rattray,2006 ) 、密 码 子 的 使 用 ( Jia and Higgs, 2007) 、基因排列( Zhang and Hewitt,1997; Shao and Barker,2003; Mueller and Boore,2005) 等,一些特征在不同类群中具有明显的特异性。鞘翅目昆虫线粒体全基因组具有以下特点:

  首先,和祖先昆虫一样,鞘翅目线粒体基因组相对较小,结构简单,不含间隔区和内含子,基因之间排列非常紧凑,在遗传过程中不易发生基因重组、倒位、易位等突变,并且遵守严格的母系遗传方式 ( Boore, 1999; Moraes et al.,2002) ,这些结构和进化上的特点使 mtDNA 已成为研究鞘翅目昆虫进化的重要分子标记,广泛应用于鞘翅目昆虫种群遗传、系统地理学、分子系统学等研究。mtDNA 基因组的13 个编码蛋白基因具有不同的进化速率,因此,线粒体基因已广泛应用于昆虫纲不同分类阶元系统发育关系的研究,应用比较广泛的是 COI,COII,Cytb,16S rRNA,ND1, ND2,ND5 和 12S rRNA,其中前 4 个分子标记的应用频率 最 高。两 个 核 糖 体 RNA ( 12S rRNA 和 16S rRNA) 变异速率相对于其他蛋白编码基因要慢的多,常用于属级以上阶元系统发育关系的研究。

  其次,鞘翅目昆虫线粒体基因组的基因顺序和组成相对保守。目前已发表的鞘翅目全线粒体基因组表明,其基因组成特别是蛋白编码基因的组成基本与祖先昆虫的排列方式相同,除了 tRNA 有重排外( Timmermans and Vogler,2012) ,基本不发生重排。对于多样性如此丰富的甲虫而言,线粒体基因组的基因排列稳定性是一个比较有意义的发现,因为在 昆 虫 纲 其 他 目 中,除 了 双 翅 目 ( Diptera ) 外 ( Lessinger et al.,2000; Junqueira et al.,2004) ,很多目线粒体基因组基因重排的现象非常普遍,例如半翅目 ( Hemiptera ) 、鳞 翅 目 ( Lepidoptera ) 、缨 翅 目 ( Thysanoptera) 等( Shao et al.,2003; Cameron et al., 2006,2007,2008; Li et al.,2011,2012) 。

  最后,密码子的使用及 tRNA 二级结构也有其特殊性。在鞘翅目昆虫中,除了 COI 基因,多数蛋白编码基因的起始密码子为 ATN。但是有些基因的起始密码子是变化的,如有些类群的 ND1 使用TTG 作为起始密码子; 祖先昆虫 COI 基因的起始密码子为 ATN。在鞘翅目昆虫中,COI 基因的起始密码子目前还存有争议,存在不同的起始密码子( Nardi et al.,2003; Oliveira et al.,2005; Castro et al.,2006; Lee et al.,2006; Fenn et al.,2007; Cameron and Whiting,2008) ,且不同类群 COI 的起始密码子可能不同,如: 多食亚目 COI 的起始密码子为 AAT 或 AAC ( Sheffield et al.,2008) 。终止密码子也可分为 2 类: TAR( TAG 和 TAA) 和不完全的 T 或 TA,其中最常用的是 TAA,不完全终止子( T 或 TA) 在后生动物线粒体基因组中很常见,推测可由转录后 3'端“A”补齐转化为完全的终止子 TAA( Coates et al.,2005; Castro et al.,2006) 。从目前已知的鞘翅目昆虫线粒体全基因组来看,其 tRNA-Ser ( AGN) 缺少 DHU 臂,其反密码子除多食亚目为 UCU 其他 3 个亚目都为 GCU,目前的统计结果来看,tRNA-Ser ( AGN) 使用 GCU 作为反密码子是较原始的类群。

  2 线粒体全基因组在鞘翅目昆虫中的应用

  随着分子生物学技术特别是第 2 代测序技术 ( next-generation sequencing,NGS) 的发展 ( Metzker, 2005; Mardis,2008; Miller et al.,2010; Nagarajan and Pop,2010; Horner et al.,2010; Lloyd et al., 2012) ,线粒体全基因组在昆虫分子系统发育学、种群遗传学、分子诊断、分子进化及地理系统学等方面的应用越来越多( Lessinger et al.,2000; Junqueira et al.,2004; Stewart and Beckenbach,2005,2006; Cameron et al.,2006,2007,2008; Cha et al.,2007; Salvato et al.,2008; Ye et al.,2012) 。到目前为止 ( 2014 年 2 月) ,GenBank 上共提交鞘翅目线粒体全基因组( 或者近线粒体全基因组) 共 74 个,来自于鞘翅目 4 个亚目: 原鞘亚目( Archostemata) 最少,只有眼 甲 科 ( Ommatidae ) 的 1 个 种; 藻 食 亚 目 ( Myxophaga) 也包括 2 个科 2 个种的线粒体全基因组; 肉食亚目( Adephaga) 相对较多,已经得到 5 个科 6 个种; 剩下 65 个线粒体基因组全部来自多食亚目的 5 个系,其中以扁甲系( Cucujiformia) 数目最多,共有 21 科 32 种,其中 9 个种来自叶甲总科( 天牛科 4 个种,叶甲科 4 个种,Zeugophoridae 1 个种) ; 叩甲系( Elateriformia) 的数目其次,涉及到 15 科 16 种。具体统计结果及相关参考文献见表 1。

  线粒体基因组在鞘翅目中的应用主要分为两个方面: ( 1) 系统学的研究: 扩增线粒体全基因组,分析其结构组成及相关参数,或联合其他可利用的线粒体基因组数据解决系统学相关问题; ( 2) 分子进化的研究: 利用线粒体全基因组解决相关进化问题。

  2. 1 系统学研究

  线粒体 DNA 作为一个完整的基因组从整体上展开鞘翅目不同阶元的系统发育研究更具有说服力。从线粒基因组水平上开展大规模的系统发育分析与单基因或多基因比较而言具有明显的优势。线粒体基因组序列对于解析深层次的系统发育关系提供了更全更有用的信息。近年来,一些学者在分析线粒体全基因组结构及相关参数的同时,结合可利用的线粒体基因组来解决物种间系统发育的研究越来越多:

  自 Friedrich 和 Muqim( 2003) 通过传统的测序方法得到了鞘翅目拟步甲科( Tenebrionidae) 的第一个线粒体全基因组以来,线粒体全基因组在鞘翅目中的研究越来越多。Stewart 和 Beckenbach( 2003) 报道了叶甲科负泥虫亚科( Criocerinae) 的 Crioceris duodecimpunctata 的线粒体全基因组,并且第一次指出鞘翅目线粒体全基因组一些有异于其他昆虫的特征,比 如: tRNA-Ser 的 反 密 码 子 由 GCU 代 替 为 UCU,tRNA-Ile 的 TΨC 环也不同于其他目的昆虫,以及 COI 基 因 非 常 规 起 始 密 码 子 ATT。Bae 等 ( 2004 ) 以传统测序方法得到了一种萤科 ( Lampyridae) 昆虫 Pyrocoelia rufa 的线粒体基因组,并结合 GenBank 上其他目的16 个种类进行了分析,表明鞘翅目为单系,但是所涉及 3 个鞘翅目种类的关系没有得到解决。Li 等( 2007) 利用两个长片段扩增方法得到了光萤科( Rhagophthalmidae) 两个种Rhagophthalmus lufengensis 和 Rhagophthalmus ohbai 的线粒体全基因组,并结合其他 6 个节肢动物的线粒体基因组进行了系统分析,表明鞘翅目为单系,所涉及的两种光萤具有较近的亲缘关系。Hong 等 ( 2009) 通过 4 条有重叠区的长片段扩增得到吉丁科( Buprestidae) 一个种 Chrysochroa fulgidissima 的线粒体全基因组,结合已发表的鞘翅目扁甲系其他 4 个种线粒体全基因组的数据进行了系统分析,其结果支持叩甲总科为单系。Kim 等( 2009) 采用长片段 PCR 扩增和 ABI 测序技术得到叶甲总科天牛科 ( Cerambycidae) 1 个种 Psacothea hilaris 的线粒体全基因组,并结合已经发表的鞘翅目 14 个其他种,对鞘翅目亚目及总科间的系统关系进行了分析,其结果表明多食亚目是( 原鞘亚目 + ( 藻食亚目 + 肉食亚目) 的姊妹群,位于系统树的基部。Timmermans 等( 2010) 首次利用第 2代测序技术( 454 测序) 得到了鞘翅目 21 个近线粒体全基因组( 长度约 10 kb) ,该研究是鞘翅目线粒体全基因组研究中的一个飞跃,它首次使用第 2 代测序技术,且使用了单个长片段 PCR 扩增,该 PCR一次能扩增出约 10 kb 的基因长度,且在线粒体全基因组的分析方法上有了很大改进,使得线粒体全基因组能批量生产。另外,该研究基于 28 个近线粒体全基因组及 GenBank 上 25 个线粒体全基因组的 12 个编码蛋白基因的联合数据对鞘翅目亚目间的系统发育关系进行了探讨,结果表明肉食亚目与藻食亚目互为姊妹群,多食亚目圆花蚤科( Scirtidae) 在该亚目的基部,叩甲系和扁甲系为单系,叩甲系与多食亚目的其他 4 个系所形成的进化枝形成姊妹群。Wan 等( 2012) 使用长片段扩增和传统测序方法得到步甲科( Carabidae) 一个濒危物种 Damaster mirabilissimus mirabilissim 的线粒体全基因组,并对其基因排列进行注解。Kim 等( 2012) 报道了瓢虫科( Coccinellidae) 七星瓢虫 Coccinella septempunctata 线粒体全基因组,分析结果表明该种线粒体全基因组的控制区( 4 469 bp) 是鞘翅目昆虫最长控制区。 Timmermans 和 Vogler( 2012) 再次利用第 2 代测序技术得到叩甲系 3 个科 3 个种的近线粒体全基因组,并联合叩甲系其他已发表的线粒体基因组( 共 63 个) 探讨了叩甲系水生甲虫的系统关系,并总结了鞘翅 目 基 因 重 排 对 系 统发育的应用。Kim 等 ( 2013) 测 得 锹 甲 科 ( Lucanidae ) 一 个 濒 危 种 类 Metopodontus blanchardi 线粒体全基因组,该基因组是目前已知鞘翅目线粒体基因组最长的一个,长度为 21 628 bp,包含了 3 100 bp 的控制区和 4 051 bp 的非编码区。

  2. 2 分子进化研究

  线粒体基因组作为经典的结构、功能和进化基因组研究模型,在遗传系统以及 DNA 进化机制研究等方面具有重要价值。线粒体基因组的遗传系统与核基因组比较而言具有特殊之处,包括遗传密码子的使用和进化、tRNA 系统的简化、起始密码子和终止密码子的改变、同义密码子使用偏向性、mRNA 及 rRNA 的加工等。鞘翅目线粒体全基因组在探讨鞘翅目的遗传与进化生物学研究中具有重要价值。

  相关知识推荐:基因分析论文发表sci方法

  Arnoldi 等( 2007) 首次利用长片段 DNA 聚合酶分 4 段扩增得到叩甲科( Elateridae) 的 Pyrophorus divergens 线粒体全基因组,并且结合鞘翅目的其他 3 个可利用的种类、双翅目和鳞翅目的种类进行了系统分析,试图解决昆虫生物发光的进化问题。但由于所选种类有限,没有得到很好的解决,不过该研究在鞘翅目线粒体全基因组 PCR 扩增方法上有了很大的改善,首次突破传统的 PCR 扩增方法,使用巢式 PCR( nested PCR) 扩增 4 个长片段( 16S-COX2 约 7 kb; COX2-NADH5 约 4. 5 kb; NADH5-16S 约 6 kb; 后两个片段的重叠区约 500 bp) ,不过测序方法仍然使用传统的 Sanger 测序。Sheffield 等( 2008) 提供了鞘翅目 6 个新的线粒体全基因组( 代表了鞘翅目的 4 个亚目) ,并结合可利用的鞘翅目其他 7 个线粒体全基因组对鞘翅目线粒体基因组的进化进行了分析比较,提出了 COI 基因的起始密码 TTG,发现在 tRNA-Ser( UCN) 和 ND1 之 间 有 20 bp 的 非 编 码 DNA,分析了 tRNA-Ser 的反密码子 UCU 可能是多食亚目的共源性状,并且提供了一个新的可以用于识 别 tRNA-Ser 的二级结构图的协方 差模型 ( covariance model,CM) 。Sheffield 等( 2009) 基于鞘翅目( 原鞘亚目和多食亚目) 13 个线粒体全基因组和 5 个外群( 3 个鳞翅目种类,2 个双翅目种类) 的线粒体全基因组数据矩阵探究碱基组成的异质性对重构物种系统关系的影响。该研究将数据矩阵分成无碱基偏好和碱基偏好方法,采用不同的建树方法和建树模型,验证了两种分析策略对系统分析的影响。结果表明不考虑碱基偏好的策略导致错误的系统关系,而考虑碱基偏好的策略则能得到正确的系统关系; 氨基酸重编码有利于系统树的构建; 传统的方法如 LogDet,由于数据没有分割,不能评估碱基的偏好型,因此不能计算位点速率的差异,建议基于多基因大矩阵的数据构建系统树前应评估碱基组成的异质性。Song 等( 2010) 基于 31 个线粒体全基因组 ( 内群为鞘翅目 24 个种,分别取自于鞘翅目的 4 个亚目) 探究碱基组成的异质性及位点间速率的异质性对构建系统发育树造成的影响,该研究结果表明这两个方面都会影响系统树的拓扑结构及支持率。 Pon 等( 2010) 基于鞘翅目 4 个亚目的 15 个线粒体全基因组( 该研究提供 2 个新的线粒体基因组) 重建了 4 个亚目的系统树,并估算鞘翅目核苷酸的进化速率,重点分析了蛋白编码基因数据分割及模型选择对进化速率的影响。系统发育树表明原鞘亚目在鞘翅目的基部,藻食亚目和肉食亚目形成姊妹群。核苷酸的进化速率受数据分割和模型选择的影响非常大,基于数据分割和最优模型的选择,得出鞘翅目整个蛋白编码基因的进化速率为 1. 34% /MY,并指出 COI 不太适合作为高级阶元系统分歧时间矫正的分子标记。相反 ND2,ND4 和 ND5 较适合,因其 3 个密码子的进化速率较为相似。Timmermans 等 ( 2012) 选用目前所有可利用的鞘翅目线粒体全基因组或近线粒体全基因组为材料探究了鞘翅目线粒体基因组基因重组包含的系统学信息的情况,总体来看鞘翅目基因顺序非常保守,但也有基因重组的现象,主要表现在 tRNA 的转位及缺失,特别是位于 ND3 和 ND5 之间 6 个 tRNA 组合,这些基因重排可能提供系统学信息,如泥甲总科( Dryopoidea) 进化枝一致存在 tRNApro 和 ND6 互换位置的现象,该现象的多样性可追溯到侏罗纪。

  3 线粒体全基因组在鞘翅目应用中存在的问题及讨论

  近年来,线粒体全基因组已经成为鞘翅目分子系统学研究中重要的分子标记之一,并广泛地应用于鞘翅目昆虫各个阶元的研究中。研究的主要内容包括了物种基因组与变异、系统学和分子进化的研究等。线粒体基因组在解决这些问题时表现出了很多的优越性,然而也存在着一些缺点:

  ( 1) 相对于普通基因片段,较难获得。主要表现在: 线粒体基因组的获得对于所需的实验材料要求很高,最好是 100% 酒精浸泡的新鲜标本; 对 DNA 模板质量、PCR 的反应条件、实验操作过程及序列的测定都有很高的要求。目前鞘翅目线粒体全基因组共获得 74 个,对于种类数量庞大的鞘翅目昆虫而言是微乎其微的。这对于精确的鞘翅目昆虫系统学研究显然是有限的。但随着第 2 代测序技术的成熟,该问题会逐步得到解决。

  ( 2) 基因类型单一。线粒体全基因组主要包括了蛋白编码基因、核糖体基因、转运 RNA 和非编码基因,这些都属于线粒体基因型。在解决物种系统关系时,基因的类型有时会对结果造成比较大的影响,一般情况下核基因和线粒体基因联合使用更为有效。另外,线粒体全基因具有明显的母系遗传的特征,对于鞘翅目一些雌雄比例失调的类群的系统学的研究存在局限性。因此,在系统分析时,结合其他类型的基因( 如核基因) 共同分析还是有必要的。

  ( 3) 蛋白编码基因密码子进化速率不同。不同类型的基因在解决不同分类阶元系统发育关系时的应用范围是有区别的,在不同类群系统发育研究中如何选择和分析线粒体基因组的基因是一项困难的工作。因此,在系统分析时应采取多种分析方法进行对比和评估,比如不同的比对方法、建树方法以及数据分割方法来验证系统树拓扑结构的稳定性 ( Sheffield et al.,2009) 。

  ( 4) 线粒体全基因组在鞘翅目昆虫中的应用还比较局限,主要用于系统和进化方面的研究。线粒体基因作为一种进化遗传学、分子生态学、遗传多样性及保护生物学等研究的重要标记,具有很宽的应用范围。因此应扩展线粒体全基因组在鞘翅目中的应用范围,以解决不同的问题。

  ( 5) 对于控制区的研究还不够。线粒体基因组中最主要的一段非编码区,AT 含量极其丰富,并且长度变异非常大,是复制与表达的主要调控 ( Zhang et al.,1995; Zhang and Hewitt,1997) 。控制区不编码任何基因,所以在进化中的选择压力相对较小,易发生碱基变异,在遗传上属于高变区,其碱基替换率比线粒体 DNA 其他区域高 5 ~ 10 倍。目前鞘翅目线粒体基因组控制区的研究比较少 ( Mardulyn et al.,2003) ,没有真正的发挥其作用,一方面是由于已获得控制区数据的可靠性有待考究; 另一方面,控制区很难扩增得到,数量比较少。因此在今后的研究中,应加强对控制区的研究,使其发挥自身优势。

  总而言之,线粒体基因组在解决系统及进化问题上既有其优点也有其缺点。实际上任何一种分子标记都不是万能的,在使用时应扬长避短,使其发挥最大的效力。相信随着第 2 代测序技术及分析方法的成熟,线粒体全基因将会在解决鞘翅目系统和进化的研究中起着越来越重要的作用。——论文作者:聂瑞娥,杨星科*

文章名称:鞘翅目昆虫线粒体基因组研究进展

文章地址:http://www.sciqk.com/lwfw/nylw/13241.html