海洋与湖沼  2023, Vol. 54 Issue (1): 246-258   PDF    
http://dx.doi.org/10.11693/hyhz20220400101
中国海洋湖沼学会主办。
0

文章信息

马颜雯, 李继姬, 叶莹莹. 2023.
MA Yan-Wen, LI Ji-Ji, YE Ying-Ying. 2023.
狄氏斧蛤(Donax dysoni)线粒体全基因组测定及结构特征分析
COMPLETE SEQUENCE AND GENE ORGANIZATION OF THE MITOCHONDRIAL GENOME OF CLAM DONAX DYSONI
海洋与湖沼, 54(1): 246-258
Oceanologia et Limnologia Sinica, 54(1): 246-258.
http://dx.doi.org/10.11693/hyhz20220400101

文章历史

收稿日期:2022-04-19
收修改稿日期:2022-07-07
狄氏斧蛤(Donax dysoni)线粒体全基因组测定及结构特征分析
马颜雯, 李继姬, 叶莹莹     
浙江海洋大学 国家海洋设施养殖工程技术研究中心 浙江舟山 316022
摘要:为解析狄氏斧蛤(Donax dysoni)线粒体全基因组结构特征以及进化地位, 采用二代高通量测序技术获得狄氏斧蛤线粒体基因组全序列, 对线粒体基因进行注释并对其序列结构进行分析。结果表明, 狄氏斧蛤的线粒体全基因组序列全长为16 908 bp, 碱基组成为A (26.81%)、T (41.13%)、G (21.21%)和C (10.85%), A+T含量为67.94%, 表现出明显的AT偏向。与其他双壳贝类相似, 狄氏斧蛤共编码13个蛋白质编码基因, 包含22个tRNA和2个rRNA, 且所有基因均位于H链; 蛋白质编码基因拥有3种起始密码子(ATG、ATT、ATA), 而除了ND3ND4以及ATP6使用TAG作为终止密码子外, 其余所有蛋白质编码基因都使用TAA作为终止密码子。除tRNASer不能折叠成典型的三叶草结构, 没有明显的DHU茎环, 其余tRNA都能折叠成典型的三叶草结构。狄氏斧蛤与斧蛤科(Donacidae)其他物种具有相同的基因排列, 未发现基因重排现象。基于线粒体12个蛋白质编码基因构建62种贝类的进化树, 结果显示: Donax semiestriatusDonax vittatus聚为一小支, Donax trunculusDonax variegatus聚为一小支, 这四个物种与狄氏斧蛤一起聚为斧蛤科这一支; 进化树支持将斧蛤科划归到樱蛤总科中, 且将樱蛤总科所属的鸟蛤目单独列为一个目而非划归到帘蛤目中。
关键词狄氏斧蛤    线粒体基因组    基因重排    系统发育分析    
COMPLETE SEQUENCE AND GENE ORGANIZATION OF THE MITOCHONDRIAL GENOME OF CLAM DONAX DYSONI
MA Yan-Wen, LI Ji-Ji, YE Ying-Ying     
National Engineering Research Center for Marine Aquaculture, Zhejiang Ocean University, Zhoushan 316022, China
Abstract: To improve the systematics and taxonomy of Donax dysoni, the complete mitochondrial genome of D. dysoni was sequenced and annotated by the Next-Generation Sequencing. Results show that the total length of the mitochondrial genome is 16 908 bp, consisting A (26.81%), T (41.13%), G (21.21%) and C (10.85%), and A+T content was 67.94%, showing obvious AT bias. Similar to other bivalves, D. dysoni contains 13 proteins, 22 tRNAs, and 2 rRNAs genes, and all the genes are encoded by the H-strand. Protein-coding genes have three start codons (ATG, ATT, and ATA), and all protein-coding genes use TAA as the stop codon; except for ND3, ND4 and ATP6, they use TAG as the stop codon. Among the 22 tRNA genes, 21 tRNA genes (except only for tRNASerI) can fold into a typical perfect secondary structure due to miss a distinct DHU stem ring. The gene arrangements of all species of the Donacidae are consistent. The phylogenetic tree of 62 species show that Donax semiestriatus and Donax vittatus cluster into a small clade, and Donax trunculus and Donax variegatus cluster into a small clade, then clustered together with D. dysoni into Donacidae. The phylogenetic tree supports the inclusion of the family Donacidae to the Tellinoidea, and the inclusion of the order Cardiida to which the Tellinoidea belongs as a separate order rather than as part of the order Venerida.
Key words: Donax dysoni    mitochondrial genome    gene rearrangement    phylogenetic analysis    

线粒体是细胞中进行有氧呼吸的主要场所, 为生物体的生命活动提供ATP。由于动物线粒体DNA具有结构简单、母系遗传、进化速率快等特点(董依萌等, 2020), 常被用于解决分类学争议问题、确定隐种(Tong et al, 2022)、重建系统发生关系(Xu et al, 2011, 2022)及研究近缘种和种内群体间遗传分化(Breton et al, 2009; Zbawicka et al, 2010)等。与基于单个线粒体基因的分析相比, 基于线粒体全基因组的系统发育分析可以提高系统发育树的分辨率和统计置信度(Ingman et al, 2000; Mueller, 2006; Miao et al, 2022)。贝类线粒体基因组通常包括13个蛋白质编码基因、22个tRNA基因、2个rRNA基因和一个非编码控制区(陈复生等, 2003)。无脊椎动物尤其是贝类的线粒体基因组表现出高度变异性, 且是目前已知变异程度最高的类群(徐晓东等, 2009)。此外, 在双壳纲各种属之间, 线粒体基因组在基因结构和基因排列方式等方面也都显示出了极大的多样性(孟学平等, 2013)。到目前为止, 已经发表了不少基于线粒体全基因组的双壳类软体动物系统发育分析研究, 例如, 远洋等(2012)测定了六种异齿亚纲双壳贝类的线粒体全基因组, 并基于线粒体全基因组进行系统发育分析, 构建的系统进化树支持将缢蛏属划归到竹蛏总科而非樱蛤总科; 夏立萍等(2021)等基于等边浅蛤(Macridiscus multifarious)线粒体全基因组进行系统发育分析, 结果表明等边浅蛤与菲律宾蛤仔亲缘关系最近; 林巧惠(2010)对池碟蚌(Hyriopsis schlegelii)线粒体基因组全序列进行了分析, 构建的系统进化树显示池碟蚌与三角帆蚌亲缘关系最近。此外, 线粒体全基因组在腹足纲的系统发育关系的重建中也取得了一定进展, 例如, Miao等(2022)基于蜑螺亚纲(Neritimorpha)线粒体全基因组进行系统发育分析, 发现蜑螺亚纲和Gaenogastropoda具有较近的亲缘关系。Xu等(2022)基于笠形腹足目(Patellogastropoda)线粒体全基因组进行系统发育分析, 构建的系统进化树将笠形腹足目下的Lottioidea分为两个具有高分支支持度的非单系群。

狄氏斧蛤(Donax dysoni), 属于鸟蛤目(Cardiida)、樱蛤超科(Tellinoidea)、斧蛤科(Donacidae)、斧蛤属(Donax), 其贝壳表面光滑, 壳表颜色不固定, 一般为浅黄褐色和白灰色, 体型较小近似瓜子, 在亚洲主要分布于越南沿海以及中国东海和南海的潮间带沙滩中(蔡英亚等, 2002), 并且斧蛤属是温带, 热带和亚热带地区沙滩动物的重要组成部分(Ansell, 1983)。但目前国内外对斧蛤科的研究多集中于种群动态分析(Singh, 2017; Tenjing, 2017), 对斧蛤科进行的系统发育研究较少, Fernández-Pérez等(2017)测定了四种雌性斧蛤属贝类线粒体全基因组并基于此进行系统发育分析, 研究结果表明四种斧蛤聚为一支, 形成斧蛤科, 与樱蛤总科中其他四个科构成姊妹群(紫云蛤科、截蛏科、樱蛤科、双带蛤科); 随后Fernández-Pérez等(2018)又对四种斧蛤科贝类的ITS序列进行研究并基于此构建系统发育树, 结果与基于线粒体基因组构建的系统发育树相似。其他相关的系统发育研究则大多集中于斧蛤科所属的樱蛤总科(Bieler el al, 2006), 如于红等(2011)研究了樱蛤总科贝类的线粒体基因组特征并基于线粒体蛋白质编码基因序列构建系统发育树, 进化树分支支持缢蛏属于竹蛏总科, 而不属于樱蛤总科的截蛏科, 并且樱蛤总科下的紫云蛤属不是单系发生; 远洋等(2012)基于线粒体全基因组构建了樱蛤总科和竹蛏总科的六种双壳贝类系统发育树, 结果显示缢蛏(Sinonovacula constricta)与樱蛤总科下的截蛏科相距较远, 与竹蛏科的大竹蛏(Solen grandis)是姐妹群。此外, 于贞贞(2014)还详细研究了樱蛤总科的系统发生学关系, 研究结果显示樱蛤总科是并系或者复系发生的, 且樱蛤总科的缢蛏属与竹蛏总科的刀蛏属显示了较近的亲缘关系, 但具体的分类地位还需要进一步研究。

本研究利用二代高通量技术对狄氏斧蛤的线粒体基因组进行测序, 分析狄氏斧蛤线粒体基因组核苷酸组成、密码子的使用、tRNA的二级结构以及基因重排。同时基于12个蛋白质编码基因(PCGs)对狄氏斧蛤和Imparidentia超目下的61个物种进行系统发育分析, 以了解狄氏斧蛤的系统发育地位。这些研究结果可为鸟蛤目的系统发育关系及进化地位积累有价值的数据资料。

1 材料与方法 1.1 样品采集和DNA提取

本研究于2018年7月在浙江省舟山市桃花岛塔湾沙滩(122°30’E, 29°82’N)采集了狄氏斧蛤样品, 在无水乙醇中于–20 ℃条件下保存。首先通过张素萍(2008)的《中国海洋贝类图鉴》对标本进行初步形态学鉴定。随后使用盐析法(Aljanabi et al, 1997)提取闭壳肌组织DNA, 1%琼脂糖凝胶电泳检测DNA质量, 送样测序前在–20 ℃条件下保存。

1.2 线粒体基因组的测序和注释

委托上海元莘生物医药科技有限公司使用二代测序方法(Aljanabi et al, 1997)对狄氏斧蛤闭壳肌组织DNA样品进行高通量测序。测序前对建好的文库进行质检, 合格后采用Illumina HiSeqTM平台测序。共获得约10 G数据量, 对下机后的数据进行质控, 对低质量读段、重复读段(duplication reads)、N率较高序列及测序接头序列等进行数据过滤, 最终得到高质量的测序数据(Clean data)。利用NOVOPlasty组装软件(Dierckxsens et al, 2017)对Clean data片段进行组装拼接。得到的叠连群与参考基因和GenBank数据库已有的斧蛤线粒体全长数据进行比对, 得到大部分线粒体基因组序列信息。然后通过在线软件MITOS (http://mitos.bioinf.uni-leipzig.de/index.py)进行结构功能注释, 最终得到完整的线粒体基因结构。

为保证狄氏斧蛤物种的准确性和序列的正确性, 使用NCBI BLAST对其进行分类鉴定(Altschul et al, 1997)。而后利用在线软件MITOS确定狄氏斧蛤线粒体蛋白质编码基因的数量及其起始和终止密码子的位置。环状基因组可视化利用CGView服务器(http://cgview.ca/)。利用在线软件MITOS对转运RNA (tRNA)及核糖体RNA (rRNA)进行注释, 并识别其tRNA的数量和二级结构, 而后使用Adobe Photoshop CC软件进行编辑(Zuker, 2003)。利用MEGA 7.0 (Kumar et al, 2016)计算各蛋白质编码基因的核苷酸组成和相对同义密码子使用(relative synonymous codon usage, RSCU)。AT和GC偏斜值计算公式如下(Hassanin et al, 2005): AT-skew=(A–T)/(A+T)和GC-skew=(G–C)/(G+C)。

1.3 系统发育进化树构建

为了分析斧蛤科贝类的系统发育关系, 本研究从GenBank中下载Imparidentia超目下的61个物种线粒体全序列, 以大脐鹦鹉螺(Nautilus macromphalus, NC007980)和圆鲍螺(Haliotis ovina, NC056350)的线粒体基因组全序列为外群, 由于部分物种如文蛤等缺少ATP8基因, 所以使用软件MEGA7.0将64个物种的12个编码基因(ATP8除外)分别信息序列比对和分析(Kumar et al, 2016), 将所有物种的蛋白质编码基因串联成一个大的数据集, 使用软件MEGA7.0进行序列比对和修剪, 利用多序列比对的结果, 基于最大似然法(ML)和贝叶斯推理(BI)进行系统发育分析构建系统发育树。本研究所使用的线粒体基因组具体信息见表 1

表 1 本研究中分析的物种列表及其GenBank登录号 Tab. 1 List of species analyzed in this study and their GenBank accession numbers
Order(目) Family(属) Species(种) 序列长度/bp GenBank登录号
Venerida
(帘蛤目)
Veneridae
(帘蛤科)
Paphia amabilis 19 629 NC_016889
Paphia textile 18 561 NC_016890
Paphia undulata 18 154 NC_016891
Macridiscus melanaegis 20 738 NC_045870
Macridiscus multifarius 20 171 NC_045888
Dosinia japonica 17 693 NC_038063
Dosinia troscheli 17 229 NC_037917
Dosinia altior 17 536 NC_037916
Mercenaria mercenaria 18 365 NC_048487
Meretrix lusoria 20 268 NC_014809
Meretrix meretrix 19 826 NC_013188
Meretrix petechialis 19 567 NC_012767
Meretrix lyrata 21 625 NC_022924
Saxidomus purpuratus 19 637 NC_026728
Cyclina sinensis 21 799 KU097333
Callista chinensis 19 703 NC_056193
Venerupis aspera 18 519 MN635724
Antigona lamellaris 17 532 MT254059
Ruditapes decussatus 18 995 NC_035757
Ruditapes philippinarum 22 089 NC_031332
Vesicomyidae
(囊螂科)
Calyptogena marissinica 17 374 NC_044766
Calyptogena magnifica 19 738 NC_028724
Calyptogena extenta 16 106 MF981085
Ectenagena elongata 16 827 NC_051454
Pliocardia ponderosa 16 275 MF981084
Archivesica gigas 15 674 MF959623
Arcticidae
(北极蛤科)
Arctica islandica 18 289 KF363951
Corbiculidae
(蚬科)
Corbicula fluminea 17 423 NC_046410
Corbicula japonica 17 426 MW646293
Corbicula leana 17 041 MW646295
Villorita cyprinoides 15 880 NC_050989
Mactridae
(马珂蛤科)
Lutraria maxima 17 082 NC_036766
Lutraria rhynchaena 16 927 NC_023384
Pseudocardium sachalinense 17 978 MG431821
Coelomactra antiquata 17 199 NC_021375
Mactra chinensis 17 285 NC_025510
Mactra quadrangularis 16 848 MW691169
Cardiida
(鸟蛤目)
Cardiidae
(鸟尾蛤科)
Acanthocardia tuberculata 16 104 NC_008452
Tridacnidae
(砗磲科)
Tridacna crocea 19 157 MK249738
Tridacna derasa 20 760 NC_039945
Tridacna squamosa 20 930 NC_026558
Donacidae
(斧蛤科)
Donax semiestriatus 17 044 NC_035984
Donax trunculus 17 365 NC_035985
Donax variegatus 17 195 NC_035986
Donax vittatus 17 070 NC_035987
Donax dysoni 16 908 MZ362260
Psammobiidae
(紫云蛤科)
Soletellina diphos 16 352 JN398363
Sanguinolaria ovalis 16 460 NC_042423
Gari elongata 16 766 NC_042422
Hiatula acuta 16 352 NC_042421
Soletellina chinensis 16 333 NC_042420
Solecurtidae
(截蛏科)
Solecurtus divaricatus 16 749 NC_018376
Tellinidae
(樱蛤科)
Moerella iridescens 16 799 NC_018371
Semelidae
(双带蛤科)
Semele scabra 17 117 NC_018374
Adapedonta
(贫齿蛤目)
Hiatellidae
(缝栖蛤科)
Panopea abrupta 15 381 NC_033538
Panopea generosa 15 585 NC_025635
Panopea globosa 15 469 NC_025636
Solenidae
(竹蛏科)
Solen grandis 16 784 NC_016665
Solen strictus 16 535 NC_017616
Myoida
(海螂目)
Myidae
(海螂科)
Mya arenaria 17 947 NC_024738
Lucinida
(满月蛤目)
Lucinidae
(满月蛤科)
Loripes lacteus 17 321 NC_013271
Lucinella divaricata 18 940 NC_013275

首先将比对好的数据导入IQ-TREE运行程序中, 进行卡方检验, 随后使用ModelFinder自动计算筛选最佳替换模型(TVM+F+R6)构建ML树(Nguyen et al, 2015; Kalyaanamoorthy et al, 2017)。使用MrBayes v3.2(Ronquist et al, 2012)程序进行贝叶斯分析, 结合MrMTgui中的PAUP 4.0、Modeltest 3.7和MrModeltest 2.3软件, 根据AIC信息准则(Posada et al, 1998; Swofford, 2002)选择最适合的替代模型(GTR+I+G)构建BI树。BI分析基于MCMC (Markov Chain Monte Carlo)抽样法, 每1000代抽样一次, 共运行200万代, 初始25%的采样数据作为老化数据丢弃, 最终得到一致树并计算后验概率(Posterior Probability, PP)。最后使用软件FigTree v1.4.3和Adobe Photoshop CC编辑得到的系统发育树图。

2 结果与分析 2.1 线粒体基因组结构与特征

经NCBI BLAST比对鉴定, 确定本研究所使用物种为狄氏斧蛤, 并将获得的狄氏斧蛤线粒体全基因组序列经注释后上传至NCBI数据库, GenBank序列号为MZ362260。狄氏斧蛤线粒体全基因组序列为典型的环状结构(图 1), 全长为16 908 bp, 碱基组成为A (26.81%)、T (41.13%)、G (21.21%)、C (10.85%); A+T含量为67.94%, 高于G+C的含量(32.06%), 表现出明显的AT偏向, 且AT偏斜值为–0.211, 而GC偏斜值为0.323。狄氏斧蛤线粒体全基因组序列共包含了13个蛋白编码基因, 22个tRNA基因和2个rRNA基因。

图 1 狄氏斧蛤线粒体基因组图谱 Fig. 1 The gene map of the mitochondrial genome of D. dysoni
2.2 狄氏斧蛤线粒体基因组rRNA、tRNA分析

狄氏斧蛤线粒体基因组序列中的两个rRNA (12S rRNA16S rRNA)分别由869个碱基和1 255个碱基组成, 其中12S rRNA位于tRNAGlytRNAMet之间, 而16S rRNA则位于编码基因ND6ATP6之间(表 2)。

表 2 狄氏斧蛤线粒体基因组成 Tab. 2 Annotation of the D. dysoni mitochondrial genome
基因 编码链 起止位置 长度/bp 起始/终止密码子 间隔长度 反密码子
COI + 1 1581 1 581 ATG/TAA 23
ND4 + 1605 2945 1 341 ATG/TAG 1
tRNAHis + 2947 3010 64 24 GTG
tRNASer2 + 3035 3097 63 3 TGA
tRNAGlu + 3101 3165 65 9 TTC
ND3 + 3175 3528 354 ATT/TAG 14
tRNAIle + 3543 3611 69 1 GAT
tRNALys + 3613 3678 66 1 CTT
ND4L + 3680 3970 291 ATG/TAA 1
tRNATyr + 3972 4038 67 –2 GTA
tRNAThr + 4037 4103 67 0 TGT
tRNALeu1 + 4104 4170 67 –1 TAG
tRNAAsp + 4170 4233 64 0 GTC
tRNALeu2 + 4234 4298 65 0 TAA
ND1 + 4299 5225 927 ATA/TAA 0
tRNAAsn + 5226 5290 65 19 GTT
ND5 + 5310 7028 1 719 ATT/TAA 7
tRNAArg + 7036 7099 64 108 TCG
Cytb + 7208 8332 1 125 ATG/TAA 1
COII + 8334 9188 855 ATG/TAA 6
tRNAVal + 9195 9261 67 2 TAC
tRNATrp + 9264 9329 66 2 TCA
tRNAGly + 9332 9395 64 3 TCC
12S rRNA + 9399 10267 869 66
tRNAMet + 11638 11706 69 12 CAT
ATP8 + 11719 11877 159 ATG/TAA –32
tRNASer1 + 11846 11913 68 86 TCT
ND6 + 12000 12485 486 ATA/TAA –20
16S rRNA + 12466 13720 1 255 34
ATP6 + 13755 14432 678 ATT/TAG 3
COIII + 14436 15219 784 ATG/TAA 180
ND2 + 15400 16398 999 ATT/TAA –15
tRNAPro + 16421 16486 66 4 TGG
tRNAGln + 16491 16558 68 –1 TTG
tRNACys + 16558 16622 65 20 GCA
tRNAAla + 16643 16707 65 0 TGC
tRNAPhe + 16708 16773 66 54 GAA

22个tRNA的序列总长度为1 450 bp, 长度范围为63~69 bp, 长度最短的为tRNASer2, 最长的为tRNAIletRNAMet。其中tRNASertRNALeu基因各有两个, 而除tRNASer基因缺失二氢尿嘧啶臂(DHU臂)外, 其余21个tRNA均含有典型的三叶草二级结构(图 2)。此外, 在氨基酸臂中, tRNAProtRNASer1各自存在1对U-U不配对。在反密码子茎中, 由于A-C转换造成的tRNAPro中G-A不配对, 由于C-T转换造成的tRNAMet中A-C不配对。在TΨC茎上, tRNALeu2有两对U-U不配对。

图 2 狄氏斧蛤线粒体tRNA二级结构 Fig. 2 The secondary structure of D. dysoni mitochondrial tRNA
2.3 狄氏斧蛤蛋白质编码基因分析

狄氏斧蛤线粒体基因组含有13个蛋白质编码基因(表 3), A+T含量均高于50%, 可见其在蛋白编码基因组中也具有AT偏好性。13个蛋白质编码基因(COⅠ、ND4ND3ND4LND1ND5CytbCOⅡ、ATP8ND6ATP6COⅢ、ND2)都在H链上编码蛋白。编码基因拥有3种起始密码子(ATG、ATT、ATA), 其中COⅠ、ND4ND4LCytbCOⅡ、ATP8COⅢ使用ATG作为起始密码子, ND3ND5ATP6ND2使用ATT作为起始密码子, 而ND1以及ND6则使用ATA作为起始密码子。在终止密码子的使用情况中, 狄氏斧蛤只有2种终止密码子, 除了ND3ND4以及ATP6使用TAG作为终止密码子, 其余所有蛋白质编码基因都使用TAA作为终止密码子。

表 3 狄氏斧蛤线粒体基因组碱基组成比较 Tab. 3 The skewness of the D. dysoni mitogenome
基因 长度/bp A/% T/% G/% C/% A+T/% G+C/% AT-skew GC-skew
mitogenome 16 908 26.81 41.13 21.21 10.85 67.94 32.06 –0.211 0.323
COI 1 581 24.92 39.41 21.82 13.85 64.33 35.67 –0.225 0.223
ND4 1 341 23.19 43.40 22.74 10.66 66.59 33.41 –0.304 0.362
ND3 354 20.90 44.35 24.86 9.89 65.25 34.75 –0.359 0.431
ND4L 291 20.96 46.05 23.37 9.62 67.01 32.99 –0.374 0.417
ND1 927 23.84 44.66 21.57 9.92 68.50 31.50 –0.304 0.370
ND5 1 719 23.85 44.85 22.51 8.78 68.70 31.30 –0.306 0.439
Cytb 1 125 23.73 42.40 20.71 13.16 66.13 33.87 –0.282 0.223
COII 855 27.02 38.71 24.91 9.36 65.73 34.27 –0.178 0.454
ATP8 159 22.01 42.77 26.42 8.81 64.78 35.22 –0.321 0.500
ND6 486 24.49 41.98 22.02 11.52 66.46 33.54 –0.263 0.313
ATP6 678 24.34 46.46 19.91 9.29 70.80 29.20 –0.312 0.364
COIII 784 22.07 41.20 22.58 14.16 63.27 36.73 –0.302 0.229
ND2 999 24.82 44.74 20.72 9.71 69.57 30.43 –0.286 0.362
2.4 狄氏斧蛤同义密码子相对使用频率(RSCU)分析

密码子平均使用频率和相对同义密码子平均使用频率如表 4图 3所示。狄氏斧蛤线粒体基因组13个蛋白质编码基因中存在32个偏好密码子(RSCU密码子), 密码子第三位点对A、T的偏好性与蛋白质编码基因密码子的第三位点对A、T偏向性相一致。密码子使用频率较高的为UUA (L)和GCU (A), 其次为GUU (V)、AUU (I)和AGU (S)等, 使用频率相对较低的为CGC (R)、CUC (L)和GUC (V)。在编码氨基酸的同义密码子中, 第3位点为A或者T的密码子使用频率较高。例如: 编码亮氨酸Leu (L)的同义密码子中, 密码子UUA (RSCU=2.4)使用频率远高于UUG (RSCU=1.16); 编码异亮氨酸Ile (I)的同义密码子中, 密码子AUU (RSCU=1.68)使用频率远高于密码子AUC (RSCU=0.32)。

表 4 狄氏斧蛤13个编码蛋白编码基因密码子使用频率 Tab. 4 The codon number and relative synonymous codon usage in the mitochondrial genomes of D. dysoni
密码子 出现次数 RSCU 密码子 出现次数 RSCU 密码子 出现次数 RSCU 密码子 出现次数 RSCU
UUU(F) 409 1.63 UCU(S) 76 1.28 UAU(Y) 255 1.51 UGU(C) 135 1.51
UUC(F) 92 0.37 UCC(S) 31 0.52 UAC(Y) 82 0.49 UGC(C) 44 0.49
UUA(L) 360 2.4 UCA(S) 49 0.83 UAA(*) 204 1.12 UGA(W) 96 0.84
UUG(L) 174 1.16 UCG(S) 22 0.37 UAG(*) 161 0.88 UGG(W) 132 1.16
CUU(L) 153 1.02 CCU(P) 38 1.65 CAU(H) 66 1.61 CGU(R) 33 1.57
CUC(L) 29 0.19 CCC(P) 18 0.78 CAC(H) 16 0.39 CGC(R) 1 0.05
CUA(L) 90 0.6 CCA(P) 22 0.96 CAA(Q) 40 1 CGA(R) 17 0.81
CUG(L) 95 0.63 CCG(P) 14 0.61 CAG(Q) 40 1 CGG(R) 33 1.57
AUU(I) 222 1.68 ACU(T) 55 1.46 AAU(N) 139 1.65 AGU(S) 99 1.67
AUC(I) 43 0.32 ACC(T) 24 0.64 AAC(N) 29 0.35 AGC(S) 36 0.61
AUA(M) 186 1.22 ACA(T) 45 1.19 AAA(K) 115 1.11 AGA(S) 86 1.45
AUG(M) 119 0.78 ACG(T) 27 0.72 AAG(K) 92 0.89 AGG(S) 76 1.28
GUU(V) 208 1.68 GCU(A) 75 2.03 GAU(D) 77 1.52 GGU(G) 126 1.66
GUC(V) 37 0.3 GCC(A) 19 0.51 GAC(D) 24 0.48 GGC(G) 35 0.46
GUA(V) 139 1.13 GCA(A) 30 0.81 GAA(E) 87 1.04 GGA(G) 64 0.84
GUG(V) 110 0.89 GCG(A) 24 0.65 GAG(E) 81 0.96 GGG(G) 79 1.04
注: *表示终止密码子; 括号内的字母表示各氨基酸名称的缩写; 表中加粗字体为氨基酸偏好密码子

图 3 狄氏斧蛤线粒体基因氨基酸组成及同义密码子使用频率 Fig. 3 Amino acid composition and relative synonymous codon usage (RSCU) in the mitogenomes of D. dysoni 注: a. 狄氏斧蛤线粒体基因氨基酸组成; b. 狄氏斧蛤线粒体基因同义密码子使用频率
2.5 樱蛤总科线粒体基因排序比较分析

对樱蛤总科贝类线粒体基因组的基因排序进行分析, 结果表明除紫云蛤科中的双线紫蛤(Soletellina diphos)、卵紫蛤(Sanguinolaria ovalis)、尖紫蛤(Hiatula acuta)和中国紫蛤(Soletellina chinensis)没有ATP8基因外, 其余物种都拥有完整的13个蛋白质编码基因(图 4); 五个科共有三种不同的排序方式, 其中斧蛤科、截蛏科、樱蛤科以及除紫云蛤科中的Gari elongata具有完全相同的基因排序。整个樱蛤总科中双带蛤科(Semelidae)的基因排序与其他科属区别最大, 双带蛤科在trnG-trnV-trnW-rrnS-cox2这一段基因排序中与其他科属不同点在于trnG、cox2和rrnS之间的易位, 其他物种在这段基因中的排序为cox2-trnV- trnW-trnG-rrnS, 除此之外其他物种之间的基因排序相似度都很高。狄氏斧蛤与本研究下载的所有同科物种都拥有相同的基因排列, 没有出现基因重排现象。

图 4 樱蛤总科线粒体基因排序比较 Fig. 4 Comparison of mitochondrial gene rearrangements of the superfamily Tellinoidea
2.6 系统发育树分析

基于最大似然法(ML)和贝叶斯推理(BI)两种方法作出的树型结构基本一致, 在大多数节点中都获得了较高的支持度(图 5)。本研究涉及了Imparidentia超目下的5个目, 其中鸟蛤目(Cardiida)、贫齿蛤目(Adapedonta)以及满月蛤目(Lucinida)分别为单系群; 帘蛤目(Venerida)的单系性不被支持; 由于海螂目(Myida)仅有一个物种参与建树, 其单系性无法验证。此外, 帘蛤目为多系群, 且帘蛤目中的帘蛤总科与同心蛤总科聚集在同一枝系, 北极蛤总科、花蚬总科和蛤蜊总科聚集在同一枝系。其中帘蛤目下的同心蛤总科与海螂蛤科的砂海螂(Mya arenaria)聚集在同一分支, 分支支持度很高; 狄氏斧蛤所属的樱蛤总科为单系群, 樱蛤总科与贫齿蛤目的缝栖蛤总科和竹蛏总科聚集在同一分支, 但分支支持度不高; 狄氏斧蛤与斧蛤属的另外四个物种(Donax semiestriatusDonax vittatusDonax trunculusDonax variegate)聚为一支, 与紫云蛤科、截蛏科、樱蛤科和双带蛤科互为姊妹群。本次研究中, 基于线粒体基因组构建的系统发育树分支支持将鸟蛤目列为单独的一个目, 并且将狄氏斧蛤所属的樱蛤总科划归到鸟蛤目中。

图 5 基于12个PCGs构建的狄氏斧蛤与其他双壳贝类系统发育树 Fig. 5 The phylogenetic tree of D. dysoni and other Bivalvia species based on 12 PCGs
3 讨论

通过研究狄氏斧蛤线粒体基因组碱基组成发现, 其基因组成呈现出明显的AT偏向性, 与大部分双壳贝类线粒体组成相似, 且在鱼类、鸟类、昆虫类等动物的线粒体基因中也都具有AT碱基偏好性特性(毛明光等, 2019; 赵婉清等, 2021; 雷莹等, 2021)。狄氏斧蛤线粒体基因组13个蛋白质编码基因都在H链上编码蛋白, 这与已报道的海水双壳贝类如小荚蛏(Feng et al, 2021)、等边浅蛤(夏立萍等, 2021)等在H链上编码蛋白一致, 而蒋文枰等(2010)指出造成这种情况的原因可能与它们生活在海水或淡水中有关, 但产生的机理还需要进一步研究。狄氏斧蛤含有完整的13个蛋白质编码基因, 其编码基因的种类和数目与多数双壳贝类类似, 而与仅含有12个蛋白质编码基因的真曲巴非蛤、文蛤以及短文蛤等不同(夏立萍等, 2021)。对于狄氏斧蛤的tRNA二级结构而言, 由于tRNASer没有明显的DHU茎环导致tRNASer已不能形成典型的三叶草结构, 这与在同一Imparidentia超目下的小荚蛏(Siliqua minima)的tRNA二级结构相似(Feng et al, 2021)。对于狄氏斧蛤密码子偏好性分析显示, 以NNU类型的密码子使用频率最高, 与其蛋白质编码基因组成中碱基T偏好性一致, 与文蛤属贝类结果类似(张志东等, 2019)。

线粒体基因组的重排可用于研究物种间的进化关系、系统发育的祖先谱系等, 双壳贝类的线粒体基因序列具有高度可变性, 是目前发现的后生动物中突变最多的物种(Serb et al, 2003)。研究樱蛤总科的基因排序关系时, 得出的结果显示只有紫云蛤科中的部分物种有ATP8基因的缺失, 根据之前的研究发现ATP8基因在软体动物中不是很保守, ATP8基因对自然选择的作用较为敏感, 因此具有较高的突变率(Mishmar et al, 2003); 整个樱蛤总科中, 只有双带蛤科基因排序与其他科属有部分不同, 这与远洋等(2012)研究的樱蛤总科与竹蛏总科的基因排序一致。同时, 基因排序的研究结果还可为后续系统发育分析提供相关信息。

从系统发育分析结果来看, 帘蛤目的单系性不被支持。构建的系统进化树分支将斧蛤科划归到樱蛤总科, 作为紫云蛤科、截蛏科、樱蛤科以及双带蛤科的姊妹群, 这与翁朝红等(2013)Fernández-Pérez等(2017)测定的分类结果一致; 从总科的单系性来看, 樱蛤总科下的五个科聚集在同一枝系且分支支持度较高, 证实了樱蛤总科的单系性, 这与Taylor等(2007)的研究结果一致, 并且在以往的研究中也提到过, 樱蛤总科是单系群(Combosch et al, 2017)。到目前为止对于帘蛤目和鸟蛤目的分类还没有统一的标准, 在有的研究中依然将鸟蛤目划归为帘蛤目中的一个科(Fernández-Pérez et al, 2017), 这可能与构建进化树时使用到的基因不同有关, 因此得到的进化树分支不同。此外, 在之前的研究里有的学者还建议将樱蛤总科中的截蛏科划归到帘蛤目中(王琳楠等, 2013), 相关的具体分类地位还需要进一步研究。

4 结论

本次研究利用生物信息学的方法, 在编码蛋白质水平进行了密码子偏好性分析, 明确了狄氏斧蛤的密码子偏好性及特征, 并基于线粒体基因组全序列构建了Imparidentia超目下部分贝类系统发育树, 分支支持将鸟蛤目列为单独的一个目, 并且将狄氏斧蛤所属的樱蛤总科划归到鸟蛤目中。研究结果可为斧蛤科贝类的物种鉴定和系统进化分析提供依据, 并可为狄氏斧蛤未来可持续发展及分子育种等工作提供理论基础。

参考文献
于贞贞, 2014. 异齿亚纲贝类DNA条形码与系统发生学研究[D]. 青岛: 中国海洋大学.
于红, 李琪, 远洋, 2011. 樱蛤总科线粒体基因组系统发生分析与海洋双壳贝类线粒体tRNA反密码子摆动碱基进化特性研究[C] // 中国海洋湖沼学会贝类学分会第九次会员代表大会暨第十五次学术讨论会会议摘要集. 广州: 中国海洋湖沼学会: 33.
王琳楠, 闫喜武, 秦艳杰, 等, 2013. 中国帘蛤目16种经济贝类DNA条形码及分子系统发育的研究. 大连海洋大学学报, 28(5): 431-437 DOI:10.3969/j.issn.2095-1388.2013.05.004
毛明光, 顾杰, 刘瑞婷, 等, 2019. 太平洋鳕线粒体全基因组测序及结构特征分析. 水生生物学报, 43(1): 17-26
远洋, 李琪, 于红, 等, 2012. 六种异齿亚纲双壳贝类的线粒体全基因组: 多变化的基因排列和系统发生的暗示[C] // 2012年中国水产学会学术年会论文摘要集. 郑州: 中国水产学会: 45.
张志东, 陈爱华, 吴杨平, 等, 2019. 5种文蛤属贝类线粒体基因密码子偏好性分析. 海洋渔业, 41(5): 589-595 DOI:10.13233/j.cnki.mar.fish.2019.05.006
张素萍, 2008. 中国海洋贝类图鉴. 北京: 海洋出版社
陈复生, 付承玉, 汪泰初, 2003. 动物线粒体基因分子系统学研究进展. 安徽农业科学, 31(4): 596-598, 601 DOI:10.3969/j.issn.0517-6611.2003.04.039
林巧惠, 2010. 池碟蚌线粒体全基因组序列分析[D]. 南昌: 南昌大学.
孟学平, 申欣, 赵娜娜, 等, 2013. 双壳类线粒体基因组结构分析. 水产科学, 32(12): 721-729 DOI:10.3969/j.issn.1003-1111.2013.12.007
赵婉清, 史淦琳, 高诗聪, 等, 2021. 盲蝽科线粒体蛋白编码基因的比较研究. 山西农业大学学报(自然科学版), 41(5): 96-103 DOI:10.13842/j.cnki.issn1671-8151.202105003
夏立萍, 徐鸣, 郭宝英, 等, 2021. 等边浅蛤线粒体全基因组测序和系统发育研究. 浙江海洋大学学报(自然科学版), 40(2): 93-100 DOI:10.3969/j.issn.1008-830X.2021.02.001
徐晓东, 吴相云, 喻子牛, 2009. 真曲巴菲蛤(Paphia euglypta)线粒体基因组全序列测定及比较基因组学研究[C] // 中国动物学会、中国海洋湖沼学会贝类学会分会第十四次学会研讨会论文摘要汇编. 南昌: 中国海洋湖沼学会: 132.
翁朝红, 谢仰杰, 肖志群, 等, 2013. 线粒体COⅠ和16S rRNA片段确定近江蛏和缢蛏属的分类地位. 水生生物学报, 37(4): 684-690
董依萌, 王天骄, 刘华淼, 等, 2020. 线粒体DNA和Y染色体主要基因的研究进展. 安徽农业科学, 48(8): 18-22 DOI:10.3969/j.issn.0517-6611.2020.08.004
蒋文枰, 李家乐, 郑润玲, 等, 2010. 褶纹冠蚌线粒体基因组全序列分析. 遗传, 32(2): 153-162
雷莹, 李静云, 白俊艳, 等, 2021. 鹌鹑线粒体cytb基因和ND2基因的系统发育分析. 黑龙江畜牧兽医, (21): 130-133
蔡英亚, 李海燕, 2002. 越南沿海的双壳纲软体动物. 湛江海洋大学学报, (04): 1-13 DOI:10.3969/j.issn.1673-9159.2002.04.001
ALJANABI S M, MARTINEZ I, 1997. Universal and rapid salt-extraction of high quality genomic DNA for PCR-based techniques. Nucleic Acids Research, 25(22): 4692-4693 DOI:10.1093/nar/25.22.4692
ALTSCHUL S F, MADDEN T L, SCHAFFER A A, et al, 1997. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research, 25(17): 3389-3402 DOI:10.1093/nar/25.17.3389
ANSELL A D, 1983. The biology of the genus donax [M] // MCLACHLAN A, ERASMUS T. Sandy Beaches as Ecosystems. Dordrecht: Springer: 607-635.
BIELER R, MIKKELSEN P M, 2006. Bivalvia—a look at the Branches. Zoological Journal of the Linnean Society, 148(3): 223-235 DOI:10.1111/j.1096-3642.2006.00255.x
BRETON S, BEAUPRÉ H D, STEWART D T, et al, 2009. Comparative mitochondrial genomics of freshwater mussels (Bivalvia: Unionoida) with doubly uniparental inheritance of mtDNA: gender-specific open reading frames and putative origins of replication. Genetics, 183(4): 1575-1589 DOI:10.1534/genetics.109.110700
COMBOSCH D J, COLLINS T M, GLOVER E A, et al, 2017. A family-level Tree of Life for bivalves based on a Sanger-sequencing approach. Molecular Phylogenetics and Evolution, 107: 191-208 DOI:10.1016/j.ympev.2016.11.003
DIERCKXSENS N, MARDULYN P, SMITS G, 2017. NOVOPlasty: de novo assembly of organelle genomes from whole genome data. Nucleic Acids Research, 45(4): e18 DOI:10.1093/nar/gkw955
FENG J T, GUO Y H, YAN C R, et al, 2021. Novel gene rearrangement in the mitochondrial genome of Siliqua minima (Bivalvia, Adapedonta) and phylogenetic implications for Imparidentia. PLoS One, 16(4): e0249446 DOI:10.1371/journal.pone.0249446
FERNÁNDEZ-PÉREZ J, NANTÓN A, MÉNDEZ J, 2018. Sequence characterization of the 5S ribosomal DNA and the internal transcribed spacer (ITS) region in four European Donax species (Bivalvia: Donacidae). BMC Genetics, 19(1): 97 DOI:10.1186/s12863-018-0684-x
FERNÁNDEZ-PÉREZ J, NANTÓN A, RUIZ-RUANO F J, et al, 2017. First complete female mitochondrial genome in four bivalve species genus Donax and their phylogenetic relationships within the Veneroida order. PLoS One, 12(9): e0184464 DOI:10.1371/journal.pone.0184464
HASSANIN A, LÉGER N, DEUTSCH J, 2005. Evidence for multiple reversals of asymmetric mutational constraints during the evolution of the mitochondrial genome of metazoa, and consequences for phylogenetic inferences. Systematic Biology, 54(2): 277-298 DOI:10.1080/10635150590947843
INGMAN M, KAESSMANN H, PÄÄBO S, et al, 2000. Mitochondrial genome variation and the origin of modern humans. Nature, 408(6813): 708-713 DOI:10.1038/35047064
KALYAANAMOORTHY S, MINH B Q, WONG T K F, et al, 2017. ModelFinder: fast model selection for accurate phylogenetic estimates. Nature Methods, 14(6): 587-589 DOI:10.1038/nmeth.4285
KUMAR S, STECHER G, TAMURA K, 2016. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets. Molecular Biology and Evolution, 33(7): 1870-1874 DOI:10.1093/molbev/msw054
MIAO J, FENG J T, LIU X J, et al, 2022. Sequence comparison of the mitochondrial genomes of five brackish water species of the family Neritidae: phylogenetic implications and divergence time estimation. Ecology and Evolution, 12(6): e8984
MISHMAR D, RUIZ-PESINI E, GOLIK P, et al, 2003. Natural selection shaped regional mtDNA variation in humans. Proceedings of the National Academy of Sciences of the United States of America, 100(1): 171-176 DOI:10.1073/pnas.0136972100
MUELLER R L, 2006. Evolutionary rates, divergence dates, and the performance of mitochondrial genes in Bayesian phylogenetic analysis. Systematic Biology, 55(2): 289-300 DOI:10.1080/10635150500541672
NGUYEN L T, SCHMIDT H A, VON HAESELER A, et al, 2015. IQ-TREE: a fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies. Molecular Biology and Evolution, 32(1): 268-274
POSADA D, CRANDALL K A, 1998. MODELTEST: testing the model of DNA substitution. Bioinformatics, 14(9): 817-818
RONQUIST F, TESLENKO M, VAN DER MARK P, et al, 2012. MrBayes 3.2: efficient bayesian phylogenetic inference and model choice across a large model space. Systematic Biology, 61(3): 539-542
SERB J M, LYDEARD C, 2003. Complete mtDNA sequence of the North American freshwater mussel, Lampsilis ornata (Unionidae): an examination of the evolution and phylogenetic utility of mitochondrial genome organization in Bivalvia (Mollusca). Molecular Biology and Evolution, 20(11): 1854-1866
SINGH Y T, 2017. Status of population dynamics of the Asian wedge clam, Donax scortum (Bivalvia: Donacidae): a first report from Asia. Journal of the Marine Biological Association of the United Kingdom, 97(8): 1635-1642
SWOFFORD D, 2002. PAUP*. Phylogenetic Analysis Using Parsimony (*and Other Methods), Version 4.0b10 [M]. Sunderland, MA, USA: Sinauer Associates.
TAYLOR J D, WILLIAMS S T, GLOVER E A, et al, 2007. A molecular phylogeny of heterodont bivalves (Mollusca: Bivalvia: Heterodonta): new analyses of 18S and 28S rRNA genes. Zoologica Scripta, 36(6): 587-606
TENJING S Y, 2017. Population dynamics of Donax faba (Family: Donacidae) in the coastal waters of Padukere, Karnataka (India). Iranian Journal of Fisheries Sciences, 16(1): 411-421
TONG Y, WU L, AYIVI S P G, et al, 2022. Cryptic species exist in Vietnamella sinensis hsu, 1936 (Insecta: Ephemeroptera) from studies of complete mitochondrial genomes. Insects, 13(5): 412
XU K F, KANNO M, YU H, et al, 2011. Complete mitochondrial DNA sequence and phylogenetic analysis of Zhikong scallop Chlamys farreri (Bivalvia: Pectinidae). Molecular Biology Reports, 38(5): 3067-3074
XU T, QI L, KONG L F, et al, 2022. Mitogenomics reveals phylogenetic relationships of Patellogastropoda (Mollusca, Gastropoda) and dynamic gene rearrangements. Zoologica Scripta, 51(2): 147-160
ZBAWICKA M, BURZYŃSKI A, SKIBINSKI D, et al, 2010. Scottish Mytilus trossulus mussels retain ancestral mitochondrial DNA: complete sequences of male and female mtDNA genomes. Gene, 456(1/2): 45-53
ZUKER M, 2003. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Research, 31(13): 3406-3415