作物杂志, 2025, 41(6): 83-90 doi: 10.16035/j.issn.1001-7283.2025.06.011

遗传育种·种质资源·生物技术

抗列当食用向日葵杂交种经葵1408叶绿体基因组特征及密码子偏好性分析

马军,1, 张祥雷2, 安呈洁2, 杨学文3, 张博琳2, 张武,2, 王鹏冬,4

1 黑龙江省农业科学院经济作物研究所150086黑龙江哈尔滨

2 佳木斯大学理学院154007黑龙江佳木斯

3 佳木斯大学生物与农业学院154007黑龙江佳木斯

4 山西农业大学经济作物研究所030031山西太原

Chloroplast Genome Characteristics and Codon Bias Analysis of Anti-Broomrape Confectionery Sunflower Hybrid Jingkui 1408

Ma Jun,1, Zhang Xianglei2, An Chengjie2, Yang Xuewen3, Zhang Bolin2, Zhang Wu,2, Wang Pengdong,4

1 Institute of Industrial Crops, Heilongjiang Academy of Agricultural Sciences, Harbin 150086, Heilongjiang, China

2 College of Science, Jiamusi University, Jiamusi 154007, Heilongjiang, China

3 College of Biology and Agriculture, Jiamusi University, Jiamusi 154007, Heilongjiang, China

4 Research Institute of Economic Crops, Shanxi Agricultural University, Taiyuan 030031, Shanxi, China

通讯作者: 王鹏冬,研究方向为作物种质资源与遗传育种,E-mail:wangppdd@126.com张武为共同通信作者,研究方向为生物物理学,E-mail:zw19700@126.com

收稿日期: 2024-07-26   修回日期: 2024-09-26   网络出版日期: 2025-02-25

基金资助: 黑龙江省农业科技创新跨越工程―经济作物突破性新品种选育及产业化应用(GX23GG04)
吕梁市重点研发项目(2022NYGG15)

Received: 2024-07-26   Revised: 2024-09-26   Online: 2025-02-25

作者简介 About authors

马军,研究方向为作物种质资源与遗传改良,E-mail:wangyimajun@126.com

摘要

为探究抗列当食用向日葵杂交种经葵1408的叶绿体基因组特征及密码子偏好性,通过高通量测序技术获取其全基因组数据,对其叶绿体基因组进行组装和注释,筛选出50条编码序列(coding sequence,CDS)用于密码子偏好性分析。结果显示,经葵1408的叶绿体基因组总长151 100 bp,包含1对IR区(inverted repeat)、1个大单拷贝区(large single-copy region,LSC)和1个小单拷贝区(small single-copy region,SSC);共注释出129个基因,其中有85个基因编码蛋白质,8个基因编码rRNA,36个基因编码tRNA。50条CDS序列GC1、GC2、GC3和GCall平均GC含量分别为47.06%、39.29%、28.36%和38.24%,有效密码子数(ENC)平均值为47.62;中性绘图分析和PR2-plot偏倚分析表明密码子使用偏好主要受到自然选择影响;50条CDS共有20 244个密码子,最优密码子为CUU、CCA、ACU、GCU、UAU、CAU、AAA、GAU和GGA。

关键词: 叶绿体基因组; 密码子偏好性; 向日葵

Abstract

In order to explore the chloroplast genome characteristics and codon bias of anti-broomrape confectionery sunflower hybrid Jingkui 1408, the whole genome data were obtained by high-throughput sequencing technology, and the chloroplast genome was assembled and annotated, and 50 coding sequences (CDS) were screened for codon bias analysis. The results showed that the total chloroplast genome of JK1408 was 151 100 bp, including a pair of inverted repeat regions, a large single-copy region, and a small single-copy region. A total of 129 genes were annotated, of which 85 genes encoded proteins, 8 genes encoded rRNA, and 36 genes encoded tRNA. The average GC content of GC1, GC2, GC3, and GCall in the 50 CDS sequences was 47.06%, 39.29%, 28.36% and 38.24%, respectively, and the average value of effective number of valid codons (ENC) was 47.62. Neutrality plot analysis and PR2-plot bias analysis showed that codon use bias was mainly influenced by natural selection; There are 20 244 codons in 50 CDS, and the optimal codons are CUU, CCA, ACU, GCU, UAU, CAU, AAA, GAU, and GGA.

Keywords: Chloroplast genome; Codon bias; Sunflower

PDF (1037KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

马军, 张祥雷, 安呈洁, 杨学文, 张博琳, 张武, 王鹏冬. 抗列当食用向日葵杂交种经葵1408叶绿体基因组特征及密码子偏好性分析. 作物杂志, 2025, 41(6): 83-90 doi:10.16035/j.issn.1001-7283.2025.06.011

Ma Jun, Zhang Xianglei, An Chengjie, Yang Xuewen, Zhang Bolin, Zhang Wu, Wang Pengdong. Chloroplast Genome Characteristics and Codon Bias Analysis of Anti-Broomrape Confectionery Sunflower Hybrid Jingkui 1408. Crops, 2025, 41(6): 83-90 doi:10.16035/j.issn.1001-7283.2025.06.011

叶绿体是植物特有的细胞器,在植物细胞中扮演能量转换的角色,并参与多个重要的生命活动[1]。叶绿体基因组结构简单,长度一般在107~218 kb,包含大量的遗传信息,叶绿体具有独立于细胞核的基因组,与核基因组相比,叶绿体基因组具有拷贝数高、进化速率适中且全基因组序列更容易获取等特点。随着测序技术的发展,叶绿体基因组研究迅速,叶绿体全基因组学成为物种鉴定分类和基因组进化分析的重要工具。目前,在NCBI数据库上收集的向日葵属叶绿体完整基因组仅有60个,亟需补充更多的向日葵属叶绿体基因组数据,从而理清菊科植物系统发育进化过程,为菊科植物向日葵品种的定位、分类、开发与改良奠定基础。

生物体内普遍存在同义密码子非均衡使用的现象,即密码子偏好性。密码子偏好性与基因表达相关,在分子进化和基因翻译调控等方面的研究[2]发现物种不同基因在密码子使用上存在偏好性,即便是同一物种不同功能的基因其密码子使用也存在较大的偏好性。密码子使用偏好性现象在许多物种中广泛存在,然而物种不同、基因在细胞器中位置不同,影响偏好性的因素及程度也大不相同[3]。密码子使用偏好性模式、成因分析在基因组学研究中有重要意义[4],密码子使用偏好性对基因组进化有极深的影响[5]

向日葵作为一种重要的特色油料作物,有着非常显著的经济价值。向日葵原产于美洲,发展于欧洲,而后传入亚洲。我国向日葵种质资源匮乏,大多数种质资源存在遗传背景狭窄和谱系溯源不清等问题。在已登记的向日葵品种中“一品多名”现象尤为突出,严重制约我国向日葵种业的创新与发展。作物种质资源是作物新品种选育的基础材料,生产推广的栽培品种是向日葵种质资源来源的重要途径之一。抗列当食用向日葵杂交种经葵1408是食用向日葵杂交种[登记编号GPD向日葵(2021)140009],具有品种权保护,授权号为CNA20211008289,该品种作为山西省农业农村厅优选出的适宜农业生产的主推品种,具有抗列当和抗菌核病的优良特性。本研究对食用向日葵杂交种经葵1408叶绿体全基因组数据(GenBank登录号:PQ009581)进行分析,在叶绿体基因组水平上为人们利用优质向日葵种质资源创新改良食用向日葵品种提供数据支持。

1 材料与方法

1.1 试验材料

试验材料为食用向日葵杂交种经葵1408(JK1408),由山西农业大学经济作物研究所提供,提取的全基因组DNA委托华大基因股份有限公司进行高通量测序获取测序数据,对基因组数据进行叶绿体基因组组装[6](NOVOPlasty 4.3.1)和注释(Geneious 9.0.2),叶绿体基因组物理图谱采用OGDRAW软件绘制[7]

1.2 密码子相关参数与绘图分析

使用Geneious 9.0.2软件筛选用于密码子偏好性分析的CDS,使用CondoW计算其密码子偏好参数,使用SPSS 19软件做数据相关性分析[8]。中性绘图、ENC-plot绘图和PR2-plot分析参考陈晓丹等[1]和王雪等[9]的方法。选取RSCU>1的密码子为高频密码子,对50条CDS按照ENC值由小到大的顺序进行排序,计算ΔRSCU值(RSCUhigh- RSCUlow),ΔRSCU≥0.08为高表达密码子[10]

2 结果与分析

2.1 JK1408叶绿体基因组结构与特征

JK1408的叶绿体基因组呈现典型的四分体结构,全长151 100 bp,LSC长度为83 531 bp,占全长55.3%;SSC长度为18 319 bp,占全长12.1%;IR的长度均为24 625 bp,共占全长32.6%(图1)。

图1

图1   JK1408叶绿体基因组物理图谱

Fig.1   Physical map of the chloroplast genome in JK1408


2.2 叶绿体基因组注释

JK1408叶绿体基因组共注释出129个基因,其中编码蛋白质基因85个,编码rRNA基因8个,编码tRNA基因36个。蛋白质编码基因中,复制相关基因29个,光合作用相关基因46个,其他功能基因6个,未知功能基因4个。LSC区共有81个基因,其中编码蛋白基因60个,编码tRNA基因21个。SSC区共有12个基因,其中编码蛋白基因11个,编码tRNA基因1个。反向重复区IRa区与IRb区各有17个基因,其中编码tRNA基因7个,编码蛋白质基因6个,编码rRNA基因4个。注释结果还表明,在JK1408叶绿体基因组中蛋白质编码基因rps19位于IRb与LSC的边界,蛋白质编码基因ycf1位于IRb与LSC的边界。注释结果中还有一个5′端位于LSC区,3′端位于2个IR区的分裂基因rps12图1表1)。

表1   JK1408叶绿体基因组基因分类

Table 1  Gene classification of the chloroplast genome in JK1408

功能
Function
家族
Family name
基因代码
Code
基因
Gene
复制基因
Duplicate gene
核糖体小亚基
rps
rps11,rps12,rps12,rps14,rps15,rps16,rps18,rps19,rps2,rps3,rps4,rps7,rps7,rps8
rRNArrnrrn16,rrn23,rrn4.5,rrn5,rrn5,rrn4.5,rrn23,rrn16
核糖体大亚基
rpl
rpl14,rpl16,rpl2,rpl2,rpl20,rpl22,rpl23,rpl23,rpl32,rpl33,rpl36
脱氧核糖核酸依赖性RNA聚合酶rporpoA,rpoB,rpoC1,rpoC2
tRNA




trn




trnM-CAU,trnL-CAA,trnV-GAC,trnI-GAU,trnA-UGC,trnR-ACG,trnN-GUU,trnL-UAG,trnN-GUU,trnR-ACG,trnA-UGC,trnI-GAU,
trnV-GAC,trnL-CAA,trnM-CAU,trnP-UGG,trnW-CCA,trnM-CAU,trnV-UAC,trnF-GAA,trnL-UAA,trnT-UGU,trnS-GCU,trnfM-CAU,trnG-GCC,trnS-UGA,trnT-GGU,trnG-UCC,trnR-UCU,trnE-UUC,trnY-GUA,trnD-GUC,trnC-GCA,trnS-GCU,trnQ-UUG,trnH-GUG
光合作用基因
Photosynthesis gene
ATP合酶亚基atpatpA,atpB,atpE,atpF,atpH,atpI
NADH-脱氢酶亚基
ndh
ndhA,ndhB,ndhB,ndhC,ndhD,ndhE,ndhF,ndhG,ndhH,ndhI,ndhJ,ndhK
细胞色素b/f复合物的亚基petpetA,petB,petD,petG,petL,petN
光系统I的亚基psapsaA,psaB,psaC,psaI,psaJ,ycf3
光系统II的亚基
psb
psbH,psbA,psbB,psbC,psbD,psbE,psbF,psbL,psbI,psbJ,psbK,psbM,psbN,psbT,psbZ
二磷酸核酮糖氧合酶/羧化酶亚基rbcrbcL
其他基因Other gene乙酰辅酶A-羧化酶亚基accaccD
包膜蛋白基因cemcemA
c型细胞色素合成基因ccsccsA
蛋白酶基因clpclpP
成熟酶基因matmatK
平移起始因子InfinfA
未知基因Unknown gene假定叶绿体阅读框ycfycf1,ycf2,ycf2,ycf4

新窗口打开| 下载CSV


2.3 密码子偏好性分析

在JK1408叶绿体全基因组中,共获得129条CDS,为减小误差选取序列长度大于300 bp的CDS,共计50条用于分析密码子偏好性获取相关参数。50条CDS的GC1、GC2、GC3和GCall平均GC含量分别为47.06%(32.82%~59.39%)、39.29%(27.43%~55.47%)、28.36%(18.63%~36.91%)和38.24%(29.7%~45.74%)(表2),平均GC含量GC1>GC2>GC3,表明密码子第1、2和3位的碱基种类含量存在差异,第3位碱基的GC值较小,JK1408叶绿体基因密码子偏向于以A或U(T)作为第3位碱基。以有效密码子数(ENC)=45为标准衡量基因密码子使用偏好性程度,取值范围在20~61,20表示每个氨基酸只有1个有效密码子数,61表示所有的密码子都均衡使用。50条CDS的ENC值大于45的有37个基因(占比74%),小于45的有13个(占比26%)。ENC值最大的是ycf3基因,为59.17,最小的是rpl22基因,为39.13。ENC平均值为47.62,表明JK1408叶绿体基因密码子使用偏好性较弱[9]。分析发现,JK1408叶绿体基因组密码子适应指数(CAI)平均值为0.1719,更为接近0,与ENC值共同表明密码子使用偏好性较弱。JK1408叶绿体基因组最优密码子使用频率(FOP)平均值为0.3537,表明最优密码子的使用程度并不高。

表2   JK1408叶绿体基因组密码子不同位置的GC含量及ENC值

Table 2  GC contents and ENC values of codons at different locations in the chloroplast genome of JK1408

基因
Gene
GC1
(%)
GC2
(%)
GC3
(%)
GCall
(%)
有效密码子数
ENC
基因
Gene
GC1
(%)
GC2
(%)
GC3
(%)
GCall
(%)
有效密码子数
ENC
ycf444.3240.5430.2738.3851.04psaA52.8643.6832.7643.1049.59
ycf347.3438.4632.5439.4559.17petD51.5539.1327.3339.3439.25
ycf241.8934.2436.9137.6852.81petB49.0741.6727.3139.3543.52
ycf134.9427.4326.6129.7046.14petA52.6537.3830.8440.2950.97
rps841.4840.7428.1536.7948.57ndhK43.8144.2526.5538.2051.26
rps753.2146.1523.7241.0346.00ndhJ50.9437.1130.8239.6243.40
rps453.4739.6028.7140.5952.21ndhI41.9235.9325.7534.5343.82
rps346.1233.3323.7434.4043.16ndhH50.2536.0428.1738.1649.79
rps243.4643.0427.4337.9746.26ndhG45.7633.9028.2535.9752.00
rps1834.3142.1625.4933.9944.76ndhF36.9635.8924.6032.4845.30
rps1444.5547.5233.6641.9139.24ndhE42.1634.3118.6331.7043.98
rps1154.7455.4727.0145.7450.38ndhC45.4533.0624.7934.4448.97
rpoC246.5237.4930.4538.1550.87ndhB41.2938.5532.0937.3148.60
rpoC150.2936.5226.2337.6848.88ndhA45.0539.8418.9634.7141.16
rpoB50.5237.3227.8038.5548.50matK38.5234.3327.9433.6046.82
rpoA44.3532.1429.7635.4251.62clpP59.3938.0730.4642.6450.07
rpl2239.3540.0023.8734.4139.13cemA39.1328.2630.8732.7549.80
rpl2037.8045.6727.5637.0146.96ccsA32.8237.1524.7731.5849.45
rpl250.1847.2733.4543.6456.40atpI50.4037.9028.2338.8446.54
rpl1456.1037.4026.8340.1145.15atpF46.4932.4332.9737.3051.82
rbcL57.0043.0030.8643.6247.42atpE52.9641.0425.3739.8051.30
psbD52.2643.2232.4942.6644.10atpB55.7141.6829.0642.1548.21
psbC53.3846.2029.5443.0443.82atpA56.1939.4925.1540.2746.83
psbB53.8345.9730.4543.4247.88accD42.2035.7630.3536.1150.67
psbA50.0043.5033.0542.1841.16平均Average47.0639.2928.3638.2447.62
psaB48.0343.4029.2540.2346.17

新窗口打开| 下载CSV


对JK1408叶绿体基因组筛选出的50条CDS的GC含量和ENC值进行相关性分析(表3),GC1与GC2、GC1与GCall、GC2与GCall、GC3与GCall、GC3与ENC相关性为极显著水平,密码子第1、2位碱基的成分相似,而第3位碱基组成与前2位碱基具有一定差异,这导致GC3与GC1、GC2二者含量之间的相关性均不显著;ENC与GC1、GC2之间无显著相关性,但与GC3含量具有极显著相关性,说明第3位碱基含量变化会对JK1408叶绿体基因组密码子偏好性产生重要影响。

表3   JK1408叶绿体基因组密码子数各位置GC含量与ENC值的相关性分析

Table 3  Correlation analysis between GC content and ENC value of codon number in chloroplast genome of JK1408

指标
Index
GC1GC2GC3GCall有效密码子数
ENC
GC20.389**
GC30.2100.111
GCall0.838**0.737**0.498**
有效密码子数ENC0.084-0.1140.391**0.121
密码子数N-0.141-0.277*0.280-0.1230.157

*”代表显著相关(P < 0.05);“**”代表极显著相关(P < 0.01)。

*”indicates significant correlation (P < 0.05);“**”indicates extremely significant correlation (P < 0.01).

新窗口打开| 下载CSV


通过对氨基酸密码子的相对同义密码子(RSCU)值分析(表4)可知,50条CDS共有20 244个密码子,亮氨酸(Leu)数量最多,具有2154个密码子,占比10.7%;半胱氨酸(Cys)数量最少,只有217个密码子,占比1.1%。结果显示,RSCU值>1的密码子有32个,其中16个密码子的第3位碱基为U,13个密码子的第3位碱基为A,3个密码子的第3位碱基为G,表明JK1408偏好于使用A/U作为密码子的末尾碱基。

表4   JK1408叶绿体基因组各氨基酸的RSCU分析

Table 4  RSCU analysis of amino acids in the chloroplast genome of JK1408

氨基酸
Amino
acid
密码子
Codon
数目
Number
相对
同义
密码子
RSCU
氨基酸
Amino
acid
密码子
Codon
数目
Number
相对
同义
密码子
RSCU
苯丙氨酸
Phe
UUU7681.35丙氨酸
Ala
GCU5091.77
UUC3680.65GCC1820.63
亮氨酸
Leu
UUA6901.92GCA3351.16
UUG4581.28GCG1270.44
CUU4581.28酪氨酸
Tyr
UAU6281.63
CUC1280.36UAC1420.37
CUA2890.81组氨酸
His
CAU3571.5
CUG1310.36CAC1190.5
异亮氨酸
Ile
AUU8361.46谷氨酰胺
Gln
CAA5701.53
AUC3400.6CAG1760.47
AUA5360.94天冬酰胺
Asn
AAU7901.57
甲硫氨酸
Met
AUG
473
1
AAC
214
0.43
缬氨酸
Val
GUU3951.46赖氨酸
Lys
AAA7881.49
GUC1330.49AAG2670.51
GUA4101.51天冬氨酸
Asp
GAU6631.58
GUG1460.54GAC1760.42
丝氨酸
Ser
UCU4411.77谷氨酸
Glu
GAA8221.51
UCC2190.88GAG2670.49
UCA3041.22半胱氨酸
Cys
UGU1571.45
UCG1190.48UGC600.55
AGU
326
1.31
色氨酸
Trp
UGG
367
1
AGC820.33精氨酸
Arg
AGA3621.84
脯氨酸
Pro
CCU3441.61AGG1230.62
CCC1450.68CGU2751.39
CCA2341.09CGC780.4
CCG1340.63CGA2601.32
苏氨酸
Thr
ACU4071.64CGG850.43
ACC1870.75甘氨酸
Gly
GGU4701.35
ACA3031.22GGC1590.46
ACG940.38GGA5361.53
GGG2320.66

新窗口打开| 下载CSV


2.4 ENC-plot分析

由JK1408叶绿体基因组密码子ENC-plot图分析(图2)可知,较多基因没有沿标准曲线分布,而是落在标准曲线下方。从JK1408叶绿体基因组ENC比值频数分布(表5)看,50个基因中,[-0.05,0.05)有22个(占比44%),这22个基因与标准曲线更近,即与预期ENC值更为接近,表明这些基因的密码子使用偏好性仅受或主要受突变压力影响,其他28个占比56%,这28个基因与标准曲线较远,即与预期ENC值较远,表明这些基因受自然选择影响较大。综上,自然选择和突变压力对密码子的使用偏好性均有不同程度的影响,但更多受自然选择影响[1]

图2

图2   JK1408叶绿体基因组ENC-plot分析

Fig.2   ENC-plot analysis in the chloroplast genome of JK1408


表5   JK1408叶绿体基因组ENC比值频数分布表

Table 5  Frequency distribution of ENC ratio in the chloroplast genome of JK1408

组段
Class range
组中值
Class mid value
频数
Frequency number
频率
Frequency (%)
[-0.15,-0.05)-0.1012
[-0.05,0.05)0.002244
[0.05,0.15)0.102040
[0.15,0.25)0.20612
[0.25,0.35)0.3012
合计Total0.50501

新窗口打开| 下载CSV


2.5 中性绘图及PR2-plot分析

JK1408叶绿体基因组的中性绘图分析(图3)表明,GC12含量在18.63%~36.91%,GC3含量在31.18%~55.11%,相关系数为0.199,回归系数为0.1475,第1、2与第3位碱基的组成成分相关性较小,突变压力对JK1408的密码子使用偏好性影响仅占14.75%,自然选择对密码子使用模式产生了重要影响[8]

图3

图3   JK1408叶绿体基因组中性绘图分析

Fig.3   Neutrality plot analysis in the chloroplast genome of JK1408


由PR2-plot偏倚分析(图4)可知,50条CDS在PR2偏倚图中分布不均衡,第4象限内分布较多,中心点(0.5,0.5)左侧有18个基因,右侧有32个基因;中心点(0.5,0.5)上方有16个基因,下方有34个基因,没有基因落在中心点上,表明密码子第3位碱基的使用频率存在显著差异,G>C、T>A,如JK1408叶绿体基因密码子偏好性仅受或更多地受自身碱基突变影响,那么4种碱基使用频率应该相等或相近,在PR2偏倚分析图(图4)中各基因应该富集于中心,但结果显示存在离散分布,并未完全集中,表明自然选择仍是影响JK1408叶绿体基因密码子使用偏好的重要因素。

图4

图4   JK1408叶绿体基因组PR2-plot偏倚分析

Fig.4   PR2-plot bias analysis in the chloroplast genome of JK1408


2.6 最优密码子的确定

按照50条CDS的ENC值由小到大排序,用ENC值小的高表达基因(rpl22、rps14、petD、psbA、ndhA)和ENC值大的低表达基因(ndhD、rps4、ycf2、rpl2、ycf3)建立高、低表达库(表6),计算ΔRSCU(ΔRSCU=RSCUhigh-RSCUlow),结果显示,ΔRSCU≥0.08的密码子有32个。当密码子同时满足2个条件即密码子高表达(ΔRSCU≥0.08)和密码子高频出现(RSCU≥1)时,该密码子即为最优密码子[10]。经过计算,JK1408的叶绿体基因密码子偏爱A/U结尾,最优密码子为CUU、CCA、ACU、GCU、UAU、CAU、AAA、GAU和GGA。

表6   JK1408叶绿体基因组最优密码子的确定

Table 6  Determination of the optimal codon for the chloroplast genome of JK1408

氨基酸
Amino
acid
密码子
Codon
高表达基因
High expression gene
低表达基因
Low expression gene
相对
使用度
差值
ΔRSCU
氨基酸
Amino
acid
密码子
Codon
高表达基因
High expression gene
低表达基因
Low expression gene
相对
使用度
差值
ΔRSCU
数目
Number
相对同义
密码子
RSCU
数目
Number
相对同义
密码子
RSCU
数目
Number
相对同义
密码子
RSCU
数目
Number
相对同义
密码子
RSCU
苯丙氨酸
Phe
UUU911.33361.57-0.24丙氨酸
Ala
GCU*461.61401.470.14
UUC*860.67240.430.24GCC***220.9070.280.62
亮氨酸
Leu
UUA671.74512.33-0.59GCA310.90281.66-0.76
UUG771.24251.39-0.16GCG130.5990.590.00
CUU*821.31281.080.23酪氨酸
Tyr
UAU*911.45281.340.11
CUC**280.4820.150.33UAC240.55150.66-0.11
CUA480.84270.90-0.06组氨酸
His
CAU**621.66111.170.49
CUG*260.3950.140.24CAC170.3470.43-0.09
异亮氨酸
Ile
AUU991.29551.77-0.48谷氨酰胺
Gln
CAA751.28221.69-0.41
AUC*580.59180.340.25CAG**380.7240.310.41
AUA*791.12250.880.23天冬酰胺
Asn
AAU1301.40341.44-0.04
甲硫氨酸
Met
AUG
58
1.00
30
1.00
0.00
AAC
45
0.60
16
0.56
0.04
缬氨酸
Val
GUU360.98271.85-0.87赖氨酸
Lys
AAA*1201.62341.390.23
GUC***230.6440.140.50AAG*620.3860.210.17
GUA301.38331.76-0.38天冬氨酸
Asp
GAU*1231.61241.360.25
GUG***270.1040.250.74GAC300.3960.64-0.25
丝氨酸
Ser
UCU671.31271.240.08谷氨酸
Glu
GAA1001.48461.68-0.19
UCC471.05161.31-0.26GAG*540.52110.320.19
UCA571.41191.65-0.24半胱氨酸
Cys
UGU211.3281.80-0.48
UCG**300.7130.270.44UGC**110.6810.200.48
AGU*
45
1.34
20
1.20
0.14
色氨酸
Trp
UGG
47
1.00
26
1.00
0.00
AGC140.1760.32-0.16精氨酸
Arg
CGU322.17202.42-0.24
脯氨酸
Pro
CCU361.18291.97-0.79CGC**180.5630.250.31
CCC*260.8490.570.27CGA381.02121.15-0.14
CCA*411.26151.070.19CGG*170.4130.260.15
CCG**180.7260.390.33AGA611.25151.59-0.34
苏氨酸
Thr
ACU*481.59221.400.19AGG*340.5940.340.25
ACC*220.77110.640.12甘氨酸
Gly
GGU451.05481.77-0.72
ACA401.25231.60-0.35GGC90.19100.32-0.13
ACG190.3820.350.04GGA***691.78221.260.52
GGG**400.9780.640.33

*”:ΔRSCU≥0.08;“**”:ΔRSCU≥0.30;“***”:ΔRSCU≥0.50;下划线显示RSCU>1.00;加粗显示的密码子表示其为最优密码子。

The underlined indicates RSCU > 1; The bolded codon indicates the optimal codon.

新窗口打开| 下载CSV


3 讨论

叶绿体基因组拷贝数高、进化速率适中且全基因组序列更容易获取的特点使得其在物种鉴定、分类、系统发育分析和基因工程等方面呈现出巨大的利用价值。本研究通过高通量二代测序技术获取了JK1408的全基因组数据,组装过程确定MK341450作为最佳参考序列,MK341450是MAX1细胞质类型的向日葵栽培品种,初步判断JK1408为MAX1细胞质类型,更加清晰的证据需要后续线粒体基因组的研究补充。有关黎平瘤果茶[11]、蒺藜苜蓿[12]、再力花[13]、绣球[14]和西南牡蒿[15]的研究支持大多数高等植物的叶绿体基因组呈现双链环状四分体结构,本研究得出的双链环状四分体结构与其结果一致。研究[9]显示,10个一年生栽培型向日葵叶绿体基因组序列长度在151 100~151 150 bp,所有材料均注释出127个基因,而本研究组装的JK1408的叶绿体基因组大小为151 100 bp,注释出129个基因,由于油用和食用向日葵种质来源不同,系统发育定位不清晰,在组装注释过程中参考基因组的选择存在一定的局限性,注释结果因而产生偏差。

密码子偏好性问题在生物学研究中一直是热点话题,突变压力、自然选择、基因重组、基因遗传漂变以及基因水平转移等因素在物种的长期进化中均可能影响到密码子的偏好性,而突变压力和自然选择是主要因素[16]。本研究中JK1408的ENC平均值为47.62,CAI平均值为0.1719,FOP平均值为0.3537,表明该品种密码子使用偏好性较弱,最优密码子的使用程度并不高,在裸果木[1]、人参[17]、菘蓝[18]、百合属[19]及柏科[20]等大多数植物的叶绿体基因组密码子偏好性研究中均显示其偏好性较弱,这也揭示了植物叶绿体基因组密码子使用模式相对保守的现象。相关性分析表明第3位碱基含量变化会对JK1408叶绿体基因组密码子偏好性产生重要影响,多数研究支持这种现象,如梁山慈竹[21]、硬尖神香草和欧神香草[22]、栽培大麦和野生大麦[23]、裸果木[1]、人参[17]及菘蓝[18]。JK1408叶绿体基因组密码子ENC-plot图、中性绘图分析和PR2-plot偏倚分析显示自然选择和突变压力对不同基因的密码子的偏好性影响程度不同,自然选择对密码子使用模式产生了重要影响,这与王雪等[9]的研究结果一致。本研究确定了JK1408叶绿体基因组中均以A/U结尾的最优密码子CUU、CCA、ACU、GCU、UAU、CAU、AAA、GAU和GGA,为密码子偏好性方面的应用如预测未知蛋白基因位置、提高基因工程中目的基因表达量等提供了理论支撑。

4 结论

通过高通量测序技术获取了JK1408全基因组数据,组装、注释其叶绿体基因组并绘制了物理图谱,JK1408叶绿体基因组信息的释放丰富了向日葵叶绿体基因组构建的系统进化树,有助于理清向日葵品种的系统发育关系,寻找不同品种间的叶绿体基因组高变异区域还可以进行品种的鉴定,更好地服务于向日葵育种工程。系统分析JK1408的密码子偏好性,发现JK1408的密码子使用模式受自然选择主导,确定了9个均以A/U结尾的最优密码子CUU、CCA、ACU、GCU、UAU、CAU、AAA、GAU和GGA。

参考文献

陈晓丹, 冯玉玺, 郭海洋, .

裸果木叶绿体基因组密码子使用偏性分析

分子植物育种, 2023, 21(23):7715-7724.

[本文引用: 5]

吴宪明, 吴松锋, 任大明, .

密码子偏性的分析方法及相关研究进展

遗传, 2007, 29(4):420-426.

[本文引用: 1]

赵耀, 刘汉梅, 顾勇, .

玉米waxy基因密码子偏好性分析

玉米科学, 2008, 16(2):16-21.

[本文引用: 1]

唐晓芬, 陈莉, 马玉韬.

密码子使用偏性量化方法研究综述

基因组学与应用生物学, 2013, 32(5):660-666.

[本文引用: 1]

Sharp P M, Matassi G.

Codon usage and genome volution

Current Opinion in Genetics & Development, 1994, 4(6):851-860.

[本文引用: 1]

Dierckxsens N, Mardulyn P, Smits G.

NOVOPlasty: de novo assembly of organelle genomes from whole genome data

Nucleic Acids Research, 2017, 45(4):e18.

[本文引用: 1]

Tillich M, Lehwark P, Pellizzer T, et al.

GeSeq-versatile and accurate annotation of organelle genomes

Nucleic Acids Research, 2017, 45(1):6-11.

[本文引用: 1]

李冬梅, 吕复兵, 朱根发, .

文心兰叶绿体基因组密码子使用的相关分析

广东农业科学, 2012, 39(10):61-65.

[本文引用: 2]

王雪, 马军, 杨学文, .

栽培型向日葵叶绿体基因组密码子使用偏好性分析

分子植物育种, 2024, 22(4):1096-1102.

[本文引用: 4]

原晓龙, 李云琴, 王毅, .

西南桦叶绿体基因组密码子偏好性分析

基因组学与应用生物学, 2020, 39(12):5758-5764.

[本文引用: 2]

颜超, 徐钦, 李志, .

黎平瘤果茶的叶绿体基因组特征及系统发育分析

分子植物育种,(2024-02-29)[2024-07-26]. https://link.cnki.net/urlid/46.1068.S.20240228.1659.008.

URL     [本文引用: 1]

杨国锋, 苏昆龙, 赵怡然, .

蒺藜苜蓿叶绿体密码子偏好性分析

草业学报, 2015, 24(12):171-179.

DOI:10.11686/cyxb2015016      [本文引用: 1]

本文对蒺藜苜蓿叶绿体基因组全序列密码子进行分析,筛选出50条CDS(coding DNA sequence)利用CodonW软件进行分析其密码子使用模式。结果显示,蒺藜苜蓿叶绿体基因组密码子第3位碱基GC含量为26.9%,即第3位密码子富含A和U,ENC值在37.11~51.91之间密码子偏好性较弱。相对同义密码子使用度分析显示RSCU值大于1的密码子有23个,其中以A和U为结尾20个。中性绘图分析显示GC<sub>12</sub>与GC<sub>3</sub>的相关系数为0.341,相关性不显著,回归系数为0.4843;单基因ENC比值多分布在-0.05~0.05,即大部分基因ENC值离ENC期望值较近;对应性分析,第一轴显示了12.50%的差异为主要影响因素,第一轴与ENC和GC<sub>3</sub>的相关系数分别为0.091和-0.092,均相关不显著。综合这几项分析发现蒺藜苜蓿叶绿体基因组密码子偏好性主要受到突变的影响,但是并不是唯一的影响因素,其他因素对密码子偏好性也可能有一定的影响。最终通过高表达优越密码子方法确定得出UUA、UUG、CCU等23个密码子为最优密码子,为之后对外源基因进行改造,提高其在叶绿体中的表达效率奠定了基础。

张文达, 赵逸伦, 王湘雨, .

再力花叶绿体基因组特征和系统发育分析

分子植物育种,(2024-04-03)[2024-07-26]. https://link.cnki.net/urlid/46.1068.s.20240403.0936.006.

URL     [本文引用: 1]

崔雨丝, 韩骐泽, 张诗文, .

绣球叶绿体基因组特征及密码子偏好性分析

分子植物育种,(2024-03-29)[2024-07-26]. https://link.cnki.net/urlid/46.1068.S.20240329.0938.007.

URL     [本文引用: 1]

李志芳, 陈丽玲, 罗淑洁, .

西南牡蒿叶绿体基因组特征及系统发育分析

广西植物, 2024, 44(9):1732-1745.

[本文引用: 1]

Hunt R C, Simhadri V L, Iandoli M, et al.

Exposing synonymous mutations

Trends Genet, 2014, 30(7):308-321.

DOI:10.1016/j.tig.2014.04.006      PMID:24954581      [本文引用: 1]

Synonymous codon changes, which do not alter protein sequence, were previously thought to have no functional consequence. Although this concept has been overturned in recent years, there is no unique mechanism by which these changes exert biological effects. A large repertoire of both experimental and bioinformatic methods has been developed to understand the effects of synonymous variants. Results from this body of work have provided global insights into how biological systems exploit the degeneracy of the genetic code to control gene expression, protein folding efficiency, and the coordinated expression of functionally related gene families. Although it is now clear that synonymous variants are important in a variety of contexts, from human disease to the safety and efficacy of therapeutic proteins, there is no clear consensus on the approaches to identify and validate these changes. Here, we review the diverse methods to understand the effects of synonymous mutations. Published by Elsevier Ltd.

马楠, 叶奕含, 邹晨鑫, .

人参叶绿体全基因组特征及密码子偏好性分析

分子植物育种,(2022-11-30)[2024-07-26]. https://link.cnki.net/urlid/46.1068.S.20221129.1638.028.

URL     [本文引用: 2]

余志伟, 陈垣, 郭凤霞, .

菘蓝叶绿体基因组密码子使用偏好性分析

草地学报, 2024, 32(8):2374-2385.

DOI:10.11733/j.issn.1007-0435.2024.08.005      [本文引用: 2]

为探究菘蓝(Isatis indigotica Fort.)叶绿体基因组密码子使用偏好性及其影响因素,本研究使用Codon W 1.4.2软件和在线软件CUSP对筛选到的52个蛋白质编码序列进行密码子使用模式分析。结果表明:菘蓝叶绿体基因组密码子总GC含量(Total GC content of codon,GC<sub>all</sub>)为37.59%,密码子第1位碱基GC含量(GC content of the first base of codon,GC<sub>1</sub>)>密码子第2位碱基GC含量(GC content of the second base of codon,GC<sub>2</sub>)>密码子第3位碱基GC含量(GC content of the third base of codon,GC<sub>3</sub>),且均小于50%,说明密码子第3位碱基拥有较低的GC含量且密码子偏好使用A或U。有效密码子数(Effective number of codon,ENC)值为35.92~55.32,密码子适应指数(Codon adaptation index,CAI)值为0.10~0.31,密码子偏好指数(Codon bias index,CBI)值为-0.24~0.20,最优密码子使用频率(Frequency of optimal codons,FOP)值为0.24~0.54,说明密码子使用偏好性较弱;通过中性绘图分析、PR2-plot分析、ENC-plot分析和对应性分析,发现菘蓝叶绿体基因组密码子使用偏好性受选择压力和突变等因素的共同影响,主要因素为自然选择。最优密码子分析共筛选出14个最优密码子,且均以A或U结尾。以上研究可为菘蓝的系统进化、环境适应性和种质改良提供理论基础。

代国娜, 尚明越, 王嘉乐, .

百合属药用植物叶绿体基因组密码子偏好性及系统发育研究

中草药, 2024, 55(11):3835-3844.

[本文引用: 1]

黄思琦, 张麒功, 叶泽霖, .

5种柏科植物叶绿体基因组密码子偏好性分析

福建农林大学学报, 2024, 53(2):214-220.

[本文引用: 1]

魏亚楠, 龚明贵, 白娜, .

梁山慈竹叶绿体基因组密码子偏好性分析

浙江农林大学学报, 2024, 41(4):696-705.

[本文引用: 1]

张智, 张国帅, 张新可, .

硬尖神香草和欧神香草叶绿体基因组密码子偏好性分析

分子植物育种,(2024-04-22)[2024-07-26]. https://link.cnki.net/urlid/46.1068.S.20240420.1355.002.

URL     [本文引用: 1]

谢刘义, 任璇, 应文博, .

栽培大麦和野生大麦叶绿体基因组密码子偏好性比较分析

云南民族大学学报, 2024, 34(3):268-276.

[本文引用: 1]

/