基因组密码子使用偏好性研究-以口蹄疫病毒为例

资源描述

《基因组密码子使用偏好性研究-以口蹄疫病毒为例》由会员分享，可在线阅读，更多相关《基因组密码子使用偏好性研究-以口蹄疫病毒为例（15页珍藏版）》请在金锄头文库上搜索。

1、15第2章口蹄疫病毒基因组密码子使用偏好性研究（1）存在于基因序列碱基组成过程中的偏好性一般情况下，序列本身的碱基组成是在没有自然选择压力的条件下，它的组成会受到一定程度的影响，进而产生某方向的突变压力。这个现象通常也会在同义密码子的第三个位点上得以体现。但是这种偏好性只能反映出序列组成的特点，和蛋白质功能或者表达水平没有关系。（2）自然选择的弱效应对于所有的密码子家族来说，存在密码子偏好性这个特征，也不会使得同义密码子最终对蛋白质的产物带来某些改变。所以，那些常用密码子的密码子选择性是非常弱的，此类弱点将会反映在基因表达水准上。在进行高度表达的基因当中，密码子运用偏好强于通常表达的基因。（

2、3）tRNA丰度蛋白质翻译的过程当中，FMDV基因组密码子也需要利用相应的反密码子t RNA ，从而更有利于给多肽链上转移一些游离氨基酸残基。相对应的tRNA的丰度也会对蛋白质的合成的过程带来一定的影响。密码子运用偏倚和细胞内t RNA含量的正相关部分。（4）基因长度基因长度与这个基因所能够容纳的密码子数量是成正比例的。在完全没有其他影响因素的情况下，因为受到样本量的限制，选取同义密码子的概率根本不会受统计误差带来的影响；相反的情况，如果基因长度越短，那么能够进行编码的密码子的类型就会比较少，更有一些情况，一些密码子更是无法显示与表达的。（5）蛋白质的结构功能采用的基因密码子与编码的蛋白质结

3、构和功之间能有一定关系。蛋白质折叠模式和序列间也有其相关性，蛋白质三级结构和密码子采用的概率紧密相关。即使在不同的物种当中，类型相同的基因密码子也会运用类似的模式。因为物种差异而引起的同义密码子运用的偏差，对于类似的基因来说，这个差异是非常小的。（6）蛋白的疏水性以及相关氨基酸不同保守基因编码序列的氨基酸含量是不相同的。从一方面来说，稀有氨基酸因为其自身的小概率而不太可能发生，一旦采用一个密码子，另外一个密码子发生的可能性就不会太大。从另一方面来讲，更保守且不易突变的氨基酸，它们的密码子采用模式固定在序列自身的构成。 2.1.2 有关密码子使用偏好性的分析方法（1）相对同义密码子的使用度(

4、Relative Synonymous Codon Usage, RSCU )RSCU代表编码特定密码子相应氨基酸的同义密码子之间的相对的概率。将氨基酸在构成过程当中对于密码子的采用偏好性所造成的影响进行消除。如果密码子的使用偏好性这一现象不存在，那么密码子对应的的RSCU=1。当密码子的RSCU值1的时候，这就意味着密码子为偏好性强的密码子，与之相反也是成立的。第一个氨基酸的第j个密码子，计算他的同义密码子使用度的计算公式为公式2-1：RSCUij=Xij1nj=1niij（2-1）在公式2-1中， X ij为编码第一个氨基酸的密码子 X ij出现的次数， n i为编码第二个氨基酸的同义密码

5、子的数目（16）。对于高表达基因的RSCU值，通常可以用于建立参考表格。（2）密码子适应指数(Codon Adaptation Index, CAI) 基于已知的高表达基因的序列对未知的基因的密码子采用的偏好进行估测。CAI的值范围在0到1之间，如果CAI的值越高，那么其基因的密码子采用的偏好就会越强。CAI值通常用于预测物种中基因表达的水准，也可用于外来物种基因表达水准的估测。 W ij 代表密码子相对适应度（The relative adaptiveness of a codon)。Wij=RSCUijRSCUimax=XijXimax（2-2）公式2-2中 RSCU imax、X i

6、max这两个分别代表了编码第i个氨基酸的使用频率最高密码子的RSCU值和X值。CAI=(K=1LWk)1L（2-3）L代表的是基因中所采用的密码子数量。（3）有效密码子数(Effective Number of Codon, ENC) ENC描述了密码子采用偏离随机选取的程度，并且密码子家族当中同义密码子的非平衡运用的偏好程度也可以由ENC充分反映出。如果ENC值在20到61的范围之间，ENC值越近，偏差越强。高表达基因密码子的偏好较大，因此ENC值相对较小；低表达的基因中含有更多种类、更稀有的密码子，所以ENC的值更大。通常比较ENC的值来确定内源基因表达的相对水准。一般情况下，如果ENC

7、值越小，那就说明与其相对应的内源基因的表达性也就越高。 n 代表了基因组中使用的密码子的总数，K代表同义密码子的数量，P i是使用第一密码子的使用频率（ n i / n ）。 ENC值同时也是会受到氨基酸的构成与基因长度的影响。ENC=2+9F2+1F3+5F4+3F6（2-4）F=ni=1kPi2n-1 n1,Pi=nin（2-5）（4）密码子偏好参数(Codon Preference Parameter, CPP)CPP的数值在0至18之间, 越接近最大值18，就表示密码子被非随机采用的概率越高。但是它相对于基因编码整体性区域的碱基构成的敏感度并不精确, 适合比较基因之间或者物种间密码子

8、采用偏性的大小。CPP=i=118|xij-j=1nixijni|j=1nixijni(2ni-2)（2-6）Xij代表了编码第i个氨基酸密码子（j）出现的次数，ni代表编码第ni个（当值为2-6且 ni= 1的时候应被排除）氨基酸同义密码子的数目。2.2 研究过程 2.2.1 选取的基因样本在本实验中的FMDV O型和A型的完整编码基因的相关信息来自于Gen- Bank（列举如下）。其中，FMDV O型、A型均为27条，同时都含有完整的多聚蛋白质编码序列。O型EF552697，EF552696，EF552694， EF552693，EF552692，EU400597，EUl40964， AF

9、026168，NC004004，AJ539139，AY593819， AY593835，AFl89157，AFl89157，AY593836， AF511039， EFl75732，DQ248888， AJ320488， AJ633821，AY312588S2，AB079061，AFl89157， AF511039，AY317098，AY312586S2。A型NC011450，EF494488，EF494487， EF494486，AY593751，AY593789，AY593767， AY593770，AY593782，AY593783，AY593784， AY593785，AY593790

10、，AY593801，AY593802， AY593787，AY593788，AY593803，AY593753， AY593756，AY593757，AY593768，AY593794， AY593771，AY593758，AY593775，AY593751。 2.2.2 在给定的区域分析密码子偏好性由于目标区域的每个位点产生的突变现象，可以通过定义密码子使用趋势(TCU Tendency of Codon Usage)的变体进而分析编码序列中给定区域的密码子使用趋势，计算TCU值:TCU是特定区域(即起始位点)每个位置的值的累积值。TCU=RUCU=RSCUij-RSCU0（2-7）表示一个

11、密码子使用偏好性的值，对应于a中的特定氨基酸。n表示此研究中的所有样本。当所有RSCU值根据区域中的特定位置为时，TCB为零。这意味着在该位置存在很少的显性密码子或次要密码子，相反地，当TCB的绝对值远大于时，意味着优化密码子或次要密码子用于特定位置。翻译的初始区域起始位点到第30个下游密码子和从翻译终止的终端区域点到第30个上游密码子。TTC值计算相应的基因组和计算相应基因组的值与TCU值进行比较以解决问题特定区域某些密码子之间的关系和一个相应的基因组。2.3 研究结果 2.3.1 翻译起始区附近密码子的使用偏好性图2-2表现了每个从第三十个密码子起始的特定位点之间的关系，以及FMDV七种亚

12、型的TCU值。每个条形代表特定位点中密码子的使用趋势。TCU值如果越高就说明其对应s位点对在翻译起始区域中出现具有强倾向的密码子。在所有感兴趣的区域中存在几个具有负密码子使用倾向的位点。这表明了，即使他们对整个基因组的血清型的优先使用性更强，一些次要密码子更加容易在在翻译起始区域出现。AA*CodonRSCUAaaCodonRSCUAla+GCA1.02Leu*CUA0.17GCC1.45CUC1.95GCG0.59CUG1.65GCU0.94CUU1.1Arg*AGA1.46UUA0.05AGG0.8UUG1.05Asn*Asp*CysGlnGlu+GlyHis*Ile*CGACGCCGGC

13、GUAACAAUGACGAUUGCUGUCAACAGGAAGAGGGAGGCGGGGGUCACCAUAUAAUCAUU0.331.770.660.971.720.281.50.51.170.830.891.150.711.291.041.20.820.941.750.250.171.81.1LysPheProSer+Thr+Tyr*Val*AAAAAGUUCUUUCCACCCCCGCCUAGCAGUUCAUCCUCGUCUACAACCACGACUUACUAUGUAGUCGUTGUU0.861.141.230.770.821.290.781.11.230.651.021.560.890.760.

14、91.560.60.941.710.290.271.131.620.98表2-1 FMDV中同义密码子使用偏性和密码子偏性Table 2-1 Synonymous codon usage bias and codon bias in FMDV*：aAA是氨基酸的缩写; bRSCU值是平均值; 每个氨基酸的优先使用的密码子以粗体描述;氨基酸包括同义密码子使用之间的差异; 氨基酸包括同义密码子使用中的相对差异。七种血清型中具有负TCU值如图4-1所示。这种现象特别是在下列血清型的不同位点可以体现。血清型A血清型O亚洲型I血清型C血清型SAT-I血清型SAT-II 血清型SAT-III 第2 第3 第3 第2 第3 第2 第3第3 第4 第6 第3 第4 第3 第4第4 第6 第7 第4

展开阅读全文

基因组密码子使用偏好性研究-以口蹄疫病毒为例

最新文档