关于DNA编码的一些研究

上传人:豆浆 文档编号:776050 上传时间:2017-05-14 格式:DOCX 页数:4 大小:21.61KB
返回 下载 相关 举报
关于DNA编码的一些研究_第1页
第1页 / 共4页
关于DNA编码的一些研究_第2页
第2页 / 共4页
关于DNA编码的一些研究_第3页
第3页 / 共4页
关于DNA编码的一些研究_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《关于DNA编码的一些研究》由会员分享,可在线阅读,更多相关《关于DNA编码的一些研究(4页珍藏版)》请在金锄头文库上搜索。

1、遗传密码决定蛋白质中氨基酸顺序的核苷酸顺序 ,由 3 个连续的核苷酸组成的密码子所构成 。由于脱氧核糖核酸(DNA)双链中一般只有一条单链(称为有义链或编码链)被转录为信使核糖核酸(mRNA) ,而另一条单链(称为反义链)则不被转录,所以即使对于以双链 DNA 作为遗传物质的生物来讲,密码也用核糖核酸(RNA)中的核苷酸顺序而不用 DNA中的脱氧核苷酸顺序表示。遗传密码是一组规则,将 DNA 或 RNA 序列以三个核苷酸为一组的密码子转译为蛋白质的氨基酸序列,以用于蛋白质合成。几乎所有的生物都使用同样的遗传密码,称为标准遗传密码;即使是非细胞结构的病毒,它们也是使用标准遗传密码。现在所遇到的问

2、题就是:如何将交叉编码后的碱基序列中不包含终止密码子和开始密码子(TAG,TGA ,TAA)该问题也就是说:必须有一种特定编码方式使得交叉编码后的碱基序列不包含终止密码子,反响推导可以知道,存在一些特定的情况不能用于交叉编码中。以下就是推导论证方法:TAA TAG TGA ATG000 ATT ATC ACT TAC001 ATA ATG ACA TAG010 AAT AAC AGT TTC011 AAA AAG AGA TTG100 TTT TTC TCT AAC101 TTA TTG TCA AAG110 TAT TAC TGT ATC111 TAA TAG TGA ATG也就是说这些是不

3、能用于进行随机交叉编码的密码子,除去重复的共有 24 种不可用的碱基密码子:ACT ACA AGT AGA TCT TCA TGT TGA ATT ATA AAT AAA TTT TTA TAT TAA ATC ATG AAC AAG TTC TTG TAC TAG 也就是说这 24 中编码不能用于 DNA 编码中。现在又可以知道的是三位一个密码子共有 4*4*4=64 中编码方式,意味着有 40 种编码方式可以使用(ACC ACG AGC AGG TCC TCG TGC TGG CAA CAT CAC CAG CTA CTT CTC CTG CCA CCT CCC CCG CGA CGT C

4、GC CGG GAA GAT GAC GAG GTA GTT GTC GTG GCA GCT GCC GCG GGA GGT GGC GGG) ,4026(英文字母表的字符个数) ,所以从理论来讲使用一个密码子编码一个英文字符是可行的。优点:相对于一般的将明文信息转换为二进制数据再进行数字编码的编码方式而言,该编码方式可以节省一位的空间,尤其是在加密信息巨大的情况下,每一位的存储空间都很珍贵。更加简单,省去了很多的繁琐的处理,只需要对照编码即可。缺点:随机交叉编码的必要性:如果将编码后的明文信息直接藏在一段序列中,入侵者可以很容易破解出明文。例如:假如 ACC 编码字符 A,ACG 编码字符

5、B,AB 的碱基编码就是 ACCACG,现在直接将编码后的 DNA 序列藏于一段 DNA 序列的 ORF: ATGTGGTGGTCCTAG 中,ATGTGGTACCACGGGTCCTAG。在这种情况下,可以使用不同的阅读方式来破解:ATG TGG TAC CAC GGG TCC TAG 这种情况下得到错误的信息。A TGT GGT ACC ACG GGT CCT AG 这种情况下就可以得到 AB。所以由上例可以看出,在进行 DNA 序列拼接之前还需要进一步的处理对于上例来说:ACCACG 在一段指导编码 011010 的指导作用下进行交叉编码为 TCCTCC,再将其编码到 ORF中:ATGTG

6、GTGTCCTCC GTCCTAG对其进行不同的阅读方式进行破解:A TGT GGT GTC CTC CGT CCT AGATG TGG TGT CCT CCG TCC TAGAT GTG GTG TCC TCC GTC CTAG可以看到虽然第三种阅读方式是正确的,但是在不知道明确信息的前提下,入侵者是不能区别的。就算入侵者能区别,他仍需要对该信息进行穷举攻破,当数据位数较小时,该工作很容易破解,但是当数据位数较大时,破解工作就显得天方夜谭。也就是说需要 4n 中情况。进一步的研究:ORF 是指导蛋白质的一段可以编码基因片段,该编码非彼编码,这里的编码指导多肽的编码,而上文的编码指的是对字符的

7、编码。我们知道氨基酸有一个编码表:- - 第二位碱基 第二位碱基 第二位碱基 第二位碱基- - T C A G第 一 位 碱 基TTTT (Phe/F)苯丙氨酸 TTC (Phe/F)苯丙氨酸 TTA (LeT/L)亮氨酸 TTG (LeT/L)亮氨酸TCT (Ser/S)丝氨酸 TCC (Ser/S)丝氨酸 TCA (Ser/S)丝氨酸 TCG (Ser/S)丝氨酸TAT (Tyr/Y)酪氨酸 TAC (Tyr/Y)酪氨酸 TAA (终止) TAG (终止)TGT (Cys/C)半胱氨酸 TGC (Cys/C)半胱氨酸 TGA (终止) TGG (Trp/W)色氨酸第 一 位 碱 基CCTT

8、 (LeT/L)亮氨酸 CTC (LeT/L)亮氨酸 CTA (LeT/L)亮氨酸 CTG (LeT/L)亮氨酸CCT (Pro/P)脯氨酸 CCC (Pro/P)脯氨酸 CCA (Pro/P)脯氨酸 CCG (Pro/P)脯氨酸CAT (His/H)组氨酸 CAC (His/H)组氨酸 CAA (Gln/Q)谷氨酰胺 CAG (Gln/Q)谷氨酰胺CGT (Arg/R)精氨酸 CGC (Arg/R)精氨酸 CGA (Arg/R)精氨酸 CGG (Arg/R)精氨酸第 一 位 碱 基AATT (Ile/I)异亮氨酸 ATC (Ile/I)异亮氨酸 ATA (Ile/I)异亮氨酸 ATG (Me

9、t/M)甲硫氨酸(起始)ACT (Thr/T)苏氨酸 ACC (Thr/T)苏氨酸 ACA (Thr/T)苏氨酸 ACG (Thr/T)苏氨酸AAT (Asn/N)天冬酰胺 AAC (Asn/N)天冬酰胺 AAA (Lys/K)赖氨酸 AAG (Lys/K)赖氨酸AGT (Ser/S)丝氨酸 AGC (Ser/S)丝氨酸 AGA (Arg/R)精氨酸 AGG (Arg/R)精氨酸第 一 位 碱 基GGTT (Val/V)缬氨酸 GTC (Val/V)缬氨酸 GTA (Val/V)缬氨酸 GTG (Val/V)缬氨酸GCT (Ala/A)丙氨酸 GCC (Ala/A)丙氨酸 GCA (Ala/A

10、)丙氨酸 GCG (Ala/A)丙氨酸GAT (Asp/D)天冬氨酸 GAC (Asp/D)天冬氨酸 GAA (GlT/E)谷氨酸 GAG (GlT/E)谷氨酸GGT (Gly/G)甘氨酸 GGC (Gly/G)甘氨酸 GGA (Gly/G)甘氨酸 GGG (Gly/G)甘氨酸注:(起始)标准起始编码,同时为甲硫氨酸编码。mRNA 中第一个 ATG 就是蛋白质翻译的起始部位。逆密码子表此表列出了和 20 种氨基酸和密码子的标准配对。 Ala A GCT,GCC,GCA,GCG LeT L TTA,TTG,CTT,CTC,CTA,CTGArg R CGT,CGC,CGA,CGG,AGA,AGG

11、Lys K AAA,AAGAsn N AAT,AAC Met M ATGAsp D GAT,GAC Phe F TTT,TTCCys C TGT,TGC Pro P CCT,CCC,CCA,CCGGln Q CAA,CAG Ser S TCT,TCC,TCA,TCG,AGT,AGCGlT E GAA,GAG Thr T ACT,ACC,ACA,ACGGly G GGT,GGC,GGA,GGG Trp W TGGHis H CAT,CAC Tyr Y TAT,TACIle I ATT,ATC,ATA Val V GTT,GTC,GTA,GTG起始 ATG 终止 TAG,TGA,TAA如何详细具体

12、的编码英文字符,其编码方式应该符合这样的条件:1.不能使 24 中的编码方式;2.必须能够编码一个特定的氨基酸。集合 A:24 中可能产生终止密码子的编码方式集合 B:可用的 40 中编码方式集合 C:可以编码氨基酸的编码方式可以用来进行编码字符的集合 target=B C预期:|target| 26可用来进行编码的 target 集合:GCT,GCC,GCA,GCG,CGT,CGC,CGG,AGG,GAC,GAT,TGC,CAA,CAG,GAA,GAG,GGT,GGC,GGA,GGGCAT,CAC,CTT,CTC,CTA,CTG,CCT,CCC,CCA,CCG,TCC,TCG,AGC,ACC

13、,ACG,TGG,GTT,GTC,GTA,GTG证明:target=BAla A GCT,GCC,GCA,GCG LeT L TTA,TTG,CTT,CTC,CTA,CTGArg R CGT,CGC,CGA,CGG,AGA,AGG Lys K AAA,AAGAsn N AAT,AAC Met M ATGAsp D GAT,GAC Phe F TTT,TTCCys C TGT,TGC Pro P CCT,CCC,CCA,CCGGln Q CAA,CAG Ser S TCT,TCC,TCA,TCG,AGT,AGCGlT E GAA,GAG Thr T ACT,ACC,ACA,ACGGly G GGT,GGC,GGA,GGG Trp W TGGHis H CAT,CAC Tyr Y TAT,TACIle I ATT,ATC,ATA Val V GTT,GTC,GTA,GTG起始 ATG 终止 TAG,TGA,TAA其中红色着色的是不能用来进行编码的 24 种方式。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号