实验二双序列比对分析

资源描述

《实验二双序列比对分析》由会员分享，可在线阅读，更多相关《实验二双序列比对分析（3页珍藏版）》请在金锄头文库上搜索。

1、1实验三双序列比对分析一实验目的Tay-Sachs 是一种常染色体隐性遗传疾病，它的起因是第 15 号染色体的等位基因HEXA 突变。人类的 HEXA 基因在 GenBank 中的编号为“NM_000520” ，小鼠的 HEXA基因在 GenBank 中的编号为 “AK080777”，它们是核苷酸序列，以这两条序列为例，学习双序列比对分析。1 学习和掌握在 MATLAB 平台上应用 Bioinformatics 工具包有关核苷酸和蛋白质双序列比对的命令和功能。2 学习和掌握在 MATLAB 平台上应用 Bioinformatics 工具包访问 GenBank，并提取核苷酸和蛋白质序列数据的

2、方法。3 学习和掌握在 MATLAB 平台上应用 Bioinformatics 工具包制作核苷酸或蛋白质两条序列比对的点阵图的方法。4 学习和掌握在 MATLAB 平台上应用 Bioinformatics 工具包进行核苷酸或蛋白质双序列的局部比对和全局比对的方法。二实验内容1 在 MATLAB 平台上应用 Bioinformatics 工具包访问 GenBank，提取核苷酸序列并转换为蛋白质序列。用“web”命令在 MATLAB 平台上打开 NCBI 网页。web(http:/www.ncbi.nlm.nih.gov/) web(http:/www.ncbi.nlm.nih.gov/boo

3、ks/bv.fcgi?call=bv.View.ShowSection&rid=gnd) 用“getgenbank”功能从 GenBank 中读序列信息到 MARLABhumanHEXA = getgenbank(NM_000520)mouseHEXA = getgenbank(AK080777)在 MATLAB 的 workshop 打开 humanHEXA 和 mouseHEXA 查看其内容。从 GenBank 中提取 2 条核苷酸序列后，首先要做的是用全局比对来寻找两条序列中的相似序列。因为进行蛋白质序列的比对更能体现其生物学本质，所以常常进行蛋白质序列的比对。用“nt2aa”功能可将

4、核苷酸序列转换为蛋白质序列。mouseProtein = nt2aa(mouseHEXA.Sequence);2humanProtein = nt2aa(humanHEXA.Sequence,Frame,3);在 MATLAB 的 workshop 打开 mouseProtein 和 humanProtein 查看其内容。2 核苷酸和蛋白质双序列比对分析蛋白质双序列比对的点阵图。寻找两条序列的相似部分序列的最简单的方法是做点阵图。用“seqdotplot ”功能制作 mouseProtein 和 humanProtein 的点阵图。seqdotplot(humanProtein,mouseP

5、rotein)ylabel(Human hexosaminidase A);xlabel(Mouse hexosaminidase A);用上述命令作出的点阵图的特点不清楚，可以将命令稍加修改，图象特点将非常清楚。seqdotplot(humanProtein,mouseProtein,4,3)ylabel(Human hexosaminidase A);xlabel(Mouse hexosaminidase A);思考并完成：如果想做两条核苷酸序列的点阵图应该怎样进行？应用 Needleman-Wunsch 算法的蛋白质双序列全局比对。应用“nwalign”功能对 mouseProtein

6、和 humanProtein 两条蛋白质序列进行Needleman-Wunsch 算法的双序列全局比对。 “showalignment”功能可以将比对结果以不同的颜色显示在“Help Browser”。score, globalAlignment = nwalign(humanProtein,mouseProtein);showalignment(globalAlignment);思考并完成：如果想做两条核苷酸序列的全局比对应该怎样进行？分析一下比对结果。蛋白质双序列的局部比对。从 Needleman-Wunsch 算法的双序列全局比对结果来看，mouseProtein 和humanP

7、rotein 两条序列的最开始的 540 个氨基酸比对非常好，而其后的序列匹配不好。注意，在这一点有一个停止的符号“*”。试想，如果只对“* ”前面的序列进行比对，那么比对结果的得分将会很高。我们用“find”命令寻找“*”标志的位置。humanStops = find(humanProtein = *)mouseStops = find(mouseProtein = *) 分别截取两条蛋白质序列的前 540 个氨基酸组成新的局部序列。用“seqdisp”功能将组成的两条新序列显示在屏幕上。humanSeq = humanProtein(1:humanStops(1);humanSeqForm

8、atted = seqdisp(humanSeq)mouseSeq = mouseProtein(1:mouseStops(1);mouseSeqFormatted = seqdisp(mouseSeq)3 将两条新序列 humanSeq 和 mouseSeq 进行全局比对。score, alignment = nwalign(humanSeq,mouseSeq);showalignment(alignment); 思考：分析其得分结果，与第步的结果进行比较。局部比对方法能够替代上述过程，用“swalign”功能就可以一步得到最好的比对。score, localAlignment = swalign(humanProtein,mouseProtein);showalignment(localAlignment);思考：将结果与的结果进行比较。3 分析比较用点阵图、基于 N-W 算法的全局部比对、局部比对三种方法进行同一对序列比对的结果。4 练习和完成：从 GenBank 中找自己感兴趣的两条 DNA 序列进行三种方法的比对，并分析结果。三本实验用到的有关生物信息学的指令和函数1. seqdotplot 2. ylabel 3. xlabel 4. nwalign 5. showalignment 6. find 7. swalign 8. seqdisp

展开阅读全文

实验二 双序列比对分析

最新文档

实验二双序列比对分析