实验二 双序列比对分析

上传人:ji****72 文档编号:31496683 上传时间:2018-02-08 格式:DOC 页数:3 大小:33.50KB
返回 下载 相关 举报
实验二 双序列比对分析_第1页
第1页 / 共3页
实验二 双序列比对分析_第2页
第2页 / 共3页
实验二 双序列比对分析_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《实验二 双序列比对分析》由会员分享,可在线阅读,更多相关《实验二 双序列比对分析(3页珍藏版)》请在金锄头文库上搜索。

1、1实验三 双序列比对分析一 实验目的Tay-Sachs 是一种常染色体隐性遗传疾病,它的起因是第 15 号染色体的等位基因HEXA 突变。人类的 HEXA 基因在 GenBank 中的编号为“NM_000520” ,小鼠的 HEXA基因在 GenBank 中的编号为 “AK080777”,它们是核苷酸序列,以这两条序列为例,学习双序列比对分析。1 学习和掌握在 MATLAB 平台上应用 Bioinformatics 工具包有关核苷酸和蛋白质双序列比对的命令和功能。2 学习和掌握在 MATLAB 平台上应用 Bioinformatics 工具包访问 GenBank,并提取核苷酸和蛋白质序列数据的

2、方法。3 学习和掌握在 MATLAB 平台上应用 Bioinformatics 工具包制作核苷酸或蛋白质两条序列比对的点阵图的方法。4 学习和掌握在 MATLAB 平台上应用 Bioinformatics 工具包进行核苷酸或蛋白质双序列的局部比对和全局比对的方法。二 实验内容1 在 MATLAB 平台上应用 Bioinformatics 工具包访问 GenBank,提取核苷酸序列并转换为蛋白质序列。 用“web”命令在 MATLAB 平台上打开 NCBI 网页。web(http:/www.ncbi.nlm.nih.gov/) web(http:/www.ncbi.nlm.nih.gov/boo

3、ks/bv.fcgi?call=bv.View.ShowSection&rid=gnd) 用“getgenbank”功能从 GenBank 中读序列信息到 MARLABhumanHEXA = getgenbank(NM_000520)mouseHEXA = getgenbank(AK080777)在 MATLAB 的 workshop 打开 humanHEXA 和 mouseHEXA 查看其内容。 从 GenBank 中提取 2 条核苷酸序列后,首先要做的是用全局比对来寻找两条序列中的相似序列。因为进行蛋白质序列的比对更能体现其生物学本质,所以常常进行蛋白质序列的比对。用“nt2aa”功能可将

4、核苷酸序列转换为蛋白质序列。mouseProtein = nt2aa(mouseHEXA.Sequence);2humanProtein = nt2aa(humanHEXA.Sequence,Frame,3);在 MATLAB 的 workshop 打开 mouseProtein 和 humanProtein 查看其内容。2 核苷酸和蛋白质双序列比对分析 蛋白质双序列比对的点阵图。寻找两条序列的相似部分序列的最简单的方法是做点阵图。用“seqdotplot ”功能制作 mouseProtein 和 humanProtein 的点阵图。seqdotplot(humanProtein,mouseP

5、rotein)ylabel(Human hexosaminidase A);xlabel(Mouse hexosaminidase A);用上述命令作出的点阵图的特点不清楚,可以将命令稍加修改,图象特点将非常清楚。seqdotplot(humanProtein,mouseProtein,4,3)ylabel(Human hexosaminidase A);xlabel(Mouse hexosaminidase A);思考并完成:如果想做两条核苷酸序列的点阵图应该怎样进行? 应用 Needleman-Wunsch 算法的蛋白质双序列全局比对。应用“nwalign”功能对 mouseProtein

6、 和 humanProtein 两条蛋白质序列进行Needleman-Wunsch 算法的 双序列全局比对。 “showalignment”功能可以将比对结果以不同的颜色显示在“Help Browser”。score, globalAlignment = nwalign(humanProtein,mouseProtein);showalignment(globalAlignment);思考并完成:如果想做两条核苷酸序列的全局比对应该怎样进行?分析一下比对结果。 蛋白质双序列的局部比对。 从 Needleman-Wunsch 算法的双序列全局比对结果来看,mouseProtein 和humanP

7、rotein 两条序列的最开始的 540 个氨基酸比对非常好,而其后的序列匹配不好。注意,在这一点有一个停止的符号“*”。试想,如果只对“* ”前面的序列进行比对,那么比对结果的得分将会很高。我们用“find”命令寻找“*”标志的位置。humanStops = find(humanProtein = *)mouseStops = find(mouseProtein = *) 分别截取两条蛋白质序列的前 540 个氨基酸组成新的局部序列。用“seqdisp”功能将组成的两条新序列显示在屏幕上。humanSeq = humanProtein(1:humanStops(1);humanSeqForm

8、atted = seqdisp(humanSeq)mouseSeq = mouseProtein(1:mouseStops(1);mouseSeqFormatted = seqdisp(mouseSeq)3 将两条新序列 humanSeq 和 mouseSeq 进行全局比对。score, alignment = nwalign(humanSeq,mouseSeq);showalignment(alignment); 思考:分析其得分结果,与第步的结果进行比较。 局部比对方法能够替代上述过程,用“swalign”功能就可以一步得到最好的比对。score, localAlignment = swalign(humanProtein,mouseProtein);showalignment(localAlignment);思考:将结果与的结果进行比较。3 分析比较用点阵图、基于 N-W 算法的全局部比对、局部比对三种方法进行同一对序列比对的结果。4 练习和完成:从 GenBank 中找自己感兴趣的两条 DNA 序列进行三种方法的比对,并分析结果。三 本实验用到的有关生物信息学的指令和函数1. seqdotplot 2. ylabel 3. xlabel 4. nwalign 5. showalignment 6. find 7. swalign 8. seqdisp

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号