实验六 蛋白质家族序列模式及多序列比对

上传人:飞*** 文档编号:40594686 上传时间:2018-05-26 格式:DOC 页数:4 大小:60.50KB
返回 下载 相关 举报
实验六 蛋白质家族序列模式及多序列比对_第1页
第1页 / 共4页
实验六 蛋白质家族序列模式及多序列比对_第2页
第2页 / 共4页
实验六 蛋白质家族序列模式及多序列比对_第3页
第3页 / 共4页
实验六 蛋白质家族序列模式及多序列比对_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《实验六 蛋白质家族序列模式及多序列比对》由会员分享,可在线阅读,更多相关《实验六 蛋白质家族序列模式及多序列比对(4页珍藏版)》请在金锄头文库上搜索。

1、实验六、多序列比对及进化树的构建(实验六、多序列比对及进化树的构建(3 学时)学时)目的:目的: 1、了解蛋白质序列模式二级数据库的结构、内容及基本使用方法。 2、了解多序列比对工具 ClustalW/X 的使用方法并学习对比对结果进行编辑与分析。 3、学习如何构建系统进化树。 内容:内容: 、蛋白蛋白质质功能位点数据功能位点数据库库 PROSITE、蛋白、蛋白质质序列指序列指纹图谱纹图谱数据数据库库 Prints 的内容、的内容、结结构及构及使用。使用。 1、 熟悉 PROSITE 数据库的数据结构。 从生物学院-国家生物学理科基地-课件下载处下载最新的课课程相关内容程相关内容.rar,解包

2、后打开实 验数据-实验二中的 CBI EMBL format_P02753,找到 Database cross-references 项中的 PROSITE,点击 PS00213 的链接。则显示 PROSITE 数据库中 Lipocalin 模式(AC 号为 PS00213)的记录信息。利用网上的 PROSITE user manual(http:/cn.expasy.org/prosite/prosuser.html#convent36)理解每一个字段及内容的含义。 回答问题: A、 Lipocalin pattern 的长度是多少? B、 请解释/TAXO-RANGE=?EP?的含义。 C

3、、 分别解释 NR 字段中三行数据的含义。D、 Q28133 蛋白(ALL2_BOVIN)是否符合此 pattern?E、 Is this a good pattern? Why?2、 PROSITE 数据库的检索。ExPaSy(http:/cn.expasy.org/prosite/) 及 SRS(http:/ ,http:/srs.ebi.ac.uk )都提供了对 PROSITE 数据库的检索服务。可以通过 AC、ID、description、author 等信息 进行数据库检索,你还可以通过各序列数据库中的交叉引用链接(cross-references or xref 等)找到相应的 P

4、ROSITE pattern, profile or rules 信息。 ScanProsite 工具(http:/cn.expasy.org/tools/scanprosite/)则可以分析查询序列中可能包 含的序列模式或序列谱,以作为进一步鉴定的基础。同时,ScanProsite 还可以利用特定的 序列模式进行对 SWISS-PROT、TrEMBL 及 PDB 数据库的搜索以获得相应数据库中所 有具有此模式的序列。利用 ScanProsite 的 help 页面了解有关的使用方法。回答问题: F、 如果查找 PLEK_HUMAN 序列中所包含的序列模式或序列谱? G、 如何利用 ScanP

5、rosite 在 SWISSPROT 中查找有多少个人类(homo sapiens)序列包含有 与 PLEK_HUMAN 相同的序列谱?请写明过程。此此查询执查询执行的行的过过程很慢,程很慢,预预先作先作过过的的 结结果可从果可从实验实验六六-prosite- ScanProsite Results Viewer of PLEK_HUMAN PROFILE.html 文件中查看。3、 蛋白质序列指纹图谱数据库 Prints 的数据内容及查询工具。 利用课程相关内容-实验数据-实验二中的 CBI EMBL format_P02753,找到 Database cross-references 项中

6、的 PRINTS,点击 PR00179 的链接,即显示 PRINTS 数据库中 Lipocalin 蛋白序列指纹信息。利用 PRINTS 数据库的用户指南 (http:/umber.sbs.man.ac.uk/dbbrowser/PRINTS/printsman.html)熟悉其中的内容与含义。 利用 FingerPrintScan(http:/umber.sbs.man.ac.uk/fingerPRINTScan/)进行查询序列中的序列指纹鉴别(以实验五中的蛋白质查询序列为例):MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEE

7、N DVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDT VPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIP RVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQ FLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGH VPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLS SF

8、GELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPR PFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK 回答问题: H、 此序列包含了哪种序列指纹? I、 此序列指纹包含了几个 motif?、利用网上或下利用网上或下载载的的 ClustalX/W 进进行多序列比行多序列比对对,并,并对结对结果果进进行行编辑编辑与分析。与分析。 1、 多序列比对。 1)利用 BLAST 进行比对序列的收集。 (当然,你也可以利用 SRS 系统进行某家族序列的 收集,并通过 SRS 整合的 clustalW 进行

9、多序列比对。 )在你的多序列比对中,可能希望包 含两种类型的序列:已经过鉴定的具有良好注释及实验信息的序列,以及你感兴趣的未 鉴定的序列(但必须属于此序列家族)。将后者加入多序列比对的主要目的是确定序列 中不会发生突变的保守位点,同时确定重要性相对小一些的那些区域。 进入 ExPASy 的 BLAST server (http:/au.expasy.org/tools/blast/),在检索框内输入 P20472(如果在检索框内输入的是蛋白质序列,使用 blastp 程序,如果输入的是 CDS 序 列,则选择 tblastn 程序), 从 options 选项中的 Number of best

10、 scoring sequences to show 以及 Number of best alignments to show 的下拉菜单中选择 1000。点击 RUN BLAST。 2)从结果中选择少于 10 条序列进行第一次的多序列比对。注意选择的序列要在具有良 好的 E 值(10-40)与不太好的 E 值(10-5)之间平均分配,同时查看具体的 alignment 以确 定选择的目标序列与查询序列(P20472)之间具有全序列范围内的相似性。在选择的序列前打勾,如 P20472,P80079,P02626,P02619,P43305,P32930,P91482,P02620,P02622

11、。在 Send selected sequences to 项目的下拉菜单中选择合适的序列输出选项,如 clustalW 是将序列 发送到 EMBnet 的 ClustalW 服务器上,点击提交查询内容,则将所选序列装填入 ClustalW 服务器的检索框内,利用默认参数,点击 RUN ClustalW,则可以得到以不同格 式保存的多序列比对结果以及.dnd 格式的向导树(guide tree)或称 dendogram,它并不是 真正的系统进化树。 T-coffee 也是一个多序列比对工具,采用的是与 ClustalW 相类似的渐进式比对算 法,它产生的比对结果准确度要比 ClustalW 高

12、,但运行速度要比 ClustalW 慢。利用默认 参数,我们可以看到 T-coffee 产生的结果不仅包含了各种格式的多序列比对情况以及 向导树,还有用颜色标记比对质量的 html 文件及相应的 PDF 文件。在这些文件中,红 色表示高质量的片段,而兰色则表明比对的区域不可信。 3)将上步所选的序列以 FASTA 格式进行保存,并将多序列比对结果中的 aln 格式结果 及.dnd 文件进行保存。 4)接入 EBI 的 clustalW 服务器(http:/www.ebi.ac.uk/clustalw/index.html),将另一个蛋白 质 P19132 的 FASTA 格式加入到刚才下载的

13、FASTA 格式序列文件中。如果查看刚才 利用 P20472 序列进行对库搜索的结果中,这个蛋白的 E 值为 4.4!而且其与查询序列的同一性仅为在 33 个连续残基中的 39%,因此进化关系上与 P20472 很远。将这些序列 进行多序列比对分析,必要时进行相关参数的设置。在 Phylogenetic tree 选项中的 tree type 选择 phylip 或 dist,使用帮助参见课程相关内容-实验数据-实验六中的 EBI Help- clustalW.html,将比对结果进行保存,并与前一步骤得到的结果进行比较。 5、解包课程相关内容-实验数据-实验六-clustalX1.83,打开

14、 ClustalX 黄色图标,装 入上述 FASTA 格式文件(file 菜单中的 load sequences),进行比对、构建向导树 (alignment 菜单中的前两项)。并利用邻位相连算法构建进化树(tree 菜单中的 Draw D-J tree)。利用 njplotWIN95.exe 查看 3、5 步骤所分别形成的向导树及进化树,并将步骤 4 与步骤 5 形成的进化树进行比较。2、 多序列比对结果的分析。 在多序列比对结果中,我们希望发现一些很好的无空位插入的比对区块(blocks), 这些区块对应了蛋白质结构中的核心区域,而那些富含空位的区域可能对应着相对进 化较快的 loop 区

15、域。那么,如何判断区块的好坏呢? 在 ClustalW/X 及 T-coffee 的比对结果中,我们可以发现最后一行包含了三种符号:(*), (:), (.)。* indicates a entirely conserved column, : indicates columns where all the residues have roughly the same size and the same hydropathy, . indicates columns where the size or the hydropathy has been preserved in the cours

16、e of evolution。一个好的区一个好的区块块在在 10-30 个氨基酸残基中至少表个氨基酸残基中至少表现现出出 1-3 个星号(个星号(*),),5-7 个冒号(:)以及一些个冒号(:)以及一些(.)。 。 如果多序列比对显示在大约 50 个氨基酸残基中有 4-5 个保守的位点,那么我们就 可以相信它是一个真实的信号。而这时的序列同一性还不到 10%!而利用双序列比对 时我们至少需要 25%的序列同一性才能确信比对有意义。因此,多序列比对要比双序列 比对灵敏得多。 另一个评价多序列比对的标准是了解保守残基的类型。下表给出了多序列比对中可能遇到的保守列的一般特性。 Table. Patterns of Conservation in Multiple sequences alignmentsAmino AcidCharacteristicW,Y,FIt is common to find conserved tryptophans. Tryptophan is a large hydrophobic res

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 研究报告 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号