实验八 蛋白质的结构

上传人:鲁** 文档编号:562076130 上传时间:2023-07-18 格式:DOCX 页数:6 大小:22.76KB
返回 下载 相关 举报
实验八 蛋白质的结构_第1页
第1页 / 共6页
实验八 蛋白质的结构_第2页
第2页 / 共6页
实验八 蛋白质的结构_第3页
第3页 / 共6页
实验八 蛋白质的结构_第4页
第4页 / 共6页
实验八 蛋白质的结构_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《实验八 蛋白质的结构》由会员分享,可在线阅读,更多相关《实验八 蛋白质的结构(6页珍藏版)》请在金锄头文库上搜索。

1、实验八、蛋白质的结构(3学时)目的:了解分子三维结构的重要性,了解如何进行蛋白质的二级结构预测以 及发现与自己的蛋白序列最适合的三维模型,学会运用结构浏览软件对生物大分 子的结构进行观察。内容:预测一个蛋白质序列的二级结构,从 PDB 站点检索并显示相应分子的 三维结构,对蛋白质序列的三维结构进行猜测,观察蛋白质的三维结构及其序列 特性。一、蛋白质序列的二级结构预测 蛋白质的二级结构预测已取得了巨大的成就。如今,利用 Hidden Markov Models and neural networks 方法,一些相当好的网上服务器可以对你感兴趣的任意一个蛋白质序列 的二级结构进行准确的预测(注意:

2、如果你的蛋白质与现有数据库中的记录有足够的同源 性,就可以认为其二级结构的预测有近 80%的准确性。但是,记住这只是个预测,与其它 的预测一样,它们的准确性与估计值是有出入的)。我们以PSIPRED为例(预测最准确的服 务器之一)来进行蛋白质二级结构的预测。1、 将你感兴趣的蛋白质序列以FASTA格式存储于一个.txt文件中。(比如NP-360043 )2、进入由 Bioinformatics Unit of University College in London (UK)维护的蛋 白质结构预测服务器http:/bioinf.cs.ucl.ac.uk/psipred/ .点击页面下方的 Cl

3、ick Here to Access the Server 链接。3、将你的 E-mail address 填在新出现的输入表格页面的上部相应字段里(服务器将 结果以 E-mail 的形式返回给用户)。4、将你的蛋白质序列粘贴到Paste PROTEIN Sequence Here窗口中(注意:此处不需 要 FASTA 格式的头部注释行)。5、你可以在序列窗口下方的字段中为此次预测(你的序列)起个短名。6、点击Predict。如果事情顺利,则会跳出一个新页面通知你的预测工作已被提交, 结果会发送到你所提供的 E-mail 帐号中。同时还会给你报出一个工作完成的大致 时间。缺省条件下,服务器执行

4、二级结构预测方法,即PSIPRED。当然,如果你有时间,可以 选择其它的三种预测方法:一种预测跨膜片段的方法以及两种识别折叠的方法。7、查看由psipred$.ucl.ac.uk发回的预测结果(你的e-mail,如果收不到,请参看 实验数据-实验八中的 message from PSIPRED.doc 文件中查看)。这是一个简单的 文本文件,除你的序列外还有两行额外的信息,它们与序列的每一列一一对齐。Conf ( The confidence )行:由0到9的数字组成,表明了每个位置预测构造的可靠性 ( 9 为高 0 为低)。Pred(The predicton)行:由H、E和C三种特性组成,

5、显示了每一个残基预测的构造。 H=Helical, E=Extended, C= Random coil。Note: There are three types of local segments:Helices: Where residue seem to be following the shape of a spring. The most common are the so-called alpha helices.Extended or Beta-strands: Where residues are in line and successive residues turntheir

6、 back to each otherRandom coils: When the amino-acid chain is neither helical nor extended.除此之外, PSIPRED 还创建了一个便于发表使用的图形显示的结果。你可以在你的 PSIPRED E-mail 的末端发现这样的内容:Calculate PostScript, PDF and JPEG graphical output for this result using http:/bioinf.cs.ucl.ac.uk/cgi-bin/psipred/graphics/nphview.cgi?id=点

7、击此处的链接,你就可以进入PSIPRED结果页面,它提供了三种不同格式的图形文件 供你下载:PostScript File, PDF File and JPEG page.由于我们的机子已经安装了 Acrobat Reader,因此可以直接点击相应的链接(注意,预测的图形文件在原服务器上的保存时间只 有一天左右,如果不能找到相应页面,则可以使用实验数据 -实验八中的 NP360043 second structure predict.PDF 文件查看)。图形结果中的conf行以柱状谱的形式表示,同时增加了一行用清晰的符号表达的pred 行。二、利用更复杂的网上服务器预测其它的序列特性如果只需要

8、快速得到诸如“我的蛋白质的二级结构是什么样子的?”这类基本问题的答 案,PSIPRED无疑是个理想的工具。然而如果想知道更多的你的蛋白质中的其它特性,则要 转去其它的网站。The PredictProtein server也许是进行蛋白质结构分析中最复杂的站点 了,然而由Columbia University维护的原始网站非常繁忙,对你提交的预测工作的响应时 间可能超过一两天。好在PredictProtein server在世界各地有很多镜像站点,包括欧洲、 美国、亚洲以及澳大利亚。下面是一些PredictProtein server的网址:Europe: www.embl-heidelber

9、g.de/predicprotein/www.cmbi.k un.n l/bioi nf/predictprotei n/USA: cubic.bioc.columbia.edu/predictprotein/www.sdsc.edu/predictprotein/.你可以用一条序列试一下哪一个服务器比较适用。一般说来,PredicProtein的缺省分 析包括了如下的内容:* A secondary structure prediction on the three conformational states (H=Helical, E=extended, and C=Random coil

10、)* A prediction of the solvent accessibility of the various residues* A prediction of transmembrane helices and their topology* A prediction of globular regions in your protein* A prediction of the coiled/coil regions of your protein* A description of the PROSITE motifs matching your sequence (for m

11、ore on PROSITE mitifs)* A description of the putative domain structure for your sequence (Prodom domain)* A prediction of bound cysteines (disulphide bonds) in your sequence* A description of the composition-biased regions in your sequence 注意:上述各种特性是否能在返回给你的结果中显示依赖于你的查询序列中是否含有它们。三、在 PDB 站点上进行蛋白质 3D

12、结构的检索与显示Protein Data Bank (PDB) 是所有结构生物学家都认可的 3D 结构公共数据库。就象所 有的分子生物学家都要将他们的序列数据存储于 GenBank/EMBL/DDBJ 那样,所有的 3D 结构数据也都存储于PDB中。然而,PDB提供的界面并不是为非结构专家设计的。你可以 通过 PDB 的站点对一个蛋白质的 3D 结构进行检索。但检索前必须了解你要查找的结构的 一些准确信息。比如准确的蛋白质名称,如果知道它的PDBID(ide ntifier )就更好了。你 可以通过具有友好的用户界面的ExPASy/SWISS-PROT服务器或利用各种NCBI查寻工具 得到结构

13、的 ID。这里我们要查找的是E.coli的TolB蛋白的结构,它的PDB ID是1CRZ(想一想,给定 了蛋白质的名称TolB及物种,我们如何得知它是否具有3D结构数据?如何得知其在3D 结构中的ID?)。1、进入 PDB 的主页(www.rcsb.org/pdb/ )。2、在 Search the Archive 下侧文本框内输入1 CRZ (PDB ID of this protein ),点击 Search。在输出的结构中,上部给出了一些著录信息,描述了这一记录的内容。随后更多的 是描述我们难以理解的晦涩的结晶参数的技术数据。这里,我们只想知道这一蛋白 分子在 3D 水平上是个什么样子。

14、3、点击右上角的3D图形图标,则出现了一个浏览页面,可以使用多种交互式的3D结 构格式( VRML, RamMol 等)显示你的分子(我们会在本实验指导的后面介绍这 种交互式方式)。现在,我们仅使用最简单的方式:显示静止的结构。4、在静止图像的下方,点击Ribbons (500X500)链接。你的结构图像会以带状形式显 示。你也可以利用cylinders选项以柱形形式显示你的蛋白质中的螺旋结构区域。5、保存图像,在图像上右键点击鼠标,选择保存文件的格式、文件名称及保存目录。 (注意:PDB文件不易被非结构专家所阅读。它们的内容相当冗长,包含了大量的数据, 比如结构中每一个原子的三维坐标以及它们

15、之间的联系信息。如果你确定你要下载一个 PDB文件,就可以的页面左侧栏中找到相应的操作链接(Download/Display File) 在页面左侧,有一项显示序列信息的链接(Sequenee Details),点击它,你可以看到这 一序列中实际的二级结构。你可以将它与前面我们预测的NP_360043的二级结构进行 比较(想一想,为什么我们可以对这两个蛋白的二级结构进行比较?如何知道这两个序 列的相似性以及两个序列上相似性区域的位置?)。四、猜测你的蛋白质可能的 3D 结构尽管我们能够检索并显示一个PDB结构,但我们还是不能了解我们的序列在三维形式 中会是个什么样子。我们假定已经确定了蛋白质的

16、序列及其二级结构,目前我们的问题是:它是如何进行折 叠的?回答这个问题可以使用一个简单的方法,即在已知3D结构的PDB数据库中查找你 的同源蛋白质。假设我们已经测定了细菌Riekettsia conor中iTolB基因的序列,我们很想知道它的结 构。就可以:1、从NCBI上得到其蛋白质序列。(其AC号为NP_360043)2、进入 NCBI 的 Blast 服务器主页,选择 Standard Protein-Protein BLAST blastp链 接。3、在Choose database下拉菜单中确定PDB (作为目标数据库)。4、将TolB序列或其AC号输入blastp查询窗口。5、取消Do CD-Search框前的选定。6、点击 BLAST!7、点击 Format!在结果中有两个E值远小于

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号