生物信息学蛋白质系统工程

上传人:ap****ve 文档编号:118768329 上传时间:2019-12-25 格式:PPT 页数:59 大小:1.20MB
返回 下载 相关 举报
生物信息学蛋白质系统工程_第1页
第1页 / 共59页
生物信息学蛋白质系统工程_第2页
第2页 / 共59页
生物信息学蛋白质系统工程_第3页
第3页 / 共59页
生物信息学蛋白质系统工程_第4页
第4页 / 共59页
生物信息学蛋白质系统工程_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《生物信息学蛋白质系统工程》由会员分享,可在线阅读,更多相关《生物信息学蛋白质系统工程(59页珍藏版)》请在金锄头文库上搜索。

1、LOGO 蛋白质的生物信息学分析 LOGO v1、蛋白质序列分析 通过比较两个或多个蛋白质序列的相似区域和保守 性位点,确定相互间有共同功能的序列模式和分子 进化关系,进一步分析其结构和功能。 通过对核酸和蛋白质序列进行分析,预测其理化性 质、空间结构及生物学功能。 v2、蛋白质结构预测 包括二级和三维结构预测 LOGO v3、蛋白质功能预测 由于蛋白质不同区段进化速率不同,通过与相似序 列的数据库和序列模体数据库的比对,确定某蛋白 质序列中的保守区域,从而进一步预测功能。 也可以直接从蛋白质序列预测其疏水性、跨膜螺旋 等。 LOGO v4、蛋白质分子设计 蛋白质一级结构决定其空间结构,蛋白质

2、空间结构 决定其生物学功能。因此可通过对蛋白质进行分子 设计,有目的的改造其空间结构,使其发挥其特定 的生物功能。 LOGO v数据库来源 NAR数据库分类目录 NAR Nucleic Acids Research 网址: http:/www.oxfordjournals.org/nar/database/cap / LOGO (一)核酸序列数据库 1、GenBank 2、EMBL 3、DDBJ (二)基因组数据库 1、GDB数剧库 LOGO v(一)核酸序列数据库 v1、GenBank Genbank库包含了所有已知的核酸序列和蛋白质序 列,以及与它们相关的文献著作和生物学注释。它 是由美国

3、国立生物技术信息中心(NCBI) national center for biotechnology information建立和维护 的。 它的数据直接来源于测序工作者提交的序列;由测 序中心提交的大量EST序列和其它测序数据;以及与 其它数据机构协作交换数据而来。 Genbank每天都会与欧洲分子生物学实验室(EMBL) 的数据库,和日本的DNA数据库(DDBJ)交换数据, 使这三个数据库的数据同步。 LOGO v(一)核酸序列数据库 v1、GenBank Genbank的数据可以从NCBI的FTP服务器上免费下 载完整的库,或下载积累的新数据。NCBI还提供广 泛的数据查询、序列相似性搜

4、索以及其它分析服务 ,用户可以从NCBI的主页上找到这些服务。 vNCBI的网址是:http:/www.ncbi.nlm.nih.gov/ vGenebank的网址是: http:/www.ncbi.nlm.nih.gov/Genbank/ LOGO v2、EMBL核酸序列数据库 EMBL核酸序列数据库由欧洲生物信息学研究所 (EBI)维护的核酸序列数据构成,由于与 Genbank和DDBJ的数据合作交换,它也是一个 全面的核酸序列数据库。 v数据库网址是:http:/www.ebi.ac.uk/embl/ vSRS的网址是:http:/srs.ebi.ac.uk/ LOGO v3、DDBJ数

5、据库 日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数 据库,与日本国家遗传学研究所负责维护和管理,与 Genbank和EMBL核酸库合作交换数据。可以使用其主 页上提供的SRS工具进行数据检索和序列分析。可以用 Sequin软件向该数据库提交序列。 v DDBJ的网址是:http:/www.ddbj.nig.ac.jp/ LOGO v蛋白质数据库 (一)蛋白质序列数据库 SWISS-PROT;PIR;TrEMBL;UniProt;( 二)蛋白质序列二次数据库 PROSITE;PRINTS;BLOCKS; (三)蛋白质结构数据库 PDB;MMDB; LOGO v1、 SWISS-PROT

6、 SWISS-PROT数据库由瑞士日内瓦大学于1986年创 建,现由欧洲生物信息学研究所(EBI)进行维护和 管理,是目前国际上权威的蛋白质序列数据库之一 。 SwissProt数据库的每个条目都有详细的注释,包括 结构域、功能位点、跨膜区域、二硫键位置、翻译 后修饰、突变体等。该数据库中还包括了与核酸序 列数据库EMBL/GenBank/DDBJ、蛋白质结构数据 库PDB以及Prosite、PRINTTS等十多个二次数据库 的交叉引用代码。 LOGO v ExPAsy专门聘请了由200多位国际知名生物学家组成 的网上专家评审团,并将SwissProt数据库中的蛋白质 分成200多个类别,每个

7、类别由1位或2位评审专家负责, 通过计算机网络进行审核。 LOGO (1)简介 美国Brookhaven实验室1971年建立的 大分子结构数据库PDB 蛋白质晶体结构资 料数据库 (Protein Data Bank)。 PDB数据库的维护由结构生物信息学研 究合作组织(Research Collaboration for Structural Bioinformatics, RCSB)负责。 2、PDB数据库 LOGO (2)数据来源 通过实验(X射线晶体衍射,核磁共振 ,电子显微镜方法等)测定的生物大分子的 三维结构。 主要是蛋白质的三维结构,还包括核酸 、糖类、蛋白质与核酸复合物的三维结

8、构。 LOGO Other 包括 proteins nucleicacids complexes X-ray NMR Microscopy LOGO (4)数据查询 PDB中的记录有唯一的PDB-ID,包括4个字 符串,可由大写字母AZ和数字09组合而成。 PDB和它的镜像站点提供每个PDB记录的查 询,可按一些专门的查询项目(如提交数据、作 者姓名、结构表达)进行检索。 LOGO 例1:查询“PDB ID = 1ADZ”的结构数据 (1)登陆PDB网站 http:/www.rcsb.org/pdb/ (2)在上方的搜索栏选中“PDB ID or keyword ” , 在文本框中输入“1AD

9、Z”,单击Site Search按钮 ,出现结果。 LOGO LOGO 数据查看: (3)分别单击标签Biology & Chemistry生物学和化学, Materials & Methods材料和方法,Sequence Details细分 序列,Geometry几何形态,观察数据信息。也可以单击 Help查看帮助文件。 (4)回到Structure Summary组织摘要,标签,在右侧的 Images and Visualization区域可以观察蛋白的三维结构, 可以单击KiNG,Jmol,WebMol等查看三维结构。 (5)单击左侧目录中的Download Files下载不同格式和内容

10、的 文件;或下载FASTA序列文件;也可单击1adz 右侧的 Download PDB file 图标下载PDB文件(1adz.pdb)。 LOGO 生物学与化学标签 LOGO 方法标签 LOGO 序列标签 LOGO 几何形状标签 LOGO 摘要标签 LOGO (5)数据结构 PDB中对于每一个结构记录,包含名称、参 考文献、序列、一级结构、二级结构和原子坐标 等信息。 LOGO (6)结构模型显示软件 RasMol RasMol是一个进行分子三维立体结构显示的软件, 可以非常方便地观察蛋白质、核酸以及一些小分子的三 维结构,并在自己的个人电脑上,以各种模式、各种角 度,甚至按照自己的意愿旋转

11、,观察此分子的微观三维 立体结构,进而了解化合物分子结构和各种微观性质与 宏观性质之间的定量关系。 LOGO 例如:在RasMol软件下观察1GGZ.pdb结构 (1)下载并安装RasMol 2.7.3.1( http:/www.rasmol.org/software/rasmol/ ) (2)单击开始程序RaswinRaswin,运行RasMol 。 (3)当运行RasMol时,程序首先打开具有黑色背景的 主窗口(显示窗口),同时也会打开另一个窗口, 其背景色是白色的,被称作“命令行窗口”。初始运 行时,命令行窗口通常为最小化状态,用 ALT+TAB键切换,即可打开该窗口,在主显示窗 口的菜

12、单中的任何选择和操作,均可在此窗口中输 入命令行实现。 LOGO (4)单击RasMol主菜单上的“File/Open”载入“人上皮细胞 calmodulin样蛋白”的结构数据(即1GGZ.pdb)。 (5)蛋白质分子的外观立体结构观察: 利用RasMol主菜单上的“Display”命令中的不同显示 模式来变换分子的三维立体结构的外观。 (6)蛋白质分子的外观立体结构的颜色显示模式: 利用主菜单上的“Colours”命令来选择不同的颜色显 示模式,以进一步更直观、清晰地展示所要观察的分 子的立体结构。 LOGO (7)蛋白质分子三维结构的选择性显示: RasMol主菜单中的“Display”和

13、“Colours”命令主要用于 分子的正常显示,在主菜单上还有一个“Options”选项 命令,可以进行一些非正常的显示。 (8)蛋白质分子三维结构的旋转显示: 鼠标点击窗口右方与下方的滚卷条,将以X轴或Y轴 旋转。 将鼠标移至主屏幕区,按住鼠标左键,移动鼠标, 就可以任意旋转此分子。按住Shift键,同时按住鼠标的 右键,移动鼠标,即可实现以Z轴旋转。 通过命令行方式。 (9)蛋白质三维立体结构图像的输出 LOGO 3、 SCOP数据库 (1)简介 蛋白质结构分类数据库SCOP (Structural Classification of Proteins)的目标是提供关于已知结构 蛋白质之间

14、的结构和进化关系的信息,所涉及的蛋白 质包括结构数据库PDB中的所有条目。 LOGO SCOP数据库除了提供蛋白质结构和进化关系 信息外,对于每一个蛋白质还包括下述信息: 到PDB的链接 蛋白质序列 参考文献链接 空间结构的图像等。 SCOP的结构分类主要是通过人工来完成的, 通过图形显示器观察和比较蛋白质结构,并借助 于一些软件工具进行分析。 LOGO (2)分类的层次结构 v家族: 具有明显进化关系的蛋白质聚集到一个家族中, 意味着两个蛋白质之间的等同氨基酸残基数超过 30%。然而,在某些情况下,虽然两个蛋白质序 列不相似,但它们具有相似的结构和相似的功能 ,表明属于同一个家族。 LOGO

15、 v超家族: 超家族中的成员具有远源进化关系,具有共同 的进化源。 v折叠: 无论有无共同的进化起源,只要具有相同排列 和拓扑结构的主要二级结构,即将蛋白质分类 为具有相同的折叠。 LOGO (3) SCOP查询 v网址:http:/scop.mrc-lmb.cam.ac.uk/scop/ v单击 top of the hierarchy SCOP首先从总体上将蛋白质进行分类,例如全型,全 型,以平行折叠为主的/型,以反平行折叠为主的+型 等。 LOGO LOGO LOGO LOGO LOGO 例如: SCOP1.73版本有46456个全型蛋白质,该结构类型下有 258个折叠类。在这258个折叠类中的第一个超家族是类球 蛋白;类球蛋白又包含4个家族,其中第一个家族包含6个 结构域;每个结构域下面有很多蛋白质成员。 也可以直接利用查找工具,查找特定的蛋白质1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号