antheprot中文说明书

上传人:第*** 文档编号:31318914 上传时间:2018-02-06 格式:DOC 页数:18 大小:735KB
返回 下载 相关 举报
antheprot中文说明书_第1页
第1页 / 共18页
antheprot中文说明书_第2页
第2页 / 共18页
antheprot中文说明书_第3页
第3页 / 共18页
antheprot中文说明书_第4页
第4页 / 共18页
antheprot中文说明书_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《antheprot中文说明书》由会员分享,可在线阅读,更多相关《antheprot中文说明书(18页珍藏版)》请在金锄头文库上搜索。

1、 生物的化学,就是蛋白质与核酸的化学。对蛋白质的研究是生物化学领域一个非常重要的部分。近年来,通过实施基因组计划,得到了大量的蛋白序列数据,但是,面对如此众多的蛋白质序列数据,其分析工作是一个非常困难的工作。用人工的方法是不可能完成如此大量的分析工作的。运用计算机,利用一定的运算规则,进行蛋白序列分析是唯一的方法。蛋白序列分析软件包 ANTHEPROT 4.3 正是这样的一个程序。蛋白序列分析软件包 ANTHEPROT 4.3 是位于法国的蛋白质生物与化学研究院(Institute of Biology and Chemistry of Proteins)用十多年时间开发出的蛋白质研究软件包。

2、软件包包括了蛋白质研究领域所包括的大多数内容,功能非常强大。应用此软件包,使用个人电脑,便能进行各种蛋白序列分析与特性预测。感谢软件的编写者,他们将此软件包免费提供给此领域的同行使用,这对于我国的科学技术人员来说,实在是一件好事。因为一个功能再多再好的专业应用软件,如果作为商业软件进行销售的话,往往使大多数需要使用此软件的科技人员因为科研经费的问题,无缘使用,这点在我国尤为突出。软件分为三个版本,分别用于 Unix 系统,DOS 系统与WINDOWS95 或 98 系统,让我以用于 WINDOWS 系统的版本为例,介绍一下这个软件的基本用法。软件包为一个自解压执行文件,文件名 Anthe4_3

3、c.exe,大小为1.9 兆。执行此文件,输入解压后存放的目录名,便可将所有文件解压在此目录下。主程序名为 Anthewin,在桌面上建立它的快捷图标,双击快捷图标便打开了 ANTHEPROT 4.3 主窗口。通过主程序,我们可以载入蛋白序列,对序列进行编辑、打印、拷贝、改变设定等操作,更重要的是,我们可以在此调用各种所需的分析工具,对蛋白序列进行分析。一 序列编辑功能ANTHEPROT 4.3 的主窗口便是其序列编辑窗口:可以使用 按键或菜单中的 File/Open 命令打开各种序列文件,程序识别的文件类型包括:单序列文件格式:*.SEQ, (ANTHEPROT 3.3 支持以下格式的单序列

4、文件:DNA/Strider 格式、EMBL 格式、NBRF 格式、Pearson/Fasta 格式、PIR 格式与 IG/Stanford 格式);含有多个蛋白序列的蛋白数据库文件:*.BAS,(以Pearson/Fasta 格式添加序列,上限为 30 条序列或 32K 文件大小);ClustalV 或 ClustalW 文件:*.ALN 含有 ClustalW 格式的多队列;含有多队列的 Multalin 4.1 格式文件:*.MUL;在 Prosite 蛋白数据库中查寻出 Site 结果的文件:*.SIT,蛋白质原子空间结构的 PDB 格式文件:*.PDB;使用 IBCP(http:/w

5、www.ibcp.fr/predict.html)服务器预测蛋白二级结构所获得的结果文件格式:*.CNS ;序列可以从 ANTHEPROT 编辑窗口以键盘输入,或者以*.SEQ等文件格式载入,也可以从其它文件复制粘贴到编辑窗口。最简单的序列格式为 Pearson/Fasta 格式,为文本格式文件,带有开始的为序列蛋白的名称,其后便是蛋白序列。下面为一个此格式的例子:MBNVLSEGEWQLVLHVWAKVEADVAGHGQDILIRLFKSHPETLEKFDRFKHLKTEAEMKASEDLKKHGVTVLTALGAILKKKGHHEAELKPLAQSHATKHKIPIKYLEFISEAIIH

6、VLHSRHPGDFGADAQGAMNKALELFRKDIAAKYKELGYQG程序支持的一些编辑功能如下: 取消,恢复(Undo):Ctrl+Z。 查找 Ctrl+T。 支持复制与粘贴。 可以自定义字符颜色,背景色与打印字体。 可打印序列文件。输入或载入序列后,便同时打开了一个图像窗口,以彩图的形式显示出蛋白序列。不同的蛋白残基以不同的颜色表示。下面便是打开一个序列后的主程序窗口的例子:二工具栏与基本功能当序列格式识别后,Methods 菜单便被激活,相应的快捷按键也出现在工具栏中。这些按键依次为:打开文件按键 ;存储文件按键 ;打印按键 ;更改字体与格式按键 ;更改设定颜色按键 ;进行蛋白

7、序列二级结构预测 ;在蛋白序列中查找符合 PROSITES 数据库的特征序列 ;绘制出蛋白序列的所有理化特性曲线 ;在 Internet 或本地蛋白序列数据库中查找类似序列 ;计算蛋白序列分子量,比重与各蛋白残基百分组成 ;计算蛋白序列滴定曲线与等电点 ;选定一个片段后,绘制 Helical Wheel 图 ;进行点阵图(Dot Plot)分析 ;计算信号肽潜在的断裂位点 ;打开一个简单的帮助文件 ;退出程序 。三基本分析工具介绍除了通过单击快捷按键的方式进行各种蛋白序列分析,通过菜单进行各种操作也非常方便。下面让我将一些主要分析工具的功能介绍一下:1. 点阵图(Dot Plot)Dot Pl

8、ot 分析方法对以下分析工作非常有用: 在一条序列内查找重复序列; 在 2 条序列中不同位置查找类似片段; 在不同序列中查找同源性。只有当程序载入一条序列时,才可以激活 Dot Plot 程序,选择菜单命令 Dot Plot 或单击按键 ,运行 Dot Plot 程序,可再选择要进行比较的第二条序列。然后,再确定参数与限制条件,包括:窗口尺寸:移动片段的长度矩阵:选择替代矩阵下图为含有两个蛋白酶序列的点阵图,两个酶具有同源性,因为由点阵图可以看到,基本上有非常好的斜线。但由于此斜线的位置开始于位置 115,很容易知道,水平轴的蛋白序列含有前体(由1 到第 114 个残基组成) ,也清楚地看到,

9、它们具有一个小的内部重复片段(图上非常短的红线) 。2. 类似性查找(Similarity Search)此程序用来在一个蛋白数据库(可以是本地数据库,也可是网上的数据库)中,找出所有与给定序列具有同源性的序列。选择菜单命令 Methods/Similarity Search/WWW or Local Fasta,或者 Methods/Similarity Search/WWW-Blast at PBIL NPS server 便实现在蛋白数据库中对类似性蛋白序列的查找。需注意,如果在本地蛋白数据库中查找,需要先下载 SwissProt 蛋白质数据库。3. 查找 Site/signature在

10、 ANTHEPROT 主窗口单击 按键或选取菜单命令Methods / Site detection (Prosite),便进行位点与特征序列的查找。程序查找给定序列是否存在 PROSITE 数据库中已定义的特征序列,缺省设置为 100%匹配,也可设定为 Mismatch 1 or 2(一到两个不匹配)或者 Similarity level(类似水平) 。当前 PROSITE 数据库是 95 年 2月发布的,共 1054 个不同位点与特征序列,含有两个文件,PROSITE.DAT 与 PROSITE.DOC。此两个文件必需均放在ANTHEPROT 程序的目录下,程序才能进行。下图为查找结束后程

11、序输出的结果:绿色的文字可连接到 PROSITE 文件中相应的位置。需要知道的是,在你的蛋白序列中找到的特征序列并不一定具有生物学意义,只能说,查找的结果对寻找潜在的有意义片段具有很大帮助。4. 在序列数据库中查找一个自定义的特征序列:Pattern search选择菜单命令 Databases/Pattern search,便开始在网上的蛋白数据库或本地蛋白数据库中查找含有自定义特征序列的蛋白。所定义的特征序列必需符合 PROSITE 规定的语法。语法规则如下:- 位置分隔符;- 允许此位置为括号内的任何一个残基;- 允许此位置为除了括号内所包括的任何一个残基;- x 代表任何残基;- x(

12、3) 代表任何 3 个氨基酸残基,根据以上语法,如果要查找的特征序列为 N-PT-GM-x(2)-ILVM,则序列 N-P-K-G-H-V, N-T-L-K-G-M 将能够找到,而序列N-L-K-G-H-V, N-T-G-K-H-V 将不能找到。查找结束后,所有找到的序列将以 Pearson 格式,以 SEQ_x.BAS 为文件名存储在硬盘中。5. 预测物理化学特性曲线Antheprot 可以以图示的方法,显示出预测的蛋白质的物理化学特性曲线,下图为一个亲水性特性曲线的例子。在图中,一个可移动的光标,显示了目前在序列中的位置为 115,此位置的氨基酸残基(L )显示为红色,同时显示前 5 个与

13、后五个残基(为AIIHVLHSRHP) ,特性值(-7)与参数(5)也显示在图中。光标可以如下方式移动:鼠标左键在选定位置单击;方向键左或右为每次移动一个位置;Shift+方向键左或右为每次移动十个位置;方向键上或下为放大缩小。可显示的物理化学特性曲线包括:亲水曲线(Hydrophobicity profile)疏水曲线(Hydrophilicity profile)易溶性曲线(Solvent accessibility profile)抗原性曲线(Antigenicity profile)跨膜区域曲线(transmembranous regions profile)结合抗原性曲线(Combi

14、ned antigenicity profile)6. 二级结构预测Antheprot 提供了几种方法进行蛋白质二级结构预测,包括: GOR I 方法:在菜单中选择 Method/Secondary structure prediction/Garnier et al Gibrat 方法:在菜单中选择 Method/Secondary structure prediction/Gibrat et al Double Prediction Method DPM 方法:在菜单中选择Method/Secondary structure prediction/DPM Homologue 方法:在菜单中

15、选择 Method/Secondary structure prediction/Levin Predator 方法:在菜单中选择 Method/Secondary structure prediction/ Predator 或全部使用以上几种方法:单击 按键或在菜单中选择Method/Secondary structure prediction/All,其快捷键为Ctrl+L。五种方法的输出形式分别举例如下:GOR I 方法Gibrat 方法Double Prediction Method DPM 方法Homologue 方法Predator 方法全部使用以上几种方法的输出形式为上图中加入

16、了自定义的由 X 射线衍射法确定的二级结构图,可以显示在一个窗口,与其它预测的二级结构相比较。自定义的二级结构由以*.XRA 为扩展名的文件输入。其格式为 Pearson/Fasta 文件格式,下面是一个*.xra 文件的例子,Myoglobin CCCHHHHHHHHHHHHHHTTSHHHHHHHHHHHHHHHCHHHHHTCHHHHTCCSHHHHHHCHHHHHHH HHHHHHHHHHHTTTTCCHHHHHHHHHHHHHTTCCCHHHHHHHHHHHHHHHHHHCTTTTSHHHHHH HHHHHHHHHHHHHHHHHHHTCCCH 代表螺旋,图中表示为蓝色;E 代表折叠

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号