实验五蛋白质序列分析ppt课件.ppt

上传人:资****亨 文档编号:123379408 上传时间:2020-03-09 格式:PPT 页数:50 大小:5.50MB
返回 下载 相关 举报
实验五蛋白质序列分析ppt课件.ppt_第1页
第1页 / 共50页
实验五蛋白质序列分析ppt课件.ppt_第2页
第2页 / 共50页
实验五蛋白质序列分析ppt课件.ppt_第3页
第3页 / 共50页
实验五蛋白质序列分析ppt课件.ppt_第4页
第4页 / 共50页
实验五蛋白质序列分析ppt课件.ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《实验五蛋白质序列分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《实验五蛋白质序列分析ppt课件.ppt(50页珍藏版)》请在金锄头文库上搜索。

1、复旦大学 实验五 蛋白质序列分析 基因与蛋白质组学数据分析 实验项目五 蛋白质序列分析 一 实验目的和要求 掌握蛋白质基本性质分析 基本理化性质 和疏水性分析 掌握蛋白质信号肽的预测 亚细胞定位的 预测 跨膜结构及卷曲螺旋结构的预测 了解基于motif 结构位点 结构功能域数 据库的蛋白质功能预测 掌握基于序列同源性分析的蛋白质功能预 测 一 蛋白质基本理化性质分析 蛋白质理化性质是蛋白质研究的基础 蛋白质的基本性质 相对分子质量 氨基酸组成 等电点 PI 消光系数 半衰期 不稳定系数 总平均亲水性 实验方法 相对分子质量的测定 等电点实验 沉降实验 缺点 费时 耗资 基于实验经验值的计算机分

2、析方法 软件 Bioedit 网络工具ProtParam Compute PI 基于一级序列的组分分析 氨基酸亲疏水性等分析为高级结构预测提供参考 ExPASy Expert Protein Analysis System 开发的 针对蛋白质基本理化性质的分析 Protparam 工具 蛋白质理化性质分析 Protparam 工具 计算以下物理化学性质 相对分子质量 理论 pI 值 氨基酸组成 原子组成 消光系数 半衰期 不稳定系数 脂肪系数 总平均亲水性 主要选项 参数 序列在线提交形式 如果分析SWISS PORT和TrEMBL数据库中序列 直接填写Swiss Prot TrEMBL AC

3、号 accession number 如果分析新序列 直接在搜索框中粘贴氨基酸序列 输入Swiss Prot TrEMBL AC号 打开protein txt 将蛋白质序列 粘贴在搜索框中 输入Swiss Prot TrEMBL AC号 分不同的功能域肽段 以P02699为例 输出结果 功能域 用户自定义区段 点击不同功能域得到以下结果 氨基酸数目 相对分子质量 理论 pI 值 氨基酸组成 正 负电荷残基数 9 消光系数 半衰期 原子组成 分子式 总原子数 不稳定系数 脂肪系数 总平均亲水性 40 unstable 二 蛋白质疏水性分析 疏水作用是蛋白质折叠的主要驱动力 分析蛋白质氨基酸亲疏水

4、性是了解蛋白质折叠的 第一步 氨基酸疏水分析为蛋白质二级结构预测提供佐证 是分析蛋白质跨膜区重要一步 ProtScale工具 氨基酸标度 表示氨基酸在某种实验状态下相对其他氨基酸在某些性 质的差异 如疏水性 亲水性等 收集50多个文献中提供的氨基酸标度 默认值以Hphob Kyte Doolittle做疏水性分析 ProtScale能计算超过50种蛋白质的特性 仅一项需要额外设 定的参数是输入框的宽度 该参数将指示系统每次运行计算 和显示的残基数 其缺省值为9 如果想考虑跨膜螺旋特性 该参数设置应为20 因为一个跨膜螺旋通常有20个氨基酸 长度 蛋白质亲疏水性分析 主要选项 参数 序列在线提交

5、形式 如果分析SWISS PORT和TrEMBL数据库中序列 直接填写Swiss Prot TrEMBL AC号 accession number 如果分析新序列 直接在搜索框中粘贴氨基酸序列 以P02699为例 输入Swiss Prot TrEMBL AC号 打开protein txt 将一条蛋白质序列 粘贴在搜索框中 氨基酸标度 计算窗口 7 11 相对权重值 权重值变化趋势 是否归一化 所用氨基酸 标度信息 分析所用参 数信息 输出结果 图形结果 文本结果 参数 每个位置 的得分 三 信号肽预测 蛋白质合成后要运送到细胞中不同的部位 有的 蛋白质要通过内质网膜进入内质网腔内 最终成 为分

6、泌蛋白 分泌蛋白的N端都有一段约15 35个氨基酸的疏水 性肽段 其功能是引导蛋白质多肽链穿过内质网 膜进入腔内 称为信号肽 signal peptide 按照氨基酸组成及其位置特征 可将信号肽分为4 大类 1 分泌信号肽 2 脂蛋白信号肽 3 Pilin like信号肽4 细菌素和细菌素信号肽 蛋白质序列分析 信号肽主要由三个domain组成 N region H regin 和C region N region为正电荷区域 至少含有一个精氨酸 R 或赖氨酸 K H region为疏水核 一般长为12 14个氨基酸 C region包含信号肽酶 SPase 的剪切位点 在剪切 位点的 1位和

7、 3位上多为中性的丙氨酸 该区域也 称为富含丙氨酸区域 N H C N端 C端 蛋白质序列分析 常用工具 SignaIP 通过神经网络方法的组合 预测信号肽的位置及相应切点 三 信号肽的预测 人的内质网驻留蛋白信号肽预测 Q9BS26 输入序列的FASTA文件 人的内质网驻留蛋白信号肽预测 曲线颜色 此处C值最大 S值陡峭 Y值最高峰 预测为信 号肽剪切位点 文本结果 YES代表该蛋 白包含信号肽 剪切位点 位于29 30残基处 C score 剪切位点分值 S score 信号肽分值 Y score 综合剪切位点分值 四 蛋白质亚细胞定位预测 亚细胞定位与蛋白质的功能存在着非常重要的联系 亚

8、细胞定位 预测基于如下原理 1 不同的细胞器往往具有不同的理化环境 它根据蛋白质的结构及表面理化特征 选择性容纳蛋白 2 蛋白 质表面直接暴露于细胞器环境中 它由序列折叠过程决定 而后者 取决于氨基酸组成 因此可以通过氨基酸组成进行亚细胞定位的 预测 推荐使用PSORT II软件对PDCD5蛋白的细胞内定位进行预测 PSORT将动物蛋白质定位于10个细胞器 1 细胞浆 2 细胞骨架 3 内质网 4 胞外 5 高尔基体 6 溶酶体 7 线粒体 8 胞核 9 过氧化物酶体 peroxisome 和 10 细胞膜 输入蛋白质序列 FASTA文件 细胞外 细胞壁 线粒体 细胞骨架 细胞核 五 跨膜区预

9、测 各个物种的膜蛋白的比例差别不大 约四分之一的人类已知蛋 白为膜蛋白 由于膜蛋白不溶于水 分离纯化困难 不容易生 长晶体 很难确定其结构 因此 对膜蛋白的跨膜螺旋进行预 测是生物信息学的重要应用 推荐使用TMHMM软件 ICEs TMHMM 对蛋白进行跨膜预测 TMHMM 综合了跨膜区疏水性 电荷偏倚 螺旋长度和膜蛋白拓扑学限 制等性质 采用隐马氏模型 Hidden Markov Models 对跨膜 区及膜内外区进行整体的预测 TMHMM是目前最好的进行跨膜区 预测的软件 它尤其长于区分可溶性蛋白和膜蛋白 因此首选它 来判定一个蛋白是否为膜蛋白 所有跨膜区预测软件的准确性 都不超过52 但

10、86 的跨膜区可以通过不同的软件进行正确预 测 因此 综合分析不同的软件预测结果和疏水性图以获得更 好的预测结果 输入蛋白质序列 FASTA文件 铝激活苹果酸转运蛋白的跨膜区预测 跨膜区 起始氨 基酸 终止氨 基酸 文字结果 跨膜区膜外区膜内区 图形结果 卷曲螺旋 coiled coil 是蛋白质中由2 7条 螺旋链缠绕成麻花 状结构的总称 存在于多种天然蛋白质中 如转录因子 结构蛋白 膜 蛋白中 在生物体内执行着代谢调控 分子运动 膜通 道 分子识别等重要的生物功能 六 蛋白质卷曲螺旋域分析 典型的有亮氨酸拉链 存在7残基 重复结构 heptad repeat 以a b c d e f g位

11、置表示 其 中a和d位置为疏水性氨基酸 而其他 位置 残 基为亲水性 卷曲螺旋 控制蛋白质寡聚化的元件 存在于转录因子 蛋白融合多肽等 一种很简单的三级结构 容易预测 常用工具 COILS Prediction of Coiled Coil Regions in Proteins 选择滑动窗口大小 选择打分矩阵 和权重 选择输入格式 选择 SwissProtID or AC 查询内容 输入 Q9H2G9 33 图形结果 预测为 卷曲螺 旋的区 域 七 结构域分析 结构域 structure domain 是在蛋白质三 级结构中介于二级和三级结构之间的可以 明显区分但又相对独立的折叠单元 每个

12、结构域自身形成紧实的三维结构 可以独 立存在或折叠 但结构域与结构域之间关 系较为松散 结构域通常由25 300个氨基酸组成 不同 蛋白质结构域数目或同一蛋白质结构域相 似度差异较大 蛋白质序列分析 常见的结构域主要有5种 全平行结构域 反平行结构域 结构域 结构域 其他折叠类型 结构域是蛋白质的功能 结构和进化单元 结构域分析对于蛋白质结构的分类和预 测有着重要作用 蛋白质序列分析 七 基于结构域 模体 的蛋白质功能预测 一类基因具有转录功能 且它们所编码的蛋白 质都具有Y结构域 模体 蛋白质B也具有Y 结构域 模体 因而蛋白质B的功能也应该 与基因转录相关 蛋白质B 转录活性 转录活性 蛋

13、白质模体或结构域在氨基酸序列水平比其他区 域保守 通过对序列比对可以发现这些在进化上 较为保守的区域 蛋白质模体或结构域通常与该蛋白质的功能直接 相关 根据模体或结构域信息可以对同源水平较低的蛋 白质的进行功能预测 基于结构域 模体 的蛋白质功能预测 七 蛋白质序列分析 蛋白质家族 结构域 位点及功能分析 绿脓假单胞菌 RpsA 层粘连蛋白受体 蛋白质序列分析 保守结构域以及功能分析 RNA结合结构域 核酸结合 七 基于同源序列的蛋白质功能预测 蛋白质A具有转录功能 蛋白质B与A在氨 基酸序列上相似 直系同源 因而蛋白 质B也具有转录功能 AB 转录活性 转录活性 蛋白质A 蛋白质B 至少80

14、个氨基酸长度范围内具有25 以上的序列一 致性才提示可能的显著性意义 未知功能序列对库 检索的一般分析策略如下 和运行Blastp程序的服务器 连接 将目的序列粘贴到序列输入框中 选择BLOSUM62 记分矩阵运行BlastP程序 NCBI的BlastP程序要求输 入格式为FASTA格式 如果BlastP检测到了高度同源的序列 将有可能提 示目的序列的生物学功能 七 基于同源序列的蛋白质功能预测 序列相似性比较作为一个非常有效的工具用于同源 基因的发现 基于序列同源的蛋白质功能预测 基于序列同源的蛋白质功能预测 1 在uniprot数据库中检索人脂联素 adiponectin 蛋白质序列 写

15、出检索号 2 使用在线分析平台ExPASy对上述蛋白质序列进行分子质量 氨基酸组成 protparam 和疏水性等基本性质分析 protscale 写出分子质量是多少 氨基酸组成情况 哪个氨 基酸所占比例最高 哪个最低 不稳定系数是多少 根据该系 数判断 该蛋白质稳定吗 带正负电荷氨基酸个数分别是多少 疏水性分析结果如何 截图报道图形结果 在图中标出疏 水性高的位点三个 疏水性低的位点3个 并在文字结果中 找到这些位点对应的的氨基酸编号和类型 格式例如6号亮氨 酸 作 业 作 业 3 预测海参溶菌酶A0MT08的信号肽 并分析 结果 指出信号肽位置 4 预测P69332的亚细胞定位 并翻译 分

16、析 截取最终结果 指出该蛋白质在那些位置 表达 5 预测P69332的跨膜区 并分析预测结果 指出哪些区域是跨膜区 6 使用COILS Server对对水稻瘤矮病毒RGDV P2蛋白卷曲螺旋预测分析 指出预测为卷 曲螺旋的区域 作 业 6 利用Interproscan分析人脂联素 adiponectin 蛋白质的结构域信息 写出 该蛋白包含哪些结构域 其可能的功能是 什么 7 对人脂联素 adiponectin 蛋白质进 行blast 搜索 找到与其同源的蛋白 前五个列出 检索号和蛋白名称 分别来自于五个什 么物种 实验报告 到网络教学平台 基因与蛋白质组学数据分析 B2100029 教学材料 实验课件 下载基因与蛋白质组学数据分析实验报告模版 将上述问题答案整理到实验报告中 正反打印放在 2张纸上 不超过2张 下次实验课上交 复旦大学 谢谢大家 此课件下载可自行编辑修改 供参考 感谢您的支持 我们努力做得更好

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号