[计算机软件及应用]蛋白质组学数据分析

上传人:tian****1990 文档编号:69073944 上传时间:2019-01-12 格式:PPT 页数:72 大小:5.72MB
返回 下载 相关 举报
[计算机软件及应用]蛋白质组学数据分析_第1页
第1页 / 共72页
[计算机软件及应用]蛋白质组学数据分析_第2页
第2页 / 共72页
[计算机软件及应用]蛋白质组学数据分析_第3页
第3页 / 共72页
[计算机软件及应用]蛋白质组学数据分析_第4页
第4页 / 共72页
[计算机软件及应用]蛋白质组学数据分析_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《[计算机软件及应用]蛋白质组学数据分析》由会员分享,可在线阅读,更多相关《[计算机软件及应用]蛋白质组学数据分析(72页珍藏版)》请在金锄头文库上搜索。

1、实习5:蛋白质组学数据分析,系统生物学平台 浙江加州国际纳米技术研究院(ZCNI),张 婧 毛瑞芳 金呈朦 刘贯峰,1.蛋白质组学质谱分析背景介绍 2.蛋白质组学数据库检索软件GPM(X!tandem) 3.蛋白质组学数据统计分析软件TPP,课程内容:,蛋白质组学质谱分析背景介绍,Tandem MS,蛋白质组学质谱分析背景介绍,m/z:质量电荷比,蛋白质组学质谱分析背景介绍,http:/www.expasy.ch/tools/peptidecutter/,粘贴蛋白序列:PGYRNNVVN TMRLWSAKAPNDFNLKDFNVG,选择“Only the following selection

2、 of enzymes and chemicals”,并选择胰酶Trypsin酶切,点击Perform,蛋白质组学质谱分析背景介绍,APNDFNLK,肽段离子碎片示意图,蛋白质组学质谱分析背景介绍,具体数值,对应后页中离子质量,蛋白质组学质谱分析背景介绍,蛋白质组学质谱分析背景介绍,蛋白质组学质谱分析背景介绍,?面对如此多的质谱谱图和理论图谱我们将如何进行比对,目前人类已知蛋白大约有6万8千种,平均每种蛋白长度为500个氨基酸,平均每种蛋白可以胰切成50个肽段,平均每个肽段有10种可能打碎情况,每一种可能情况产生1张理论图谱,平均一次质谱实验有3000次扫描,每一次扫描产生1张质谱图,蛋白质组

3、学数据库检索软件 GPM(X!tandem),蛋白质组学数据库检索软件,X!Tandem 优点: 运算速度快 免费,并行集群计算成本低 开源可自行修改代码 缺点: 应用范围尚不广泛 后期统计软件接口尚未成熟,蛋白质组学数据库检索软件,硬件要求: 当前主流电脑配置即可胜任小规模数据检索,Download GPM Cyclone XE: ftp:/ftp.thegpm.org/projects/gpm/gpm-xe-installer/,蛋白质组学数据库检索软件,蛋白质组学数据库检索软件,数据库、结果 程序等核心内容,运行程序,质谱原始数据,解压缩:,蛋白质组学数据库检索软件,输出结果目录,数据库

4、,参数,工作流程: 将 *.raw 文件转变为 *.mzXML 文件 (练习文件为肝癌蛋白质组学数据) 2. 编辑参数 3. 运行 GPM中的X!Tandem 4. 查看结果 5. 使用自己的数据库,蛋白质组学数据库检索软件,1. 将 *.raw 文件转变为 *.mzXML 文件,开始运行输入“cmd” 开启命令行窗口,Download:http:/ 编辑参数,双击打开,选择程序X!Tandem,选择需要搜索的质谱数据 DTA, PKL, MGF, mzData, mzXML or Tandem BIOML,选择数据库,数据检索输出阈值,二级谱中片段离子理论与实际差异最大允许值,一级谱中片段离

5、子理论与实际差异最大允许值,搜索的离子为b离子与y离子,(|0|/M0)X10(ppm) 为离子质量的实测值; 为离子质量的理论值;,氨基酸残基的修饰,完全修饰,潜在的修饰 氧化,磷酸化等等,快速搜索可能的修饰,3.运行程序,点击运行,运行界面,4. 查看结果,查看检索参数,可保存为excel,将结果保存为excel,5.替换数据库,下载蛋白数据库存放到本文件夹 (所使用fasta数据库为所研究种属的蛋白数据库,可从ftp:/ftp.ebi.ac.uk/pub/databases/IPI/current/下载得到),用记事本打开,编辑文件,在GPM界面,数据库的下拉菜单中添加一个名为mydat

6、abase的选项,将新数据库的newdatabase.fasta.pro添加到GPM中, 保存文件,重新选择数据库运行程序。,参考文献:,http:/thegpm.org/ http:/thegpm.org/GPM/gpm_install_faq.html,蛋白质组学数据统计分析软件 Trans-Proteomics Pipeline (TPP),Trans-Proteomic Pipeline (TPP)是用于LC/MS/MS蛋白质组学数据分析的软件. TPP包含一系列蛋白质鉴定和定量分析的模块, 能够对经Sequest数据库搜索引擎得到的结果进行筛选过滤,从而达到蛋白质鉴定和测序的目的.,

7、蛋白质组学数据统计分析软件,Trans-Proteomic Pipeline,蛋白质组学数据统计分析软件,蛋白质组学数据统计分析软件,sp|P02754|LACB_BOVIN BETA-LACTOGLOBULIN PRECURSOR (BETA-LG) (ALLERGEN BOS D 5) - Bos taurus (Bovine). MKCLLLALALTCGAQALIVTQTMKGLDIQKVAGTWYSLAMAASDISLLDAQSAPLRVYVEELKPTPEGDLEILLQKWENGECAQKKIIAEKTKIPAVFKIDALNENKLVLDTDYKKYLLFCMENSAEPEQS

8、LACQCLVRTPEVDDEALEKFDKALKALPMHIRLSFNPTQLEEQCHI,TPEVDDEALEK : p = 0.96,PTPEGDLEILLQK : p = 0.81,LSFNPTQLEEQCHI : p = 0.65,P = 1 (1-0.81)(1-0.96)(1-0.65) = 0.99,蛋白质组学数据统计分析软件,TPP的安装与配置,从http:/tools.proteomecenter.org/TPP.php上下载并安装windows版本TPP软件。TPP_Setup_v4_2_JETSTREAM_rev_0.exe。安装过程中选择附带安装Apache(安装TP

9、P4.2要求系统已安装ActivePerl-5.8.8.*以上版本,可从http:/网站上下载)。安装完成后,将会生成TPP的图标,安装完后,桌面上生成了TPP图标,使用TPP,点击桌面上的 TPP Web Tools ,将会出现TPP的登陆界面.,UserName: guest Password: guest,TPP Web Interface的欢迎界面,样本数据分析,准备工作: 确保C盘至少1G的空闲的硬盘空间. 将数据文件ZCNI_No1(含.dta和.out文件)至ZCNI_No6和质谱RAW文件ZCNI_No1.RAW至ZCNI_No6.RAW,以及Sequest参数文件seques

10、t.param放到目录: C:InetpubwwwrootISBdataZCNI_training下 3. 将数据库文件ipi.HUMAN.fasta放到目录: C: database中,操作流程,将质谱RAW文件转换成mzXML文件 ; 以Sequest结果文件和mzXML文件转换成xml文件; 运行PeptideProphet,得到pepXML文件; 以上步得到的pepXML文件运行ProteinProphet,得到最终结果;,1.将RAW转换成mzXML文件,点击mzXML Utils,选择mzXML,在Input File Format中选择 Thermo Raw,在Specify F

11、ile to convert to mzXML中添加RAW文件,选择目录ZCNI_training,选择所有的RAW文件,在Conversion Options中选择Centroid, 然后点击Convert to mzXML,程序运行界面,2.由.out文件整合成pepXML文件,点击“Analysis Pipeline”, 然后点击pepXML,出现如图所示的界面。,选择需要转换成pepXML的.out文件夹,提交sequest检索时所用参数文件,选择所有文件夹,选择sequest的参数文件,其他参数选择默认,点击Convert to PepXML,即可以将文件夹中的所有.out文件整合成

12、pepXML文件,程序运行界面,3.运行PeptideProphet,选择RUN PeptideProphet,其他参数为默认.,点击RUN Xinteract,即可作 PeptideProphet分析.,PeptideProphet分析,在IE中打开的PeptideProphet的结果,在pick columns选项中选中xcorr、deltcan、sprank三个sequest的参数,选择Update Page,4.运行ProteinProphet,点击Analysis Pipeline,选择Analyze Proteins,点击,添加文件,选择经PeptideProphet后生成的 In

13、teract.pep.xml文件,其他为默认,点击Run ProteinProphet!,其它参数为默认,点击Run ProteinProphet,即可运行ProteinProphet程序,运行ProteinProphet完成后生 成的interact-prot.shtml 文件可由IE打开.,在IE中输入http:/localhost/ISB/data/ZCNI_training/interact.prot.shtml,看到经ProteinProphet后的结果为:,7.数据的过滤筛选和将结果保存成Excel文件,在min probability填上0.9,选择export To excel,然后点击Filter/Sort/Discard Checked entries,即可将结果过滤并生成Excel文件.,过滤筛选后生成的excel文件,肽段的氨基酸序列,过滤筛选后生成的excel文件,Thank You!,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号