生物信息学软件技巧课件

上传人:博****1 文档编号:573836735 上传时间:2024-08-15 格式:PPT 页数:62 大小:1.37MB
返回 下载 相关 举报
生物信息学软件技巧课件_第1页
第1页 / 共62页
生物信息学软件技巧课件_第2页
第2页 / 共62页
生物信息学软件技巧课件_第3页
第3页 / 共62页
生物信息学软件技巧课件_第4页
第4页 / 共62页
生物信息学软件技巧课件_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《生物信息学软件技巧课件》由会员分享,可在线阅读,更多相关《生物信息学软件技巧课件(62页珍藏版)》请在金锄头文库上搜索。

1、生物信息学软件及使用技巧内容概要一. 生物信息学的概念二. 生物信息学软件的主要功能简介1.1.分析和处理实验数据和公共数据,加快研究进度,缩分析和处理实验数据和公共数据,加快研究进度,缩短科研时间短科研时间2.2.提示、指导、替代实验操作,利用对实验数据的分析提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验所得的结论设计下一阶段的实验3.3.用计算机管理实验数据用计算机管理实验数据4.4.寻找、预测新基因及预测其结构、功能寻找、预测新基因及预测其结构、功能5.5.蛋白高级结构预测蛋白高级结构预测三.生物学软件部分常见功能使用技巧PCR PCR 引物设计引物设计DNA

2、DNA、蛋白质序列同源分析及进化树构建、蛋白质序列同源分析及进化树构建Contig Express-DNA Contig Express-DNA 序列片断拼接序列片断拼接DNA DNA 模拟电泳模拟电泳重要生物数据库简介重要生物数据库简介四.生物信息学服务一.生物信息学的概念生物信息学的概念:生物信息学的概念:生物信息学是一门新兴的交叉学科,它将数学和计算机知识应用于生物学,以获取、加工、存储、分类、检索与分析生物大分子的信息,从而理解这些信息的生物学意义。二.生物信息学软件的主要功能简介生物信息学软件主要功能1.分析和处理实验数据和公共数据,加快研究进度,缩短科研时间2.提示、指导、替代实验

3、操作,利用对实验数据的分析所得的结论设计下一阶段的实验3.实验数据的自动化管理4.寻找、预测新基因及其结构、功能5.蛋白质高级结构及功能预测(三维建模,目前研究的焦点和难点)功能功能1. 分析和处理实验数据和公共数据,分析和处理实验数据和公共数据,加快研究进度,缩短科研时间加快研究进度,缩短科研时间核酸:序列同源性比较,分子进化树构建,结构信息分析,包括基元(Motif)、酶切点、重复片断、碱基组成和分布、开放阅读框(ORF),蛋白编码区(CDS)及外显子预测、RNA二级结构预测、DNA片段的拼接蛋白:序列同源性比较,结构信息分析(包括Motif,限制酶切点,内部重复序列的查找,氨基酸残基组成

4、及其亲水性及疏水性分析),等电点及二级结构预测等等本地序列与公共序列的联接,成果扩大网上数据库的运用(成果扩大)http:/IRACE(基因拉长功能)BLAST同源序列检索ENTREZSYSTEM(集成信息检索系统)ENTREZ集成检索示意图VectorNTISuit同源比较主窗口VectorNTISuit同源比较进化树Antheprot5.0DotPlot点阵图PeptoolLite-DotPlot点阵图DNASIS2.5蛋白二级结构预测DNASIS2.5RNA二级结构预测DNASIS2.5tRNA二级结构预测RNAStructure3.5RNA二结构预测Omiga2.0ORFMapDnaS

5、tar之Protean对氨基酸的亲疏水性分析:helicalwheel图功能功能2. 提示、指导、替代实验操作,利用对实提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验验数据的分析所得的结论设计下一阶段的实验用软件设计PCR引物,测序引物或杂交探针,设计克隆策略,构建载体,做模拟电泳实验,即模拟核酸内切酶或内肽酶对相应的底物分子切割后的电泳行为。蛋白跨膜区域分析,信号肽潜在断裂点预测。VectorNTISuit5.5模拟电泳GeneConstructionKit2.0模拟电泳Winplas2.6质粒构建OLIGO5.0PCR引物设计Atheprot5.0预测蛋白跨膜区

6、域Antheprot5.0预测信号肽断裂点功能功能3. 用计算机管理实验室数据及文献资料用计算机管理实验室数据及文献资料实验室结果的储存,管理和申报工作从网络数据库获得的序列文件(由ENTREZ集成检索系统所得的数据文件可以进入EndNote或者ReferenceManager储存管理)或资料文献的管理v软件:EndNote,ReferenceManagerReferenceManager9界面功能功能4. 用计算机预测新基因及其结构和功能用计算机预测新基因及其结构和功能对CDS(CodingSequence)蛋白编码区的预测准确率已达到90%以上对整个基因结构的预测存在一定难度vPWM(位置

7、权重矩阵)算法由物化原理技术开发,侧重于找基因表达系统和核酸相互作用的位点。给信号序列各个位置每种可能出现的核苷酸分配一个分数,将各位置分数相加后得出该序列作为潜在作用位点的分数。DNASIS2.5对蛋白编码区的预测A.(CodonBias)DNASIS2.5对蛋白编码区的预测B.(RareCodon)DNASIS2.5对蛋白编码区的预测C.(ORFList)DNASTAR之GeneQuest预测CDS功能5.蛋白高级结构预测该项技术算法十分复杂,尚未成熟。PDB及MMDB数据库目前仍然禁止收录软件预测出来的蛋白高级结构模型。X射线晶体学技术和多维核磁共振技术是当前人们认识蛋白高级结构的主要手

8、段,但两种技术都有不足之处。前者要求必需得到高标准的蛋白晶体,后者对分子量大于3万的大蛋白不能测定。因此理论模拟和结构预测显得十分重要。序列与结构关系的根源在于“蛋白质折叠的问题”,这是近期研究关注的焦点。目前应用的蛋白质结构预测的算法目前应用的蛋白质结构预测的算法1.同源预测(一级结构决定高级结构)2.结构与结构相对比(DALI算法)3.当前最先进的结构预测方法:结构类识别(foldrecognition)先建立一个已知的结构类数据库(foldlibrary),将待测序列“穿过”该数据库构成的座标,并根据事先确定的物理限制,逐个位置移动(threading,sequence-structur

9、ealignment),并用一个函数(sequence-structurefitnessalignment)判断序列与结构类的符合程度,找出未知序列在目标结构上的能量最优和构象最稳 固 的 比 对 位 置 。 对 计 算 机 要 求 很 高 。Cn3D2.5显示1EQFA链三维结构RasMol2.7显示1EQFA链三维结构PDB与MMDB结构图比较三.生物学软件部分常见功能使用技巧PCR引物设计引物设计的原则引物设计的原则 首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定的二聚体或发夹结构存在,最后引物不能在别的非目的位点引起高效DNA聚合反应(即错配)。围绕这几条基本原则,设计引物需要

10、考虑诸多因素,如引物长度(primer length),产物长度(product length),序列Tm值 (melting temperature),G值(internal stability),引物二聚体及发夹结构(duplex formation and hairpin),错误引发位点(false priming site),引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。引物设计要点一般引物的长度为16-23bp,常用的长度为18-21bp,过长或过短都不合适。引物3端的碱基一般不用A,因为A在错误引发位点的引发效率相对比较高,而其

11、它三种碱基的错误引发效率相对小一些。引物的GC含量一般为45-55%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。引物所对应模板序列的Tm值最好在72左右,当然由于模板序列本身的组成决定其Tm值可能偏低或偏高,可根据具体情况灵活运用。 G值反映了引物与模板结合的强弱程度,也是一个重要的引物评价指标,一般情况下,在Oligo 5.0软件的G值窗口中,引物的G值最好呈正弦曲线形状,即5端和中间部分G值较高,而3端G值相对较低,且不要超过9(G值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。分析其原理,引物与模板应具有较高的结合能量,这样有利于引物与模板序列的整

12、合,因此5端与中间段的G值应较高,而3端G值影响DNA聚合酶对模板DNA的解链,过高则不利于这一步骤。可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,最好没有错误引发位点,如此可以保证不出非目的产物的假带。引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会降低引物浓度从而导致PCR正常反应不能进行。对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。 关于引物的自动搜索和评价分析推荐使用自动搜索软件:Primer

13、Premier 5.0 推荐使用引物评价软件:Oligo 5/6实际操作示例 DNA、蛋白质序列同源分析及进化树构建相似性与同源性相似性是指一种很直接的数量关系,比如部分相同或相似的百分比或其它一些合适的度量。可进行自身局部比较。如 Dot Plot (点阵序列比较)同源性指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论,属于质的判断。如 Alignment (同源性分析)推荐软件相似性分析 Peptool Lite同源性分析Vector NTI Suit 6-AlignX实际操作示例 ContigExpress-DNA序列片断拼接推荐软件DNA序列片断拼接Vector NTI S

14、uit 6-ContigExpress Project实际操作示例 DNA模拟电泳一点体会DNA模拟电泳具有一定实验预示功能,模拟电泳不能作为实验结果或依据实际操作示例 重要生物数据库简介三大数据库NCBI (美国)http:/www.ncbi.nlm.nih.govDDBJ (日本)http:/www.ddbj.nig.ac.jpEBI (欧洲)http:/www.ebi.ac.uk/index.html其他重要数据库酵母基因组数据库(SGD)酵母蛋白质数据库(YPD)拟南芥数据库(AtDB)医学数据库(OMIM)线虫数据库(ACEDB)四.生物信息学服务服务内容1. PCR引物、测序引物及杂交探针的设计及评价2. DNA,蛋白质序列同源分析及进化树构建3. 生物大分子二级结构模拟显示及基本序列分析4.有关蛋白质亲疏水性,等电点,抗原性,跨膜蛋白,信号肽等分析以及Dot Plot服务5.质粒载体构建及克隆策略6.小型数据库建设及协助实验室进行数据管理维护 7.医学相关的图像、病例统计、分析及小型数据库建设8.网上数据库应用辅助:包括序列拉长(扩大实验成果),Blastn/Blastp,NCBI Entrez查询(多维查询),新序列、SNIP等申报9.蛋白质三维结构初步预测(此为生物信息学目前研发的焦点,正在探索中,结果可能不十分准确或者不能出结果) Thanks!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号