生物信息学简介幻灯片

上传人:E**** 文档编号:90119545 上传时间:2019-06-08 格式:PPT 页数:43 大小:349KB
返回 下载 相关 举报
生物信息学简介幻灯片_第1页
第1页 / 共43页
生物信息学简介幻灯片_第2页
第2页 / 共43页
生物信息学简介幻灯片_第3页
第3页 / 共43页
生物信息学简介幻灯片_第4页
第4页 / 共43页
生物信息学简介幻灯片_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《生物信息学简介幻灯片》由会员分享,可在线阅读,更多相关《生物信息学简介幻灯片(43页珍藏版)》请在金锄头文库上搜索。

1、,揭开生命奥秘的新兴交叉学科 第七章 生物信息学,内 容,生物信息学概念 生物信息学的内容 生物信息学的研究方法和技术 生物信息学软件和数据库,一、生物信息学的概念(p199),生物信息学是用数理和信息科学的观点、理论和方法,以计算机为工具对生物信息进行收集、加工、储存、传播、检索和分析的科学。 研究材料和结果是各种各样的生物学数据,人基因组海量信息 23对=46条染色体 30亿碱基对(base pairs) 35万个基因基因组学 3万种以上蛋白质 蛋白质组学 基因表达、作用、调控网络,已经或即将完成的生物全基因组,几百种原核生物 酵母菌 拟南芥 (1-2亿bp) 水稻 人类 (32亿bp)

2、小鼠 大鼠 猪 鸡等,生物信息学的概念,后基因组时代的到来 人类首次了解了自身的基因序列,了解了很多远亲生物的基因序列 正在面对指数扩增的基因序列和各种数据库 面临如何将基因序列资料转变为有用的知识,进而服务于人类,造福人类健康的挑战 人类功能基因组学必须多学科协作 生物信息学技术 生物芯片技术 蛋白质组学技术 高通量细胞筛选技术等 生物信息学是人类功能基因组学研究的必要工具,生物信息的开发和应用,以核酸蛋白质等生物大分子为主要研究对象 以信息、数理、计算机科学为主要研究手段 以计算机网络为主要研究环境 以计算机软件为主要研究工具 对序列数据进行存储、管理、注释、加工 对各种数据库进行查询、搜

3、索、比较、分析 构建各种类型的专用数据库信息系统 研究开发面向生物学家的新一代计算机软件,生物信息学的概念,计算机学、计算机网络,医学,生物学、 分子生物学,生物信息学,数学、 统计学,生物信息学和其它学科的关系,生物信息学是一门边缘学科,它位于生物、医学、计算机、数学等多个领域的交叉点上,生物信息学的概念,蛋白质组学和 结构基因组学,高通量药物筛选,药物设计和小分子设计,创新药物和新剂型,生物芯片,计算机辅助药物筛选 高通量虚拟筛选方法,分子数据库,组合化学化合物库,靶标生物大分子的功能分析.,蛋白质蛋白质相互 作用识别,信号传导系统、代谢途径的分子模拟.,图像处理、聚类分析、表达谱和调控网

4、络分析.,基因组信息 ,生物信息技术,计算机辅助先导化合物设计、药物设计,二、生物信息学的内容(p200),1.基因与基因组分析,可读框预测和基因标注,序列拼接 与组装,结果上传到数据库,碱基读取,载体标识与去除,测序仪中原始数据的采样与分析,大规模基因序列测定,生物信息学的内容,基因预测,DNA序列中编码区的鉴定 预测方法的依据: 编码统计学:编码区序列同非编码区序列相比,有不同的特点,存在一些非随机的特点 GC 含量 密码子偏倚性 (CODON FREQUENCY) 第三个碱基组成 基因结构/统计学方法 比较/同源性,生物信息学的内容,原核生物基因结构,编码区,启动子,转录起始位点,非翻译

5、区,转录区,起始密码子,终止密码子,5,3,转录终止位点,RBS,生物信息学的内容,5,真核生物基因结构,生物信息学的内容,HMM? HMM 描述了模型中各隐含状态的转换概率,用于基因预测的隐马尔可夫模型 Hidden Markov Models ,HMM,ATGCGTGCAGTCACCAGCAGTCAGTCG,基因组序列,生物信息学的内容,特定状态碱基对的概率取决于它前面碱基对的状态 向另一种状态的转换概率取决于转换信号的出现(剪切位点) 和/或 在特定隐藏状态的碱基对平均数量 (即内含子或外显子大小).,Introns,Exon,P= 0.5,P= 0.8,基因组序列,ATGCGTGCAG

6、TCACCAGCAGTCAGTCG,用于基因预测的隐马尔可夫模型,生物信息学的内容,研究主要集中在核苷酸序列的存储、分类、检索和分析等方面 新基因的发现 非蛋白编码区生物学意义的分析 基因组整体功能及其调节网络的系统把握 基因组演化与物种演化,基因组分析,生物信息学的内容,蛋白质结构 新蛋白的完整、精确和动态的三维结构 计算机辅助结构模拟 理解蛋白质的氨基酸序列和三维结构之间的关系 蛋白质序列及特性分析 蛋白质组学,2.蛋白质与蛋白质组分析,生物信息学的内容,相当数量的蛋白质、核酸、多糖的三维结构获得精确测定,基于生物大分子结构知识的药物设计成为热点; 根据靶标分子与药物分子相结合的活性部位的

7、几何形状和化学特征,设计出与其相匹配的具有新颖结构的药物分子。,3 新药设计,三、生物信息学的研究方法和技术,数学统计方法 在分析DNA语言中的语义、分析密码子使用频率、利用马尔可夫模型进行基因识别 动态规划(Dynamic Programming)方法 一种通用的优化方法:在状态空间中,根据目标函数,通过递推,求出一条从状态起点到状态终点的最优路径(代价最小的路径)。 DNA序列或者蛋白质序列的两两对比排列 模式识别技术 两种方法 根据统计特征进行识别 根据对象的结构特征进行识别,常用句法识别。 DNA序列上功能位点和特征信号的识别,数据库技术 生物分子信息的存储、管理、查询等功能建立在数据

8、库管理系统之上 人工神经网络技术 在功能上、结构上模拟大脑神经网络 神经网络计算速度快,更具有分析智能 应用:神经网络计算在优化和模式识别方面具有非常强的能力 基因识别、蛋白质结构预测上神经网络都取得了比其它方法更为准确的结果,分子模型化技术 利用计算机分析分子结构。通过交互操作平移、旋转和缩放分子的三维结构,从不同的角度观察分子构象和形状 分子力学和量子力学计算 主要基于半经验势函数的分子力学方法研究生物大分子的构象 量子力学在确定势函数的参数和研究局部性质 分子动力学模拟 研究蛋白质的构象及动力学,是计算机模拟实验的基础,遗传学运算规则 Optimisers / Evolvers DNA

9、computing,Evolutionary Computation (Metaphors from DNA to Selection),生物信息学的研究方法和技术,“Half day on the Web,saves you half month in the lab”,专家系统 将有关专家的知识和经验以一定的知识表示形式(如产生式规则、语义网络等)存放在计算中以智能的方式帮助提供参考性决策。如用于基因识别 Internet技术 交流:通过Internet网交流生物分子数据 查阅:从Internet网上查生物分子数据,如原始的序列、结构数据,加工处理的数据 服务:将所要处理的数据直接送到相应

10、的网络服务器上,服务器接受你的处理请求,并将处理结果返回给你,生物信息学的研究方法和技术,国外一直非常重视生物信息学的发展,各种专业研究机构和公司如雨后春笋般涌现出来,生物科技公司和制药工业内部的生物信息学部门的数量也与日俱增 1979年,美国洛斯阿拉莫斯国家实验室建立起GenBank数据库; 1982年,欧洲分子生物学实验室提供核酸序列数据库EMBL的服务; 1984年,日本着手建立国家级的核酸序列数据库DDBJ并于1987年开始提供服务,四、常用的分子生物学软件和数据库(p210),国内对生物信息学领域也越来越重视 1997年3月,北京大学于成立了生物信息学中心; 2000年3月,中科院上

11、海生命科学研究院成立 其他,北京大学的罗静初和顾孝诚教授在生物信息学网站建设方面、中科院生物物理所的陈润生研究员在EST序列拼接方面以及在基因组演化方面、天津大学的张春霆院士在DNA序列的几何学分析方面等等,软件和数据库,基因图谱数据库 核酸序列数据库 蛋白质序列数据库 大分子结构数据库等 国际著名的生物信息中心 NCBI National Center for Biotechnology Information (US) EBI European Bioinformatics Institute (EU) HGMP Human Genome Mapping Project Resource

12、Centre (UK ) ExPASy Expert of Protein Analysis System (Switzerland ) CMBI Centre of Molecular and Biomolecule (The Netherlands) ANGIS National Genome Information Service (Australia) NIG National Institute of Genetics (Japan) BIC National Bioinformatics Centre (Singapore),1. 数据库,国内部分生物信息学和生物医学信息服务器 北

13、京大学生物信息中心 http:/ 中国生物信息http:/www.biosino.org/ 北京大学物理化学研究所http:/ 北京医科大学生物医学信息http:/ 中国科学院微生物研究所http:/ 天津大学生物信息中心 http:/ 中科院计算所智能信息处理重点实验室生物信息学研究组 http:/ 中国科学院基因组信息学中心 http:/ 包含所有已知的核酸序列和蛋白质序列,以及相关的文献著作和生物学注释。 美国国立生物技术信息中心(NCBI)建立和维护 EMBL核酸序列数据库 由欧洲生物信息学研究所(EBI)维护 通过因特网上的序列提取系统(SRS)服务完成查询检索。 DDBJ数据库 日

14、本国立遗传学研究所维护 与Genbank和EMBL核酸库合作交换数据。使用主页上SRS工具进行数据检索和序列分析,全球数据已实现同步化 Global data synchronization,软件和数据库,GenBank的增长,图片来自http:/www.ncbi.nlm.nih.gov/Genbank/genbankstats.html,软件和数据库,资料来自:http:/www.ddbj.nig.ac.jp/images/ddbjnew/DBGrowth-e.gif,2005年6月发行的第84版EMBL数据库中,总计超过4525万条、491亿碱基数量的数据库,软件和数据库,Public f

15、ree Available via Internet,三大基因数据库之间的关系,Nucleotide Sequence Database (entry)2005.6.15,完整序列,软件和数据库,蛋白质信息资源数据库(PIR),主要提供按同源性和分类学组织的综合性、非冗余数据库 PIR由美国华盛顿的国家医学研究基金会支持,德国马普学会的慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护。 PIR通过提供蛋白质序列数据库、衍生的相关数据库及相应的软件而支持有关分子进化、功能基因组学和计算生物学方面的研究,,软件和数据库,蛋白质结构数据库( PDB),由美国自然科学基金会、能源部和国立卫生研究院共同投资建立 主要由X-射线晶体衍射和核磁共振(NMR)测得的生物大分子三维结构组成 用户可直接查询、调用和观察库中所收录的任何大分子三维结构,软件和数据库,PBD数据的增长,软件和数据库,2.软件,序列对比和数据库搜索软件BLAST, FASTA, BLITZ等 生物大分子可视化软件有Rasmol, Mage, Raster3d, Grasp等 与蛋白质结构有关的程序有Procheck, WHATIF, DSSP等 大型分子生物学软件包如GCG. 在基因识别著名软件GRAIL、GeneID、GeneM

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号