生物信息学 第一章 生物信息学概述

上传人:n**** 文档编号:88919757 上传时间:2019-05-13 格式:PPT 页数:56 大小:9.17MB
返回 下载 相关 举报
生物信息学 第一章 生物信息学概述_第1页
第1页 / 共56页
生物信息学 第一章 生物信息学概述_第2页
第2页 / 共56页
生物信息学 第一章 生物信息学概述_第3页
第3页 / 共56页
生物信息学 第一章 生物信息学概述_第4页
第4页 / 共56页
生物信息学 第一章 生物信息学概述_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《生物信息学 第一章 生物信息学概述》由会员分享,可在线阅读,更多相关《生物信息学 第一章 生物信息学概述(56页珍藏版)》请在金锄头文库上搜索。

1、生物信息学Bioinformatics,生物科学与技术学院,初步计划讲授内容,第一章 概论(2) 第二章 生物学基础(略) 第三章 生物信息数据库及其信息检索(4-6) 第四章 序列比对与算法(6) 第五章 核酸序列分析(6) 第六章 蛋白质结构预测和分子设计(4-6) 第七章 基因组信息学(4) 第八章 蛋白质组信息学(4) 第九章 生物信息学前沿(自学),参考书籍,1、生物信息学教程蔡禄. 化学工业出版社, 2007 2、生物信息学(第二版)张阳德主编. 科学出版社, 2009 3、生物信息学陶士珩主编. 科学出版社, 2007 4、生物信息学应用技术王禄山, 高培基.化学工业出版社, 2

2、007 5、生物信息学与功能基因组学(美)乔纳森佩夫斯纳 著; 孙之荣 译. 化学工业出版社, 2006,网上资源,1、华中农业大学国家精品课程生物信息学网站 (http:/ 2、西南交通大学生物信息学精品课程网站 (http:/ 3、东南大学生物信息学网络学习平台 (http:/ 4、美国国立生物技术信息中心 ( http:/www.ncbi.nlm.nih.gov),期刊,生物信息学、Bioinformatics、BMC Bioinformatics,生物信息学概述,什么是生物信息学:,生物信息学(Bioinformatics): 是研究生物信息的采集,处理,存储,传播,分析和解释等各方面

3、的学科。 是随着生命科学和计算机科学的迅猛发展而快速突起的一门学科。 是生命科学、生物统计学、现代数学、信息科学和计算机科学的结合学科,可揭示大量而复杂的生物数据所蕴藏的生物学奥秘。,生物信息学?新兴的交叉学科,Mathematical sciences,Computer sciences,Life sciences,生物学背景? 分子生物学基因工程 数学? 统计学,模型,算法 计算机科学背景? Linux/Perl/PHP/JAVA/C+/Visual Basic,生物信息学的学习人员: 1)学习生物信息学是为了发展生物信息学 计算机科学家 2)学习生物信息学是为了应用生物信息学 生物学家

4、我们属于,Bioinformatics in the Universe,Universe (宇宙=空间+时间),Human civilization,Non-human world,一级结构 二级结构 三级结构,1、DNA分子 2、蛋白质分子,生物分子,一级结构 二级结构 三级结构 四级结构,DNA,前体RNA,mRNA,多肽链,基因的DNA序列,蛋白质序列,对 应 关 系,遗 传 密 码,(1)遗传信息的载体DNA,DNA通过自我复制,在生物体的繁衍过程中传递遗传信息;,DNA,RNA,转录,翻译,蛋白 质,基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性

5、状。,复制,(2)蛋白质的结构决定其功能,蛋白质功能取决于蛋白质的空间结构 蛋白质结构决定于蛋白质的序列(这是目前基本公认的假设),蛋白质结构的信息隐含在蛋白质序列之中。,三个重要的信息,(3) DNA分子和蛋白质分子都含有进化信息,通过比较相似的蛋白质的核苷酸序列,如肌红蛋白和血红蛋白,可以发现由于基因复制而产生的分子进化证据。 通过比较来自于不同种属的同源蛋白质,即直系同源蛋白质,可以分析蛋白质甚至种属之间的系统发生关系,推测它们共同的祖先蛋白质。,总结:生物分子至少携带着三种信息 遗传信息 与功能相关的结构信息 进化信息,DNA 核酸序列,蛋白质 氨基酸序列,蛋白质 结构,蛋白质 功能,

6、最基本的 生物信息,维持生命活动的机器,第一部 遗传密码,第二部 遗传密码,生命体系千姿百态的变化,生物分子数据及其关系,蛋白质结构决定功能,第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少 对于第二部密码,目前则只能用统计学的方法进行分析 无论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量的生物分子数据之中。,生物分子数据是宝藏, 生物信息数据库是金矿,等待我们去挖掘和利用。,生 物 分 子 信 息,DNA序列数据,蛋白质序列数据,生物分子结构数据,生物分子功能数据,最基本,直观展示生命体系千姿百态的变化,复杂剖析,生物信息学涉及的生物分子数据

7、库,特征: 生物分子信息数据量大 生物分子信息复杂 生物分子信息之间存在着密切的联系,特征: 信息存储量大 计算性能高速、有效 信息交流方便,生物分子数据与计算机计算,生物信息学的发展历史,生物信息学 基本思想的产生,生物信息学 的迅速发展,二十世纪 50年代,二十世纪 80-90年代,生物科学和 技术的 发展,人类基因组 计划的 推动,20世纪50年代,生物信息学开始孕育 20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来,是生物信息学形成雏形的阶段 1962 Zucherkandl和Pauling提出分子进化理论 1967 Dayhoff研制出蛋白质序列图集,后演变为著

8、名的蛋白质信息源PIR 20世纪70年代,核酸测序技术成熟,开始了少量的基因组测序工作,标志着生物信息学的真正开端,(1)前基因组时代(20世纪90年代前),20世纪70年代到80年代初期,出现了一系列著名的序列比较方法和生物信息分析方法 1970 Needleman-Wunsch提出序列比对算法 1970 Gibbs和McIntyre发表矩阵打点作图法 1972 Gatlin将信息论引入序列分析,证实自然的生物分子序列是高度非随机的 1977 出现将DNA序列翻译成蛋白质序列的算法。 1975 Pipas和McMahon首先提出运用计算机技术预测RNA二级结构 1978 Gingeras等研

9、制出核酸序列中限制性酶切位点的识别软件 1981 Smith-Waterman算法出现 1981 Doolittle提出序列模式的概念 1983 Wilbur和Lipman提出序列数据库的搜索算法 1985 快速的蛋白质序列相似性搜索程序FASTP/FASTN发布 1988 Pearson和Lipman发表著名的序列比较算法FASTA,20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库 1982 GenBank数据库(Release3)公开 1986 日本核酸序列数据库DDBJ诞生 1986 出现蛋白质数据库SWISS-PROT 1988 美国国家生物技术信息中心NCBI创立 19

10、88 成立欧洲分子生物学网络(EMBnet),专门发布各种生物数据库,20世纪90年代后,HGP促进生物信息学的迅速发展,标志工作是人类基因组测序,基因寻找和识别等。 1986 “基因组学”概念产生,研究基因组的作图、测序和分析 1990国际人类基因组计划启动 1993成立Sanger中心,专门从事基因组研究 1995第一个细菌基因组测序完成 1996酶母基因组测序完成 1998第一个多细胞生物线虫基因组测序 1999果蝇基因组测序完成 2000人类基因组测序基本完成 2001人类基因组初步分析结果公布,(2)基因组时代(20世纪90年代后至21世纪初),Saccharomyces cerev

11、isiae 酿酒酵母(1996-1997),Caenorhabditis elegans 秀丽线虫(1998),冲击,我国对人类基因组计划的贡献,人类基因组计划给生物信息学提出挑战,随着实验数据和可利用信息急剧增加,信息的管理和分析成为HGP的一项重要的工作,发现生物学 规律,,解读生物 遗传密码,认识生命的本质,研究基因组数据 之间的关系,分析现有的 基因组数据,利用数学模型 和人工智能技术,(3)后基因组时代(21世纪后至今),21世纪后,发展重点逐渐转移到功能基因组学研究领域,主要标志技术是进行高通量基因组分析(megabace、3700、454测序技术)、蛋白质组分析和各种数据的比较整

12、合等,出现了转录组、蛋白质组和代谢组等各种组学概念。,megabace,3700,Sanger, UK,大规模测序基本策略,逐个克隆法:小片段针对图谱的! 全基因组鸟枪法:大片段-测序-组装(美国Celera公司) Contig:重叠群,基因组测序中将许多序列片段经过比对找到重叠区,从而连接成的长片段。,A,B,C,D,E,F,G,H,I,J,K,L,CONTIG,GAP,基因组比较,蛋白质结构,蛋白质序列,蛋白质功能关系,核苷酸序列,高通量测序技术,注释、解析,预测,验证,基于生物信息学的新药设计,基因组 数据库,蛋白质 序列 数据库,蛋白质 结构 数据库,DDBJ,EMBL,GenBank

13、,SWISS-PROT,PDB,PIR,(1)生物分子数据的收集与管理,生物信息学的主要研究内容,EMBL欧洲分子生物学实验室,于1974年由欧洲14个国家加上亚洲的以色列共同发起建立,包括一个位于德国Heidelberg的核心实验室,三个位于德国Hamburg,法国Grenoble及英国Hinxton的研究分部。,GenBank是美国国家生物技术信息中心建立的DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或来源于大规模基因组测序计划。,DDBJ日本DNA数据库,于1984年建立,是世界三大DNA 数据库之一,与NCBI的GenBank,EBI的EMBL数据库共同组成国际D

14、NA数据库。,SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。,PIR全称The Protein Information Resource,是一个集成了关于蛋白质功能预测数据的公共资源的数据库,其目的是支持基因组/蛋白质组研 究。PIR与MIPS(the Munich Information Center for Protein Sequences)、JIPID(the Japan International Protein Information Database)合作,共同构成了PIR-国际蛋白质序列数据库(PSD):一个主要的已预测的蛋白质数据库,

15、包括250000个蛋白。,蛋白质数据库PDB是由美国国家科学基金会、能源部的生物和环境研究所、国家健康组织中的两个单位:药品科学研究所和医药图书馆共同资助的。它们设立这个机构的共同目标是通过PDB尽量广泛地传播其收集的信息。,通过数据库搜索可以找到目的基因的相关信息 通过序列比较寻找同源基因,(2)数据库搜索及序列比较,AAGCTTAACGT AATCTTA-CGT,(3) 基因组序列分析,基因组结构分析、基因识别、基因功能注释 基因调控信息分析、基因组比较,UTR 内含子 启动子 基因之间的序列 ,基因的相关信息,基因组结构分析,基因表达数据分析是目前生物信息学研究的热点和重点 。对基因表达数据的处理主要是进行聚类分析,将表达模式相似的基因聚为一类,在此基 础上寻找相关基因,分析基因的功能 。,(4)基因表达数据的分析与处理,蛋白质的生物功能由蛋白质的结构所决定 ,蛋白质结构预测成为了解蛋白质功能的重要途径。,(5) 蛋白质结构预测,各种基序(motif)的识别 酸/碱性氨基酸的位置和统计 富含某种氨基酸的特性 亚细胞定位的预测 分子进化 蛋白质互作 等等,生物结构的组成 蛋白质与蛋白质之间的相互关系,(6)生物信息分析的技术与方法研究,改进和创造

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号