生物信息学的研究内容方法及意义

上传人:宝路 文档编号:48009519 上传时间:2018-07-08 格式:PPT 页数:84 大小:5.67MB
返回 下载 相关 举报
生物信息学的研究内容方法及意义_第1页
第1页 / 共84页
生物信息学的研究内容方法及意义_第2页
第2页 / 共84页
生物信息学的研究内容方法及意义_第3页
第3页 / 共84页
生物信息学的研究内容方法及意义_第4页
第4页 / 共84页
生物信息学的研究内容方法及意义_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《生物信息学的研究内容方法及意义》由会员分享,可在线阅读,更多相关《生物信息学的研究内容方法及意义(84页珍藏版)》请在金锄头文库上搜索。

1、生物信息学1生物信息学 说文解字:生物 + 信息 + 学 (bioinformatics)biology + information + theory 广义 应用信息科学的方法和技术,研究生物体 系和生物过程中信息的存贮、信息的内涵和信 息的传递,研究和分析生物体细胞、组织、器 官的生理、病理、药理过程中的各种生物信息 ,或者也可以说成是生命科学中的信息科学。 狭义 应用信息科学的理论、方法和技术,管理 、分析和利用生物分子数据。 2生命信息系统生物所处的时空系统物质系统,信息传递与控制,能量3相关学科图示4广义概念图示5狭义概念图示6总结:生物信息学 生物信息学(Bioinformatics

2、) 是一门新兴的交叉学科 ,是生命科学领域中的新兴学科,面对人类基因组计 划等各种项目所产生的庞大的分子生物学信息,生物 信息学的重要性将越来越突出,它将会为生命科学的 研究带来革命性的变革。 生物信息学是在生命科学的研究中,以计算机为工具 对生物信息进行储存、检索和分析的科学。 生物信息学是当今生命科学和自然科学的重大前沿领 域之一,同时也将是21世纪自然科学的核心领域之一 ,其研究重点主要体现在基因组学(Genomics)和蛋 白组学(Proteomics) 。 7生物学基础速递 细胞(分子水平) 个体生命 生命之树8生命的分子基础 细胞/分子水平 DNA/RNA 蛋白质 糖 脂类 9DN

3、A结构和碱基互补原理10中心法则11生物信息学的历史从人类基因组计划(从人类基因组计划(HGPHGP)说起)说起12曼哈顿原子弹计划阿波罗登月计划人类基因组计划1360年代初,美国总统Kennedy提出两个科学计划:登月计划攻克肿瘤计划 人类遗传信息的复杂性人类基因组计划 (HGP,Human Genome Project) 目标:整体上破解人类遗传信息的奥秘目标:整体上破解人类遗传信息的奥秘为什么提出为什么提出HGPHGP?14生命活动三要素:物质、能量、信息DNA: 遗传物质(遗传信息的载体) 双螺旋结构A, C, G, T四种基本字符的复杂文本基因(Gene):具有遗传效应的DNA分子片

4、段DNADNA、基因、基因组基因、基因组15基因组(Genome):包含细胞或生物体全套的遗传信息的全部遗传物质。原核生物(细菌、病毒等)真核生物(真菌、植物、动物等)人类基因组:3.2109 bp 16HGPHGP的历史回顾的历史回顾1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基因组DNA序列的意义 1985 Dulbecco在Science撰文 “肿瘤研究的转折点:人类基因组的测序” 美国能源部(DOE)提出“人类基因组计划”草案 1987 美国能源部和国家卫生研究院(NIH)联合为“人类基因组计划”下拨启动经费约550万美元 1989 美国成立“国家人类基因组研究中心”,W

5、atson担任第一任主任 1990.10 经美国国会批准,人类基因组计划正式启动171995 第一个自由生物体流感嗜血菌(H. inf)的全基因组测序完成1996 完成人类基因组计划的遗传作图启动模式生物基因组计划H.inf全基因组Saccharomyces cerevisiae 酿酒酵母Caenorhabditis elegans 秀丽线虫181997 大肠杆菌(E.coli)全基因组测序完成 1998 完成人类基因组计划的物理作图开始人类基因组的大规模测序Celera公司加入,与公共领域竞争启动水稻基因组计划1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度大肠杆菌及其全基因

6、组水稻基因组计划191999.7 第5届国际公共领域人类基因组测序会议,加快测序速度 2000 Celera公司宣布完成果蝇基因组测序国际公共领域宣布完成第一个植物基因组拟南芥全基因组的测序工作Drosophila melanogaster 果蝇Arabidopsis thaliana 拟南芥 202001年2月15日Nature封面2001年2月16日Science封面2000.6.26 公共领域和Celera公司同时宣布完成人类基因组工作草图 2001.2.15 Nature刊文发表国际公共领域结果 2001.2.16 Science刊文发表Celera公司及其合作者结果21我国对人类基因

7、组计划的贡献22HGPHGP带来的科学挑战带来的科学挑战 随着实验数据和可利用信息急剧增加,信息的管理和 分析成为HGP的一项重要的工作 发现生物学 规律解读生物 遗传密码认识生命的本质研究基因组数据 之间的关系分析现有的 基因组数据利用数学模型 和计算技术23 各学科参与、协作:生命科学、数学、物理学、化学、计算机科学、材料科学以及伦理、法律等社会科学 首要科学问题如何找到记载在基因组DNA一维结构上控制生命时间、空间的调控信息的编码方式和调节规律。应用数学、复杂系统理论、信息论、非线性科学催生生物信息学、计算生物学 芯片技术交叉性技术领域:物理学、微电子信息技术、生化技术、信息技术、自动化

8、、材料科学 结构生物学前沿领域之一:生物物理学、生物化学、晶体学、波谱学、光谱学以及X射线晶体衍射技术、核磁共振技术24生物信息学的发展历史生物信息学 基本思想的产生 生物信息学的迅速发展二十世纪 50年代二十世纪 80-90年代生物科学和 技术的 发展人类基因组 计划的 推动 25 20世纪50年代,生物信息学开始孕育 20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来 20世纪70年代,生物信息学的真正开端 20世纪70年代到80年代初期 ,出现了一系列著名的序列比较方法和生物信息分析方法 20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库 20世纪90年代

9、后 ,HGP促进生物信息学的迅速发展26关于生物信息学发展历程中的重要大事, 请参见下面两个网站的介绍:http:/www.ncbi.nlm.nih.gov/Education /BLASTinfo/milestones.html、http:/www.biosino.org/bioinformatics/ 。27生物信息学的研究内容1、 生物分子数据的收集与管理 2、 数据库搜索及序列比较 3、 基因组序列分析 4、基因表达数据的分析与处理 5、蛋白质结构与功能预测 6、基因-蛋白相互作用网络 7、整个系统调控网络28基因组 数据库 蛋白质 序列 数据库 蛋白质 结构 数据库 DDBJEMBL

10、GenBankSWISS-PROT PDBPIR生物分子数据的收集与管理生物分子数据的收集与管理29数据库搜索及序列比较 搜索同源序列在一定程度上就是通过序列比 较寻找相似序列 序列比较的一个基本操作就是比对( Alignment),即将两个序列的各个字符( 代表核苷酸或者氨基酸残基)按照对应等同 或者置换关系进行对比排列,其结果是两个 序列共有的排列顺序,这是序列相似程度的 一种定性描述 多重序列比对研究的是多个序列的共性。序 列的多重比对可用来搜索基因组序列的功能 区域,也可用于研究一组蛋白质之间的进化 关系。 30基因组序列分析 遗传语言分析天书 基因组结构分析 基因识别 基因功能注释

11、基因调控信息分析 基因组比较31基因表达数据的分析与处理 基因表达数据分析是目前生物信息学研究的 热点和重点 目前对基因表达数据的处理主要是进行聚类 分析,将表达模式相似的基因聚为一类,在此 基础上寻找相关基因,分析基因的功能 所用方法主要有:相关分析方法、模式识别 技术中的层次式聚类方法、人工智能中的自 组织映射神经网络、主元分析方法 等 表达数据缺点:仅反映mRNA丰度,噪声, 32蛋白质结构预测 蛋白质的生物功能由蛋白质的结构所决定 , 蛋白质结构预测成为了解蛋白质功能的重要 途径 蛋白质结构预测分为: 二级结构预测 空间结构预测 蛋白质折叠33二级结构预测 在一定程度上二级结构的预测可

12、以归结为模式识别问 题 在二级结构预测方面主要方法有: 立体化学方法 图论方法 统计方法 最邻近决策方法 基于规则的专家系统方法 分子动力学方法 人工神经网络方法 预测准确率超过70%的第一个软件是基于神经网络的 PHD系统 34空间结构预测 在空间结构预测方面,比较成功的理论 方法是同源模型法 该方法的依据是:相似序列的蛋白质倾 向于折叠成相似的三维空间结构 运用同源模型方法可以完成所有蛋白质 10-30%的空间结构预测工作 35生物信息学当前的主要任务 当今生物信息学界的大 部分人都把注意力集中在基 因组、蛋白质组、蛋白质结 构以及与之相结合的药物设 计上,随蛋白组学、代谢组 学进一步的发

13、展,将在整体 水平进行 36基因组 新基因的发现 通过计算分析从EST(Expressed Sequence Tags)序列库中拼接出完整的新基因编码区, 也就是通俗所说的“电子克隆”;通过计算分析从 基因组DNA序列中确定新基因编码区,经过多年 的积累,已经形成许多分析方法,如根据编码 区具有的独特序列特征、根据编码区与非编码 区在碱基组成上的差异、根据高维分布的统计 方法、根据神经网络方法、根据分形方法和根 据密码学方法等。 37非蛋白编码区生物学意义的分析 38非蛋白编码区约占人类基因组的95%,其生物学 意义目前尚不是很清楚,但从演化观点来看,其中 必然蕴含着重要的生物学功能,由于它们

14、并不编码 蛋白,一般认为,它们的生物学功能可能体现在对 基因表达的时空调控上。对非蛋白编码区进行生物学意义分析的策略有两 种,一种是基于已有的已经为实验证实的所有功能 已知的DNA元件的序列特征,预测非蛋白编码区中 可能含有的功能已知的DNA元件,从而预测其可能 的生物学功能,并通过实验进行验证;另一种则是 通过数理理论直接探索非蛋白编码区的新的未知的 序列特征,并从理论上预测其可能的信息含义,最 后同样通过实验验证。 39基因组整体功能及其调节网络的系统把握 把握生命的本质,仅仅掌握基因组中部分 基因的表达调控是远远不够的,因为生命现象 是基因组中所有功能单元相互作用共同制造出 来的。基因芯

15、片技术由于可以监测基因组在各 种时间断面上的整体转录表达状况,因此成为 该领域中一项非常重要和关键的实验技术,对 该技术所产生的大量实验数据进行高效分析, 从中获得基因组运转以及调控的整体系统的机 制或者是网络机制,便成了生物信息学在该领 域中首先要解决的问题。 40基因组演化与物种演化 (生命之树)41尽管已经在分子演化方面取得了许多重要的成就, 但仅仅依靠某些基因或者分子的演化现象,就想阐明物 种整体的演化历史似乎不太可靠。例如,智人与黑猩猩 之间有98%-99%的结构基因和蛋白质是相同的,然而 表型上却具有如此巨大的差异,这就不能不使我们联想 到形形色色千差万别的建筑楼群,它们的外观如此不同 ,但基础的部件组成却是几乎一样的,差别就在于这些 基础部件的组织方式不同,这就提示我们基因组整体组 织方式而不仅仅是个别基因在研究物种演化历史中的重 要作用。由于基因组是物种所有遗传信息的储藏库,从 根本上决定着物种个体的发育和生理,因此,从基因组 整体结构组织和整体功能调节网络方面,结合相应的生 理表征现象,进行基因组整体的演化研究,将是揭示物 种真实演化历史的最佳途径。 42基因组对生命体的整体控制必须通过它所表达的全 部蛋白质来执行,由于基因芯片技术只能反映从基因组 到RNA的转录水平上的表达情况,由于从RNA到蛋白质还 有许多中间环节的影响,因此仅凭基因芯片

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号