生物信息学全77页课件

上传人:F****n 文档编号:88160673 上传时间:2019-04-20 格式:PPT 页数:77 大小:3.77MB
返回 下载 相关 举报
生物信息学全77页课件_第1页
第1页 / 共77页
生物信息学全77页课件_第2页
第2页 / 共77页
生物信息学全77页课件_第3页
第3页 / 共77页
生物信息学全77页课件_第4页
第4页 / 共77页
生物信息学全77页课件_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《生物信息学全77页课件》由会员分享,可在线阅读,更多相关《生物信息学全77页课件(77页珍藏版)》请在金锄头文库上搜索。

1、,第九讲 生物信息学,将给生命科学带来变革性的变化! Biology is shifting from being an observational science to being a quantitative molecular science,学习目的,1、了解生物信息学的发展背景、定义 2、理解生物信息学在生命科学研究中的作用 3、理解数学、计算机科学如何在生物信息中的地位和作用 4、了解基因芯片的检测原理和制备方法,第一节 生物信息学 (Bioinformatics),一、生物学基础(复习) 二、发展背景与定义 三、研究内容 四、研究现状 五、发展前景,一、生物学基础,表型与基因型(

2、phenotype vs. genotype) 遗传信息的流动 基因的表达与调控 分子进化 DNA序列分析:基因识别、调控元件识别、进化分析 mRNA:剪切位点识别、基因表达分析 蛋白质:结构预测、蛋白质间相互作用、亚细胞定位 基因组:基因预测、进化分析 染色体:结构分析 网络:pathway建模 细胞: 系统:,二、发展背景和定义,生物信息广义的概念,生命现象是不同层次上的物质、能量与信息的交换,不同层次是指核酸、蛋白质、细胞、器官、系统、整体等 研究生物体系和生物过程中信息的内涵和信息的传递 生物电磁学与电磁生物学、视觉系统与光信息处理、脑和神经系统与信息、生物体结构与微光机电系统,发展背

3、景,Biocomputing Computational Biology Bioinformatics 1986年,在EMBL Heidelberg成立Biocomputing部门,命名为BIOinformatis.如果我们不能回答生物学问题,作为计算生物学家是失败的。1997年底创立了CABIOS(Computer Applications in the Biosciences). we assert:computational planning and analysis is an integral part of the biological discovery process. 在完整

4、基因组序列和高通量技术时代不要仅仅谈论分析海量数据的挑战,相反,要谈论疾病产生的风险,关于人类遗传差异、基因型改变的进化如何导致功能的改变,如何使用数据来回答这些问题。,Background 背景,1965 1970 1975 1980 1985 1990 1995 2000,100,000 10,000 1,000 100 10 1 0.1 0.01 0.001,1,000,Medline Records,Transistors/Chip,DNA Sequences,3D Structures,Cumulative Growth of Biological Information and C

5、omputer Power,Mark Bogulski (1998) Bioinformatics: A New Era,生物医药工业,提供大量基因序列分析的工具,在以下方面加快新药开发的进程: 资料的获取、包括从数据库中寻找新药开发者感兴趣的基因序列和相关资料文献 基因功能的预测和基因生理作用的预测 需要大量信息处理的药物筛选和加工过程(Weinstein JN et al. ,1997),Definition of Bioinformatics (1),Bioinformatics is defined as a scientific discipline that encompasses

6、 all aspects of biological information acquisition, processing, storage, distribution, analysis and interpretation, that combines the tools and techniques of mathematics, computer science and biology with the aim of understanding the biological significance of a variety of data. 生物信息学是一门交叉学科。它包含了生物信

7、息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。 Understanding Our Genetic Inheritance. The US Human Genome Project: The First Five Years 1991-1995. NIH Publibcation No. 901590, April, 1995,Definition of Bioinformatics (2),Bioinformatics is conceptualising biology in terms of

8、molecules(in the sense of Physical chemistry) and applying “informatics techniques” (derived from disciplines such as applied maths, computer science and statistics) to understand and organise the information associated with these molecules, on a large scale. Oxford English Dictionary,Computation,In

9、formatics,Biology,Bioinformatics,算法 统计学 信息理论 图形学 科学可视化 图像识别 人工智能 密码学 非线性动力学 计算机模拟 语言学 机器学习 数据库 软件工程 计算机网络 分布式系统,数据获取 数据解释 基因组图谱 三维结构预测 分子建模 药物设计 同源比较 分子进化 数据库检索 基因预测 仪器设计 数据库构建 基因调控 基因诊断及治疗,生物信息学,计算机科学和数学,分子生物学,生物信息学研究意义,利用数理统计、模式识别、动态规划、密码解读、语意解析、信令传递、神经网络、遗传算法以及隐马氏模型等各种方法 对序列、结构数据进行定性和定量分析,从中获取基因编

10、码、基因调控、序列-结构-功能关系等理性知识 阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律和时空联系 探索生命起源、生物进化、生命本质等重大理论问题,最终建立“生物学周期表”,指导分子生物学实验,生物信息学 研究方向,基因组序列装配 基因识别 基因功能预报 基因多态性分析 基因进化 mRNA结构预测 基因芯片设计 基因芯片数据分析 疾病相关基因分析,蛋白质序列分析 蛋白质家族分类 蛋白质结构预测 蛋白质折叠研究 代谢途径分析 转录调控机制 蛋白质芯片设计 蛋白质芯片数据分析 药物设计,三、生物信息学的研究内容,数学、计算机科学、生物学 1、与HGP相关的研究内容 2、功能基因组研究相

11、关内容 3、蛋白组学相关 4、基因芯片信息学研究,Statistics 统计学,Probability Theory 概率论 (特别是随机过程理论),Operational Research 运筹学,Optimization Theory & Method 最优化理论与方法,Topology 拓扑学 (主要是几何拓扑),Function Theory 函数论,Information Theory 信息论,Computational Mathematics 计算数学,Group Theory 群论,数学(Maths),几个常用 数学模型概念与方法,Bayes 公式、 Bayes统计 马氏链 (M

12、arkov chains) 隐马氏链 (Hidden Markov chains) Poisson 过程与连续时间马氏链 熵、相对熵与信息增益 神经网络 (neural networks (NN): Multi-layer feed-forward NN, self-organized learning NN, recurrent NN(Hopfield NN, Bolztmann machine ),网络技术,数据库 (特别是关系型数据库),数据整合和可视化,数据挖掘,基于Unix操作系统的各种软件包,一些重要的算法的复杂性研究,计算机科学(Computer Science),计算机硬件,生

13、物信息学研究内容, Alignment (序列比对) 包括:全序列、局部和多重比对;Fasta, Blast, PSI-Blast Protein Structure Prediction (蛋白质结构预测) Computer-Aided Gene Recognitions (计算机辅助基因识别) 算法纷纭,较著名的为GeneScan, GeneFinder, 等;尚存在许多问题 DNA Language (DNA语言) Molecular Evolution & Compared Genomics (分子进化和比较基因组学) Contig Assembly (序列重叠群装配) Origin

14、of Genetic Codes (遗传密码的起源) Analysis of Metabolize Network (代谢网络分析) GeneChip Design (基因芯片设计),与HGP相关的生物信息学研究,1、高度自动化的实验数据的获得、加工和整理 各种自动化分子生物学仪器应用上,如DNA测序仪,PCR仪等 实验过程高度自动化甚至工厂化,产生的海量数据(gigabyte),专门的实验室数据管理系统自动完成包括实验进程和实验数据的纪录,常规数据分析,数据质量检测和问题的自动查找,常规的数据说明和数据输入数据库。 目前还没有成熟的通用的分子生物学数据管理系统。,2、序列片段的拼接,目前DN

15、A自动测序仪每个反应只能测序500bp左右, 传统测序方法是将克隆进行亚克隆并对亚克隆进行排序。 自动而高速拼接序列的算法,Lander-Waterman模型(Lander ES and Waterman MS,1998)利用鸟枪法进行测序,再将大量随机测序的片段用计算机进行自动拼接。1.9Mb Haemophilus influenzae(流感嗜血杆菌)(Fleischmann RD et al. ,1995)0.58Mb Mycoplasmu genitalium(枝原体)(Fraser CM et al. ,1995) 0.58Mb jannaschii(甲烷杆菌) (Bult CJ e

16、t al. ,1996) 有待改进:将已知的基因组知识应用于拼接算法,进一步提高拼接真核基因组的有效性;自动处理自动测序造成的差错,Alignment, Alignment (序列比对、联配、 对齐等) 包括:全序列、局部 多重比对; Fasta, Blast, PSI-Blast,AGCGGTGCAGGTTACTGCGCGTAGTAC | | | ACGGTGCGGTTACTGCGGCGTAGTAC,AGCGGTGCAGGTTACTGCGCGTAGTAC | | | | | A_CGGTGCGGTTACTGCGGCGTAGTAC,AGCGGTGCAGGTTACTGCGCGTAGTAC | | | A_CGGTGC_GGTTACTGCGGCGTAGTAC,AGCGGTGCAGGTTACTGC_

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号