普通生物学——生命科学通论整理.ppt

上传人:摩西的****12 文档编号:133231018 上传时间:2020-05-25 格式:PPT 页数:77 大小:4.06MB
返回 下载 相关 举报
普通生物学——生命科学通论整理.ppt_第1页
第1页 / 共77页
普通生物学——生命科学通论整理.ppt_第2页
第2页 / 共77页
普通生物学——生命科学通论整理.ppt_第3页
第3页 / 共77页
普通生物学——生命科学通论整理.ppt_第4页
第4页 / 共77页
普通生物学——生命科学通论整理.ppt_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《普通生物学——生命科学通论整理.ppt》由会员分享,可在线阅读,更多相关《普通生物学——生命科学通论整理.ppt(77页珍藏版)》请在金锄头文库上搜索。

1、 第九讲生物信息学 将给生命科学带来变革性的变化 Biologyisshiftingfrombeinganobservationalsciencetobeingaquantitativemolecularscience 学习目的 1 了解生物信息学的发展背景 定义2 理解生物信息学在生命科学研究中的作用3 理解数学 计算机科学如何在生物信息中的地位和作用4 了解基因芯片的检测原理和制备方法 第一节生物信息学 Bioinformatics 一 生物学基础 复习 二 发展背景与定义三 研究内容四 研究现状五 发展前景 一 生物学基础 表型与基因型 phenotypevs genotype 遗传信息

2、的流动基因的表达与调控分子进化DNA序列分析 基因识别 调控元件识别 进化分析mRNA 剪切位点识别 基因表达分析蛋白质 结构预测 蛋白质间相互作用 亚细胞定位基因组 基因预测 进化分析染色体 结构分析网络 pathway建模细胞 系统 二 发展背景和定义 生物信息 广义的概念 生命现象是不同层次上的物质 能量与信息的交换 不同层次是指核酸 蛋白质 细胞 器官 系统 整体等研究生物体系和生物过程中信息的内涵和信息的传递生物电磁学与电磁生物学 视觉系统与光信息处理 脑和神经系统与信息 生物体结构与微光机电系统 发展背景 BiocomputingComputationalBiologyBioinf

3、ormatics1986年 在EMBLHeidelberg成立Biocomputing部门 命名为BIOinformatis 如果我们不能回答生物学问题 作为计算生物学家是失败的 1997年底创立了CABIOS ComputerApplicationsintheBiosciences weassert computationalplanningandanalysisisanintegralpartofthebiologicaldiscoveryprocess 在完整基因组序列和高通量技术时代不要仅仅谈论分析海量数据的挑战 相反 要谈论疾病产生的风险 关于人类遗传差异 基因型改变的进化如何导致功

4、能的改变 如何使用数据来回答这些问题 Background背景 19651970197519801985199019952000 100 00010 0001 0001001010 10 010 001 1 000 MedlineRecords Transistors Chip DNASequences 3DStructures CumulativeGrowthofBiologicalInformationandComputerPower MarkBogulski 1998 Bioinformatics ANewEra 生物医药工业 提供大量基因序列分析的工具 在以下方面加快新药开发的进程 资

5、料的获取 包括从数据库中寻找新药开发者感兴趣的基因序列和相关资料文献基因功能的预测和基因生理作用的预测需要大量信息处理的药物筛选和加工过程 WeinsteinJNetal 1997 DefinitionofBioinformatics 1 Bioinformaticsisdefinedasascientificdisciplinethatencompassesallaspectsofbiologicalinformationacquisition processing storage distribution analysisandinterpretation thatcombinesthet

6、oolsandtechniquesofmathematics computerscienceandbiologywiththeaimofunderstandingthebiologicalsignificanceofavarietyofdata 生物信息学是一门交叉学科 它包含了生物信息的获取 处理 存储 分发 分析和解释等在内的所有方面 它综合运用数学 计算机科学和生物学的各种工具 来阐明和理解大量数据所包含的生物学意义 UnderstandingOurGeneticInheritance TheUSHumanGenomeProject TheFirstFiveYears1991 1995

7、NIHPublibcationNo 901590 April 1995 DefinitionofBioinformatics 2 Bioinformaticsisconceptualisingbiologyintermsofmolecules inthesenseofPhysicalchemistry andapplying informaticstechniques derivedfromdisciplinessuchasappliedmaths computerscienceandstatistics tounderstandandorganisetheinformationassocia

8、tedwiththesemolecules onalargescale OxfordEnglishDictionary Computation Informatics Biology Bioinformatics 算法统计学信息理论图形学科学可视化图像识别人工智能密码学非线性动力学计算机模拟语言学机器学习数据库软件工程计算机网络分布式系统 数据获取数据解释基因组图谱三维结构预测分子建模药物设计同源比较分子进化数据库检索基因预测仪器设计数据库构建基因调控基因诊断及治疗 生物信息学 计算机科学和数学 分子生物学 生物信息学研究意义 利用数理统计 模式识别 动态规划 密码解读 语意解析 信令传递 神

9、经网络 遗传算法以及隐马氏模型等各种方法对序列 结构数据进行定性和定量分析 从中获取基因编码 基因调控 序列 结构 功能关系等理性知识阐明细胞 器官和个体的发生 发育 病变 衰亡的基本规律和时空联系探索生命起源 生物进化 生命本质等重大理论问题 最终建立 生物学周期表 指导分子生物学实验 生物信息学 研究方向 基因组序列装配基因识别基因功能预报基因多态性分析基因进化mRNA结构预测基因芯片设计基因芯片数据分析疾病相关基因分析 蛋白质序列分析蛋白质家族分类蛋白质结构预测蛋白质折叠研究代谢途径分析转录调控机制蛋白质芯片设计蛋白质芯片数据分析药物设计 三 生物信息学的研究内容 数学 计算机科学 生物

10、学1 与HGP相关的研究内容2 功能基因组研究相关内容3 蛋白组学相关4 基因芯片信息学研究 Statistics统计学 ProbabilityTheory概率论 特别是随机过程理论 OperationalResearch运筹学 OptimizationTheory Method最优化理论与方法 Topology拓扑学 主要是几何拓扑 FunctionTheory函数论 InformationTheory信息论 ComputationalMathematics计算数学 GroupTheory群论 数学 Maths 几个常用数学模型概念与方法 Bayes公式 Bayes统计马氏链 Markovc

11、hains 隐马氏链 HiddenMarkovchains Poisson过程与连续时间马氏链熵 相对熵与信息增益神经网络 neuralnetworks NN Multi layerfeed forwardNN self organizedlearningNN recurrentNN HopfieldNN Bolztmannmachine 网络技术 数据库 特别是关系型数据库 数据整合和可视化 数据挖掘 基于Unix操作系统的各种软件包 一些重要的算法的复杂性研究 计算机科学 ComputerScience 计算机硬件 生物信息学研究内容 Alignment 序列比对 包括 全序列 局部和多重

12、比对 Fasta Blast PSI Blast ProteinStructurePrediction 蛋白质结构预测 Computer AidedGeneRecognitions 计算机辅助基因识别 算法纷纭 较著名的为GeneScan GeneFinder 等 尚存在许多问题 DNALanguage DNA语言 MolecularEvolution ComparedGenomics 分子进化和比较基因组学 ContigAssembly 序列重叠群装配 OriginofGeneticCodes 遗传密码的起源 AnalysisofMetabolizeNetwork 代谢网络分析 GeneCh

13、ipDesign 基因芯片设计 与HGP相关的生物信息学研究 1 高度自动化的实验数据的获得 加工和整理各种自动化分子生物学仪器应用上 如DNA测序仪 PCR仪等实验过程高度自动化甚至工厂化 产生的海量数据 gigabyte 专门的实验室数据管理系统自动完成包括实验进程和实验数据的纪录 常规数据分析 数据质量检测和问题的自动查找 常规的数据说明和数据输入数据库 目前还没有成熟的通用的分子生物学数据管理系统 2 序列片段的拼接 目前DNA自动测序仪每个反应只能测序500bp左右 传统测序方法是将克隆进行亚克隆并对亚克隆进行排序 自动而高速拼接序列的算法 Lander Waterman模型 Lan

14、derESandWatermanMS 1998 利用鸟枪法进行测序 再将大量随机测序的片段用计算机进行自动拼接 1 9MbHaemophilusinfluenzae 流感嗜血杆菌 FleischmannRDetal 1995 0 58MbMycoplasmugenitalium 枝原体 FraserCMetal 1995 0 58Mbjannaschii 甲烷杆菌 BultCJetal 1996 有待改进 将已知的基因组知识应用于拼接算法 进一步提高拼接真核基因组的有效性 自动处理自动测序造成的差错 Alignment Alignment 序列比对 联配 对齐等 包括 全序列 局部多重比对 F

15、asta Blast PSI Blast AGCGGTGCAGGTTACTGCGCGTAGTAC ACGGTGCGGTTACTGCGGCGTAGTAC AGCGGTGCAGGTTACTGCGCGTAGTAC A CGGTGCGGTTACTGCGGCGTAGTAC AGCGGTGCAGGTTACTGCGCGTAGTAC A CGGTGC GGTTACTGCGGCGTAGTAC AGCGGTGCAGGTTACTGC GCGTAGTAC A CGGTGC GGTTACTGCGGCGTAGTAC 序列一 序列二 RawDNAsequence GeneBank 11 5Millonsequence12

16、5billionbasesSeparatingcodingandnon codingIdentificationofintronsandexonsGeneproductpredictionForensicanalysis 基因识别 识别基因组编码区 识别基因结构1 同源比较 DNA序列 EST 2 基因预测 不是用同源搜索的方法来识别基因 从头开始基因预测基于知识的基因预测 密码子使用 碱基组成 剪切位点特征 PolyA信号 2 3 6核苷酸频率 转录信号 转译信号 尺寸分布 基因预测的步骤 1 识别可能的外显子2 辨别起始 内部 终止外显子3 把起始 一些内部的和终止外显子的连起来 形成可能的基因4 确保该可能的基因没有内部的移位或终止密码子5 leftovers shadowexons算法 Rule basedsystem linguisticsystem lineardiscriminantanalysis decisiontree splicedalignment fourieranalysis EvaluatingGenePrediction 敏感性 Sensitivity

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号