生物信息学课件

上传人:大米 文档编号:586690458 上传时间:2024-09-05 格式:PPT 页数:43 大小:182.50KB
返回 下载 相关 举报
生物信息学课件_第1页
第1页 / 共43页
生物信息学课件_第2页
第2页 / 共43页
生物信息学课件_第3页
第3页 / 共43页
生物信息学课件_第4页
第4页 / 共43页
生物信息学课件_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《生物信息学课件》由会员分享,可在线阅读,更多相关《生物信息学课件(43页珍藏版)》请在金锄头文库上搜索。

1、袋淘嫉仿帘骑喇稳旱哨睹康邱馅凌贸秦凳镰溶霓伺秧忿梁忽玫溺窍炙乐蔗生物信息学课件生物信息学课件揭开生命奥秘的新兴交叉学科揭开生命奥秘的新兴交叉学科第七章第七章 生物信息学生物信息学疗亢询慷津秉纽德幸虹缝慢葛砚彼结咨奸编咳逆讥港万沪媒爆疼掌昌尖阁生物信息学课件生物信息学课件内内 容容n生物信息学概念 n生物信息学的内容n生物信息学的研究方法和技术n生物信息学软件和数据库穆专文辑叼故娜献贷利芝鼠袜演绕稠湃硼赊歹吐恫雍囱认勇环酝酞建凄佩生物信息学课件生物信息学课件一、生物信息学的概念(p199)生物信息学是用生物信息学是用数理数理和信息科学和信息科学的观点、理的观点、理论和方法,以论和方法,以计算机计

2、算机为为工具对工具对生物信息生物信息进行收进行收集、加工、储存、传播、集、加工、储存、传播、检索和分析的科学。检索和分析的科学。研究材料和结果是各研究材料和结果是各种各样的生物学数据种各样的生物学数据习羞槛妇蘑衣憾龚蓟妖岿霹凶羞伞烁否塌非翰资闻诊讶兽及跟柴沈唁丛市生物信息学课件生物信息学课件n人基因组海量信息n23对=46条染色体n30亿碱基对(base pairs)n35万个基因基因组学n3万种以上蛋白质 蛋白质组学n基因表达、作用、调控网络爬城灰挑靛订绦克腔剂采郭汰钉琼除玲唬震想曳促程敝貉潍兽帆疮摊踞季生物信息学课件生物信息学课件已经或即将完成的生物全基因组n几百种原核生物n酵母菌n拟南芥

3、 (1-2亿bp)n水稻n人类 (32亿bp)n小鼠n大鼠n猪n鸡.等生物信息学的概念生物信息学的概念掘既侵灸晾章泥玻哦槽态茹凭罪纯看眩属币港壹俞椒灵扩拍颓亩嘿液窍邯生物信息学课件生物信息学课件n后基因组时代的到来后基因组时代的到来n人类首次了解了自身的基因序列,了解人类首次了解了自身的基因序列,了解了很多远亲生物的基因序列了很多远亲生物的基因序列n正在面对指数扩增的基因序列和各种数正在面对指数扩增的基因序列和各种数据库据库n面临如何将基因序列资料转变为有用的面临如何将基因序列资料转变为有用的知识,进而服务于人类,造福人类健康知识,进而服务于人类,造福人类健康的挑战的挑战n人类功能基因组学必须

4、多学科协作人类功能基因组学必须多学科协作n生物信息学技术生物信息学技术n生物芯片技术生物芯片技术n蛋白质组学技术蛋白质组学技术n高通量细胞筛选技术等高通量细胞筛选技术等n生物信息学是人类功能基因组学研生物信息学是人类功能基因组学研究的必要工具究的必要工具实验实验生物学生物学计算计算生物学生物学理论理论生物学生物学圆宰掖运忧级宰禁疼碉卒旬脂爪誓藏傍氟八钮沉淫取琴荧禽至话鹃孺格涎生物信息学课件生物信息学课件生物信息的开发和应用生物信息的开发和应用n以核酸蛋白质等生物大分子为主要研究对象n以信息、数理、计算机科学为主要研究手段n以计算机网络为主要研究环境n以计算机软件为主要研究工具n对序列数据进行存

5、储、管理、注释、加工n对各种数据库进行查询、搜索、比较、分析n构建各种类型的专用数据库信息系统n研究开发面向生物学家的新一代计算机软件生物信息学的概念生物信息学的概念嗣喉敖撰取囱省块水动弥搪衬淫钒根挞颂泼僧划嘉础沧床魏狸帆术蛙沥账生物信息学课件生物信息学课件 计算机学、计算机网络医学生物学、分子生物学生物信息学数学、 统计学生物信息学和其它学科的关系生物信息学和其它学科的关系生物信息学是一门边生物信息学是一门边缘学科,它位于生物、缘学科,它位于生物、医学、计算机、数学医学、计算机、数学等多个领域的交叉点等多个领域的交叉点上上生物信息学的概念生物信息学的概念劫度偶遇拜傍懂褒团包艘狈橡祭圃呈瞎部松

6、勇锨蹲窄宋因奏赔徐砌柔钟剿生物信息学课件生物信息学课件计算机辅助药物筛选高通量虚拟筛选方法分子数据库,组合化学化合物库,靶标生物大分子的功能分析.蛋白质蛋白质相互作用识别,信号传导系统、代谢途径的分子模拟.图像处理、聚类分析、表达谱和调控网络分析.计算机辅助先导化合物设计、药物设计二、生物信息学的内容(二、生物信息学的内容(p200)币推球挤蚊膳糜灰烁课醚以量旺丙裳猖总马勺撞帧漆眺权婉懈妊食趾德疙生物信息学课件生物信息学课件1.1.基因与基因组分析基因与基因组分析 可读框预测和可读框预测和基因标注基因标注序列拼接序列拼接与组装与组装结果上传到数结果上传到数据库据库碱基读取载体标识与去除载体标识

7、与去除测序仪中原始数测序仪中原始数据的采样与分析据的采样与分析大规模基因序列测定大规模基因序列测定生物信息学的内容生物信息学的内容铜枷袍搀褥没乞租软靳搁祟疚肮涯淋篆蝗径傀膀孩瘟针范士昂躯料处褥倍生物信息学课件生物信息学课件基因预测基因预测DNADNA序列中编码区的鉴定序列中编码区的鉴定 预测方法的依据预测方法的依据: : 编码统计学:编码区序列同非编码区序列相比,有编码统计学:编码区序列同非编码区序列相比,有不同的特点,存在一些非随机的特点不同的特点,存在一些非随机的特点 GC GC 含量含量 密码子偏倚性密码子偏倚性 (CODON FREQUENCY) (CODON FREQUENCY) 第

8、三个碱基组成第三个碱基组成 基因结构基因结构/ /统计学方法统计学方法 比较比较/ /同源性同源性生物信息学的内容生物信息学的内容藉更琅崭勃诬郁批排酚仙蛇散歉秧训坡润馅赶读岂寝禾罐革烁亡痴侥镶栏生物信息学课件生物信息学课件原核生物基因结构原核生物基因结构编码区启动子转录起始位点非翻译区转录区起始密码子终止密码子53转录终止位点RBS生物信息学的内容生物信息学的内容河惨贿恩丰可议昌铜安叁沤舍隙豁送站铅晴氛没绳蛹部昧蛇识珊族迂愈擅生物信息学课件生物信息学课件5启动子转录起始位点非翻译区转录区起始密码子 终止密码子3转录终止位点外显子 切除和拼接位点GTAG内含子真核生物基因结构生物信息学的内容生物

9、信息学的内容遵糜发傀仗丝皆晾墒往筏香示岔邑视驶作醒低蛰痰趴帐街质羔氟搓因肿盗生物信息学课件生物信息学课件lHMM?lHMM 描述了模型中各隐含状态的转换概率基因组序列基因组序列ATGCGTGCAGTCACCAGCAGTCAGTCGIntronsExon隐含状态隐含状态用于基因预测的隐马尔可夫模型HiddenMarkovModels,HMMATGCGTGCAGTCACCAGCAGTCAGTCG基因组序列基因组序列生物信息学的内容生物信息学的内容习失扑努桓坝甲妨扣禄啥键偿尧苫怕妹撩蜀郁憋蝶溯梢妊美打陶砚孜切垄生物信息学课件生物信息学课件特定状态碱基对的概率取决于它前面碱基对的状态 向另一种状态的转

10、换概率取决于转换信号的出现(剪切位点) 和/或 在特定隐藏状态的碱基对平均数量 (即内含子或外显子大小).IntronsExonP= 0.5P= 0.8基因组序列基因组序列ATGCGTGCAGTCACCAGCAGTCAGTCG用于基因预测的隐马尔可夫模型用于基因预测的隐马尔可夫模型生物信息学的内容生物信息学的内容洼柄俄擞拓轨趁皇览拉谐很黍批夷灰经攻肉倦轩且撒峦烙锤忱敢壳换荤柿生物信息学课件生物信息学课件n研究主要集中在核苷酸序列的存储、分类、检索和分析等方面n新基因的发现n非蛋白编码区生物学意义的分析n基因组整体功能及其调节网络的系统把握n基因组演化与物种演化基因组分析基因组分析生物信息学的内

11、容生物信息学的内容懂问毖逞嗣譬圭徊瘤郎莫燎溉脐码冶烩闰虐汾晓坪噎席寂眶帚户搪岗站掺生物信息学课件生物信息学课件n蛋白质结构蛋白质结构n新蛋白的完整、精确和动态新蛋白的完整、精确和动态的三维结构的三维结构n计算机辅助结构模拟计算机辅助结构模拟n理解蛋白质的氨基酸序列理解蛋白质的氨基酸序列和三维结构之间的关系和三维结构之间的关系n蛋白质序列及特性分析蛋白质序列及特性分析n蛋白质组学蛋白质组学2.2.蛋白质与蛋白质组分析蛋白质与蛋白质组分析生物信息学的内容生物信息学的内容媚嫌等苫晚梢虐农扇莽魁缸烙恫兆释锗衔礁绑潍懂茶旁协钟妖醚兜促核蒋生物信息学课件生物信息学课件 相当数量的蛋白质、核酸、多糖的三维结

12、构获得精确测定,基于生物大分子结构知识的药物设计成为热点;根据靶标分子与药物分子相结合的活性部位的几何形状和化学特征,设计出与其相匹配的具有新颖结构的药物分子。3 3 新药设计新药设计侗邱咖闻蕾技效霓摆宽痊生饭棘登冉微尊多剁咀捶食霜送寝惭扭泡尸蛙骸生物信息学课件生物信息学课件三、生物信息学的研究方法和技术 n数学统计方法n在分析DNA语言中的语义、分析密码子使用频率、利用马尔可夫模型进行基因识别n动态规划(Dynamic Programming)方法n一种通用的优化方法:在状态空间中,根据目标函数,通过递推,求出一条从状态起点到状态终点的最优路径(代价最小的路径)。nDNA序列或者蛋白质序列的

13、两两对比排列n模式识别技术n两种方法n根据统计特征进行识别n根据对象的结构特征进行识别,常用句法识别。nDNA序列上功能位点和特征信号的识别画劳兄昼落钻挤窑侄锗办贞妙乌对讹俞金执瑶洒涟撤铀翅膛玩竿粉贮辛区生物信息学课件生物信息学课件n数据库技术n生物分子信息的存储、管理、查询等功能建立在数据库管理系统之上n人工神经网络技术n在功能上、结构上模拟大脑神经网络n神经网络计算速度快,更具有分析智能n应用:神经网络计算在优化和模式识别方面具有非常强的能力n基因识别、蛋白质结构预测上神经网络都取得了比其它方法更为准确的结果暖舟裕崇窥勃娟坦纸畔殃喘民柿柜饭叫萨还纽赛祖湿辞凿把些磋表郸炬脑生物信息学课件生物

14、信息学课件n分子模型化技术n利用计算机分析分子结构。通过交互操作平移、旋转和缩放分子的三维结构,从不同的角度观察分子构象和形状n分子力学和量子力学计算n主要基于半经验势函数的分子力学方法研究生物大分子的构象n量子力学在确定势函数的参数和研究局部性质n分子动力学模拟n研究蛋白质的构象及动力学,是计算机模拟实验的基础n遗传学运算规则nOptimisers / EvolversnDNA computingEvolutionary Computation (Metaphors from DNA to Selection)生物信息学的研究方法和技术生物信息学的研究方法和技术 雾悟堕肘挝玉侠履透酪堰赂礼油

15、聪蓑滤榜椒巩涂慰阜咒捐极箭太拘戮酉乒生物信息学课件生物信息学课件“HalfdayontheWeb,savesyouhalfmonthinthelab”n专家系统n将有关专家的知识和经验以一定的知识表示形式(如产生式规则、语义网络等)存放在计算中以智能的方式帮助提供参考性决策。如用于基因识别nInternet技术n交流:通过Internet网交流生物分子数据n查阅:从Internet网上查生物分子数据,如原始的序列、结构数据,加工处理的数据n服务:将所要处理的数据直接送到相应的网络服务器上,服务器接受你的处理请求,并将处理结果返回给你生物信息学的研究方法和技术生物信息学的研究方法和技术 息苛稼毙

16、盎闲袁舶影疵纷莆王蔑削垢涡挪臆跨天常反阜录铃看泊迈壬创酮生物信息学课件生物信息学课件 国外一直非常重视生物信息学的发展,各种专业研究机构和公司如雨后春笋般涌现出来,生物科技公司和制药工业内部的生物信息学部门的数量也与日俱增n1979年,美国洛斯阿拉莫斯国家实验室建立起GenBank数据库;n1982年,欧洲分子生物学实验室提供核酸序列数据库EMBL的服务;n1984年,日本着手建立国家级的核酸序列数据库DDBJ并于1987年开始提供服务四、常用的分子生物学软件和数据库(p210)腿莹御账已纲彝资平鲍逆慕磨翟激涧焉撂兢蛇粕拈翱榷大母扇涪载秋信淀生物信息学课件生物信息学课件国内对生物信息学领域也越

17、来越重视n1997年3月,北京大学于成立了生物信息学中心;n2000年3月,中科院上海生命科学研究院成立n其他,北京大学的罗静初和顾孝诚教授在生物信息学网站建设方面、中科院生物物理所的陈润生研究员在EST序列拼接方面以及在基因组演化方面、天津大学的张春霆院士在DNA序列的几何学分析方面等等软件和数据库软件和数据库住撵驰每鳞粒捌箕频擂宣垢满狙挨版棘哼唆皑坠甘逞爆距埔岗发魏浆蝴记生物信息学课件生物信息学课件n基因图谱数据库n核酸序列数据库n蛋白质序列数据库n大分子结构数据库等n国际著名的生物信息中心nNCBINationalCenterforBiotechnologyInformation(US)

18、nEBIEuropeanBioinformaticsInstitute(EU)nHGMPHumanGenomeMappingProjectResourceCentre(UK)nExPASyExpertofProteinAnalysisSystem(Switzerland)nCMBICentreofMolecularandBiomolecule(TheNetherlands)nANGISNationalGenomeInformationService(Australia)nNIGNationalInstituteofGenetics(Japan)nBICNationalBioinformatic

19、sCentre(Singapore)1. 数据库赦腆帝歼噶视坞耳苑读猛赔苑忧启孝朱心席足觉津者糊茨涪宣寨盯嘱亡唇生物信息学课件生物信息学课件n国内部分生物信息学和生物医学信息服务器n北京大学生物信息中心http:/n中国生物信息http:/www.biosino.org/n北京大学物理化学研究所http:/n北京医科大学生物医学信息http:/n中国科学院微生物研究所http:/n天津大学生物信息中心http:/n中科院计算所智能信息处理重点实验室生物信息学研究组http:/ data synchronization软件和数据库软件和数据库沙叉卤品些立筹藉盲秦昌颧绸尼森碳细模松鞠弹碎置晓嗣侦写

20、侈渠少鼠冗生物信息学课件生物信息学课件GenBank的增长图片来自http:/www.ncbi.nlm.nih.gov/Genbank/genbankstats.html软件和数据库软件和数据库浦钓翅痪棉泛咎贿讹免颇冤赂伍写糠层澳族堪凄阁挠联鳃怒草颖圣嘛砸募生物信息学课件生物信息学课件资料来自:http:/www.ddbj.nig.ac.jp/images/ddbjnew/DBGrowth-e.gif2005年6月发行的第84版EMBL数据库中,总计超过4525万条、491亿碱基数量的数据库软件和数据库软件和数据库榔朗剁蛆恋踊时锨两釜泡界妙聚粘苏饭痈嗽段质枕荆酣钾蹈椒畦厕至奎案生物信息学课件生

21、物信息学课件PublicfreeAvailableviaInternet三大基因数据库之间的关系NucleotideSequenceDatabase(entry)2005.6.15完整序列软件和数据库软件和数据库刊癸浇拨湿瘤火冲惨肮拂伦娥玲祥压牛款碟誓俭典尾惧遇女勇绿宿饰衣乎生物信息学课件生物信息学课件蛋白质信息资源数据库(PIR)n主主要要提提供供按按同同源源性性和和分分类类学学组组织织的的综综合合性性、非非冗冗余余数数据库据库nPIRPIR由由美美国国华华盛盛顿顿的的国国家家医医学学研研究究基基金金会会支支持持,德德国国马马普普学学会会的的慕慕尼尼黑黑蛋蛋白白质质序序列列信信息息中中心心(

22、MIPS)(MIPS)和和日日本本国际蛋白质序列数据库国际蛋白质序列数据库(JIPID)(JIPID)共同维护。共同维护。nPIRPIR通通过过提提供供蛋蛋白白质质序序列列数数据据库库、衍衍生生的的相相关关数数据据库库及及相相应应的的软软件件而而支支持持有有关关分分子子进进化化、功功能能基基因因组组学学和和计算生物学方面的研究,计算生物学方面的研究,软件和数据库软件和数据库砂剩孤腻醚妙价腋弛围秉缄谋蚤弟敛侦主校谨驻犬仿衔凰叉苑哼殷摩伶邱生物信息学课件生物信息学课件蛋白质结构数据库(PDB)n由美国自然科学基金会、能源部和国立卫生研究院共同投资建立n主要由X-射线晶体衍射和核磁共振(NMR)测得

23、的生物大分子三维结构组成n用户可直接查询、调用和观察库中所收录的任何大分子三维结构软件和数据库软件和数据库臣友戍隶猴病景犬可冕柒衡偶缠幕酶灵掺禄崖埃篓豆坚耗恕乎慌俺茁友毗生物信息学课件生物信息学课件PBD数据的增长软件和数据库软件和数据库斟男安住笆稳棍揪哟隆息氯氖墒束泵瓣挖跳畏匆炯瑟拙拐颗焙槛憨子圃僵生物信息学课件生物信息学课件2.软件n序列对比和数据库搜索软件BLAST, FASTA, BLITZ等n生物大分子可视化软件有Rasmol, Mage, Raster3d, Grasp等n与蛋白质结构有关的程序有Procheck, WHATIF, DSSP等n大型分子生物学软件包如GCG. n在基

24、因识别著名软件GRAIL、GeneID、GeneMark等n蛋白质二级结构预测程序PHD 软件和数据库软件和数据库坑犀纪忿轧止表把舍男创佯儡倚贯填抑笆契鸽募在琢僳普述缨膊所锑揉赖生物信息学课件生物信息学课件序列分析软件DNAMANhttp:/ nDNAMAN是美国Lynnon BioSoft公司开发的高度集成化的分子生物学应用软件,几乎可完成所有日常核酸和蛋白质序列分析工作,包括多重序列对齐、PCR引物设计、限制性酶切分析、蛋白质序列分析、质粒绘图等。具有面向Windows和Macintosh两个版本。 软件和数据库软件和数据库胡皋流逝量吊叮趋羞恶烁飞佯贴荚工恩仍疥抒画隋凝败掠肮枯取伍奄峰臭生

25、物信息学课件生物信息学课件综合序列分析软件BioEdithttp:/www.mbio.ncsu.edu/BioEdit/bioedit.html软件和数据库软件和数据库畅谭坤扦八圃仆燥些瞄劈室稼险枝恼察扇洪溉铸壶厂良隐潍咕精脸针梗躇生物信息学课件生物信息学课件序列分析与管理软件Omigahttp:/ NTIhttp:/ NTI软件管理序列和进行片段重叠群分析 n用Vector NTI软件分析蛋白质序列的跨膜区及显示蛋白质的三维结构软件和数据库软件和数据库闸描严匹姚杏体炼缎他黄兼烈拽讶拂跃爪凄旅厘共庙库毋孺将视惕浇男甘生物信息学课件生物信息学课件RasMol软件显示分子结构示意图蛋白质三维分子结

26、构显示软件RasMol软件和数据库软件和数据库郁汕团氏笨耪董观导棘惺请仕卷蒋姻撵毁伏置箔恕篇孔你洞藩墒硷渭梆吊生物信息学课件生物信息学课件综合生物信息学资源生物软件网http:/www.bio-锐他奔模笔君舷砍蹲廷联送渔逼验牟泊杀诲丝顺珐跌鼻湖翔诀剐返步邯饭生物信息学课件生物信息学课件n生物信息学研究是利用数理统计、模式生物信息学研究是利用数理统计、模式识别、动态规划、密码解读、语意解析、识别、动态规划、密码解读、语意解析、信令传递、神经网络、遗传算法以及隐信令传递、神经网络、遗传算法以及隐马氏模型等各种方法马氏模型等各种方法n对序列、结构数据进行对序列、结构数据进行定性和定量分析定性和定量分

27、析,从中获取基因编码、基因调控、序列从中获取基因编码、基因调控、序列- -结结构构- -功能关系等理性知识功能关系等理性知识n阐明细胞、器官和个体的发生、发育、阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律和病变、衰亡的基本规律和时空联系时空联系n探索生命起源、生物进化、生命本质等探索生命起源、生物进化、生命本质等重大理论问题,最终建立重大理论问题,最终建立“生物学周期生物学周期表表” 小结小结讳龙捣唁舟简清版捆爬互粒遭食括抹桓刽醚奖伺煌绷辙吭拥缚哺黄鄙禽剪生物信息学课件生物信息学课件n生命科学生命科学+信息科学信息科学n运筹于帷幄运筹于帷幄( (计算计算) )之中之中n从实验中来,到实验中去从实验中来,到实验中去 n游戏规则:索取与奉献游戏规则:索取与奉献思考题:什么是生物信息学?思考题:什么是生物信息学?绢谱淬拴痊擞覆藕茁虱任籽眠液凰梦梦土隋钦俗喇哥讹输肯仪框癣词亚袭生物信息学课件生物信息学课件罕靖潞乾臆湛翔旋娩象贯勘气低槐柠确霖鞋痕记桓喇索厌爱婆首铣搜惮厌生物信息学课件生物信息学课件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号