分子生物信息数据库幻灯片

上传人:E**** 文档编号:89955179 上传时间:2019-06-04 格式:PPT 页数:182 大小:11.41MB
返回 下载 相关 举报
分子生物信息数据库幻灯片_第1页
第1页 / 共182页
分子生物信息数据库幻灯片_第2页
第2页 / 共182页
分子生物信息数据库幻灯片_第3页
第3页 / 共182页
分子生物信息数据库幻灯片_第4页
第4页 / 共182页
分子生物信息数据库幻灯片_第5页
第5页 / 共182页
点击查看更多>>
资源描述

《分子生物信息数据库幻灯片》由会员分享,可在线阅读,更多相关《分子生物信息数据库幻灯片(182页珍藏版)》请在金锄头文库上搜索。

1、第二章 分子生物信息数据库,第一节 基因组计划与分子生物信息数据库,一. 基因组计划,基因组DNA 基因(Gene):生物体的遗传单位,由脱氧核糖核酸(DNA)组成。DNA由4种核苷酸(A、T、C、G)组成。,(1)密码子 1.1 密码子的使用是非随机的 如果密码子的第一、第二位碱基是A、U, 那么第三位将尽可能使用G、C;反之亦然。 如果三位都用G、C,则配对容易,分解难; 三位都用A、U,则相反。,一般地说,高表达的基因,要求翻译速度快,要求密码子和反密码子配对快、分手也快。,1.2 密码子的使用有一定的规律 对同义密码子的使用存在着偏爱 不同种属偏爱的密码子不同,密码子的使用偏性与基因功

2、能、蛋白质结构相关,1.3 密码子中的密码 三个碱基的位置与所编码的氨基酸性质存在着联系 例如: 芳香族氨基酸以U作为第一位碱基 中间位置碱基的性质与氨基酸是亲疏水性相关 疏水氨基酸的密码子,其第二位碱基是U 亲水氨基酸的密码子,其第二位碱基是A 第二位碱基是G、C的密码子所编码的氨基酸亲水性、疏水性居中。,(2) 基因组信息,遗传信息 与功能相关的结构信息 进化信息,2. 基因组计划,基因组 一个物种中所有基因的整体组成,单个基因组分析 基因序列 基因功能 基因的表达调控 基因产物 基因多态性,比较基因组分析 物种关系 物种进化 物种起源,人、鼠基因组比较老鼠约75%的基因与人类相同。,人基

3、因组 鼠基因组 鼠染色体上的颜色和数字代表在人染色体上对应的片段.,3.人类基因组计划 (Human Genome Project),“人类基因组计划”与“曼哈顿原子弹研制计划”、“阿波罗登月计划”并称为人类科学史上的“三大计划”。,(1)人类基因组DNA 人类基因组DNA是一个长度为3109的一维序列,只有4个字符(碱基A、T、G、C),它没有段落,也没有标点符号,而目前人类对它了解甚少。,人类基因组构成24条染色体和线粒体,“Whats Human Genome Project?” “One base One dollar!”,(2)人类基因组计划的发展历史,1985年,美国能源部(DOE

4、)率先提出 1986年美国宣布启动“人类基因组启动计划” 1989年,美国国家卫生研究院(NIH)建立国家人类基因组研究中心(NCHGR) 1990年,NIH和DOE联合提出美国人类基因组计划,正式启动HGP,计划于15年内提供30亿美元的资助,在2005年完成人类基因组全部序列的测定,1999年12月1日,首条人类染色体完成测序,人类第22号染色体DNA全序列测定宣布完成。 2000年4月6日,美国Celera遗传信息公司宣布,该公司已破译出一名实验者的完整遗传密码。 2000年5月,科学家聚集美国冷泉港,宣布人类基因组草图的完成。,2000年6月26日克林顿宣布人类基因组草图绘制完成,(3

5、)人类基因组计划的概念 人类基因组计划于1990年正式启动, 投入30亿美元,完成人类全部24条染色体的3109脱氧核苷酸对(bp)的序列测定,分析人类基因组DNA分子的基本成分及碱基的排列顺序,绘制成序列图。其主要任务还包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制) 和基因识别。其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息。,(4)参与的国家 中国、德国、法国、日本、英国与美国6个国家的16个中心组成国际协作组,倡导“全球合作、免费共享”的原则。,美国:WA

6、SHMIT等7家研究中心,贡献率为54。 英国:SANGER一家研究中心,贡献率为33。 日本:RIKEN等两家研究中心,贡献率为7。 法国:GENOSCOPE研究中心,贡献率为2.8。 德国:IMB等3家研究中心,贡献率为2.2。 中国:北京华大研究中心、国家南北方基因研究 中心等三家,贡献率为1。,(5)人类基因组计划的任务 5.1 四张图谱,遗传图谱 物理图谱 序列图谱 转录图谱,遗传图谱,遗传图谱(genetic map)又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离

7、(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。,遗传连锁图:通过计算连锁的遗传标志之间的重组频率,确定它们的相对距离,一般用厘摩(cM,即每次减数分裂的重组 频率为1%)表示。,物理图谱,物理图谱(physical map)是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。,1998 年完成了具有52,000个序列标签位点(STS),并覆盖人类基因组大部分区域

8、的连续克隆系的物理图谱。,敲碎基因组,分析研究内容所处的染色体位置,中心粒,一对紧密,相邻的标志,一对相邻,较远的标志,染色体图,序列图谱,随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱,大规模基因组测序,Megabace 测序仪,3700 测序仪,人类基因组计划1%测序中国实验室,大规模测序基本策略,逐个克隆法:对连续克隆系中排定的克隆逐个进行亚克隆测序并进行组装(公共领域测序计划) 全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小

9、片段随机测序,利用超级计算机进行组装(美国Celera公司),运用计算机软件进行序列拼接,转录图谱,转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。,通过定位克隆技术寻找疾病基因的过程,5.2基因识别,基因识别(gene identification)是HGP的重要内容之一,其目的是识别全部人类的基因。 基因识别包括: 识别基因组编码区 识别基因结构,基因识别目前常采用的有二种方法: 从基因组序列中识别那些转录表达的DNA片段 从cDNA文库中挑取并克隆,5.3 模式生物基因组的作图和测序,酵母,大肠杆菌,果蝇,线虫,老鼠,(6) 人类基

10、因组计划的实施意义,人类基因组计划为我们研究生物信息的组织、结构、遗传、表达带来了极大的方便,使人类对自身有一个根本的了解。 人类是最高级、最复杂、最重要的生物,如果搞清楚人类基因组,那么再研究其它的生物就容易得多。 研究多种模式生物基因组将有助于研究地球生物的进化史。,(7)人类基因组计划的实现对医学事 业的影响,对致病基因的克隆也是人类基因组计划的内容 疾病与基因直接或间接相关,通过生物学、医学等技术对相关基因进行抑制或调控,即可达到治疗某一疾病的效果 如果掌握了与某种疾病相关的基因及突变,则可以对该疾病进行预测、诊断,甚至治疗。,基因变异与疾病,基因组多态性,用于人类疾病治疗取得重要进展

11、,通过基因分析,对一些遗传性很高或较高的疾病的发病机理有了新的认识。如地中海贫血、肌肉萎缩、乳腺癌等疾病的研究中,找到了至个致病基因,约占遗传病的。 通过基因检测和使用基因药物,已能治疗一些疾病。如运用破坏性基因治疗脑肿瘤,将外来破坏性基因接入脑肿瘤细胞,已取得了比单纯开刀更好的疗效。 今后的重点将放在糖尿病、动脉硬化、焦虑症与抑郁症、高血压、老年痴呆、精神分裂症、乳腺癌,以及其它一些癌症的探索上。,基因与疾病的关系,人类第13号和第19号染色体已得到准确而完整的测序,并进行了相关的分析。至此,科学家已对人类23条染色体中的9条进行了精确测序和序列分析,并已发表测序结果。这9条染色体是第6、7

12、、13、14、19、20、21、22号和Y染色体。,第13号染色体携带与乳腺癌有关的BRCA2和RB1基因,以及与精神分裂症有关的DAOA基因,并且发现在慢性B淋巴细胞白血病细胞中该染色体经常发生重排。,第19号染色体有5580万碱基对。它具有高G+C含量、高复制率和高重排率的特点,这预示该染色体在生物进化中有重要意义。其中许多基因与呈孟德尔式遗传规律的疾病有关,包括家族性高胆固醇血症、非胰岛素依赖性糖尿病等。,第号染色体是迄今破译的对人类染色体中最大的一对,对其万个碱基完成了测序,找到了包括与糖尿病、肥胖症、小儿湿疹等疾病相关的基因。此外,第号染色体上还有一个基因能增加部分人群感染新型克雅氏

13、症的危险,这将增进人们对该疾病的了解。新型克雅氏症是疯牛病在人身上的表现形式,在疯牛病危机之后的英国备受关注。,血栓形成与基因有关,迄今为止,我们只知道老年人、血脂高者和缺乏锻炼者,其体内较容易形成血栓,但最进科学家们已识别并成功地定位出了一个名为“VKORC1”的基因。它在危害人体的血栓形成的过程中发挥着重要作用。这一发现将有助于人们进一步寻找出治疗心律不齐及冠心病等疾病的新疗法。 德国、英国和美国的科学家在各自独立的实验中,以产生了抗药性的实验鼠和血栓患者的基因为研究对象,并与天生就具有抗血栓特性人的基因进行比较,结果是这个基因可以帮助人们理解血液稀释药物的工作原理。,确定雀斑致病基因位置

14、,我国科学家在国际上首次确定雀斑致病基因位置,为找到雀斑致病基因并最终根治雀斑奠定了重要的基础。 所以,市面上的激光去斑、药物去斑等方法都只是治标不治本。只有从基因上入手,才可能彻底根治雀斑。为此,科学家采用全基因组扫描技术,通过对一个中国汉族雀斑大家族的样本进行分型和连锁分析,发现在人类第4号染色体的某个区域中存在雀斑致病基因。,导致弱智与癫痫的基因变异,科学家首次发现人体内一个基因如果发生变异,有可能会同时导致弱智与癫痫。这个新基因,位于人体染色体上。他们对全球范围内个有遗传病史的家族进行研究后发现,该基因发生特定的变异,不仅会引发多种癫痫症状,而且也会导致弱智。 他们的研究还显示,该基因

15、似乎对与人大脑正常认知功能相关的其他一些基因具有调控作用,可以影响这些基因的工作时间和方式等。科学家们因此推测,受新发现的这种基因控制的其他基因,在癫痫或弱智的发病过程中可能也起到了一定作用。,语言产生可能与基因变异有关,德国科学家最新研究发现,20万年前发生在一个基因上的两次关键的变异可能和语言的产生有关。这一研究为说明该基因在人类语言能力的发展中所扮演的重要角色提供了强有力的证据。研究人员认为,语言的优势使人类能够排挤掉那些比较原始的竞争对手。 变异基因赋予人类祖先更好的控制嘴巴和喉咙肌肉的能力,从而使他们能够发出更丰富、更多变的声音,为语言的产生打下基础。,第二节 生 物 分 子 数 据

16、 库,一. 生物分子数据库概述,1. 生物分子数据库应满足5个方面的主要需求 (1)时间性 (2)注释 (3)支撑数据 (4)数据质量 (5)集成性,2. 生物分子数据库的特征:,(1)数据库的更新速度不断加快,数据量呈指数增长趋势 (2)数据库使用频率增长更快 (3)数据库的复杂程度不断增加,(4)数据库网络化 (5)面向应用 (6)先进的软硬件配置,3. 生物分子数据库 一级数据库 数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释。 二级数据库 对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。,基因组数据库的主体是模式生物基因组数据库,此外还包括染色体,基因突变,遗传疾病,分类学,比较基因组,基因表达和调控,放射杂交,基因图谱等各种数据库。,二. 基因组数据库,一) 人类基因组数据库 GDB,GDB:1990年美国John Hopkins大学建立的重

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号