生命科学前沿进展基因组学、比较基因组学和宏基因组学

上传人:lizhe****0001 文档编号:57696290 上传时间:2018-10-24 格式:PPT 页数:161 大小:9.85MB
返回 下载 相关 举报
生命科学前沿进展基因组学、比较基因组学和宏基因组学_第1页
第1页 / 共161页
生命科学前沿进展基因组学、比较基因组学和宏基因组学_第2页
第2页 / 共161页
生命科学前沿进展基因组学、比较基因组学和宏基因组学_第3页
第3页 / 共161页
生命科学前沿进展基因组学、比较基因组学和宏基因组学_第4页
第4页 / 共161页
生命科学前沿进展基因组学、比较基因组学和宏基因组学_第5页
第5页 / 共161页
点击查看更多>>
资源描述

《生命科学前沿进展基因组学、比较基因组学和宏基因组学》由会员分享,可在线阅读,更多相关《生命科学前沿进展基因组学、比较基因组学和宏基因组学(161页珍藏版)》请在金锄头文库上搜索。

1、基因组学、元基因组学和功能基因组学,生命科学前沿进展(一),1 基因组学概述,基因组(genome),又称染色体组,是某个特定物种细胞内全部DNA分子的总和(细胞内细胞器的DNA属于该细胞器的基因组)。物种全部遗传信息的总和。物种遗传信息的“总词典” 控制发育的“总程序” 生物进化历史的“总档案”,原核生物:一般只有一个环状DNA分子,其上所有的基因为一个基因组; 真核生物:指一个物种的单倍体染色体所含有的全部DNA分子; 真核生物通常含有23个基因组核基因组(Nuclear genome)线粒体基因组(Mitochondrial genome)质体基因组(Plastid genome)真核细

2、胞中的细胞器(如叶绿体、线粒体等)中的DNA也为环状,构成叶绿体基因组、线粒体基因组If not specified, “genome” usually refers to the nuclear genome.,不同生物基因组大小的比较,原核生物基因组结构的特点1、原核生物基因组一般比真核生物基因组小得多E. coli的基因组(4.6Mb)约为酵母基因组(12.1Mb)的2/52、绝大部分原核生物基因组由一个单一的环状DNA分子组成3、原核生物的基因通常比真核生物的少 E. coli:4000多个基因,人:30000个4、原核生物的基因绝大多数是连续基因,不含间隔的内含子;基因组结构紧密,重

3、复序列远少于真核生物的基因组。,例子:E. coli K-12双链环状DNA分子,全基因组长为4,600kb;目前已经定位的基因有4,289个;非编码区占的比例约为11.4%。,真核生物基因组结构特点真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。真核细胞基因转录产物为单顺反子(Monocistron),即一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链,每个基因转录有各自的调节元件。存在重复序列,重复次数可达百万次以上。基因组中不编码的区域多于编码区域。大部分基因含有内含子,

4、因此,基因是不连续的。基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。,人类基因组的组成核基因组(nuclear genome): 由大约30亿bp组成,分为24条线性DNA分子(55250Mb),分别包含在24条不同的染色体中(22条常染色体和2条性染色体X、Y)线粒体基因组(mitochondrion genome):长为16,569bp的环状DNA分子,位于产生能量的细胞器线粒体中,基因组学(genomics),以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上分析生命体(包括人类)全部基因组结构及功能

5、,探索生命活动的内在规律及其内外环境影响机制的科学。 对物种的所有基因进行定位、作图、测序和功能分析 由美国人THRodehck在1986年提出。基因组学完全改变一次只能研究单个基因的状况,它着眼于研究并解析生物体整个基因组的所有遗传信息。,CREDIT: JOE SUTLIFF,Science, Vol 291: 1221.,Fishing in a More Effective Way!,基因组学领域的分类,根据生物系统特征分类,结构基因组学 (Structural genomics)功能基因组学 (Functional genomics),基因组图谱绘制、测序 基因和基因组组织 基因组调

6、节 网络结构 蛋白质结构特征,转录组学(Transcriptomics) 蛋白质组学(Proteomics) 代谢组学(Metabolomics),结构基因组学(Structural genomics) 基因、蛋白质和其它生物大分子的全基因组(genome-wide)结构研究,包括基因组图谱绘制、基因组测序、基因组组织、以及蛋白质结构描述。,曼哈顿计划,阿波罗登月计划,人类基因组计划HGP(Human Genome Project)是一项规模宏大的科学计划,其旨在测定组成人类染色体(指单倍体)中所包含的30亿个核苷酸序列的碱基组成,从而绘制人类基因组图谱,并且辨识并呈现其上的所有基因及其序列,

7、进而破译人类遗传信息。 人类基因组计划是人类为了解自身的奥秘所迈出的重要一步,是继曼哈顿计划和阿波罗登月计划之后,人类科学史上的又一个伟大工程。,了解人类自身奥秘的计划,亨利.格雷(HGray) 绘制了第一张人体解剖图,解开了许多人体奥秘,为近代医学的发展奠定了基础。 人类基因组计划将最终绘制出人体的第二张解剖图,从基因水平上揭示出人体的奥秘,奠定21世纪医学和生物学飞跃发展的基础。,亨利.格雷,人体的第二张解剖图,这张解剖图将包括4张小图,包括了人类基因组计划的全部主要内容,它们分别是遗传图(连锁图)、物理图、序列图和转录图,第一张图是遗传图,又叫连锁图。它是以在某个遗传位点上具有多个等位基

8、因的遗传标记作为“路标“,以遗传学上的距离即两个遗传位点之间进行交换、重组的百分率cM作为“图距“,反映基因遗传效应的基因组图。,物理图是基因组计划的第二张图。物理图以一个“物理标记“作为路标,以Mb、Kb、bP作为图距的基因组图。物理图与遗传图相互参照就可以把遗传学的信息转化为物理学信息。,人类基因组物理图的问世是基因组计划中的一个重要里程碑,被遗传学家誉为20世纪的“生命(生物学)周期表“。,第三张图是序列图,可以说它是人类基因组在分子水平上最高层次、最为详尽的物理图。测定总长为1米、由30亿对核昔酸组成的基因组全部DNA序列,是基因组计划中最为明确、最为艰巨的定时、定量、定质的硬任务。

9、人类基因组计划所提供的人类核酸序列图,蕴藏了决定我们生、老、病、死的所有遗传信息,将成为人类认识自我、改造自我使人类健康长寿的知识源泉,为21世纪现代生物学和医学奠定了基础。,我们知道,生物性状是由结构或功能蛋白决定的,功能蛋白是由信使RNA(mRNA)编码的,mRNA又是由编码蛋白功能基因转录而来的。转录图就是测定这些可表达片段(EST)的标记图。,第四张图是转录图,事实上,整个人类基因组中有97的部分由不被转录的DNA组成,只有23的DNA序列具有编码蛋白质的功能。在人体某一特定的组织中仅有10的基因被表达。也就是说,只有不足1万个不同类型的RNA分子(只有在胎儿的脑组织中,可能有3060

10、)的基因被表达。如果将这些mRNA通过一种反转录的过程构建成cDNA文库,然后再测定这些DNA的序列,最终绘制成一张可表达基因图-转录图。 有了一张总的转录图,我们就可以了解某基因在不同的时间、不同组织的表达情况;可以了解不同组织中不同基因的表达;还可以了解正常条件下与异常状况下基因表达的差异。,与人类登月计划相比,HGP的资金投入少,但它对人类生活的影响都可能更深远。 随着这个计划的完成,DNA分子中储藏的有关人类生存和繁衍的全部遗传信息将被破译,它将帮助我们理解人类如何作为健康人发挥正常生理功能,还将最终揭示严重危害人类健康疾病的机理。,1985年,美国能源部(DOE)率先提出,旨在阐明人

11、类基因组 DNA长达30亿碱基对( base pair,bp)的序列。发现所有人类基因并阐明其在染色体上的位置,从而在整体上破译人类遗传信息。 1986年美国宣布启动“人类基因组启动计划”; 1988年,DNA双螺旋结构的发现者和诺贝尔生理学或医学奖的获得者詹姆斯沃森领导着国家卫生研究院中新成立的一个基因组研究中心,加入了这个计划。但由于与上司意见不一,沃森不得不于1992年离开该计划,其位置由弗朗西斯柯林斯取代。 1990年,NIH和DOE联合提出美国人类基因组计划,正式启动HGP,计划于15年内提供30亿美元的资助,在2005年完成人类基因组全部序列的测定。随后,该计划扩展为国际合作的人类

12、基因组计划,英国、日本、法国、德国和中国先后加入,形成了国际基因组测序联盟。,国际人类基因组计划,塞雷拉人类基因组计划,在国际人类基因组计划(以下简称“国际计划”)启动八年后的1998年,美国科学家克莱格凡特尔创办了一家名为塞雷拉基因组(Celera Genomics)的小私立公司,开展自己的人类基因组计划。与国际人类基因组计划相比,公司希望能以更快的速度和更少的投资(3亿美元,仅为国际计划的十分之一)来完成。 塞雷拉基因组的另起计划被认为对人类基因组计划是一件好事,因为塞雷拉基因组的竞争促使国际人类基因组计划不得不改进其策略,进一步加速其工作进程,使得人类基因组计划得以提前完成。,国际人类基

13、因组计划VS塞雷拉计划,Celera: Craig Venter,Intl. Cons: Francis Collins,基因的知识产权之争,塞雷拉基因组一开始宣称只寻求对200至300个基因的专利权保护。1999年,塞雷拉申请对6500个完整的或部分的人类基因进行初步专利保护。此外,塞雷拉建立之初,同意与国际计划分享数据,但这一协定很快就因为塞雷拉拒绝将自己的测序数据存入可以自由访问的公共数据库GenBank而破裂。虽然塞雷拉承诺根据1996年百慕达协定每季度发表他们的最新进展(国际计划则为每天),但不同于国际计划的是,他们不允许他人自由发布或无偿使用他们的数据。 2000年,美国总统克林顿

14、宣布所有人类基因组数据不允许专利保护,且必须对所有研究者公开,塞雷拉不得不决定将数据公开。这一事件也导致塞雷拉的股票价格一路下挫,并使倚重生物技术股的纳斯达克受到重挫;两天内,生物技术板块的市值损失了约500亿美元。,国际人类基因组测序联盟的所用于测序的基因组取样于一大批捐献者的血液和精子。只有少量的样品被用做DNA测序,又由于捐献者的身份是保密的,因此无论是捐献者或是科学家都不知到用于测序的DNA是来自哪些人。有非正式的报道(在基因组计划的团体内部也盛行的说法)指出用于国际基因组计划的大部分DNA来自于住在纽约州布法罗的一名男性捐献者(编号为RP11)。 塞雷拉基因组计划使用的DNA样品来源

15、于五名捐献者。塞雷拉基因组的首席科学家克莱格凡特尔在一篇写给科学杂志的公开信中承认他本人是捐献者之一。,基因组来源,Public effort- strategy:,Celera - strategy:,Celeras view of International Consortium,International Consortiums view of Celera,Unfair competition: IC delivering the same goods but with state funding.,Unfair competition: Celera delivering the s

16、ame goods but can use IC data, while IC cannot use Celera data.,分级鸟枪测序法,全基因组鸟枪测序法,基因组测序策略,鸟枪法(shotgun sequencing),在国际计划中,基因组被分割成多个片断(长度接近150,000个碱基对)。由于这些片断能被插入细菌中,并利用细菌的DNA复制机器进行复制,因此被称为细菌人工染色体。通过对每一个这样的片断分别应用“鸟枪测序法”,最终将这些片断通过配对末端法(pair-end)以及其他许多定位数据重新组装在一起从而获得完整的基因组。这一手段是先将基因组分成相对较大的片断,并且在对片断进行测序

17、前将其定位到每条染色体对应位置,所以被称为“分级鸟枪测序法”。,BAC的构建 pBAC108L来自细菌的一个小型F质粒,其中oriS和repE控制了质粒的复制起始,parB和parA控制了拷贝数。,塞雷拉采用了更快速同时更具风险的技术全基因组鸟枪测序法。鸟枪测序法的思想是将基因组打断为数百万个DNA片断,然后用一定的算法将片断的序列信息重新整合在一起,从而得到整个基因组序列。为了提高这一方法的效率,1980年代,测序和片断信息整合达到了自动化。这一方法虽然已被用于序列长达6百万个碱基对的细菌基因组测序,但对于人类基因组中30亿个碱基对的序列测定,这一技术能否成功在当时还未有定论。塞雷拉基因组尝试用全基因组鸟枪测序法并且没有使用附加的定位拼接。但他们由于利用了少量的公共数据来完成计划而招致他人诟病。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号