文档详情

博士授课人类基因组计划(HGP)

鲁**
实名认证
店铺
PPT
5.75MB
约74页
文档ID:584003526
博士授课人类基因组计划(HGP)_第1页
1/74

人类基因组计划王王 斌斌 青岛大学医学院微生物学教研室青岛市医药生物技术重点实验室 人类基因组计划──       二十世纪三大技术之一二十世纪三大技术之一 《《《ScienceScienceScience》》》 2000 2000 2000年十大科技成就之首年十大科技成就之首年十大科技成就之首 现代遗传学家认为现代遗传学家认为, ,基因是基因是DNA(DNA(脱氧核糖核酸脱氧核糖核酸) )分分子上具有遗传效应的特定核苷酸序列的总称,是具有子上具有遗传效应的特定核苷酸序列的总称,是具有遗传效应的遗传效应的DNADNA分子片段分子片段不同人种之间头发、肤色、不同人种之间头发、肤色、眼睛、鼻子等不同,是基因差异所致眼睛、鼻子等不同,是基因差异所致 基因位于染色体上基因位于染色体上, ,并在染色体上呈线性排列并在染色体上呈线性排列基因不仅可以通过复制把遗传信息传递给下一代,还基因不仅可以通过复制把遗传信息传递给下一代,还可以使遗传信息得到表达可以使遗传信息得到表达 人体有人体有100100万个亿细胞万个亿细胞每个细胞核内有每个细胞核内有2323对染色体对染色体约约3131亿对核苷酸亿对核苷酸, ,编码约编码约1010万个蛋白质万个蛋白质人类只有一个基因组,大约有人类只有一个基因组,大约有2.92.9万个基因。

万个基因 Genome is the complete set of sequences in the genetic-material of an organism. It includes the sequence of each chromosome plus any DNA in organelles.Proteome is the total number of proteins produced byan organism.Transcriptome is the complete set of mRNAs present in a cell, tissue, or organism. 基因组基因组,Genome,一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组可是基因组测序的结果发现基因编码序列只占整个基因组序列的很小一部分因此,基因组应该指单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子说的更确切些,核基因组是单倍体细胞核内的全部 DNA分子;线粒体基因组则是一个线粒体所包含的全部DNA分子;叶绿体基因组则是一个叶绿体所包含的全部DNA分子。

  2009年诺奖获得者:端粒酶保护染色体: 一、Human genome project,HGPGoal: characterize all human genetic material by determining the complete sequence of the DNA in the human genome.HGP is accomplished by the joint effort between U.S. Human Genome Project (HGP), composed of the DOE(Department of Energy )and NIH(National Institutes of Health), and Celera Genomics Craig Venter (head of Celera Genomics),Craig Venter (head of Celera Genomics),Craig Venter (head of Celera Genomics), AriAriAri PatrinosPatrinosPatrinos (director of DOE (director of DOE (director of DOE HumanGenomeHumanGenomeHumanGenome Program Program Program and Biological and Environmental Research and Biological and Environmental Research and Biological and Environmental Research Program), Program), Program), Francis Collins (director, NIH National Human Genome Francis Collins (director, NIH National Human Genome Francis Collins (director, NIH National Human Genome Research Institute)Research Institute)Research Institute) On Feb 16th 2001… What happened? 2001年2月中旬,《Nature》与《Science》分别发表了人类基因组工作框架图(the draft genome),这是人类基因组计划(human genome project,HGP)实施以来所取得的最重大进展,也是生命科学领域中的一个里程碑。

自HGP提出以来,到现在一共16年这16年来科学家们所走过的是一条充满艰辛的路,同时也是一条谱写辉煌的路回顾这段将在人类历史上永载史册的光辉历程,相信对每一位科学殿堂里的探索者都会大有启迪我们应该记住他们,记住他们所作出的成就 J. Craig Venter是一位在人类基因组计划实施中贡献最大的科学家之一,他曾反对基因专利化,1998年,他和Perkin-Elmer公司联合组建了的Celera Genomics公司,Celera的商业计划是快速完成人类基因组测序,以及将信息调入一个复杂的遗传及医用信息库,并以订阅的方式销售给制药及生物技术公司,本文正是他们公司的成果,发表在《Science》上 John Craig Venter (born October 14, 1946) is an American biologist and entrepreneur, most famous for his role in being one of the first to sequence the human genome[1] and for his role in creating the first cell with a synthetic genome in 2010.[2][3] Venter founded Celera Genomics, The Institute for Genomic Research and the J. Craig Venter Institute, now working at the latter to create synthetic biological organisms and to document genetic diversity in the world's oceans. He was listed on Time magazine's 2007 and 2008 Time 100 list of the most influential people in the world. In 2010, The British Magazine New Statesman Listed Craig Venter at 14th in the list of "The World's 50 Most Influential Figures 2010".  1953 New Discovery(April) James Watson and Francis Crick discover the double helical structure of DNA (Nature). 1977 Methods for Sequencing DNA1977,,Allan Maxam and Walter Gilbert (pictured) at Harvard University and Frederick Sanger at the U.K. Medical Research Council (MRC) independently develop methods for sequencing DNA (PNAS, February; PNAS,December). 1972(October), Paul Berg and coworkers create the firstrecombinant DNA molecule (PNAS). 1985 HGP first be discussed (May) Robert insheimer (pictured) hosts a meeting at the University of California (UC), Santa Cruz, to discuss the feasibility of sequencing the human genome(December) Kary Mullis and colleagues at Cetus Corp. develop PCR, a technique to replicate vast amounts of DNA (Science). 1987 Develop YACs for Cloning (May) David Burke, Maynard Olson, and George Carle ofWashington University in St.Louis develop YACs (right) forcloning, increasing insert size 10-fold (Science).Applied Biosystems Inc. puts the first automated sequencing machine, based on Hood's technology, on the market. 1990 large-scale sequencingon model organisms(August) NIH (National Institutes of Health) begins large-scale sequencing trials on four model organisms: Mycoplasma capricolum (支原体), Escherichia coli (大肠杆菌)(up, pink), Caenorhabditis elegans (线虫) (up, rainbow), and Saccharomyces cerevisiae (啤酒酵母) (up,ovals). HGPHGP是美国科学家于是美国科学家于19851985年率先提出的,旨在阐明人年率先提出的,旨在阐明人类基因组类基因组3030亿个碱基对的序列,发现所有人类基因并亿个碱基对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息,搞清其在染色体上的位置,破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我。

使人类第一次在分子水平上全面地认识自我计划于计划于19901990年正式启动,这一价值年正式启动,这一价值3030亿美元的计划的亿美元的计划的目标是,为目标是,为3030亿个碱基对构成的人类基因组精确测序,亿个碱基对构成的人类基因组精确测序,从而最终弄清楚每种基因制造的蛋白质及其作用打从而最终弄清楚每种基因制造的蛋白质及其作用打个比方,这一过程就好像以步行的方式画出从北京到个比方,这一过程就好像以步行的方式画出从北京到上海的路线图,并标明沿途的每一座山峰与山谷虽上海的路线图,并标明沿途的每一座山峰与山谷虽然很慢,但非常精确然很慢,但非常精确 随着人类基因组逐渐被破译,一张生命之图将被随着人类基因组逐渐被破译,一张生命之图将被绘就,人们的生活也将发生巨大变化基因药物绘就,人们的生活也将发生巨大变化基因药物已经走进人们的生活,利用基因治疗更多的疾病已经走进人们的生活,利用基因治疗更多的疾病不再是一个奢望因为随着我们对人类本身的了不再是一个奢望因为随着我们对人类本身的了解迈上新的台阶,很多疾病的病因将被揭开,药解迈上新的台阶,很多疾病的病因将被揭开,药物就会设计得更好些,治疗方案就能物就会设计得更好些,治疗方案就能““对因下药对因下药””,生活起居、饮食习惯有可能根据基因情况进,生活起居、饮食习惯有可能根据基因情况进行调整,人类的整体健康状况将会提高,二十一行调整,人类的整体健康状况将会提高,二十一世纪的医学基础将由此奠定。

世纪的医学基础将由此奠定 参加绘制人类基因组图谱的美、英、日、法、德、中6国科学家2001年2月12日公布了更加准确、清晰、完整的人类基因组图谱国际权威科学刊物《自然》也以60多页的篇幅刊登题为《人类基因组的初步测定和分析》的学术论文,这是首次全面介绍人类基因组工作框架图的“基本信息”同一期杂志上还发表了多篇相关论文,涉及人类基因组图谱的绘制方法、Y染色体图谱、生殖细胞形成过程中染色体交换基因序列的方式、人体单核苷多态性数据等 意义:2020世纪世纪8080年代早期,对年代早期,对HGPHGP就形成了两个重要共识:就形成了两个重要共识:((1 1)全面认识基因组可以极大地加速生物医学研究全面认识基因组可以极大地加速生物医学研究2 2)可以使研究人员全面地、无偏差地解决问题可以使研究人员全面地、无偏差地解决问题19901990年美国能源部与国立卫生院启动这一计划英国、法国、日本年美国能源部与国立卫生院启动这一计划英国、法国、日本也建立基因组中心开展研究也建立基因组中心开展研究9090年代后期,年代后期,HGPHGP加速,德国和中国加速,德国和中国相继加入这一计划中国是相继加入这一计划中国是19991999年年9 9月加入这一国际协作组,负责月加入这一国际协作组,负责测定人类基因组全部序列的测定人类基因组全部序列的1%1%,成为参与这一计划的唯一发展中国,成为参与这一计划的唯一发展中国家。

家各国所承担工作比例约为美国54%,英国33%,日本7%,法各国所承担工作比例约为美国54%,英国33%,日本7%,法国2国2. .8%,德国28%,德国2. .2%,中国1%此前,人类基因组2%,中国1%此前,人类基因组““工作框工作框架图架图””已于2000年6月完成,科学家发现人类基因数目约为已于2000年6月完成,科学家发现人类基因数目约为2.52.5万个,远少于原先10万个基因的估计万个,远少于原先10万个基因的估计 二、人类基因组计划大事记19901990年年1010月月 誉为生命科学誉为生命科学““阿波罗登月计划阿波罗登月计划””的国际人的国际人类基因组计划启动类基因组计划启动19981998年年5 5月月 一批科学家在美国罗克威尔组建一批科学家在美国罗克威尔组建CeleraCelera遗传公遗传公司,目标是投入司,目标是投入3 3亿美元,到亿美元,到20012001年绘制出完整的人体基年绘制出完整的人体基因图谱,与国际人类基因组计划展开竞争因图谱,与国际人类基因组计划展开竞争19981998年年1010月月2323日日 美国国家人类基因组研究所在美国国家人类基因组研究所在《《ScienceScience》》上发表声明说,人类基因组计划的全部测序上发表声明说,人类基因组计划的全部测序工作将比原计划提前两年,即在工作将比原计划提前两年,即在20032003年完成。

年完成   19991999年年3 3月月1515日日 英国韦尔科姆基金会宣布,由于科学家加英国韦尔科姆基金会宣布,由于科学家加快工作步伐,人类基因组工作草图将提前至快工作步伐,人类基因组工作草图将提前至20002000年完成 19991999年年9 9月月 中国获准加入中国获准加入HGPHGP,,负责测定人类基因组全部负责测定人类基因组全部序列的序列的1%1%,也就是,也就是3 3号染色体上的号染色体上的30003000万个碱基对,使中万个碱基对,使中国成为继美、英、日、德、法之后第国成为继美、英、日、德、法之后第6 6个国际个国际HGPHGP参与国,参与国,也是参与这一计划的唯一发展中国家也是参与这一计划的唯一发展中国家1212月月1 1日日 国际人类基因组计划联合研究小组宣布,他们国际人类基因组计划联合研究小组宣布,他们完整地译出人体第完整地译出人体第2222对染色体的遗传密码,这是人类首对染色体的遗传密码,这是人类首次成功地完成人体染色体基因完整序列的测定次成功地完成人体染色体基因完整序列的测定20002000年年3 3月月1414日日 美国总统克林顿和英国首相布莱尔发表美国总统克林顿和英国首相布莱尔发表联合声明,呼吁将人类基因组研究成果公开,以便世界联合声明,呼吁将人类基因组研究成果公开,以便世界各国的科学家都能自由地使用这些成果。

他们是针对一各国的科学家都能自由地使用这些成果他们是针对一些私营生物技术公司为了商业利益而与国际人类基因组些私营生物技术公司为了商业利益而与国际人类基因组计划展开竞争,并试图将自己的研究成果申请专利而发计划展开竞争,并试图将自己的研究成果申请专利而发出此声明的出此声明的 4 4月月6 6日日 Celera Celera 公司宣布已破译出一名实验者的完整遗传公司宣布已破译出一名实验者的完整遗传密码但不少欧美科学家对密码但不少欧美科学家对CeleraCelera公司的成果表示质疑,公司的成果表示质疑,认为该公司的研究认为该公司的研究““没有提供有关基因序列的长度和完整没有提供有关基因序列的长度和完整性的可靠参数性的可靠参数””,因而是,因而是““有漏洞的有漏洞的””4 4月末月末 我国科学家按照国际人类基因组计划的部署,完成我国科学家按照国际人类基因组计划的部署,完成了了1%1%人类基因组的工作框架图人类基因组的工作框架图 5 5月月 国际人类基因组计划完成时间再度提前,预计从原定国际人类基因组计划完成时间再度提前,预计从原定的的20032003年年6 6月提前至月提前至20012001年年6 6月。

月5 5月月8 8日日 由德国和日本等国科学家组成的国际科研小组宣布,由德国和日本等国科学家组成的国际科研小组宣布,他们已经基本完成了人体第他们已经基本完成了人体第2121对染色体的测序工作对染色体的测序工作 6 6月月2626日日 各国科学家公布了人类基因组工作草图各国科学家公布了人类基因组工作草图 20032003年年4 4月月1414日,美国联邦国家人类基因组研究日,美国联邦国家人类基因组研究项目负责人弗朗西斯项目负责人弗朗西斯. .柯林斯博士在华盛顿隆重宣布,柯林斯博士在华盛顿隆重宣布,人类基因组序列图绘制成功,人类基因组计划的所有人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现由美、英、日、法、德和中国科学家目标全部实现由美、英、日、法、德和中国科学家经过经过1313年努力共同绘制完成了人类基因组序列图,在年努力共同绘制完成了人类基因组序列图,在人类揭示生命奥秘、认识自我的漫漫长路上又迈出了人类揭示生命奥秘、认识自我的漫漫长路上又迈出了重要的一步重要的一步 1.The human genome contains 3164.7 million chemical nucleotide (A, C, T, and G).     1.1% of the genome is spaned by exon sequence,     24% of the genome is in intron     75% of the genome is intergenic (noncoding) DNA2.  The average gene consists of 3000 bases, but sizes vary greatly, with the largest known human gene being dystrophin at 2.4 million bases.      Avereage: 8.1 exon/gene. 3.The total number of genes is estimated at 30,000 to 40 000, much lower than previous estimates of 80 000 to 140 000 that had been based on extrapolations from gene-rich areas as opposed to a composite of gene-rich and gene-poor areas.4.The functions are unknown for more than 50% of discovered genes. Assembly generated by UCSCFreeze of sequence data generated by NCBIClone layouts generated By Washington UniversityACCTTGGCCTGAATCTAGGCTTTGCATCCCTAGTCCTGATCGsequenceClonemapsWorking draft assemblyThe “Working Draft” of the human genome 三、生物信息学在人类基因组计划中的应用大规模基因组测序中的信息分析大规模基因组测序中的信息分析新基因和新新基因和新SNPsSNPs((单核苷酸多态性)的发现与鉴定单核苷酸多态性)的发现与鉴定完整基因组的比较研究完整基因组的比较研究大规模基因功能表达谱的分析大规模基因功能表达谱的分析生物大分子的结构模拟与药物设计生物大分子的结构模拟与药物设计 非编码区信息结构分析非编码区信息结构分析 遗传密码起源和生物进化的研究遗传密码起源和生物进化的研究 1.大规模基因组测序中的信息分析大规模测序是基因组研究的最基本任务,它的每大规模测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关。

目前,从测序仪的一个环节都与信息分析紧密相关目前,从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼光密度采样与分析、碱基读出、载体标识与去除、拼接与组装、填补序列间隙,到重复序列标识、读框预接与组装、填补序列间隙,到重复序列标识、读框预测和基因标注的每一步都是紧密依赖基因组信息学的测和基因标注的每一步都是紧密依赖基因组信息学的软件和数据库的特别是拼接和填补序列间隙更需要软件和数据库的特别是拼接和填补序列间隙更需要把实验设讨和信息分析时刻联系在一起.拼接与组装把实验设讨和信息分析时刻联系在一起.拼接与组装中的难点是处理重复序列,这在含有约中的难点是处理重复序列,这在含有约3030%重复序列%重复序列的人类基因组中显得尤其突出的人类基因组中显得尤其突出 2.新基因和新SNPs的发现与鉴定 人类基因组的工作草图即将完成,因此发现新基因就成了人类基因组的工作草图即将完成,因此发现新基因就成了当务之急使用基因组信息学的方法通过超大规模计算是当务之急使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段,可以说大部分新基因是靠理论方发现新基因的重要手段,可以说大部分新基因是靠理论方法预测出来的。

比如啤酒酵母完整基因组(约法预测出来的比如啤酒酵母完整基因组(约13001300万万bpbp))所包含的所包含的6 6千多个基因,大约千多个基因,大约6060%是通过信息分析得到的%是通过信息分析得到的当人类基因找到之后,自然要解决的问题是:不同人种间当人类基因找到之后,自然要解决的问题是:不同人种间基因有什么差别;正常人和病人基因又有什么差别基因有什么差别;正常人和病人基因又有什么差别这这就是通常所说的就是通常所说的SNPsSNPs((单核苷酸多态性)构建单核苷酸多态性)构建SNPsSNPs及其及其相关数据库是基因组研究走向应用的重要步骤相关数据库是基因组研究走向应用的重要步骤19981998年国年国际已开展了以际已开展了以ESTEST为主发现新为主发现新SNPsSNPs的研究在我国开展中的研究在我国开展中华民族华民族SNPsSNPs研究也是至关重要的研究也是至关重要的 3.完整基因组的比较研究现在,生物信息学家不仅有大量的序列和基因而且有现在,生物信息学家不仅有大量的序列和基因而且有越来越多的完整基因组有了这些资料人们就能对若干重大越来越多的完整基因组有了这些资料人们就能对若干重大生物学问题进行分析。

生物学问题进行分析比如:研究生命的起源、进化的,遗传密码是的起源,估计最小独立生活的生物至少需要多少基因,这些基因是如何使它们存活比如:鼠和人的基因组大小相似,都含有约三十亿碱基对,基因的数目也类似,可是为什么鼠和人差异确如此之大?同样,有的科学家估计不同人种间基因组的差别仅为0.1%;人猿间差别约为1%但他们表型间的差异十分显著因此其表型差异不仅应从基因、因此其表型差异不仅应从基因、DNADNA序列找原因,也应考虑到整个研究组、考虑染色体组织序列找原因,也应考虑到整个研究组、考虑染色体组织上的差异总之,这些例子说明由完整基因组研究所导致的上的差异总之,这些例子说明由完整基因组研究所导致的比较基因组学必将为基因组研究开辟新的领域比较基因组学必将为基因组研究开辟新的领域 4.大规模基因功能表达谱的分析 随着人类基因组测序完成,一些学者提出如下问题:即使随着人类基因组测序完成,一些学者提出如下问题:即使我们已经获得了人的完整基因图谱,那对人的生命活动能说明到我们已经获得了人的完整基因图谱,那对人的生命活动能说明到什么程度呢?于是他们提出了一系列上述数据不能说明的问题,什么程度呢?于是他们提出了一系列上述数据不能说明的问题,如:基因表达产物是否与何时出现,浓度是多少,是否存在翻译如:基因表达产物是否与何时出现,浓度是多少,是否存在翻译后修饰过程,若存在是如何修饰的;基因敲出或基因过度表达的后修饰过程,若存在是如何修饰的;基因敲出或基因过度表达的影响是什么;多基因的表现型如何等。

影响是什么;多基因的表现型如何等概括这些问题,概括这些问题,其实质是我们虽然知道了基因和核酸序列,其实质是我们虽然知道了基因和核酸序列,但不知道它们如何发挥功能,或者说是如何按照特定时间、空间但不知道它们如何发挥功能,或者说是如何按照特定时间、空间进行基因表达的,表达量有多少进行基因表达的,表达量有多少为了得到基因表达的功能谱,为了得到基因表达的功能谱,国际上在核酸和蛋白质两个层次上都发展了新技术这就是在核国际上在核酸和蛋白质两个层次上都发展了新技术这就是在核酸层次上的酸层次上的DNADNA芯片技术和在蛋白质层次上的二维凝胶电泳和测芯片技术和在蛋白质层次上的二维凝胶电泳和测序质谱技术,也称序质谱技术,也称蛋白质组技术蛋白质组技术 5.生物大分子的结构模拟与药物设计 随着人类基因组计划的执行,估计几年之内随着人类基因组计划的执行,估计几年之内就可找到人类的就可找到人类的8 8万到万到1010万个基因,也就是发现它万个基因,也就是发现它们的一级序列然而要了解他们的功能、要找到们的一级序列然而要了解他们的功能、要找到这些蛋白质功能的分子基础,必须进一步知道它这些蛋白质功能的分子基础,必须进一步知道它们的三维结构。

与此同时,要设计药物也需要了们的三维结构与此同时,要设计药物也需要了解相应的蛋白质受体的三维结构这是摆在科学解相应的蛋白质受体的三维结构这是摆在科学家面前的紧迫任务家面前的紧迫任务 6.非编码区信息结构分析 近年来完整基因组的研究表明,在细菌这样的微生近年来完整基因组的研究表明,在细菌这样的微生物中非编码区只占整个基因组序列的物中非编码区只占整个基因组序列的1010%到%到 20 20%,而高%,而高等生物和人的基因组中非编码区都占到基因组序列的绝等生物和人的基因组中非编码区都占到基因组序列的绝大部分从生物进化的观点看来,随着生物体功能的完大部分从生物进化的观点看来,随着生物体功能的完善和复杂化非编码区序列明显增加的趋势表明,这部分善和复杂化非编码区序列明显增加的趋势表明,这部分序列必定具有重要的生物功能普遍的认识是,它们与序列必定具有重要的生物功能普遍的认识是,它们与基因在四维时空的表达调控有关因此寻找这些区域的基因在四维时空的表达调控有关因此寻找这些区域的编码特征以及信息调节与表达规律是未来相当长时间内编码特征以及信息调节与表达规律是未来相当长时间内的热点课题的热点课题 对人类基因组来说,迄今为止,人们真正掌握规对人类基因组来说,迄今为止,人们真正掌握规律的只有律的只有DNADNA上的编码蛋白质的区域(基因),很多资上的编码蛋白质的区域(基因),很多资料说这部分序列只占基因组的料说这部分序列只占基因组的3 3%到%到5 5%,也就是说,%,也就是说,人类基因组中多达人类基因组中多达 95 95%到%到9797%是非编码区。

如何深人%是非编码区如何深人了解这些非编码区序列的功能是当前科学家们面临的了解这些非编码区序列的功能是当前科学家们面临的一个真正的挑战一个真正的挑战 7. 遗传密码起源和生物进化的研究 自自18591859年年DarwinDarwin的物种起源发表以来,进化论成为的物种起源发表以来,进化论成为对人类自然科学和自然哲学发展的最重大贡献之一进对人类自然科学和自然哲学发展的最重大贡献之一进化论研究的核心是描述生物进化的历史(系统进化树)化论研究的核心是描述生物进化的历史(系统进化树)和探索进化过程的机制和探索进化过程的机制自本世纪中叶以来,随着分子生物学的不断发展,自本世纪中叶以来,随着分子生物学的不断发展,进化论的研究也进入了分子水平当前分子进化的研究进化论的研究也进入了分子水平当前分子进化的研究已是进化论研究的重要手段,并建立了一套依赖于核酸、已是进化论研究的重要手段,并建立了一套依赖于核酸、蛋白质序列信息的理论方法蛋白质序列信息的理论方法 近年来,随着序列数据的大量增加,对序列差异和近年来,随着序列数据的大量增加,对序列差异和进化关系的争论也越来越激烈不少的研究结果并不支进化关系的争论也越来越激烈。

不少的研究结果并不支持分子钟的假设因为基于某一种分子序列所重构出的持分子钟的假设因为基于某一种分子序列所重构出的进化树,只能反映这种序列的系统发育关系,并不一定进化树,只能反映这种序列的系统发育关系,并不一定能代表物种之间真正的进化关系,即可能存在着基因树能代表物种之间真正的进化关系,即可能存在着基因树与物种树之间的差异同时,对垂直进化和水平演化之与物种树之间的差异同时,对垂直进化和水平演化之间关系的讨论正逐渐引起人们的重视当前的资料给了间关系的讨论正逐渐引起人们的重视当前的资料给了我们一个更为复杂也更为丰满的进化模式,它启示我们我们一个更为复杂也更为丰满的进化模式,它启示我们要彻底了解进化的规律必须使用整个基因组的信息相要彻底了解进化的规律必须使用整个基因组的信息相应地必须发展新的理论方法应地必须发展新的理论方法 四、我国HGP研究维甲酸调控基因的分离、克隆和基因鉴定维甲酸调控基因的分离、克隆和基因鉴定: : (陈竺)(陈竺)生育生育/ /不育相关基因:不育相关基因: (王琳芳)(王琳芳)人脑发育相关基因:人脑发育相关基因: (施伯勤)(施伯勤)神经性耳聋基因的分离、鉴定及序列测定神经性耳聋基因的分离、鉴定及序列测定 (夏家辉)(夏家辉)人工病毒载体人工病毒载体 (侯云德)(侯云德)转基因动物转基因动物 (曾溢涛,刘德培)(曾溢涛,刘德培)基因治疗基因治疗 (刘德培)(刘德培)基因的调控机制基因的调控机制 (张俊武)(张俊武) 中国在中国在HGP中的贡献中的贡献中国科学院中国科学院 杨焕明教授杨焕明教授南方基因组南方基因组 陈竺院士陈竺院士北方基因组北方基因组 强伯勤院士强伯勤院士测序中心测序中心—北京昌平空港工业园北京昌平空港工业园HGP的的1%,约,约3000万万bp总投资约总投资约6千万千万 基因组工程基因组学蛋白质组学药物基因组学功能基因组学比较基因组学分子病理学生物信息学等 有关HGP的深入研究方兴未艾2000年,测定HGP的全部基因序列2010年,识别所有的基因2050年,确定HGP中所有基因的功能2100年,确定HGP中基因变异和疾病的关系2000-2100年,研究其他生命大分子与生命活的关系,包括蛋白质、多糖、脂肪分子。

HGP的完成启发了我们新的思考的完成启发了我们新的思考……由于基因是遗传信息的携带者,而生命活动由于基因是遗传信息的携带者,而生命活动的执行者却是蛋白质,即基因表达产物因此,的执行者却是蛋白质,即基因表达产物因此,即使得到人类全部基因序列,也只是解决了遗传即使得到人类全部基因序列,也只是解决了遗传信息库的问题人类揭示整个生命活动的规律,信息库的问题人类揭示整个生命活动的规律,就必须研究基因的产物就必须研究基因的产物----蛋白质 相对于基因组而言,对于蛋白质的研究称相对于基因组而言,对于蛋白质的研究称为蛋白质组学为蛋白质组学 HGP计划的最新进展:1990年启动,历时约15年,耗资约30亿$2006年,人类基因组计划在美国、欧洲、亚洲20个研究所科学家的合作下已经完成人类基因数量是20000-25000个2006年5月《Nature》发表的论文是最完整的基因序列,包括99%的基因部分,已经确定了99.7%的已知基因,精确度达到99.9%近6000万年-1亿年中,新在人类基因组中出现的基因有1183个,有30个基因受到抑制基因功能研究是今后的重点 伦敦大学学院( University College London)著名遗传学家施蒂夫·琼斯教授说,人类现在已经到了历来最大可能的先进阶段,而且进化的过程已经减慢。

物竞天择、变异和突变是进化的三大要素他说,人类在体能和智力两方面,已经到了可能达到的最高程度 在150年前能活到21岁的儿童只有一半,但是现在已经达到98%人类基因变异的最大源头来自年纪大的男子由于生育的模式改变,人类基因变异已经失去了原有的生物学动力    人类基因组工程确定了大约三万四千个与蛋白质制造有关的基因而其余的基因片段——也就是大多数基因——被认为是由所谓的没有功能的“垃圾”DNA片段组成的但是最近几年的研究发现这些所谓的“垃圾”DNA产生了大约50万种RNA,只不过这些RNA的功能还未被发现2.5万基因所包含的DNA序列,大概只有人类基因组序列总长的2%左右也就是说,人类生命蓝图中约有98%的信息似乎不属于什么基因,是无用的垃圾   New progress2006年10月25日,来自全球63个科研机构的100多名科学家经过4年努力完成了蜜蜂的全基因组,这是继果蝇、蚊子之后完成的第三个昆虫基因组基因显示,蜜蜂的祖先来自非洲,推翻了以往来自欧亚的论点蜜蜂极其古老,进化缓慢,但体内控制生理节奏、衰老、RNAi等相关基因与昆虫有较大差异,与人等脊椎动物的同类基因更为接近控制嗅觉的基因极为发达。

An RNA gene expressed during cortial development evolved rapidly in humans  Nature 2006,Vol443 167-172比较遗传学揭示,一个RNA基因HAR1,在黑猩猩和人类分化前保持不变,但在以后人类加速演化时发生表达改变,该基因在neocortex的胚胎发育过程种表达,而neocortex是大脑很多最复杂发育过程的发生部位,该基因在妊娠的关键阶段活跃于Cajal-Retzius的神经元中,正在此时, neocortex的许多神经细胞正在大脑内确定自己的功能 果蝇的比较基因组学美国国立人类基因组研究所(NHGRI)资助的一个国际科研组织11月8日宣布,他们完成了12种“近亲”果蝇的基因组对比研究工作,其中有10种果蝇的基因组是首次测序对比分析确定出了数千个新的基因和其他功能元件,并揭示了进化过程在果蝇基因组上留下的痕迹相关论文以封面文章的形式发表于2007年11月8日的《自然》杂志上NHGRI主任Francis  S.  Collins表示,“这项非凡的科学成就强调了基因测序和基因组对比研究的价值,尤其是那些能够深化人们对基本生命过程理解的物种模型。

     一个世纪以来,果蝇一直是生命科学研究中理想而重要的模型尽管它们的基因组只有人类的1/25,但许多基因与人类是对应的,控制着相同的生理功能近些年来,科学家已经利用果蝇发现了许多基因线索,它们与疾病、动物发育、人类遗传学、细胞生物学、神经生物学等问题直接相关  这项最新的大规模研究由16个国家100多家研究机构的数百位科学家共同完成在12种果蝇中,黑腹果蝇(Drosophila  melanogaster)和拟暗果蝇(D.  pseudoobscura)的基因组是已知的,论文分别发表在2000年和2005年的《自然》杂志上其余10种果蝇的基因组都是最新测定的,它们分别是D.  sechellia,D.  simulans,D.  yakuba,D.  erecta,D.  ananassae,D.  persimilis,D.  willistoni,D.  mojavensis,D.  virilis和D.  grimshawi在常人看来,盘旋于腐烂香蕉上的果蝇们没有太大的差别的确,它们的基因组乍一眼看来确实十分相似不过,更加细致的分析表明,黑腹果蝇和其他11个种类只共享大约77%的编码蛋白基因(约13700个)。

   研究人员发现,果蝇基因组的不同区域进化速度也不相同,进化最快的是与果蝇味觉和嗅觉、解毒和代谢、性别和繁殖以及免疫性和防御相关的基因这表明,果蝇基因的进化很大程度上是适应环境变化和性别选择的结果比如,生活在印度洋岛屿上的D.  sechellia果蝇由于食物来源较为单一,与味觉相关的基因损失速度是其它种类的5倍而另一种D.  willistoni果蝇是科学家发现的唯一一种没有硒蛋白(Selenoproteins,有助减少机体摄入的硒矿物质量)的动物研究人员推测,该类果蝇可能以未知的特殊方式合成硒蛋白   除了进化上的认识,研究人员还发现了数千个新的基因和功能元件他们利用进化信号,发现了1193个新的编码蛋白序列,并且对此前报告的黑腹果蝇基因组中的414个编码蛋白序列提出了质疑新发现的功能元件共有数百个,包括非蛋白编码基因、转录调控部分以及负责染色体结构和动力学调控的DNA序列  来自麻省理工与哈佛大学Broad研究院(The  Broad  Institute),加州大学Santa  Cruz分校,Wellcome  Trust基因科学园(Wellcome  Trust  Genome  Campus)Sanger研究院,丹麦哥本哈根大学,比利时布鲁塞尔自由大学(  Universite  libre  de  Bruxelles,  ULB)等多国研究人员组成的研究小组测序分析了12种果蝇的基因组,从中揭示了基因和基因组进化的奥秘,以及识别了动物DNA中的功能性元素。

这是首次进行的如此大规模的测序基因组对比,研究成果公布在11月7日的《Nature》封面上,同期配发了一组重要论文,除此之外,在《Genome  Research》和其它杂志上也发表了40多篇相应的文章,引起了基因组研究领域,乃至整个生物学研究领域的轰动 199519951995年年年8 8 8月,月,月,冷泉港实冷泉港实冷泉港实验室出版验室出版验室出版社创办,社创办,社创办,关注所有关注所有关注所有物种的基物种的基物种的基因组研究因组研究因组研究 无编码意义的DNA的作用酵母和蠕虫之类的简单生物是如何进化为鸟和哺乳动物这样的复杂生物的呢?一项针对基因组进行的广泛比较研究显示,问题的答案可能就隐藏在生物的垃圾脱氧核糖核酸(DNA)中美国科学家发现,生物越复杂,其携带的垃圾DNA就越多,而恰恰是这些没有编码的“无用”DNA帮助高等生物进化出了复杂的机体 .生物的大多数DNA并没有形成有用的基因从突变保护到染色体的结构支撑,对于这种所谓的垃圾DNA的可能解释有许多种但是去年从人类、小鼠和大鼠身上得到的完全一致的关于垃圾DNA的研究结果却表明,在这一区域中可能包含有重要的调节机制,从而能够控制基础的生物化学反应和发育进程,这将帮助生物进化出更为复杂的机体。

  美国加利福尼亚大学圣塔克鲁斯分校(UCSC)的计算生物学家David Haussler领导的一个研究小组,对5种脊椎动物——人、小鼠、大鼠、鸡和河豚——的垃圾DNA序列与4种昆虫、两种蠕虫和7种酵母的垃圾DNA序列进行了比较研究人员从对比结果中得到了一个惊人的模式:生物越复杂,垃圾DNA似乎就越重要酵母与脊椎动物共享了一定数量的DNA,毕竟它们都需要制造蛋白质,但是只有15%的共有DNA与基因无关 酵母与更为复杂的蠕虫进行了比较,后者是一种多细胞生物,发现有40%的共有DNA没有被编码随后,研究人员又将脊椎动物与昆虫进行了对比,这些生物比蠕虫更为复杂,结果发现,有超过66%的共有DNA包含有没有编码的DNA   不同物种的基因组比较有些物种的基因组更加“精练”、垃圾更少,比如鸡的基因组大小只有人类的1/3、河豚则为人类的1/10,但它们的基因数量却与人类差不多也有的更夸张,如洋葱的基因组有人类基因组的12倍那么大、阿米巴变形虫的基因组更是比人的基因组大200多倍有证据显示,至少一部分垃圾DNA很像真正的垃圾,因为动物失去它们之后依然生活得很好2004年10月,一组美国科学家在《自然》杂志上发表报告说,他们删除了小鼠基因组中超过100万个碱基对的非编码DNA(约占鼠基因组的1%),但并没有对这些小鼠的发育、寿命和繁殖造成可察觉的影响。

在100多项评估基因活性的组织测试中,只有两项发现了差异他们还培育出失去300万个碱基对的非编码DNA小鼠,也没有发现明显异常   天花病毒,大肠杆菌和其他微生物的基因都是一个挤着一个,中间并没有“垃圾”或基因内区甚至有几种高等生物,如河豚,就只有很少的非编码DNA 大部分哺乳动物,无论是人、田鼠、猫,还是鼹鼠等,其基因组有大约30亿个碱基对的长度 植物的基因组经常是比哺乳动物的要更长例如,小麦的DNA大约有160亿个碱基对的长度,而野百合花却大约有1000亿个的长度;大部分“垃圾”DNA是冗长的、非编码的单一形态一些微生物,如天花病毒和细菌,有一些微小的,整齐的并不必要的基因组它们迅速地繁殖,却不能引发与立即复制相关的任何活动但是,高等动物的生命策略和复制策略都不仅仅是每20秒发生一次双裂变那样简单,它们能提供更复杂、更高级的基因组并且能为漫长而曲折的进化过程做出贡献 动植物的基因组大熊猫基因组2008年10月12日由中国完成牡蛎基因组2009年上半年完成牡蛎基因组精细图谱绘制籼稻2002年 Nature 456, 60-65 (6 November 2008) 《自然》杂志以封面文章形式发表了由深圳华大基因研究院完成的首个中国人基因组序列研究成果(定名“炎黄一号”)。

 深圳华大基因研究院院长汪建介绍说,这一长达7页的长篇论文描绘了第一个亚洲人的全基因组图谱,测序数据总量达到1177亿碱基对,基因组平均测序深度达到36倍,有效覆盖率高达99.97%,变异检测精度达99.9%以上 科学家在这一研究中详细比较了中国人与已有数据的白种人基因组在序列和结构上的差异性,新发现了41.7万例独有的遗传多态性位点,并对相应的基因功能进行了探讨,较全面地阐述了中国人基因组结构的特征 “炎黄一号”作为中国人参照基因组序列,从基因组学上对中国人与其他族群在疾病易感性和药物反应方面的显著差异作出了解释 2009年10月14日简介:我国科学家领衔的白菜、甘蓝和油菜全基因组测序项目取得阶段性重大成果,项目组日前获得了白菜全基因组的精细图,甘蓝和油菜全基因组的框架图白菜、甘蓝和油菜的基因.组大小分别约为5亿个、6.5亿个和11亿个碱基对,白菜和甘蓝含有的基因总数目分别约4.2万个和4.5万个,油菜基因覆盖度为85%以上9月23日,由14国科学家组成的“国际马铃薯基因组测序协作组”分别在北京、阿姆斯特丹、伦敦、纽约、利马等地同时宣布了马铃薯基因组序列框架图的完成  2009年10月9日 ,美国科学家通过将人类基因组分成数百万个片段并重新排列组合,成功描绘出清晰度和分辨率最高的基因组三维图像。

  2009年8月29日,我国科学家共获得了40个家蚕突变品系和中国野桑蚕的全基因.组序列,共测632.5亿对碱基序列,覆盖了99.8%的基因.组区域,是多细胞真核生物大规模重测序研究的首次报道;绘制完成了世界上第一张基因.组水平上的蚕类单碱基遗传变异图谱,这是世界上首次报道的昆虫基因.组变异图  Nature Biotechnology:斯蒂芬:斯蒂芬·夸克夸克((Stephen Quake)最近用)最近用“自绘自绘”个人个人基因组基因组图谱斯坦福大学图谱斯坦福大学8月月10日发表声明日发表声明说,夸克在两名同事的帮助下,利用一台说,夸克在两名同事的帮助下,利用一台冰箱大的单分子测序仪器,测定了自身的冰箱大的单分子测序仪器,测定了自身的基因组序列,并绘制了图谱与约基因组序列,并绘制了图谱与约10年前年前人类人类基因组基因组计划花费的庞大资金相比,夸计划花费的庞大资金相比,夸克只用了不到克只用了不到5万美元换言之,一项曾换言之,一项曾花费一架飞机的钱的任务,现在降到了一花费一架飞机的钱的任务,现在降到了一辆中等豪华轿车的价格辆中等豪华轿车的价格”由于价格太高,由于价格太高,目前全球已绘制个人目前全球已绘制个人基因组基因组图谱的只有图谱的只有10人左右,其中一些还是免费绘制。

人左右,其中一些还是免费绘制 科学家指出,拥有个人科学家指出,拥有个人基因组基因组图谱,意味图谱,意味着医生可以凭此为你设计着医生可以凭此为你设计“个性化医疗方个性化医疗方案案”,更精确地治病,甚至在发病前就进,更精确地治病,甚至在发病前就进行干预  2009-10-29 Nature:大肠杆菌(E. coli)基因组演化的速度和模式:韩、美、法三国科学家组成的研究小组长达20年实验中,研究人员在实验室中培养了一批大肠杆菌,它们在近20年时间里一直以葡萄糖为一种限制性营养物 大肠杆菌克隆的基因组分别在2,000代、5,000代、10,000代、15,000代、20,000代和 40,000代后被取样适应性的发展加速极快,但基因组演化在20,000代几乎是不变的这样的一致性被认为是中性演化的特点,但来自几个方面的证据都表明,这些突变大部分都是有益的这个种群后来突变速度加快,并且积累了数百个另外的、以中性为特征的突变显然,基因组演化和适应性演化之间的耦合是一个复杂的问题 2009-10-10,Nature:基因组和转录组随肿瘤转移所发生的变化:测序方法被用来研究来自一个患者(而不是来自一个细胞系或异种移植物)的一种“雌激素-受体-阿尔法-阳性”转移性小叶乳腺癌的基因组和转录组,研究的时段是从原发肿瘤被诊断出到出现转移之间的9年时间。

对同一患者转移肿瘤和原发肿瘤中的体细胞非同义编码突变所做比较,以及对基因组和转录组数据的组合分析,加深了我们对会随病情发展出现的突变演化的认识 2009-10-9,Nature:找到自闭症易感基因自闭症是一种具有高度遗传性的神经发育疾病,然而迄今所发现的特定易感基因非常少现在,在一组1,031个多元化自闭症家庭中利用50万个全genomics/" target="_blank">基因组SNP(单核苷酸多态性)所进行的一次全基因组扫描,显示了与自闭症相关的重要关联所发现的关联区域为罕见变异筛选提供了目标,同时研究人员还在染色体5p15上的SEMA5A 和TAS2R1之间发现了一个新的关联SEMA5A的表达被发现在自闭症患者脑中减少,从而进一步证实它是一个自闭症易感基因 2009-10-13 Nature Genetics:识别出22个影响血细胞发育的相关基因区域:一项关于全基因组关联研究(genome-wide association study,GWAS)的研究报告发表在10月11日Nature Genetics杂志上一组国际研究小组对英国和德国超过14,000人进行了8项血液测试——其中包括血红蛋白浓度,红细胞,白细胞以及血小板的数量和体积检测,揭开了人类基因组中影响血细胞发育相关的22个相关基因区域,且其中有15个基因区域是新发现的。

一些常见的人类疾病就与这些区域出现的遗传突变体有关这是GWAS首次在大量样本的血液检测上的应用 课题组对比了人类基因组中与血细胞发育相关的基因区域和引发心脏疾病基因区域通过1万名患病人群和1万名健康人的基因数据比较他们发现了一个与血小板计数相关的基因突变体同时还能引起心脏疾病这个基因组中新发现的突变体目前已知还能影响高血压,腹腔病以及1-型糖尿病的发病率进一步研究表明,这些遗传风险因素仅在欧洲血统的人群中发现该课题组比较了人类和黑猩猩的基因数据,他们得出这样的结论,即自然选择中这种有利的变异体保存下来同时也增加了患心脏疾病,腹腔病以及1-型糖尿病的风险据研究人员Dr Christian Gieger介绍,目前GWAS相关方面的研究很少超出对单一性状研究之外但是,通过对相关性状系统的分析,可以发现相同的基因突变体可能引发各种不同的人类疾病. 偷情基因2010年12月英国《每日邮报》报道:美国纽约州立大学加西娅博士负责的研究团队调查了180个年轻的男性与女性,详细了解了他们的情史与爱情观,然后再给他们做DRD4基因检测,这种基因能够影响大脑多巴胺的含量 拥有DRD4基因的人在偷情时,他们体内产生的化学反应与酒鬼贪杯、赌鬼摸牌时是类似的。

结果显示,大约25%的拥有“爱情骗子基因”的人比其他人出现不忠行为的几率要高出一倍多多巴胺就是这个系统的主脑,专门负责释放快乐   长寿基因2010年5月,英国莱顿大学科学家伊琳.斯拉格布姆领导一个小组,对三千五百名九十多岁的寿星进行了研究她说:“长寿者并不是拥有较少疾病基因或年老基因,而是拥有另一些阻止基因,这些基因阻止疾病基因和年老基因发挥作用长寿与基因和遗传有密切联系 玛土撒拉是圣经中的长寿人物,据传活了九百六十九岁所谓的玛土撒拉基因,包括了一种叫做ADIPOQ的基因,它存在于约一成的青年人身上,但是有近百分之三十的百岁老人携带这种基因另外,CETP基因和ApoC3基因,亦存在于百分之十的青年人身上,但有约百分之二十的百岁老人拥有该两种基因长寿者在新陈代谢脂肪和葡萄糖时,与一般人不同,他们的皮肤衰老速度较慢,他们患心脏病、糖尿病和高血压的机会也偏低这些因素都是受到基因的强烈影响,因此我们在老人身上看到与儿童相同的特征或可制成基因“抗老药”   逆转衰老2010年11月,美国哈佛干细胞学会艾米·韦杰斯领导的一支研究小组发现年轻老鼠的血液可使年老老鼠骨髓血干细胞变得年轻恢复活力,此外还可以恢复具有滋养、支持和刺激血干细胞和骨髓生态细胞的年轻状态。

尽管年老老鼠比年轻老鼠有更多的血干细胞和生态细胞,但这些细胞的活性较差,虽然数量多却无法达到像年轻老鼠修复身体的功能艾米说:“这种方法或许能促使年老动物恢复年轻状态,从而弥补年老动物体内细胞的缺陷性,年老老鼠体内有骨髓血细胞,可诱导炎症和发育癌症,同时较少的淋巴样细胞可起到组织修复作用  THE END 。

下载提示
相似文档
正为您匹配相似的精品文档
相关文档