基因组与比较基因组学课件

上传人:cn****1 文档编号:567685091 上传时间:2024-07-22 格式:PPT 页数:38 大小:943.50KB
返回 下载 相关 举报
基因组与比较基因组学课件_第1页
第1页 / 共38页
基因组与比较基因组学课件_第2页
第2页 / 共38页
基因组与比较基因组学课件_第3页
第3页 / 共38页
基因组与比较基因组学课件_第4页
第4页 / 共38页
基因组与比较基因组学课件_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《基因组与比较基因组学课件》由会员分享,可在线阅读,更多相关《基因组与比较基因组学课件(38页珍藏版)》请在金锄头文库上搜索。

1、11 11 基因组与比较基因组学基因组与比较基因组学11.1 DNA序列分析技术序列分析技术11.2 人类基因组计划人类基因组计划11.3 其他基因组其他基因组11.4 比较基因组学及相关研究比较基因组学及相关研究v20世纪人类科技发展史上的三大创举:世纪人类科技发展史上的三大创举:u1940年代第一颗原子弹爆炸;年代第一颗原子弹爆炸;u1960年代人类首次登上月球;年代人类首次登上月球;u1990年代提出并已基本完成的人类基因组年代提出并已基本完成的人类基因组计划(计划(HGP)。)。v基因组学是美国人基因组学是美国人THRodehck在在1986年年7月提出来的。月提出来的。v基基因因组组

2、是是生生物物体体内内遗遗传传信信息息的的集集合合,是是某某个个特特定定物物种种细细胞胞内全部内全部DNA分子的总和。分子的总和。n原原核核生生物物基基因因组组:原原核核生生物物DNA分分布布在在整整个个细细胞胞之之中中,有有时时相相对对集集中中在在类类核核体体上上。类类核核体体上上的的DNA是是一一条条共共价价、闭闭合合双双链链分分子子,类类核核体体通通常常也也称称为为染染色色体体。这这条条染色体的染色体的DNA就是原核细胞的基因组。就是原核细胞的基因组。n真真核核生生物物基基因因组组:一一个个物物种种的的单单倍倍体体的的各各条条染染色色体体中中的的全全部部DNA为为该该物物种种的的基基因因组

3、组(genome)。例例如如,人人有有23对对染染色色体体,配配子子单单倍倍体体是是23条条染染色色体体,这这23条染色体中的全部条染色体中的全部DNA就是人体基因组。就是人体基因组。11.1 高通量高通量DNA序列分析技术序列分析技术1. DNA序列测定的基本原理序列测定的基本原理vDNA自自动动测测序序仪仪可可快快速速测测定定DNA序序列列,计计算算机机处处理理能能力力的的快快速速提提高高则则使使得得大大量量DNA小小片片段段很很容容易易拼拼接接成成较较大大的的片片段甚至整个染色体。段甚至整个染色体。v高高效效快快捷捷的的DNA测测序序方方法法是是20世世纪纪70年年代代中中期期发发展展起

4、起来来的的,主主要要有有两两种种:Sanger的的双双脱脱氧氧链链终终止止法法和和Maxam-Gilbert的化学修饰法。的化学修饰法。vSanger 的的双脱氧链终止法双脱氧链终止法基本原理:基本原理: 核核酸酸模模板板在在核核酸酸聚聚合合酶酶、引引物物、四四种种单单脱脱氧氧碱碱基基存存在在条条件件下下复复制制或或转转录录时时,如如果果在在四四管管反反应应系系统统中中分分别别按按比比例例引引入入四四种种双双脱脱氧氧碱碱基基,只只要要双双脱脱氧氧碱碱基基掺掺入入链链端端,该该链链就就停停止止延延长长,链链端端掺掺入入单单脱脱氧氧碱碱基基的的片片段段可可继继续续延延长长。如如此此每每管管反反应应

5、体体系系中中便便合合成成以以共共同同引引物物为为5端端,以以双双脱脱氧氧碱碱基基为为3端端的的一一系系列列长长度度不不等等的的核核酸酸片片段段。反反应应终终止止后后,分分四四个个泳泳道道进进行行电电泳泳,以以分分离离长长短短不不一一的的核核酸酸片片段段(长长度度相相邻邻者者仅仅差差一一个个碱碱基基),根根据据片片段段3端端的的双双脱脱氧氧碱碱基基,便便可可依依次次阅阅读读合合成片段的碱基排列顺序。成片段的碱基排列顺序。vMaxam-Gilbert化学修饰法:化学修饰法:1)基本原理:用化学试剂处理具有末端放射性标记的)基本原理:用化学试剂处理具有末端放射性标记的DNA片段,造成碱基的特异性切割

6、并产生一组具有不同长片段,造成碱基的特异性切割并产生一组具有不同长度的度的DNA链降解产物,经凝胶电泳分离和放射自显影后,链降解产物,经凝胶电泳分离和放射自显影后,可直接读出待测可直接读出待测DNA片段的核苷酸序列。片段的核苷酸序列。2)基本步骤:()基本步骤:(1)同位素标记)同位素标记DNA片段的片段的5端;(端;(2)在特殊位置上通过化学反应随机打断在特殊位置上通过化学反应随机打断DNA链链G,A(some G),T(some C),C;(;(3)形成大小不一的)形成大小不一的DNA链;链;(4)电泳分离)电泳分离DNA链;(链;(5)根据同位素标记自显影后)根据同位素标记自显影后读出序

7、列。读出序列。3)优点:不存在因)优点:不存在因DNA序列或结构引起序列或结构引起DNA合成问题,合成问题,能测定用酶学方法不能正常测序的能测定用酶学方法不能正常测序的DNA序列。序列。4)缺点:需使用剧毒化学试剂。)缺点:需使用剧毒化学试剂。 vDNA测序自动化:测序自动化:1)使用荧光标记的)使用荧光标记的dNTP;2)毛细管电泳;)毛细管电泳;3)激光检)激光检测读序。测读序。PCR用于制备测序反应:用于制备测序反应:1)测序反应实质就是)测序反应实质就是DNA扩增,扩增,因而可以用因而可以用PCR进行测序反应。进行测序反应。2)与典型)与典型PCR反应的不同:(反应的不同:(1)只用一

8、个引物;()只用一个引物;(2)需用测序级的需用测序级的DNA聚合酶;(聚合酶;(3)DNA模板量高,一般模板量高,一般0.5-1.0mg;(;(3)循环次数多,一般)循环次数多,一般35-40个循环;个循环;(4)产物需纯化干燥。)产物需纯化干燥。实际工作中如要进行实际工作中如要进行DNA测序,需要准备什么?测序,需要准备什么?1)克隆你的目的基因或其片段;)克隆你的目的基因或其片段;2)鉴定你所得到的含目的基因或片段的重组质粒;)鉴定你所得到的含目的基因或片段的重组质粒;3)将含重组质粒的细菌或质粒送测序公司;)将含重组质粒的细菌或质粒送测序公司;4)等结果。)等结果。 2. 基因组基因组

9、DNA大片大片段文库的构建段文库的构建v构建基因文库是构建基因文库是测序前必须的预测序前必须的预备工作。酵母人备工作。酵母人工染色体技术工染色体技术(YAC)为创制)为创制基因组物理图提基因组物理图提供了极大的方便。供了极大的方便。ARS序列序列(Ori),),CEN序列,序列,TEL序列。序列。vYAC的主要缺点:的主要缺点: 1)存在高比例的嵌合体,即一个)存在高比例的嵌合体,即一个YAC克隆克隆含有两个本来不相连的独立片段;含有两个本来不相连的独立片段;2)部分克隆子不稳定,在转代培养中可能)部分克隆子不稳定,在转代培养中可能会发生缺失或重排;会发生缺失或重排;3)难与酵母染色体区分开,

10、因为)难与酵母染色体区分开,因为YAC与酵与酵母染色体具有相似的结构。母染色体具有相似的结构。4)操作时容易发生染色体机械切割。)操作时容易发生染色体机械切割。v用用细细菌菌的的F质质粒粒及及其其调调控控基基因因构构建建了了细细菌菌染染色色体体克克隆隆载载体体BAC,其其克克隆隆能能力力在在125-150kb左左右右。质质粒粒主主要要包包括括oriS, repE(控控制制F质质粒粒复复制制)和和parA、 parB(控控制制拷拷贝贝数数)等等成成分分。以以BAC为为基基础础的的克克隆隆载载体体转转化化效效率率高高,而而且且以以环环状状结结构构存存在在于于细细菌菌体体内内,易易于分辨和分离纯化。

11、于分辨和分离纯化。3. 鸟枪法基因组序列分析技术鸟枪法基因组序列分析技术vDNA序序列列分分析析技技术术一一次次测测序序反反应应的的长长度度不不能能超超过过1kb,不不能能直直接接用用BAC等等大大片片段段作作为为序序列列分分析析的的模模板板,采采用用全全基基因因组组鸟鸟枪枪法法测测序序技技术术随随机机挑挑选选插插入入基基因因组组DNA的的质质粒粒做做测测序序反反应应,然然后后用用计计算机程序进行序列拼接。算机程序进行序列拼接。v采用全基因组鸟枪法测序的基本原理:采用全基因组鸟枪法测序的基本原理:u对对某某基基因因组组文文库库全全部部克克隆隆片片段段进进行行末末端端序序列列测测定定中中未未测测

12、到到的碱基数,即缺口的碱基数,即缺口(gap),与已测定的总碱基数相关。,与已测定的总碱基数相关。u随随着着已已测测定定碱碱基基数数的的增增加加,缺缺口口的的总总碱碱基基数数目目会会按按照照泊泊松松公公式式的的一一个个推推论论(P=e-m)迅迅速速减减小小。其其中中P为为基基因因组组中中某某个个碱碱基基未未被被测测定定的的概概率率,m为为所所测测定定的的碱碱基基数数与与基基因因组组大大小小相相比比的的倍倍数数。m越越大大P值值越越小小。当当m=5(即即随随机机测测定定的的碱碱基基数数达达到到基基因因组组5倍倍),基基因因组组中中未未测测定定的的碱碱基基数数为为总总碱碱基基数数的的0.67%(e

13、-5=0.0067)。 对对流流感感嗜嗜血血杆杆菌菌基基因因组组(1.83Mb)来来说说,可可能能留留有有128个个平平均均长长为为100bp的的缺口。缺口。v鸟枪法测序的缺点:鸟枪法测序的缺点: u随着所测基因组总量增大,所需测序的片段大量增加,各随着所测基因组总量增大,所需测序的片段大量增加,各个片段重叠成一个连续体的概率是个片段重叠成一个连续体的概率是2n2-2n 。u高等真核生物(如人类)基因组中有大量重复序列,导致高等真核生物(如人类)基因组中有大量重复序列,导致判断失误。判断失误。v对鸟枪法的改进:对鸟枪法的改进:uClone contig法。首先用稀有内切酶把待测基因组降解为法。

14、首先用稀有内切酶把待测基因组降解为数百数百kb以上的片段,再分别测序。以上的片段,再分别测序。 u靶标鸟枪法靶标鸟枪法(direted shotgun)。首先根据染色体上已知基。首先根据染色体上已知基因和标记的位置来确定部分因和标记的位置来确定部分DNA片段的相对位置,再逐步片段的相对位置,再逐步缩小各片段之间的缺口。缩小各片段之间的缺口。 改改进进后后的的鸟鸟枪枪测测序序法法原原理理图图11.2 人类基因组计划人类基因组计划v2003年年4月月14日日,国国际际人人类类基基因因组组计计划划宣宣布布:人人类类基基因因组组序列草图提前绘制成功。序列草图提前绘制成功。v人人类类基基因因组组包包括括

15、24条条染染色色体体,约约30亿亿对对核核苷苷酸酸,编编码码约约3万万个个基基因因,人人类类基基因因组组中中携携带带了了有有关关人人类类个个体体生生长长发发育育、生老病死的全部遗传信息。生老病死的全部遗传信息。v从从整整体体上上看看,不不同同人人类类个个体体的的基基因因是是相相同同的的,因因此此,我我们们说说“人人类类只只有有一一个个基基因因组组”,人人生生来来是是平平等等的的。当当然然,不不同同的的人人可可能能拥拥有有不不同同的的等等位位基基因因,这这一一点点决决定定了了人人与与人人之之间个体上的差异。间个体上的差异。1. 人类基因组计划的科学意义人类基因组计划的科学意义v确确定定人人类类基

16、基因因组组中中约约3万万个个编编码码基基因因的的序序列列及及其其在在基基因因组组中中的的物物理位置,研究基因的产物及其功能。理位置,研究基因的产物及其功能。v了了解解转转录录和和剪剪接接调调控控元元件件的的结结构构与与位位置置,从从整整个个基基因因组组结结构构的的宏宏观水平上理解基因转录与转录后调节。观水平上理解基因转录与转录后调节。v从从整整体体上上了了解解染染色色体体结结构构,了了解解各各种种不不同同序序列列在在形形成成染染色色体体结结构构、DNA复制、基因转录及表达调控中的影响与作用。复制、基因转录及表达调控中的影响与作用。v研究空间结构对基因调节的作用。研究空间结构对基因调节的作用。v

17、发现与发现与DNA复制、重组等有关的序列。复制、重组等有关的序列。v研研究究DNA突突变变、重重排排和和染染色色体体断断裂裂等等,了了解解疾疾病病的的分分子子机机制制,为为疾病诊断、预防和治疗提供理论依据。疾病诊断、预防和治疗提供理论依据。v确确定定人人类类基基因因组组中中转转座座子子、逆逆转转座座子子和和病病毒毒残残余余序序列列,研研究究其其周周围序列的性质。围序列的性质。v研研究究人人类类个个体体之之间间的的多多态态性性(SNP)情情况况,用用于于基基因因诊诊断断、个个体体识识别别、亲亲子子鉴鉴定定、组组织织配配型型、发发育育进进化化等等许许多多医医疗疗、司司法法和和人人类类学的研究。学的

18、研究。2. 遗传图遗传图v遗遗传传图图又又称称连连锁锁图图(Linkage Map),是是指指基基因因或或DNA标标志志在在染染色色体体上上的的相相对对位位置置与与遗遗传传距距离离,通通常常以以基基因因或或DNA片片段段在在染染色色体体交交换换过过程程中中的的分分离离频频率率厘厘摩摩(cM)来来表表示示。cM值越大,两者之间距离越远。值越大,两者之间距离越远。 v产产生生配配子子的的减减数数分分裂裂过过程程中中,亲亲代代同同“号号”的的父父源源或或母母源源染染色色体体既既能能相相互互配配对对也也可可能能发发生生片片段段互互换换,而而父父母母源源染染色色体体等等位位基基因因互互换换导导致致子子代

19、代出出现现DNA“重重组组”的的频频率率与与这这两两个个位位点点之之间间的的距距离离呈呈正正相相关关,所所以以,用用两两个个位位点点之之间间的的交交换或重组频率来表示其换或重组频率来表示其“遗传学距离遗传学距离”。v连连锁锁分分析析是是通通过过分分析析同同一一遗遗传传位位点点在在不不同同个个体体中中等等位位基基因因的的不不同同(多多态态性性)来来研研究究同同一一染染色色体体上上两两位位点点之之间间的的相相互互关系。关系。v遗传距离图的基本数据来自基因的重组。遗传距离图的基本数据来自基因的重组。v由由于于不不能能对对人人类类进进行行“选选择择性性”婚婚配配,而而且且人人类类子子代代个个体体数数量

20、量有有限限、世世代代寿寿命命较较长长,呈呈共共显显多多态态性性的的蛋蛋白白质质数数量量不不多多,等等位位基基因因的的数数量量不不多多。DNA技技术术的的建建立立为为人人类类提提供供了了大量新的遗传标记。遗传标记有三代:大量新的遗传标记。遗传标记有三代:u第第一一代代DNA遗遗传传标标记记是是RFLP(限限制制性性片片段段长长度度多多态态性性)。DNA序序列列上上的的微微小小变变化化,甚甚至至1个个核核苷苷酸酸的的变变化化,也也能能引引起起限限制制性性内内切切酶酶切切点点的的丢丢失失或或产产生生,导导致致酶酶切切片片段段长长度度的的变变化。化。u第二代第二代DNADNA遗传标记利用了存在于人类基

21、因组中的大量重遗传标记利用了存在于人类基因组中的大量重复序列:复序列:重复单位长度在重复单位长度在15-6515-65个核苷酸左右的小卫星个核苷酸左右的小卫星DNADNA;重复单位长度在重复单位长度在2-62-6个核苷酸之间的微卫星个核苷酸之间的微卫星DNADNA,又称为简,又称为简短串联重复(短串联重复(STRSTR、STRPSTRP或或SSLPSSLP)。)。卫星卫星DNADNA分类分类特征特征卫星卫星DNADNA串联重复的基本单位首尾相接,在基因组中串联重复的基本单位首尾相接,在基因组中呈不均匀分布,但主要集中于着丝粒、端粒呈不均匀分布,但主要集中于着丝粒、端粒等特定部位,高度或中等重复

22、,分属三个大等特定部位,高度或中等重复,分属三个大家族。家族。卫星卫星DNADNA中等重复,基本单位长中等重复,基本单位长171bp171bp。小卫星小卫星DNADNA中等重复,基本单位长中等重复,基本单位长15-65bp15-65bp。微卫星微卫星DNADNA中等重复,基本单位长中等重复,基本单位长2-8bp 2-8bp 占人类基因组约占人类基因组约45%的重复序列来源于转座子复制机制。序的重复序列来源于转座子复制机制。序列分析表明,四类转座子产生了这些重复序列,其中前三列分析表明,四类转座子产生了这些重复序列,其中前三类转座子以类转座子以RNA为中间产物进行转座,最后一类则直接以为中间产物

23、进行转座,最后一类则直接以DNA的形式转座。的形式转座。STRP的的优优点点是是“多多态态性性”与与“高高频频率率”。由由于于(A)n,(CA)n,(CGG)n等等短短重重复复序序列列在在进进化化上上不不受受选选择择,在在同同一一位位点点上上可可重重复复单单位位数数量量变变化化很很大大,配配对对时时又又容容易易产产生生“错配错配”,使这样的位点遍布于整个基因组。,使这样的位点遍布于整个基因组。已已有有5264个个STRP为为主主体体的的遗遗传传标标记记“连连锁锁图图”,平平均均分分辨辨率率已已达达600kb,其其中中第第17号号染染色色体体上上平平均均每每495 kb有有一一个个标标记记,第第

24、9号号染染色色体体上上平平均均每每767 kb有有一一个个标标记记,整整个个基因组中只有三处标记间距大于基因组中只有三处标记间距大于4Mb。v第第三三代代DNA遗遗传传标标记记,可可能能也也是是最最好好的的遗遗传传标标记记,是是分分散散于于基基因因组组中中的的单单个个碱碱基基的的差差异异,即即单单核核苷苷酸酸的的多多态态性性(SNP),包括单个碱基的缺失、插入和替换。),包括单个碱基的缺失、插入和替换。uSNP中中大大多多数数为为转转换换,即即由由一一种种嘧嘧啶啶碱碱基基替替换换另另一一种种嘧嘧啶啶碱碱基基,或或由由一一种种嘌嘌呤呤碱碱基基替替换换另另一一种种嘌嘌呤呤碱碱基基,颠颠换换与与转转

25、换之比为换之比为1:2。uSNP有有可可能能在在密密度度上上达达到到人人类类基基因因组组“多多态态”位位点点数数目目的的极限。估计人类基因组中可能有极限。估计人类基因组中可能有300万个万个SNP位点!位点!uSNP与与RFLP和和STRP标标记记的的主主要要不不同同之之处处在在于于,它它不不再再以以DNA片片段段的的长长度度变变化化作作为为检检测测手手段段,而而直直接接以以序序列列变变异异作为标记。作为标记。v“遗遗传传图图”的的建建立立为为人人类类疾疾病病相相关关基基因因的的分分离离克克隆隆奠奠定定了了基基础础。拥拥有有5000多多个个遗遗传传学学位位点点,相相当当于于把把整整个个人人类类

26、基基因组划分为因组划分为5000多个小区,并分别设置了多个小区,并分别设置了“标牌标牌”。u如如果果在在家家系系中中证证实实该该基基因因与与某某个个标标记记不不连连锁锁(重重组组率率为为50%),表明该基因不在这一标记附近。),表明该基因不在这一标记附近。u如如果果发发现现该该基基因因与与某某个个标标记记有有一一定定程程度度的的“连连锁锁”(重重组组率小于率小于50%但大于但大于0),表明它可能位于这个标记附近。),表明它可能位于这个标记附近。u如如果果该该基基因因与与某某标标记记间间不不发发生生重重组组(重重组组率率等等于于0),我我们就推测该标记与所研究的疾病基因可能非常接近。们就推测该标

27、记与所研究的疾病基因可能非常接近。3. 物理图物理图v物物理理图图是是指指以以已已知知核核苷苷酸酸序序列列的的DNA片片段段(序序列列标标签签位位点点,STS)为为“路路标标”,以以碱碱基基对对(bp,kb,Mb)作作为为基基本本测量单位(图距)的基因组图。测量单位(图距)的基因组图。vSTS是是基基因因组组中中任任何何单单拷拷贝贝的的长长度度在在100500bp之之间间的的DNA序列,与核酸内切酶识别序列相关联。序列,与核酸内切酶识别序列相关联。v物理图主要内容是建立相互重叠连接的物理图主要内容是建立相互重叠连接的“相连相连DNA片段群片段群”。得得到到5套套以以上上包包含含相相关关染染色色

28、体体或或整整个个基基因因组组的的DNA片片段段是是建建立立STS物物理理图图的的先先决决条条件件。然然后后,可可以以通通过过拼拼接接而而得得STS物物理理图图。两两个个STS标标签签在在基基因因组组上上靠靠得得近近,它它们们就就会会一一直直同时出现在同时出现在DNA大片段上几率就会小得多。大片段上几率就会小得多。酵母第三号染色体遗传图(右)酵母第三号染色体遗传图(右)和物理图(左)的比较和物理图(左)的比较4. 转录图转录图v人人类类的的基基因因转转录录图图(cDNA图图),或或者者基基因因的的cDNA片片段段图图,即即表表达达序序列列标标签签图图(EST,expressed sequence

29、 tag)是人类基因组图的雏型。)是人类基因组图的雏型。v在在成成年年个个体体的的每每一一特特定定组组织织中中,一一般般只只有有10%-20%的的结结构基因(约构基因(约1-2万个不同类型的万个不同类型的mRNA)表达。)表达。v整整个个人人类类基基因因组组中中,有有1%-5%的的序序列列编编码码了了蛋蛋白白质质,最最多多可可能能有有(5-7)万万个个蛋蛋白白质质编编码码基基因因。得得到到了了一一段段cDNA或或一一个个EST,就就能能被被用用于于筛筛选选全全长长的的转转录录本本,并并将将该该基基因因准准确地定位于基因组上。确地定位于基因组上。vcDNA序序列列具具有有转转录录本本的的特特异异

30、性性,代代表表了了不不同同基基因因的的信信息息。可可以以将将DNA序序列列和和cDNA序序列列进进行行比比对对,找找出出对对应应于于cDNA的基因。的基因。v收集各种细胞或组织的基因表达谱进行两两或多重比较,收集各种细胞或组织的基因表达谱进行两两或多重比较,能较全面地了解哪些基因是特异性表达的。在某一细胞或能较全面地了解哪些基因是特异性表达的。在某一细胞或组织中特异性表达的基因可能与该组织或细胞类型的生理组织中特异性表达的基因可能与该组织或细胞类型的生理功能有关。功能有关。v获得各类组织或细胞的基因表达谱,从而给出人体获得各类组织或细胞的基因表达谱,从而给出人体200余余种基本组织或不同细胞组

31、成的人体基因图(种基本组织或不同细胞组成的人体基因图(bodymap)。)。v转录图(基因表达谱)所提供的信息,使人们有可能系统转录图(基因表达谱)所提供的信息,使人们有可能系统地全面地从地全面地从mRNA水平了解特定细胞、组织或器官的基因水平了解特定细胞、组织或器官的基因表达模式并解释其生理属性,深入认识细胞生长、发育、表达模式并解释其生理属性,深入认识细胞生长、发育、分化、衰老和疾病发生的机制。分化、衰老和疾病发生的机制。5. 全序列图全序列图v人类基因组的核苷酸序列图是分子水平上最高层次、最详人类基因组的核苷酸序列图是分子水平上最高层次、最详尽的物理图。测定总长约尽的物理图。测定总长约1

32、米、由米、由30亿个核苷酸组成的全亿个核苷酸组成的全序列是人类基因组计划的最终目标。序列是人类基因组计划的最终目标。v人类所拥有的基因位点都是相同的,不同种族、不同个体人类所拥有的基因位点都是相同的,不同种族、不同个体的基因差异的基因差异(人类基因组的多样性人类基因组的多样性)以及以及“正常正常”与与“疾病疾病”基因的差异,只是同一位点上的等位基因的差异。基因的差异,只是同一位点上的等位基因的差异。11.3 其它基因组其它基因组 随随着着测测序序技技术术的的逐逐步步成成熟熟和和测测序序成成本本的的逐逐渐渐降降低低,近近年年来来基基因因组组序序列列数数据据每每年年呈呈指指数数形形式式增增长长。据

33、据2007年年1月月数数据据,全全球球已已启启动动2296个个基基因因组组项项目目,其其中中607个个已已完完成成,481个个已已公公开发表基因序列。开发表基因序列。11.4 比较基因组学及相关研究比较基因组学及相关研究v与数据库中已知序列比较,基因组的序列可分为与数据库中已知序列比较,基因组的序列可分为3类:类:n确知其生理功能的确知其生理功能的n有相匹配的蛋白质序列,但并不知道其功能的有相匹配的蛋白质序列,但并不知道其功能的n在现有数据库中找不到任何相匹配的蛋白质序列的新在现有数据库中找不到任何相匹配的蛋白质序列的新基因基因v比较基因组学的威力比较基因组学的威力根据对一种生物相关基因的认识

34、根据对一种生物相关基因的认识来理解、诠释和克隆分离另一种生物的基因。来理解、诠释和克隆分离另一种生物的基因。1.基因组数据的挖掘与分析基因组数据的挖掘与分析v到到2001年年为为止止已已经经基基本本完完成成DNA序序列列分分析析的的各各种种真真核核生生物物基基因因组组数数据据的的比比较较发发现现,低低等等真真核核生生物物如如酵酵母母、线线虫虫以以及及高高等等植植物物拟拟南南芥芥,基基因因组组比比较较小小,基基因因密密度度比比较较高高,百百万碱基对中含有万碱基对中含有200个或更多的基因。个或更多的基因。v大肠杆菌基因组中,尚有大肠杆菌基因组中,尚有38%以上的未知蛋白质。以上的未知蛋白质。u与

35、物质运转和能量代谢相关的蛋白质含量分别占蛋白质总与物质运转和能量代谢相关的蛋白质含量分别占蛋白质总量的量的9%左右。左右。u各种功能性酶、细胞结构蛋白、调控蛋白、细胞周期相关各种功能性酶、细胞结构蛋白、调控蛋白、细胞周期相关因子及参与蛋白质合成、参与重要中间物合成与代谢等过因子及参与蛋白质合成、参与重要中间物合成与代谢等过程的蛋白质分别占总蛋白的程的蛋白质分别占总蛋白的4%以上。以上。u参与氨基酸合成及代谢,参与参与氨基酸合成及代谢,参与DNA合成及代谢的蛋白质也合成及代谢的蛋白质也都达到总蛋白的都达到总蛋白的3%左右。左右。v人人类类基基因因组组研研究究发发现现,人人类类基基因因的的平平均均

36、长长度度为为27kb左左右右,含含有有8.8个个长长约约145bp的的外外显显子子,内内含含子子的的长长度度大大大大超超过过外外显显子子,达达到到3365bp左左右右。人人类类基基因因的的3非非翻翻译译区区(URT)的的平平均均长长度度为为770bp,其其5非非翻翻译译区区的的平平均均长长度度为为300bp,开开放放读读码码框框的的平平均均长长度度只只有有1340bp,编编码码447个氨基酸。个氨基酸。2.基因组数据的比较研究基因组数据的比较研究v尿殖道支原体是最小的基因尿殖道支原体是最小的基因组(组( 0.58Mb ),可依此确),可依此确定能自我复制的细胞必需的定能自我复制的细胞必需的一套

37、最少的核心基因。流感一套最少的核心基因。流感嗜血杆菌的基因组为嗜血杆菌的基因组为1.83Mb。二者相差。二者相差3倍多,倍多,那么,基因组大小影响了基那么,基因组大小影响了基因数目还是基因尺度?因数目还是基因尺度?基因大小:流感嗜血杆菌平均基因大小:流感嗜血杆菌平均为为900bp,尿殖道支原体平,尿殖道支原体平均为均为1040bp。基因距离:流感嗜血杆菌中平基因距离:流感嗜血杆菌中平均均1042bp有有1个基因,尿殖个基因,尿殖道支原体中平均道支原体中平均1235bp有有1个基因。个基因。基因数量:流感嗜血杆菌有基因数量:流感嗜血杆菌有1743个个ORF,尿殖道支原体,尿殖道支原体有有470个个ORF。复习题复习题名词解释:名词解释:基因组,基因组学,鸟枪法,遗传图,物理基因组,基因组学,鸟枪法,遗传图,物理图图

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号