第十三章基因组学

上传人:hs****ma 文档编号:567685440 上传时间:2024-07-22 格式:PPT 页数:52 大小:4.54MB
返回 下载 相关 举报
第十三章基因组学_第1页
第1页 / 共52页
第十三章基因组学_第2页
第2页 / 共52页
第十三章基因组学_第3页
第3页 / 共52页
第十三章基因组学_第4页
第4页 / 共52页
第十三章基因组学_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《第十三章基因组学》由会员分享,可在线阅读,更多相关《第十三章基因组学(52页珍藏版)》请在金锄头文库上搜索。

1、第十三章基因组学第十三章基因组学第十三章基因工程和基因组学第一节第一节 基因组学基因组学 概述概述l基因组学(genomics) :遗传学研究进入分子水平后发展起来的一个分支,主要研究生物体内基因组的分子特征。* 研究对象:以整个基因组为研究单位,而不以单个基因为单位作为研究对象。* 研究目标:认识基因组的结构、功能和进化;阐明整个基因组所包含的遗传信息和相互关系;充分利用有效资源,预防和治疗人类疾病。基因组基因组(Genome):又称染色体组,是指一个物种单又称染色体组,是指一个物种单倍体的染色体数目,是生物体全部遗传物质的总和。倍体的染色体数目,是生物体全部遗传物质的总和。基因组学基因组学

2、(Genomics):对生物体所有基因进行基因对生物体所有基因进行基因组作图组作图(包括遗传图谱、物理图谱、转录图谱包括遗传图谱、物理图谱、转录图谱)、核苷、核苷酸序列分析、基因定位和基因功能分析的一门科学。酸序列分析、基因定位和基因功能分析的一门科学。最终目标:最终目标:获得生物体全部基因组序列,注解基因获得生物体全部基因组序列,注解基因组所含的全部基因,鉴定所有基因的功能及基因间相组所含的全部基因,鉴定所有基因的功能及基因间相互作用关系,并阐明基因组的复制及进化规律。互作用关系,并阐明基因组的复制及进化规律。一、一、基因组学的概念基因组学的概念生物生物基因基因组大小(大小(bp)T4T4噬

3、菌体噬菌体 T4 phage2.02.0105 5大大肠杆菌杆菌 Escherichia coli4.24.2106 6酵母酵母 Sccharomyces cereviside1.51.5107 7拟南芥南芥 Arabidopsis thaliana1.01.0108 8线虫虫 Caenorhbditis elegans1.01.0108 8果果蝇 Drosophila melanogaster1.651.65108 8水稻水稻 Oryza sativa4.34.3108 8小鼠小鼠 Mus musculus3.03.0109 9人人类Homo sapiens3.33.3109 9玉米玉米 Z

4、ea mays5.45.4109 9小麦小麦Triticum aestivum1.61.6101010不同生物基因组大小1. 人类基因组计划人类基因组计划 与曼哈顿原子与曼哈顿原子 计划、阿波罗登月计划并称的人类科学计划、阿波罗登月计划并称的人类科学史上的重大工程。于史上的重大工程。于1990年首先在美国启年首先在美国启 动,后有德、动,后有德、日、英、法、中等国的科学家先后正式加入。日、英、法、中等国的科学家先后正式加入。(一)(一) 人类基因组人类基因组 19901990年,美国国会批准美国的年,美国国会批准美国的“人类基因组计划人类基因组计划”在在1010月月1 1日正式启动。其总体规日

5、正式启动。其总体规 划是准备在划是准备在1515年内年内(1990199020052005)至少投入)至少投入3030亿美元,分析人类的基因亿美元,分析人类的基因组组30 30 亿个碱基对亿个碱基对。 20032003年,年,6 6国科学家宣布人类基因组序列图绘制成国科学家宣布人类基因组序列图绘制成功,功,HGPHGP的所有目标全部实现。覆盖人类基因组所含的所有目标全部实现。覆盖人类基因组所含基因区域的基因区域的99%99%,精确率达到,精确率达到99.99%99.99%,比原计划提前,比原计划提前两年多,耗资两年多,耗资2727亿美元。亿美元。人类基因组计划人类基因组计划人类基因组人类基因组

6、u核基因组核基因组DNA的总长约的总长约3109bp,含有,含有24条条线性线性DNA分子,最长的有分子,最长的有250 Mb,最短的,最短的55 Mb。 30亿个碱基对。亿个碱基对。u线粒体基因组是长度为线粒体基因组是长度为16569 bp的环状的环状DNA分子,每个细胞平均含有分子,每个细胞平均含有800个线粒体,个线粒体,每个线粒体含每个线粒体含10个基因组拷贝。个基因组拷贝。以每以每10cm 书写书写60个字母计算,个字母计算,30亿个碱基对连接的亿个碱基对连接的长度可达长度可达5 000 km,相当于北京到香港来回的距离。,相当于北京到香港来回的距离。为人类的基因组研究提供重要的依据

7、。为人类的基因组研究提供重要的依据。 19961996年,酵母菌基因组测序。年,酵母菌基因组测序。 19981998年年1212月,线虫完整基因组序列的月,线虫完整基因组序列的 20002000年年3 3月,果蝇的基因组测序月,果蝇的基因组测序 20012001年年1212月月1414日,拟南芥基因组的完整图谱。日,拟南芥基因组的完整图谱。(二)(二) 其他生物基因其他生物基因组我国超级杂交稻(籼稻)基因组计划我国超级杂交稻(籼稻)基因组计划 2001年年7月启动月启动2002年年4月月5日日Science。 材料:籼稻材料:籼稻“93119311”。完成单位:华大基因研究中心、中科院遗传与发

8、完成单位:华大基因研究中心、中科院遗传与发育生物学研究所等育生物学研究所等1212个单位。个单位。水平:水稻基因组的总基因数约为水平:水稻基因组的总基因数约为46022460225561555615个,工作框架图序列已覆盖水稻整个基因组个,工作框架图序列已覆盖水稻整个基因组9292以上以上的基因。的基因。方法:方法:“鸟枪射击法鸟枪射击法”,利用国产曙光,利用国产曙光20002000、曙、曙光光30003000超级计算机超级计算机(1000(1000亿次亿次/ /秒秒) )对随机对随机DNADNA碎片进行碎片进行排序和组装。排序和组装。水稻基因组计划水稻基因组计划国际水稻(粳稻)基因组计划始于

9、国际水稻(粳稻)基因组计划始于1998年,日本、年,日本、美国、中国、法国等国家和地区参加。中国负责第美国、中国、法国等国家和地区参加。中国负责第4号染色体:号染色体:36 Mb (占占910%)。国际水稻基因组测序计划国际水稻基因组测序计划2002年年12月月21日日Nature,中国第四号染色体。,中国第四号染色体。 材料:粳稻材料:粳稻“日本晴日本晴”。完成单位:中科院国家基因研究中心等完成单位:中科院国家基因研究中心等4 4家单位。家单位。水平:第四号染色体中的总碱基数目为水平:第四号染色体中的总碱基数目为0.350.35亿碱亿碱基对,覆盖全长序列基对,覆盖全长序列9898的区域,只剩

10、下的区域,只剩下7 7个小空洞,个小空洞,碱基序列的精确度达到碱基序列的精确度达到99.99%99.99%。完整测定的着丝粒序。完整测定的着丝粒序列在高等生物中属于首次。列在高等生物中属于首次。国际水稻基因组测序计划国际水稻基因组测序计划u水稻是第一个完成基因组全序列测定的农作物,核水稻是第一个完成基因组全序列测定的农作物,核基因组含有基因组含有12条染色体,总长约条染色体,总长约389Mb,1号染色体号染色体最大为最大为43.2Mb,10号染色体最小号染色体最小22.6Mb。全基因组。全基因组预测约含有预测约含有4万个基因。万个基因。u水稻双链闭环线粒体基因组大小为水稻双链闭环线粒体基因组大

11、小为491kb,叶绿体,叶绿体基因组基因组134.5kbC值:值:是指一个单倍体是指一个单倍体基因组中基因组中DNA的总量。的总量。值悖理值悖理 (C value paradox):):物种的物种的C值和它的进化复杂性之值和它的进化复杂性之间无严格对应关系的现间无严格对应关系的现象称为象称为C 值悖理,是复值悖理,是复杂生物基因组的一个普杂生物基因组的一个普遍特征遍特征(三)(三) C值悖理和值悖理和N值悖理值悖理(三)(三) C值悖理和值悖理和N值悖理值悖理N值:值:是指生物体所含有的基因数目。是指生物体所含有的基因数目。N值悖理(值悖理(N value paradox):复杂性不:复杂性不

12、同的生物种属所具有的基因数目与其生物结同的生物种属所具有的基因数目与其生物结构的复杂性不成比例的现象。构的复杂性不成比例的现象。如结构比较简单的线虫含有的基因数为如结构比较简单的线虫含有的基因数为1.91.9万个万个, , 比线虫更复杂的果蝇基因数为比线虫更复杂的果蝇基因数为1.81.8万万个个, , 水稻的基因数约水稻的基因数约4 4万个万个, , 最复杂的人类最复杂的人类其基因总数约其基因总数约3 3万个。万个。 四、基因组学研究内容四、基因组学研究内容(一)结构基因组学(一)结构基因组学(structural genomics)通过基因作图、核苷酸序列分析确定基因组通过基因作图、核苷酸序

13、列分析确定基因组成、进行基因定位的科学。成、进行基因定位的科学。遗传信息在染色体上遗传信息在染色体上,但染色体不能直接用但染色体不能直接用来测序来测序,必须将基因组这一巨大的研究对象进必须将基因组这一巨大的研究对象进行分解行分解,使之成为较易操作的小的结构区域使之成为较易操作的小的结构区域,这这个过程就是基因作图。完成基因组图谱构建个过程就是基因作图。完成基因组图谱构建之后,就可以利用图谱进行基因组序列测定之后,就可以利用图谱进行基因组序列测定和组装。和组装。四、基因组学研究内容四、基因组学研究内容(二)功能基因组学(二)功能基因组学(functional genomics) u利用结构基因组

14、所提供的信息和产物,研利用结构基因组所提供的信息和产物,研究基因组功能表达的一门分支学科。究基因组功能表达的一门分支学科。u主要研究内容主要研究内容:基因的识别、鉴定和克隆。包括新策略、新技术、基因的识别、鉴定和克隆。包括新策略、新技术、新方法的创立和各种基因组数据的建立;新方法的创立和各种基因组数据的建立;基因结构与功能及其相互关系的研究。包括基因基因结构与功能及其相互关系的研究。包括基因变异体的系统鉴定和目录的绘制;基因表达谱的编变异体的系统鉴定和目录的绘制;基因表达谱的编制、基因结构与功能关系的鉴定、基因相互作用网制、基因结构与功能关系的鉴定、基因相互作用网络图的编制;络图的编制;基因表

15、达调控的研究基因表达调控的研究 四、基因组学研究内容四、基因组学研究内容(三)蛋白质组学(三)蛋白质组学(proteomics)研究细胞内蛋白质组成及其活动规律。旨在研究细胞内蛋白质组成及其活动规律。旨在阐明生物体全部蛋白质的表达模式及功能模阐明生物体全部蛋白质的表达模式及功能模式式,内容包括鉴定蛋白质表达、存在方式、结内容包括鉴定蛋白质表达、存在方式、结构、功能和相互作用方式等。构、功能和相互作用方式等。基因是遗传信息的携带者基因是遗传信息的携带者,而全部生物功能而全部生物功能的执行者却是蛋白质的执行者却是蛋白质, 仅仅从基因的角度来研仅仅从基因的角度来研究是远远不够的。究是远远不够的。第第

16、 2节节 基因组图谱构建基因组图谱构建基因组计划的目的是获得全基因组序列,并对其进行基因组计划的目的是获得全基因组序列,并对其进行解读。解读。DNA测序每次反应仅能读取测序每次反应仅能读取1000bp的长度,的长度,因此,基因组测序的基础是基因组图谱的构建。因此,基因组测序的基础是基因组图谱的构建。鸟枪射击法鸟枪射击法(shotgun) 基因基因组序列测定组序列测定 第第 2节节 基因组图谱构建基因组图谱构建基因组测序策略基因组测序策略 重叠群法重叠群法 相互存在重叠序列的一组克隆。根据重相互存在重叠序列的一组克隆。根据重叠群的相对位置讲各个克隆首尾相连,长度可达百万叠群的相对位置讲各个克隆首

17、尾相连,长度可达百万级级bp。对单个重叠群,采用鸟枪法测序,然后进行组。对单个重叠群,采用鸟枪法测序,然后进行组装。这是由上而下(装。这是由上而下(up to down)的测序策略。)的测序策略。 直接鸟枪法直接鸟枪法 首先进行全基因组鸟枪法测序,再用首先进行全基因组鸟枪法测序,再用分子标记为起点强鸟枪分子标记为起点强鸟枪DNA片段组装。这是由下而上片段组装。这是由下而上(bottom to up)的测序策略。这种方法依赖于高密)的测序策略。这种方法依赖于高密度分子标记基因组图谱。度分子标记基因组图谱。基因组图谱分为遗传图谱和物理图谱。基因组图谱分为遗传图谱和物理图谱。(一)遗传标记(一)遗传

18、标记u遗传标记就是遗传物质的特殊的易于识别的遗传标记就是遗传物质的特殊的易于识别的多态性表现形式,它包括形态标记、细胞学标多态性表现形式,它包括形态标记、细胞学标记、生化标记和分子标记。记、生化标记和分子标记。形态标记:主要指可以观察到的一些性状形态标记:主要指可以观察到的一些性状,如种皮颜如种皮颜色、眼色、株高等。色、眼色、株高等。细胞学标记:细胞学标记是指能明确显示遗传多态性细胞学标记:细胞学标记是指能明确显示遗传多态性的细胞学特征。的细胞学特征。生化标记:主要是同工酶及种子贮藏蛋白,有时又称生化标记:主要是同工酶及种子贮藏蛋白,有时又称蛋白质标记。蛋白质标记。分子标记:主要指分子标记:主

19、要指DNA水平上的标记。水平上的标记。 DNA标记标记以以DNA为基础的分子标记主要包括为基础的分子标记主要包括 基于杂交的分子标记,如基于杂交的分子标记,如RFLP。 基于基于PCR的分子标记,如的分子标记,如RAPD、AFLP、SSR (又称又称microsatellite )、AFLP 等。等。 基于基于DNA序列和芯片的分子标记,如序列和芯片的分子标记,如SNP(single nucleotide polymorphism)。)。RAPD由由Williams 等(等(1990)和)和Welsh等等(1990)分别发展起来的分子标记技术。这)分别发展起来的分子标记技术。这一技术是以基因组

20、一技术是以基因组DNA为模板,采用随机设为模板,采用随机设计的单个寡核甘酸序列(一般为计的单个寡核甘酸序列(一般为10bp)为引)为引物,通过物,通过PCR扩增,产生不连续的扩增,产生不连续的DNA产物,产物,用于检测用于检测DNA序列的多态性序列的多态性。RAPD (Random amplified polymorphic DNA)重复序列重复序列 串联重复序列(串联重复序列(tandem repeated tandem repeated sequencesequence),其重复单位首尾相连,成串排列),其重复单位首尾相连,成串排列(Flavell 1986Flavell 1986)。)。

21、 散布重复序列(散布重复序列(interspersed repeated interspersed repeated sequencesequence),其重复单位与其它无关序列或单),其重复单位与其它无关序列或单拷贝序列相间排列。拷贝序列相间排列。SSR (simple sequence repeats)或微卫星或微卫星(microsatellite )微卫星微卫星DNA序列或序列或SSR又称短串联重复序列又称短串联重复序列(short sequence repeat,STR),它是由几个),它是由几个核甘酸(一般核甘酸(一般16个)为重复单位簇集而成的串个)为重复单位簇集而成的串联重复序列

22、,可随机的分布在整个基因组的不联重复序列,可随机的分布在整个基因组的不同位置上。微卫星长度具有高度变异性,并且同位置上。微卫星长度具有高度变异性,并且这种多态性常常表现复等位性,两端的序列多这种多态性常常表现复等位性,两端的序列多是相对保守的单拷贝序列,因而可以根据两端是相对保守的单拷贝序列,因而可以根据两端的序列设计一对特异引物,扩增每个位点的微的序列设计一对特异引物,扩增每个位点的微卫星序列,从而揭示其卫星序列,从而揭示其长度的多态性(长度的多态性(simple sequence length polymorphism,SSLP)。)。 SSRISSR是一种新型的分子标记。与是一种新型的分

23、子标记。与SSR相反,直接用同位素标记相反,直接用同位素标记SSR序列,扩序列,扩增增2个个SSR间的单拷贝序列。为了增加间的单拷贝序列。为了增加扩增的特异性,在引物的扩增的特异性,在引物的5和和3端分别端分别加入加入12个选择性碱基,引物长度个选择性碱基,引物长度1618bp。ISSR(inter-ssr) AFLP结合了结合了RFLP和和RAPD技术的优点。技术的优点。AFLP的基本原理是基于的基本原理是基于PCR的扩增基因组的扩增基因组DNA限制性片段多态性。基因组限制性片段多态性。基因组DNA先用限制先用限制性内切酶切割,然后将双链接头(性内切酶切割,然后将双链接头(adapter)连

24、)连接到接到DNA片段的末端,通过选择在片段的末端,通过选择在3端分别添端分别添加加13个选择性碱基的不同引物,选择性地识个选择性碱基的不同引物,选择性地识别具有特异配对顺序的酶切片段并与之结合,别具有特异配对顺序的酶切片段并与之结合,从而实现特异扩增。从而实现特异扩增。AFLP ( Amplicon fragment length polymorphism) AFLP反应过程示意图反应过程示意图遗传信息由遗传信息由DNA mRNA 蛋白质。蛋白质。一个典型的真核生物一个典型的真核生物mRNA分子:分子:5- U TR ( 5端转端转录非翻译区录非翻译区) , ORF (开放阅读框架开放阅读框

25、架) ,3- U TR ( 3端转端转录非翻译区录非翻译区) ,polyA任何一个基因,任何一个基因,cDNA 的的5端或端或3端的有限序列即端的有限序列即可特异性地代表生物体某种组织某个时期的一个表达可特异性地代表生物体某种组织某个时期的一个表达基因。基因。EST 的数目可以显示所代表的基因的拷贝数的数目可以显示所代表的基因的拷贝数EST (expressed sequence tags)从组织细胞中提取总从组织细胞中提取总mRNA ,构建成标准,构建成标准cDNA 文库,然后从中挑取大量克隆,利用文库,然后从中挑取大量克隆,利用载体通用引物测出插入载体的载体通用引物测出插入载体的cDNA

26、片段片段5端端或或3端端300 - 500 碱基的序列。碱基的序列。将测序所得的将测序所得的EST 与与dbEST 等数据库中的等数据库中的数据进行比较分析数据进行比较分析,根据核酸或蛋白质序列的根据核酸或蛋白质序列的同源性比较,可以鉴定出哪些同源性比较,可以鉴定出哪些EST 代表已知代表已知基因,哪些基因,哪些EST 代表未知基因。代表未知基因。EST序列标签位点(序列标签位点(sequence tagged site) 是一小段是一小段DNA序列。每个基因组仅序列。每个基因组仅1个拷贝,个拷贝,很容易分辨。很容易分辨。STS要满足要满足2个条件:个条件: 是一段已知的序列,可据此涉及是一段

27、已知的序列,可据此涉及PCRPCR引物来检测引物来检测不同不同DNADNA片断中是否存在片断中是否存在 这一序列。这一序列。 STSSTS在染色体上必须是独一无二的。如果在基在染色体上必须是独一无二的。如果在基因组中有多个位点出现,作图数据将含混不清。因组中有多个位点出现,作图数据将含混不清。常见的寻找常见的寻找STS的方法:的方法: EST、 SSLP、 随机基因组序列随机基因组序列STS 单核苷酸多态性是指基因组序列中由于单单核苷酸多态性是指基因组序列中由于单个核苷酸个核苷酸(,)的替换而引起的多态性。通常的替换而引起的多态性。通常SNPs不包括碱基的插入、缺失以及重复序列拷贝数不包括碱基

28、的插入、缺失以及重复序列拷贝数的变化。这种标记只有两种等位基因。的变化。这种标记只有两种等位基因。人类基因组的编码基因中有人类基因组的编码基因中有2020万个万个SNPs, SNPs, 在非编码在非编码区的数目可能还要多区的数目可能还要多1010倍以上。倍以上。单倍型:当前常用术语单倍型:当前常用术语“happlotype”(单倍型单倍型)代替术语代替术语“allele”(等位基因等位基因)。在给定的一条染。在给定的一条染色体的紧密连锁的位点上多个等位基因的集合色体的紧密连锁的位点上多个等位基因的集合,通常通常34个相邻等位基因彼此靠近而构成的单倍型可作个相邻等位基因彼此靠近而构成的单倍型可作

29、为一个整体而遗传为一个整体而遗传(称为单倍型块称为单倍型块(haploblock)SNP ( single nucleotide polymorphism )特性特性RFLPRAPDSSRISSRAFLP分布分布 普遍存在普遍存在普遍存在普遍存在普遍存在普遍存在普遍存在普遍存在普遍存在普遍存在遗传遗传共显性共显性多数显性多数显性共显性共显性多数显性多数显性多数显性多数显性多态性多态性中中高高高高高高非常高非常高等位检测等位检测是是不是不是是是不是不是不是不是检测位点数检测位点数1311015050更多更多20100样品信息量样品信息量低低中中高高高高高高非常高非常高基因组区域基因组区域底拷贝编

30、码底拷贝编码整个基因组整个基因组整个基因组整个基因组整个基因组整个基因组整个基因组整个基因组技术难度技术难度中等中等简单简单简单简单简单简单中等中等重复性重复性高高中等中等高高高高高高DNA样品量样品量230g1100ng50-100ng250ng100ng反射线反射线一般是一般是不是不是不是不是不是不是一般是一般是耗费时间耗费时间慢慢快快快快快快中等中等可靠性可靠性高高中等中等高高高高高高(二)(二) 遗传图谱的构建遗传图谱的构建 1 人类基因组遗传图谱的构建人类基因组遗传图谱的构建人类的遗传图谱是利用人类的遗传图谱是利用家系分析法家系分析法,在对,在对8个个家系的家系的134个成员的分析中

31、个成员的分析中(186个减数分裂个减数分裂),主要根据主要根据5264个个STR标记绘制而成的。标记绘制而成的。利用这些家系的资料绘制第利用这些家系的资料绘制第1至至22号染色体图号染色体图谱。对于谱。对于X染色体图谱,还利用了来自另外染色体图谱,还利用了来自另外12个家系,个家系,170个成员个成员(105个减数分裂个减数分裂)的资料绘的资料绘制而成。制而成。最后,将最后,将5264个标记定位在个标记定位在2335个位点(其个位点(其中有些标记相距很近而作为一个位点)。中有些标记相距很近而作为一个位点)。2 植物基因组遗传图谱的构建植物基因组遗传图谱的构建 作图群体作图群体常用的遗传作图群体

32、有常用的遗传作图群体有F2群体、群体、回交群体、加倍单倍体回交群体、加倍单倍体(double haploid,DH)群体、)群体、重组近交系(重组近交系(recombinant inbred lines,RIL)群体、近)群体、近等基因系(等基因系(nearisogenic lines,NIL)群体等(徐云碧,)群体等(徐云碧,1994)。)。遗传标记的染色体定位遗传标记的染色体定位 标记间的连锁分析标记间的连锁分析 LINKAGE、Mapmaker、JoinMap二、二、 物理图谱绘制物理图谱绘制(一(一 )限制性作图)限制性作图 (二)基于克隆的基因组作图(二)基于克隆的基因组作图(三)(

33、三) 原位杂交原位杂交(四)序列标签位点(四)序列标签位点(STS)作图)作图(五)(五) 人类基因组图谱人类基因组图谱重叠群(重叠群(contigous DNA clones, contigs)从从1个感兴趣的位置开始,利用第个感兴趣的位置开始,利用第1个元件的末端部个元件的末端部分来辩别第分来辩别第2个元件,沿染色体个元件,沿染色体“行走行走”(walk)。通)。通过鉴别目标位点两测的过鉴别目标位点两测的2个个DNA标记,从标记,从1个标记向另个标记向另1个标记的行走。个标记的行走。沿染色体鉴别一系列重叠群是大规模研究的基础。沿染色体鉴别一系列重叠群是大规模研究的基础。在特定区域的染色体行

34、走可以提供分离通过遗传图谱在特定区域的染色体行走可以提供分离通过遗传图谱定位在该区域基因的方法。集中全部染色体的重叠群,定位在该区域基因的方法。集中全部染色体的重叠群,可以为以后研究提供有效克隆来源。可以为以后研究提供有效克隆来源。染色体行走考虑的根本是每染色体行走考虑的根本是每“步步”的大小,较大的的大小,较大的步加快积聚相邻克隆的进程。步加快积聚相邻克隆的进程。(二)(二) 基于克隆的基因组作图基于克隆的基因组作图区域作图区域作图 Regional mapping区域作图区域作图 Regional mappingMinimal tiling path selected for sequen

35、cing.区域作图区域作图 Regional mapping(三)(三) 原位杂交原位杂交荧光原位杂交(荧光原位杂交(fluorescent in situ hybridization, FISH)基因组原位杂交(基因组原位杂交(genome in situ hybridization, GISH )(四)序列标签位点(四)序列标签位点(STS)作图)作图辐射杂交系辐射杂交系 是含有另一种生物染色体片是含有另一种生物染色体片断的啮齿类细胞。带有人类染色体片段的断的啮齿类细胞。带有人类染色体片段的辐射杂交系辐射杂交系 DNA库库 YAC/BAC克隆作图克隆作图 获得大分子获得大分子DNA克隆文库

36、以后,克隆文库以后,用用PCR的方法检测的方法检测STS,根据重叠的,根据重叠的STS标记绘制克隆连锁图。标记绘制克隆连锁图。(四)序列标签位点(四)序列标签位点(STS)作图)作图当当两两个个片片段段含含有有同同一一STS顺顺序序时时,则则这这两两个个片片段段彼彼此此重重叠叠。如如果果它它们们彼彼此此邻邻接接,这这两两个个STS总总会会同同时时出出现现在在相相同同片片段段上上。如如果果它它们们相相距距甚甚远远,有有时时会会在在同一片段,有时则在不同片段。同一片段,有时则在不同片段。要要将将一一组组STS作作图图定定位位,必必需需收收集集来来自自同同一一染染色色体体或或整整个个基基因因组组随随

37、机机断断裂裂的的DNA片片段段。不不同同DNA片片段段之之间间有有各各种种可可能能的的重重叠叠,可可以以覆覆盖盖整整个个作作图图区区段段。依依次次采采用用单单个个STS挑挑出出它它们们所所在在的的DNA片片段段,根根据据它们彼此的重叠关系可以逐段绘它们彼此的重叠关系可以逐段绘DNA物理图。物理图。生物信息学是现代生物技术与计算机科学的结合,生物信息学是现代生物技术与计算机科学的结合,收集、加工和分析生物资料和信息的学科。收集、加工和分析生物资料和信息的学科。应用生物信息学可以将来自不同的基因组理论和应用生物信息学可以将来自不同的基因组理论和应用综合并标准化,利用大量的生物信息资料了解应用综合并

38、标准化,利用大量的生物信息资料了解遗传网络系统、信号传递及相互关系,计算机还可遗传网络系统、信号传递及相互关系,计算机还可进行一些生物模拟研究。进行一些生物模拟研究。利用生物信息学能够分析从微生物、动物、植物利用生物信息学能够分析从微生物、动物、植物以及人类基因组序列测定产生的大量资料,阐明遗以及人类基因组序列测定产生的大量资料,阐明遗传信息。传信息。 研究内容两大类:研究内容两大类:DNA 数据分析;数据分析; 蛋白质数据分析。蛋白质数据分析。第三节生物信息学第三节生物信息学(bioinformatics)基因芯片基因芯片基因芯片(gene chip),又称DNA微阵列(microarray

39、),是由大量DNA或寡核苷酸探针密集排列所形成的探针阵列,其基本原理是通过杂交检测信息。利用基因芯片,可以实现基因信息的大规模检测。生物信息学的应用生物信息学的应用(一)(一)发现新基因和新的新基因和新的单核苷酸多核苷酸多态性性在研究生物的基因时,不断的发现新的基因。一般说来,从基因组DNA预测新基因,是发现新基因的另一个重要途径。SNP出现在蛋白质的编码基因上,它可改变蛋白质的结构和功能,也可出现在非编码区,操控基因的表达水平。(二)分析基因(二)分析基因组中非中非编码蛋白蛋白质区域功能区域功能在高等生物和人的基因组中非编码序列已占到基因组序列的绝大部分,这表明这些非编码序列必定具有重要的生

40、物功能。(三)在基因(三)在基因组水平上研究生物水平上研究生物进化化分子进化是对不同生物的同源分子,即结构和功能相似的蛋白质或编码该蛋白质的基因,进行比较。(四)完整基因(四)完整基因组比比较研究研究在后基因组时代,完整基因组数据越来越多,有了这些资料人们就能对若干重大生物学问题进行分析研究,如:生命的起源?生命是如何进化的? 估计最小独立生活的生物体至少需要多少基因?这些基因是如何使生物体具有生命?等等。 在蛋白质水平研究基因组的基因表达。分析在蛋白质水平研究基因组的基因表达。分析基因组的蛋白质类型、数量、空间结构变异以基因组的蛋白质类型、数量、空间结构变异以及相互作用的机制。及相互作用的机

41、制。蛋白质组学比基因组学更为复杂:蛋白质组学比基因组学更为复杂:DNA线线状结构与二级结构的功能差异不大,但多肽链状结构与二级结构的功能差异不大,但多肽链需折叠成一定的三维空间结构才形成有功能的需折叠成一定的三维空间结构才形成有功能的蛋白质;同一种蛋白质经不同的加工修饰可形蛋白质;同一种蛋白质经不同的加工修饰可形成不同的功能,因此蛋白质的多样性远复杂于成不同的功能,因此蛋白质的多样性远复杂于基因本身。基因本身。第四节第四节 蛋白质组学(蛋白质组学(Proteomics)蛋白质蛋白质2D电泳分析电泳分析A对照;对照;B为人的垂体瘤蛋白质为人的垂体瘤蛋白质2D电泳箭头示有明显差异的电泳箭头示有明显差异的蛋白质。蛋白质。蛋白质组学(蛋白质组学(Proteomics)人角化细胞的人角化细胞的2D电泳电泳蛋白质图谱,经蛋白质图谱,经S35放放射自显影显示,可以射自显影显示,可以分辨出分辨出100种以上的蛋种以上的蛋白质。白质。蛋白质组学蛋白质组学 酵母双杂交系统原理示意图酵母双杂交系统原理示意图如左图所示,将蛋白质X与转录因子结合域构建融合蛋白;Y、Z分别与激活域融合,通过检测报告基因(lac Z)的转录与否确定X蛋白的互作蛋白是Y,而不是Z。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号