基因测序原理概要

上传人:今*** 文档编号:107040739 上传时间:2019-10-17 格式:PPT 页数:81 大小:2.98MB
返回 下载 相关 举报
基因测序原理概要_第1页
第1页 / 共81页
基因测序原理概要_第2页
第2页 / 共81页
基因测序原理概要_第3页
第3页 / 共81页
基因测序原理概要_第4页
第4页 / 共81页
基因测序原理概要_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《基因测序原理概要》由会员分享,可在线阅读,更多相关《基因测序原理概要(81页珍藏版)》请在金锄头文库上搜索。

1、第一讲 基因组测序与序列组装,任科教师: 余爱丽 生命科学院 分子生物学与生物信息学系,主要内容: 什么是基因组 什么是基因 DNA测序的方法 DNA序列的组装 人类基因组计划 水稻基因组计划 后基因组学,1. 什么是基因组,基因组就是一个物种中所有基因的整体组成。 基因组有两层意义:遗传物质和遗传信息。 要揭开生命的奥秘,就需要从整体水平研究基因的存在、基因的结构与功能、基因之间的相互关系。,Zea mays 8,000 Homo sapiens 3,000 Oryza sativa 400 Drosophila melanogaster 165 Arabidopsis thaliana 1

2、00 Saccharomyces cerevisiae 12 E.coli 4.6,Genome Size (Mb),什么是C 值? 通常是指一种生物单倍体基因组DNA的总量.,在真核生物中,C值一般随着生物的进化而增加,高等生物C值一般大于低等生物。 C值悖理: 生物的复杂性与基因组的大小并不完全成比例增加,阴影部分为一个门内C-值的范围,重复顺序,高度重复顺序: 长度:几个几千个bp 拷贝数:几百个上百万个 首尾相连,串联排列 集中分布于染色体的特定区段(如端粒,着丝粒等) 也称卫星DNA 中度重复顺序: 一般分散于整个基因组中; 长度和拷贝数差别很大 单一顺序: 基因主要位于单一顺序 动

3、物中单一顺序约占50 植物中单一顺序约占20, DNA 的复性 遵循二级反应动力学,可表述为:,dCt / dt = -KC02,反应达 t 时,单链DNA浓度 = Ct,C0 = 单链 DNA起始浓度 K 复性速度常数,顺序复杂性,Cot(1/2) = 1/K (mol. Sec / L) 常数,Ct/C0,0,1,0,1,C0t(1/2) C0t(1/2),C0t(1/2)值与基因组复杂性成正比。,是遗传信息的物理和功能单位,包含产生一条多肽链或功能RNA所必需的全部核苷酸序列。 基因分类: 编码RNA的基因,如rRNA基因,snRNA基因等; 编码蛋白质的基因,2. 什么是基因?,基因的

4、不连续性,Intron 和Exon: 大多数真核生物蛋白质基因的编码顺序(Exon)都被或长或短的非编码顺序(Intron)隔开,基因家族,一群具有一致的或相似顺序的基因,有的还担负类似的生物学功能, 可以相互补偿, 比如:E2f transcription factor,假基因(Pseudogene),来源于功能基因 但已失去活性 的DNA序列 产生假基因的原因有: 由重复产生的假基因; 加工的假基因, 由RNA反转录为cDNA 后再整合到基因组中; 残缺的基因(Truncated gene),重叠基因: 同一段DNA 能携带两种不同蛋白的信息.,重迭基因有以下几种情况: *一个基因完全在另

5、一个基因内部 *部分重叠 * 两个基因共用少数碱基对,*一个基因完全在另一个基因内部 如:B和A, E和D 其读码结构互不相同,*部分重叠 如: K和C *两个基因共用少数 碱基对 如: D和J,-TAATG-,D 终止密码子,J 起始密码子,3. DNA测序的方法 链终止法测序 化学降解法测序 自动化测序 非常规DNA测序,3.1 链终止法测序(the chain termination method) 基本原理: 通过合成与单链DNA互补的多核苷酸链,由于合成的互补链可在不同位置随机终止反应,产生只差一个核苷酸的DNA分子,从而来读取待测DNA分子的顺序。,技术路线与要求,制备单链模板 将

6、单链模板与一小段引物退火 加入DNA多聚酶 4种脱氧核苷酸 分别加入少量4种双脱氧核苷酸 将4种反应产物分别在4条泳道电泳 根据4个碱基在4条泳道的终止位置读出基因序列,A 克隆于质粒中DNA用碱或热变性 B M13克隆单链DNA C 噬粒克隆DNA D PCR产生单链DNA,A 高酶活性 B 无53外切酶活性 C 无35外切酶活性,ddATP/ddCTP/ddGTP/ddTTP 的3碳原子连接的是氢原子,不是羟基,3.2 化学降解法测序 基本原理: 在选定的核苷酸碱基中引入化学集团,再用化合物处理,使DNA分子在被修饰的位置降解.,技术路线,将双链DNA样品变为单链 每个单链的同一方向末端都

7、用放射性同位素标记,以便显示DNA条带 分别用不同方法处理,获得只差一个核苷酸的降解DNA群体 电泳,读取DNA的核苷酸顺序,Maxam-Gilbert 法所用的化学技术,化学法测序实例,哌啶,3.3 自动化测序,基本原理 与链终止法测序原理相同,只是用不同的荧光色彩标记ddNTP,如ddATP标记红色荧光,ddCTP标记蓝色荧光, ddGTP标记黄色荧光, ddTTP标记绿色荧光.由于每种ddNTP带有各自特定的荧光颜色,而简化为由1个泳道同时判读4种碱基.,3.4 非常规测序 毛细管电泳 用毛细管电泳取代聚丙烯凝胶平板电泳,节省时间,加快测序进程,其他程序同链终止法或化学测序法. 光点测序

8、 脱氧三磷酸核苷酸连接到DNA 3-末端时会释放1个焦磷酸(PPi) ,焦磷酸在磷酸化酶的作用下转化为化学能,并发出光亮.由此,往反应液中每次只加入1种核苷酸,当加入的核苷酸结合时,反应液发出亮点,并记录核苷酸种类;当核苷酸未结合时,反应液中的核苷酸酶迅速分解此核苷酸,由此来测定DNA序列.,DNA芯片测序 基本原理 将各种排列顺序的寡核苷酸点播在芯片上, 每个点播的寡核苷酸在排列的方阵中都有指定的位置.待检测的DNA分子与芯片温浴,凡是能杂交的寡核苷酸都会在确定位置发出信号,然后根据获取的信息将寡核苷酸的顺序进行对比组装,拼接成完全的DNA顺序.,利用基因芯片进行杂交测序的原理,4 序列的组

9、装,4.1 随机测序与序列组装 随机测序也称”鸟枪法”. 序列组装原理:直接从已测序的小片段中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸. 优点:不需预先了解任何基因组的情况.,A,B,C,A,B,C,A,B,C,A,B,C,小片段测序,计算机拼装,A,B,C,小片段测序,计算机拼装,鸟枪法(Shotgun)测序的问题,CAATGCATTA GCAGCCAATGC,GAP,错装,实例:流感嗜血杆菌基因组的测序及顺序组装,超声波打断纯化的基因组DNA 琼脂糖电泳收集1.62.0Kb的区段、纯化 构建到质粒载体中 随机挑选19687个克隆,进行28643次测序,得到可读顺序为11 631

10、 485 bp 组装成140个覆盖全基因组范围的独立的顺序重叠群, ,各重叠群间仍有间隙 顺序间隙 物理间隙 ,载体或宿主菌 选用不当而被丢失的顺序,测序时遗漏的测序,解决办法:通过相邻已知顺序作为探针筛选已有的基因组文库,解决办法:利用其它宿主菌与载体重新构建文库,4.2 限制测序,限制测序:是指将一段染色体区段的DNA 顺序进行组装. 一些已绘制了遗传图与物理图的微生物基因组测序中也采用这一方法. 如高等植物拟南芥基因组的测序完全依据克隆重叠群,先进行各个BAC克隆的随机测序,再进行序列组装; 水稻基因组测序计划采取得策略与此相同.,4.3 指导测序与序列组装,建立在基因组图谱基础上的”鸟

11、枪法”,即所谓”指导鸟枪法”或”指导测序”。 在人类基因组进入测序组装阶段就采用此方法,其基本步骤如下: A 构建平均为2Kb的人类基因组质粒文库,进行双向测序; B 构建平均10Kb的人类基因组质粒文库,进行双向测序,读取2个端部顺序; C 参考人类基因组图,特别是大量的STS位标作为基点,进行序列组装,排成重叠克隆群.,先将染色体打成比较大的片段(几十-几百Kb), 利用分子标记将这些大片段排成重叠的克隆群(Contig), 分别测序后拼装. 这种策略叫基于克隆群(contig-based)的策略.,A,B,C,A,B,C,大片段contig,小片段测序拼装,两种策略的比较,鸟枪法策略 指

12、导测序策略 不需背景信息 构建克隆群 (遗传、物理图谱) 时间短 需要几年的时间 需要大型计算机 得到的是草图(Draft) 得到精细图谱,4.5 其他测序路线,重要区域优先测序 人们对感兴趣的基因或与疾病相关的基因优先测序. 如:人类主要组织相容性复合区位于第6号染色体,与人类免疫系统有关,因而优先测序.,EST (Expressed sequence tag) 测序 EST是一种重要的基因组图分子标记,以EST为探针很容易从 cDNA文库中筛选全基因,又可从BAC克隆中找到其基因组的基因序列. 优点: A mRNA 可直接反转录成cDNA,而且cDNA文库也比较容易构建; B 对cDNA文

13、库大量测序,即可获得大量EST的序列; C EST为基因的编码区,不包括内含子和基因间区域,一次测序的结果足以鉴定所代表的基因;,5.人类基因组计划,人类基因组计划(Human genome project)于1990年启动,我国于1999年加入该计划,承担其中1%的任务,即人类3号染色体短臂上约30Mb的测序任务。,5.1 人类基因组计划的目的,阐明人类基因组30亿个碱基对的序列,发现所有人类基因,并搞清其在染色体上的位置; 破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我; 解码生命、了解生命的起源、了解生命体生长发育的规律; 认识种属之间和个体之间存在差异的起因、认识疾病产生

14、的机制以及长寿与衰老等生命现象、为疾病的诊治提供科学依据。,5.2 人类基因组草图的完成,2000年6月26日是人类历史上值得纪念的一天。人类基因组的工作草图已经绘制完毕并于这天向全世界公布。最终完成图要求测序所用的克隆能忠实地代表常染色体的基因组结构,序列错误率低于万分之一。,A. Celera Genomics 人类基因组的测序策略,5.3 人类基因组测序策略,采集5个自愿者的DNA样品,构建3种不同插入子大小的基因组文库2Kb, 10Kb和50Kb,完成约2700万次插入子末端测序,总长14800Mb,GeneBank下载104018个BAC末端顺序,PFP发表的公开数据主要为BAC克隆的顺序,共4443.3Mb,随机测序与序列组装方法和 指导测序与序列组装方法 相结合进行序列组装,B 国际人类基因组测序策略 构建BAC克隆 限制性酶处理获得指纹 根据指纹重叠方法组建BAC克隆重叠群 根据STS标记,将BAC克隆重叠群标定在物理图上 每个BAC克隆内部采用鸟枪法测序,组装 将BAC插入顺序与B

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号