北京大学细胞生物学课件

上传人:F****n 文档编号:88193426 上传时间:2019-04-20 格式:PPT 页数:66 大小:7.35MB
返回 下载 相关 举报
北京大学细胞生物学课件_第1页
第1页 / 共66页
北京大学细胞生物学课件_第2页
第2页 / 共66页
北京大学细胞生物学课件_第3页
第3页 / 共66页
北京大学细胞生物学课件_第4页
第4页 / 共66页
北京大学细胞生物学课件_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《北京大学细胞生物学课件》由会员分享,可在线阅读,更多相关《北京大学细胞生物学课件(66页珍藏版)》请在金锄头文库上搜索。

1、第十一章 基因组学与比较基因组学,By Hongwei Guo, Peking University, 2008.12.29,Genomics and Comparative Genomics,基础分子生物学期末安排,考试时间: 2009 年 1 月 12 日 下 午 2:00-4:00 考试地点: 三教/301(60人)、三教/304(38人)、三教/306(37人)、三教/308(37人),基因组计划,基因组(genome)是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和。 基因组学(genomics)是指研究并解析生物体整个基因组的所有遗传信息的学科。 基因组计划(Ge

2、nome Project)是指对人类以及其它生物体全基因组的测序工作(sequencing)。 人类基因组计划(Human Genome Project,HGP): 90年代提出并已基本完成,同40年代原子弹爆炸,60年代人类登月一起被认为是二十世纪科技发展史上的三大创举。,History of the Human Genome Project,1990 Official start of HGP with 3 billion $ and a 15 year horizon. 1999 Sanger Centre publishes chromosome 22 2001 Draft Genom

3、e published: Celera & Public 2003 Completion (almost) of Human Genome,Celera: Craig Venter,Intl. Cons: Francis Collins,Public effort- strategy:,Celera - strategy:,Sequencing Strategies,Celeras view of International Consortium,International Consortiums view of Celera,Unfair competition: IC delivering

4、 the same goods but with state funding.,Unfair competition: Celera delivering the same goods but can use IC data, while IC cannot use Celera data.,Public effort- strategy: 基因组DNA大片段文库的构建,YAC(yeast artificial chromosome,酵母人工染色体):含有三种必需成分:着丝粒、端粒和复制起点。是迄今容量最大的克隆载体,插入片段平均长度为200-1000 Kbp,最大的可以达到2 Mbp。 BA

5、C(Bacterial artificial chromosome),用细菌的F质粒及其调控基因构建了细菌染色体克隆载体,其克隆能力在125150 Kbp左右。以BAC为基础的克隆载体形成嵌合体的频率较低,转化效率高,而且以环状结构存在于细菌体内,易于分辨和分离纯化,已被科学界广泛接受。,BAC的构建 pBAC108L来自细菌的一个小型F质粒,其中oriS和repE控制了质粒的复制起始,parB和parA控制了拷贝数。,遗传图谱(Genetic Map) vs 物理图谱 (Physical Map),遗传图又称为连锁图(Linkage Map),是指基因或DNA标志在染色体上的相对位置(或距离

6、),通常以基因或DNA片段在染色体交换过程中的分离频率(cM)来表示。cM值越大,两者之间遗传距离越远。 物理图谱是指以已知序列的DNA片段(序列标签位点,sequence-tagged site,STS)在染色体上的实际位置,位点之间的距离(图距)以碱基对(bp,kb,Mb)作为测量单位的基因组图。,DNA遗传标记 (DNA marker),第一代DNA遗传标记是RFLP(Restriction Fragment Length Polymorphism)。DNA序列上的微小变化,甚至1个核苷酸的变化,也能引起限制性内切酶切点的丢失或产生,导致酶切片段长度的变化。 第二代DNA遗传标记SSLP

7、(Simple Seqeuce Length Polymorphism)利用了存在于人类基因组中的大量重复序列,包括重复单位长度在15-65个核苷酸左右的小卫星DNA(minisatellite DNA),重复单位长度在2-6个核苷酸之间的微卫星DNA(microsatellite DNA)。 第三代DNA遗传标记SNP ( single nucleotide polymorphism) ,也是最广泛的遗传标记,是分散于基因组中的单个碱基的差异。这种差异包括单个碱基的缺失和插入,但更常见的是单个核苷酸的替换,即单核苷酸的多态性。 到目前为止已经在人类基因组发现了超过1000万个SNP位点,平均

8、每300bp中就有一个SNP!,RFLP marker,SSLP markers,WT,mut,SNP marker,酵母第三号染色体遗传图(右)和物理图(左)的比较,由于实验方法不同,不少markers之间的遗传距离并不等于它们在物理图上的距离。,鸟枪法序列测定技术,全基因组鸟枪法测序(shotgun sequencing)技术:随机挑选带有基因组DNA的质粒进行末端序列测定,然后用计算机程序进行序列拼接 。 鸟枪法测序的主要缺点是,随着所测基因组总量增大,所需测序的片段大量增加;其次,高等真核生物(如人类)基因组中有大量重复序列,导致判断失误,DNA target sample,SHEAR

9、 & SIZE,e.g., 10Kbp 8% std.dev.,End Reads / Mate Pairs,CLONE & END SEQUENCE,590bp,10,000bp,Mate-Pair Shotgun DNA Sequencing,大规模DNA序列拼接,DNA序列拼接问题与组合数学中的最短超串问题相似。最短超串问题即给定一个字符串的集合,找出一最短的字符串称为超串,并将集合中的任何一元素作为其子串。,Popular Assemblers,TIGR Assembler (TIGR) Phrap (Wash U) Celera Assembler (Celera, TIGR) Ar

10、achne (MIT Broad) Phusion (Sanger uses Phrap) Atlas (Baylor HGSC),Assembly of the Individual Sequences,Individual sequencing reads are compared to each other and where they overlap can be assembled to create contigs,Assembly of the Individual Sequences,Keep adding individual sequencing reads to buil

11、d larger and fewer contigs,Assembly of the Individual Sequences,Eventually all sequencing reads merge to a single consensus sequence (a large contig) for each chromosome.,鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列,改进后的鸟枪法(adopted by both IC and Celera),高通量DNA序列分析技术,人类基因组计划的成功很大程度上得益于有效减少DNA测序成本的技术更新。通过改良测序方法,不断提升其自

12、动化程度,DNA测序的成本降低了100倍,从20世纪70-80年代$10/bp降低到本世纪初$0.1/bp! 如果一个熟练的DNA序列分析人员采取早期80年代方法每天测定1000 bp计算,人类基因组(约3109bp)的全序列分析,至少也得需要100名这样的工人花上100年的时间才能完成。而2000年代的高通量测序仪可达到月测序1-6 Mbp!,目前?,$2/1 Mbp 3 Gbp/machine/day,DNA sequencing technologies “Classical” Sanger dideoxy sequencing “Next Generation”, commercial

13、ized Roche 454 Pyrosequencing Solexa/Illumina cyclical base addition ABI SOLiD sequencing by ligation Single molecule (tethered DNA polymerase) Heliscope (cyclical base addition) VisiGen (real time, FRET-based),Illumina / Solexa Genetic Analyzer 2000 Mb / run,Applied Biosystems ABI 3730XL 1 Mb / day

14、,Roche / 454 Genome Sequencer FLX 100 Mb / run,Applied Biosystems SOLiD 3000 Mb / run,Sanger sequencing,1,3,2,Roche / 454 : Genome Sequencer FLX,Real Time Sequencing by Synthesis Chemiluminescence detection in pico titer plates Amplification: emulsion PCR Pyrosequencing up to 400,000 reads / run on

15、average 250 bases / read up to 100 Mb / run,Roche / 454 Genome Sequencer FLX 100 Mb / run,Pyrosequencing-454 Sequencing,Genome sequencing in microfabricated high-density picolitre reactors Margulies, M. Eghold, M. et al. Nature. 2005 Sep 15; 437(7057):326-7,A section of Pyrosequencing reads,Illumina

16、 / Solexa: Genetic Analyzer,Real Time Sequencing by Synthesis Clonal Single Molecule Array Amplification: bridging PCR 60 million reads / run up to 50 bases / read 2 Gb / run 8 channels, app. 5 mio reads / channel Fluorescent labels Reversible 3OH blocking,Illumina / Solexa Genetic Analyzer 2000 Mb / run,Reversible terminator-based sequencing (Solexa),Fragment DNA and ligate adaptors,Comparison,Real Time Sequencing by L

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号