华大基因讲座.ppt

上传人:F****n 文档编号:109888467 上传时间:2019-10-28 格式:PPT 页数:67 大小:16.68MB
返回 下载 相关 举报
华大基因讲座.ppt_第1页
第1页 / 共67页
华大基因讲座.ppt_第2页
第2页 / 共67页
华大基因讲座.ppt_第3页
第3页 / 共67页
华大基因讲座.ppt_第4页
第4页 / 共67页
华大基因讲座.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《华大基因讲座.ppt》由会员分享,可在线阅读,更多相关《华大基因讲座.ppt(67页珍藏版)》请在金锄头文库上搜索。

1、基于新一代测序技术的 基因组学研究和系统育种策略,许姣卉 博士 华大基因研究院 科研合作总监 xujh,技术是科学发现与产业发展的源动力,1950,1960,1970,1980,1990,2000,2010,测序技术的跨跃式发展进程,Illumina Solexa Flowcell,Flowcell,A flowcell contains eight lanes,Lane 1,Lane 8,Each lane contains multiple tiles total 100 Each tile is imaged four times per cycle one image per base

2、,Image from 1 tile,焦磷酸测序,边合成边测序,边连接边测序,1P,百万 亿次,日新月异的生物信息技术,碱基产量和测序成本反向曲线,测序时间、费用的变化,NCBI数据的变化,新一代测序技术正在形成新的产业革命,传统分子育种的两条思路,新的系统育种策略,Traditional finding method,The method on re-sequencing,部分案例,15,中国农业科学院蔬菜花卉研究所 Institute of Vegetables and Flowers Chinese Academy of Agricultural Sciences,Work Plan,1

3、 全基因组从头测序的应用,How? BAC to BAC WGS 组装质量? 测序序列长度 构建片段长度 测序深度 三个阶段 基因组调查 (repeats, GC%, gene distributions) 框架图 (contig 5kb, scaffold 20Kb, single base error rate 20Kb, scaffold 300Kb,single base error rate 0.001%),Why Genome? 一个物种基因组序列图的完成,就意味着这一物种科研和产业革命性的新开端。 向仲怀院士,Data analysis Tools,Genome assembly

4、: RePS SOAP,Genome Annotation: BGF ReAS,Comparative Genomics: FGF KaKS_Calculator CAT,基因组生物信息分析: 1、全基因组基因详细注释: 基因组组分分析; 编码基因预测; 重复序列注释; Non-coding RNA基因注释; microRNA基因注释; tRNA基因注释; 假基因(Pseudogene)注释 2、基因功能注释: GO注释(Gene Ontology) InterproScan注释; 调控Motif预测; Pathway 注释; 3、比较基因组及分子进化分析: 物种特有基因组区段检测; 物种特有

5、基因检测; 快速进化基因检测; 共线性分析(Synteny Block) 基因家族分析。,2 基因组重测序的应用,Why Germplasm genomics?,对有参考基因组的群体/个体基因组测序可以检测到各种序列水平的变异,例如SNPs/Indels, Structure variations, Copy number variations等。 通过对核心种质进行重测序以及与表型的关联性分析,揭示作物品种的多数等位基因变异。,SNP的检测,Deletion的检测,测10X深度, 覆盖95%的基因组 9311品系 SNP的最低频率为1.5-2/kb,共获得80万SNP. 日本晴(粳稻)品系

6、SNP的最低频率为3/kb,获得100万SNP.,两个水稻品系的SNP 检测,个体水平研究, 水稻等栽培植物的起源模式和驯化的群体遗传学基础 利用多位点核基因序列,结合叶绿体DNA等标记,研究水稻和重要栽 培植物(茄子、茭白和香蕉)的起源地和起源时间; 探讨其野生近缘类群中的遗传变异和群体遗传结构; 探讨栽培植物驯化过程中的群体遗传动态和人工选择的后果 重要家养动物的起源和驯化 利用线粒体全基因组、Y(Z)染色体以及核基因,阐明家鸡、猪、马、牦牛、黄牛、水牛、绵羊和山羊等家养动物的遗传多样性及群体分化,揭示其起源地、驯化时间及迁移分化模式; 探讨驯化过程中的创群者数量及其地理分布; 发展新的性

7、染色体和常染色体遗传标记系统,建立家养动物群体基因组学研究方法和技术体系和大数据集的数据分析方法。,49个水稻品系的SNP检测,群体水平研究,25 representative cultivated rice lines,人工选择信号的鉴定,1. test,2. Tajimas D,Whole genome SNPs,SNPs surround sh4,SNPs surround prog1,脱粒基因,形态相关基因,3. Tree-based selection tests,共鉴定出517个可能受人工选择的基因!,E.g. 家蚕重测序,40 silkworm varieties (29 dom

8、esticated and 11 wild) 3-fold coverage for each,群体水平研究,Phylogenetic relationship,Wild species,domesticated species,受选择信号的鉴定,华北类型,欧洲温室,日本少刺,美国加工,华南类型,美国鲜食,印度野生,西双版纳,100份核心种质资源重测序,葫芦科比较基因组,30,2,3,5,4,6,7,1,8,9,10,Case study-Cloning of the M gene,26,682,基因组测序,45,遗传作图,8,3,1,关联分析,比较基因组学,数字表达谱,0.2cM,50个品种

9、,甜瓜的信息,10个组织,基因,32,M,甘氨酸 非极性 弱亲水,半胱氨酸 极性 疏水,MM,mm,m,Important trait genes in cucumber,3 转 录 组 分 析 (RNA-Seq),Total RNA,Rich mRNA (polyA RNA),Fragmentation (200700 bp),Oligo(dT) primed cDNA synthesis,Solexa adaptor,Single-end & paired-end Solexa Sequencing,Random hexamer primed cDNA synthesis,RNA frag

10、ment (200700 bp),Random hexamer primed cDNA synthesis,Schedule of Experiment,De Novo,In reference,In one cases,Three fish lines Genome Size 1.5 Gb Initial project, we can use 1Gb per fish line Gene number reach to 30005000 (length 1 Kb),De Novo,RNA-seq 快速获得参考基因库,Example II,Insect Genome Size 16G or

11、6G without Reference Sequence Data: 10G raw data Assembly Results: More than 15,000 Scaffolds (L1k) ( more than 15,000 genes identified),De Novo,更多深层次的应用领域,转录本结构研究 UTR鉴定;Intron边界鉴定;可变剪接研究;Start codon鉴定;RNA编辑研究;基因融合的发现等; 非编码区域研究 基因转录水平研究 基因表达差异;进化分析等 全新转录区域研究,In reference,Example I,Rice Transcriptome

12、 Genome Size 400 Mb with Reference Data:10Gb/sample(two samples) Result: For 27,655 high covered genes, 8923 genes re-defined , include 11,208 new exons, 9,784 introns and 3,186 exon skipping events.,A schematic representation of cancer-specific alternative gene splicing.,PLoS ONE. 2009; 4(3): e4732

13、.,应用举例,Transcriptome size estimation on rice,4 数字表达谱(DGE),用测序取代芯片的技术革命,基因表达研究进入数字时代,mRNA,产生标签,测序,表达量检测,比对,DGE的基本原理,通量高 1次实验即可得到足够数据,Total Tag Number,% of genes identified,2M,4M,6M,8M,0,100,60,40,80,0,20,基本特点,数字信号,4,2,8,Tags,表达量,可重复性高,基本特点,测量准确度高,Solexa analysis,Real time qPCR analysis,独特优势,检测低丰度基因,t

14、 Hoen, P.A.C. et al. Nucl. Acids Res. 2008.36:e141,低丰度基因具有重要生物学功能,独特优势,检测新转录本,Chromosome 9,独特优势,检测反义链转录本,独特优势,数字表达谱与芯片的比较,分析内容,表达模式聚类分析,相互作用网络分析,Pathway分析,GO功能分析,应用DGE发表的部分文章,The digital generation. Nature, 2009, March, Vol 458: 239-240. Morrissy AS, et al. Next-generation tag sequencing for cancer

15、gene expression profiling. Genome Res. 2009 July, Vol.19, No. 8. Hegeds Z, et al. Deep sequencing of the zebrafish transcriptome response to mycobacterium infection. Mol Immunol, 2009 September, Vol.46, No. 15: 2918-30. Peter A. C. t Hoen et al. Deep sequencing-based expression analysis shows major

16、advances in robustness, resolution and inter-lab portability over five microarray platforms. Nucleic Acids Research, 2008, October, Vol. 36, No. 21.,我们已完成的DGE项目,5 小RNA测序分析,三种主要的小分子RNA,Small RNA: a hotpot,Publication: ( 1991 May 1st, 2008) siRNA : 15,842 miRNA: 2,641,技术路线,De Novo In reference,分析内容,sRNA 与参考序列比对 sRNA 与rRNAetc 的比对 包括rRNA

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 小学教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号