高通量测序的应用与进展

上传人:博****1 文档编号:567689771 上传时间:2024-07-22 格式:PPT 页数:98 大小:10.51MB
返回 下载 相关 举报
高通量测序的应用与进展_第1页
第1页 / 共98页
高通量测序的应用与进展_第2页
第2页 / 共98页
高通量测序的应用与进展_第3页
第3页 / 共98页
高通量测序的应用与进展_第4页
第4页 / 共98页
高通量测序的应用与进展_第5页
第5页 / 共98页
点击查看更多>>
资源描述

《高通量测序的应用与进展》由会员分享,可在线阅读,更多相关《高通量测序的应用与进展(98页珍藏版)》请在金锄头文库上搜索。

1、高通量测序应用与进展高通量测序应用与进展报告纲要报告纲要高通量测序简介高通量测序简介高通量测序平台的介绍高通量测序平台的介绍高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析相关生物信息学分析软件介绍相关生物信息学分析软件介绍高通量测序简介高通量测序简介高通量高通量测序测序:一次性对一次性对几百万到十亿条几百万到十亿条DNA分子进行分子进行并行测序并行测序,又称为,又称为下一代测序技术下一代测序技术,其使得可对一个物种的转录组和基因组进行其使得可对一个物种的转录组和基因组进行深入、细致、全貌的分析,所以又被称为深入、细致、全貌的分析,所以又被称为深深度测序度测序。High-throu

2、ghputSequencingNextGenerationSequencingDeepSequencing3高通量测序流程高通量测序流程文库扩增低通量ASanger测序B高通量测序并行测序高通量无需建立文库,两端加测序接头PCR扩增报告纲要报告纲要高通量测序简介高通量测序简介高通量测序平台的介绍高通量测序平台的介绍高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析相关生物信息学分析软件介绍相关生物信息学分析软件介绍高通量测序技术的起源与发展高通量测序技术的起源与发展1992年LynxTherapeuticsMPSS2003年PolonySequencing(哈佛)2005年454Py

3、rosequencing2006年SolexaSequencing-by-Synthesis2007年ABISOLiD2008年HelicostSMSSequencing2010年IontorrentSemiconductorSequensing2011年PacificBiosciencesSMRTSequensing6高通量测序技术的传承关系图高通量测序技术的传承关系图LynxMPSSSolexaABI SOLiD454IonTorrentHelicosSMRTIllumina SolexaRoche 454PolonySeqABI Ion Torrent现有主要高通量测序仪开发商现有主要高

4、通量测序仪开发商测序仪品牌技术原理开发商Roche 454焦磷酸测序RocheIllumina Solexa边合成边测序IlluminaABI SOLiD基于磁珠的大规模并行连接测序ABIHelicos单分子荧光测序 HelicosIon Torrent半导体测序ABISMRT单分子实时测序 Pacific Bio454 Pyrosequencing基于磁珠的焦磷酸测序:A磁珠制备设备B454测序仪C454测序原理454 测序流程测序流程454 测序流程与测序流程与Base Calling454 的特点与主要应用的特点与主要应用读长较长,400600bp通量较低,1Run1M序列,400600

5、Mb相对成本较高主要应用:denovo测序Illumina Solexa简介简介桥式PCR边合成边测序可逆终止物HiSeq2000Illumina Solexa 测序流程测序流程Illumina Solexa 桥式桥式PCRdioldiol1st cycle denaturation1st cycle annealingdioldioln=35total1st cycle extensiondioldioldioldiol2nd cycle denaturation2nd cycle annealingdioldioldioldioldioldiol2nd cycle extensionIll

6、umina Solexa Base Calling123789456TTTTTTTGTTGCTACGATSolexa 的特点与主要应用的特点与主要应用读长较短,100150bp通量高,25G每天,120-150G每Run主要应用:RNA测序、表观遗传学研究ABI SOLiD 简介简介SOLiDSequencingbyOligoLigation/DetectionOligo连接测序:通过连接酶连接,再对oligo上荧光基团进行检测SOLiD5500xlABI SOLiD测序前期制备测序前期制备A样品片段化磁珠连接B乳化PCR3末端修饰C磁珠富集转到测序玻片ABI SOLiD测序原理测序原理ABI

7、 SOLiD荧光结合和结果示例荧光结合和结果示例SRR029969.1 VAB_5551_12_381_F3 length=35T11.0203.3.1113211010332111302330201+SRR029969.1 VAB_5551_12_381_F3 length=35!36!8/8:!:!4626=(8.)43),(95,A.SOLiDOligo荧光基团模式图B.SOLiD测序结果示例(ColorSpace)SOLiD 的特点与主要应用的特点与主要应用读长较短,50-75bp精度高,可达Q40通量高,20-30G每天,1Run可达120G主要应用:基因组重测序、SNP检测等三种平

8、台的技术差异三种平台的技术差异平台平台454454SolexaSolexaSOLiDSOLiDPCR磁珠乳化PCR桥式PCR磁珠乳化PCR测序载体磁珠玻片玻片测序方式焦磷酸、荧光可逆终止物、荧光连接酶、荧光结果序列FastQFastQCSFastQ三种平台的效能参数差异三种平台的效能参数差异平平 台台读长读长通量通量周期周期精度精度SolexaHiSeq2000Single-end:1x35bpPaired-end:2x50bpPaired-end:2x100bp25Gb/d1.5d4d8d50bp85%以上以上Q30100bp80%以上以上Q30SOLiD5500xlSingle-end:7

9、5bpPaired-end:75x35bpMate-pair:60x60bp2030Gb/d1d/1lane7d/12lane7d/12laneQ40454GSFLX400-600bp400600Mb/Run10hQ20报告纲要报告纲要高通量测序简介高通量测序简介高通量测序平台的介绍高通量测序平台的介绍高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析相关生物信息学分析软件介绍相关生物信息学分析软件介绍高通量测序应用范围高通量测序应用范围DNADNA测序测序全基因组全基因组denovo测序测序基因组重测序基因组重测序宏基因组测序宏基因组测序人类外显子组捕获测序人类外显子组捕获测序RN

10、ARNA测序测序转录组测序转录组测序小小RNA测序测序电子表达谱测序电子表达谱测序表观基因组研究表观基因组研究ChIP-SeqDNA甲基化测序甲基化测序基因组测序基因组测序基因组测序是对物种的基因组测序是对物种的基因组基因组DNADNA打断后进行高通打断后进行高通量测序,根据是否有已知基因组数据主要分为量测序,根据是否有已知基因组数据主要分为denovo全基因组测序和全基因组测序和基因组重测序基因组重测序。Denovo基因组测序是对基因组测序是对未知基因组序列未知基因组序列的物种的物种进行基因组从头测序,利用生物信息学分析手段进行基因组从头测序,利用生物信息学分析手段对序列进行拼接、组装,从而

11、获得该物种的基因对序列进行拼接、组装,从而获得该物种的基因组图谱。组图谱。全基因组重测序是对全基因组重测序是对已知基因组序列已知基因组序列的物种进行的物种进行不同个体的基因组测序,并在此基础上对个体或不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。群体进行差异性分析。 基因组测序策略基因组测序策略Paired-EndMate-End基因组测序流程两种测序策略Paired-end 原理原理29100bps100bps3000bpsPaired-end 基因组重排分析基因组重排分析 Paired-end和测序深度对测序效果的影响和测序深度对测序效果的影响 JunWang,etal.N

12、ature456,60-65(6November2008)基因组测序的生物信息学分析基因组测序的生物信息学分析数据产出处理数据产出处理:图像识别与:图像识别与BaseCalling去除接去除接头序列、检测与去除污染序列等;头序列、检测与去除污染序列等;基因组组装基因组组装:原始数据统计、测序深度分析、组:原始数据统计、测序深度分析、组装结果统计等;装结果统计等;基因组注释基因组注释:CodingGene注释、注释、RNA分类注释、分类注释、重复序列注释等;重复序列注释等;基因功能注释基因功能注释:GO功能分类、功能分类、Interpro功能分类功能分类等;等;比较基因组及分子进化分析比较基因组

13、及分子进化分析:SNP/InDel/CNV检检测等。测等。References1、ErinD.Pleasance,PhilipJ.Stephens,SarahOMeara,etal.Asmall-celllungcancergenomewithcomplexsignaturesoftobaccoexposure.Nature,2010,463:184-190.2、MichaelJamesClark,NilsHomer,BrainD.OConnor,etal.U87MGDecoded:TheGenomicSequenceofaCytogeneticallyAberrantHumanCancerC

14、ellLine.PloSGenetics,2010,6(1):e1000832.3、WeiChen,ReinhardUllmann,ClaudiaLangnick,etal.Breakpointanalysisofbalancedchromosomerearrangementsbynext-generationpaired-endsequencing.EuropeanJournalofHumanGenetics,2010,18:539-543.4、VanTassellCP,SmithTP,MatukumalliLK,TaylorJF,SchnabelRd,etal.Whole-genomese

15、quencingandvariantdiscoveryinC.elegans.NatMethods,2008,5(2):183-188.5、JunWang,WeiWang,RuiqiangLi,etal.ThediploidgenomesequenceofanAsianindividual.Nature456,60-65(6November2008)6、HuangSW,LiRQ,WangJ,etal.TheGenomeoftheCucumber(CucumissativusLinnaeus).NatureGenetics2009;doi:10.1038/ng.4757、DavidHernand

16、ez,etal.Denovobacterialgenomesequencing:Millionsofveryshortreadsassembledonadesktopcomputer.GenomeRes.2008.18:802-80933基因组重测序案例分析基因组重测序案例分析ErinD.Pleasance,etal.Thecompendiumofsomaticmutationsinasmall-celllungcancergenome.Nature,2010,463:184-190.此研究用高通量测序对一个此研究用高通量测序对一个小细胞肺癌小细胞肺癌细胞细胞系系NCIH209基因组进行重测序

17、,以探讨基因组进行重测序,以探讨吸烟引发该细胞系基因组中特定碱基及其周吸烟引发该细胞系基因组中特定碱基及其周围序列的突变及细胞损伤修复原理。围序列的突变及细胞损伤修复原理。 肺癌基因组变异情况统计图肺癌基因组变异情况统计图基因组重排和基因组重排和CNV分析分析从头基因组测序案例从头基因组测序案例DavidHernandez,etal.Denovobacterialgenomesequencing:Millionsofveryshortreadsassembledonadesktopcomputer.GenomeRes.2008.18:802-809此研究对此研究对Staphylococcus

18、aureusstrainMW2和和Helicobacter acinonychisstrainSheeba两种细菌基因组进行从头测序,两种细菌基因组进行从头测序,并比较了几种拼接方法的效果。并比较了几种拼接方法的效果。多种拼接软件拼接结果比较多种拼接软件拼接结果比较多种拼接软件拼接结果比较多种拼接软件拼接结果比较五种拼接方法的拼接结果比对五种拼接方法的拼接结果比对宏基因组测序宏基因组测序宏基因组测序是对某一特定环境,如肠道、土壤、海水等中的所有微生物进行基因组测序。通过此方法可对该环境中的微生物种类和优势物种进行检测,揭示微生物群落多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间

19、的关系。自然环境中很多微生物无法分离培养,而此方法无需对微生物进行分离培养。宏基因组测序方法现在有全基因组的宏基因组测序和16S/18SrRNA宏基因组测序。全基因组的宏基因组测序全基因组的宏基因组测序通过高通量测序技术,对环境样品的总DNA直接进行全基因组的宏基因组测序,能够实现微生物群落的物种分类研究、群落结构、系统进化、功能注释以及物种间的代谢网络研究,挖掘具有应用价值的基因资源,开发新的微生物活性物质。与传统的Sanger法相比,速度快,性价比高,周期短,单个样品的测序量可以接近饱和。宏基因组测序信息分析主要内容宏基因组测序信息分析主要内容拼接组装物种分类组成分析基因预测和功能注释生成

20、Profilingtable主成分分析(PCA)筛选与样品分组显著相关的因子多样品间比较分析16S/18S rRNA宏基因组测序宏基因组测序16S/18SrRNA是微生物群落分析和细菌进化研究以及分类研究最常用的靶分子,采用新一代测序技术,对16S/18SrDNA的可变区进行测序分析,不需进行克隆筛选,能全面的反映微生物群体的物种组成,真实的物种分布及丰度信息。16S/18S rRNA测序信息分析内容测序信息分析内容物种分类、物种丰度分析OTU(OperationalTaxonomicUnits)分析多样性分析系统进化分析多样品间的比较分析ReferenceslMeyer,F;Paarmann

21、D,DSouzaM,OlsonR,GlassEM,KubalM,(2008).ThemetagenomicsRASTserver-apublicresourcefortheautomaticphylogeneticandfunctionalanalysisofmetagenomes.BMC Bioinformatics9:0.doi:10.1186/1471-2105-9-386.lGeorgeIetal.(2010).ApplicationofMetagenomicstoBioremediation.Metagenomics: Theory, Methods and Applications

22、.CaisterAcademicPress.lWongD(2010).ApplicationsofMetagenomicsforIndustrialBioproducts.Metagenomics: Theory, Methods and Applications.CaisterAcademicPress.lNelsonKEandWhiteBA(2010).MetagenomicsandItsApplicationstotheStudyoftheHumanMicrobiome.Metagenomics: Theory, Methods and Applications.CaisterAcade

23、micPress.lCharlesT(2010).ThePotentialforInvestigationofPlant-microbeInteractionsUsingMetagenomicsMethods.Metagenomics: Theory, Methods and Applications.CaisterAcademicPress.lAllen,EE;Banfield,JF(2005).Communitygenomicsinmicrobialecologyandevolution.Nature Reviews Microbiology3(6):489498.lZheng,Hao;W

24、u,Hongwei(2010).ShortprokaryoticDNAfragmentbinningusingahierarchicalclassifierbasedonlineardiscriminantanalysisandprincipalcomponentanalysis.J Bioinform Comput Biol.8(6):9951011.人类外显子组捕获测序人类外显子组捕获测序外显子组是指全部外显子组是指全部外显子区域外显子区域的集合,该区的集合,该区域包含合成蛋白质所需要的重要信息,涵盖域包含合成蛋白质所需要的重要信息,涵盖了与个体表型相关的了与个体表型相关的大部分功能性变异

25、大部分功能性变异。与全基因组重测序相比,外显子组测序与全基因组重测序相比,外显子组测序只需针对外显子区域的只需针对外显子区域的DNA,覆盖度覆盖度更深、更深、数据数据准确性准确性更高,更加简便、更高,更加简便、经济经济、高效。、高效。46人类外显子组捕获测序原理人类外显子组捕获测序原理人类外显子组捕获测序分析流程人类外显子组捕获测序分析流程检测序列变异分析示例检测序列变异分析示例检测到检测到SNP数统计数统计序列序列InDel检测检测References1、WeiX,WaliaV,etal.ExomesequencingidentifiesGRIN2Aasfrequentlymutatedin

26、melanoma.NatGenet.2011Apr15.Epubaheadofprint2、JanelO.Johnson,J.RaphaelGibbs,etal.ExomeSequencinginBrown-Vialetto-VanLaereSyndrome.AmJHumGenet.2010October8;87(4):567569.3、TeerJK,MullikinJC.Exomesequencing:thesweetspotbeforewholegenomes.HumMolGenet.2010Oct15;19(R2):R145-51.Epub2010Aug12.4、LeyTJ,Mardis

27、ER,DingL,etal.DNAsequencingofacytogeneticallynormalacutemyeloidleukaemiagenome.Nature2008;456(7218):66-725、GnirkeA,MelnikovA,MaguireJ,etal.Solutionhybridselectionwithultra-longoligonucleotidesformassivelyparalleltargetedsequencing.NatBiotechnology2009;27(2):182-9.6、MurimChoia,UteI.Scholla,WeizhenJia

28、,etal.(2010)GeneticdiagnosisbywholeexomecaptureandmassivelyparallelDNAsequencing.PNAS.106:19096-19101.7、SarahBNg,KatiJBuckingham,CholiLee,etal.(2010)Exomesequencingidentifiesthecauseofamendeliandisorder.Nature Genetics42,30-35.50人类外显子组捕获测序案例人类外显子组捕获测序案例WeiX,WaliaV,etal.ExomesequencingidentifiesGRIN2

29、Aasfrequentlymutatedinmelanoma.NatGenet.2011Apr15.Epubaheadofprint黑色素瘤黑色素瘤发生率一直在上升,此研究对黑色发生率一直在上升,此研究对黑色素瘤细胞进行外显子组捕获测序,发现了和素瘤细胞进行外显子组捕获测序,发现了和其相关的其相关的高频突变基因高频突变基因。七个新发现的非同义高频突变位点七个新发现的非同义高频突变位点单个基因中突变位点分析单个基因中突变位点分析基因基因GRIN2A模式图,箭头表示突变位点模式图,箭头表示突变位点转录组测序简介转录组测序简介转录组即特定细胞在某一功能状态下所能转录出转录组即特定细胞在某一功能状态下

30、所能转录出来的所有来的所有RNA的总和,包括的总和,包括mRNA和非编码和非编码RNA(Non-codingRNA)。第二代测序系统可精确检测单个碱基,第二代测序系统可精确检测单个碱基,并且不受到研究中先验信息的干扰,科研人员能并且不受到研究中先验信息的干扰,科研人员能够快速地获得某一物种特定器官或组织在某一状够快速地获得某一物种特定器官或组织在某一状态下几乎所有态下几乎所有mRNA转录本序列,从而能够开展:转录本序列,从而能够开展:UTRs区域界定区域界定、可变剪切研究可变剪切研究、低丰度新转录本低丰度新转录本发现发现、融合基因鉴定融合基因鉴定、cSNP(编码序列单核苷酸(编码序列单核苷酸多

31、态性)研究等。多态性)研究等。 转录组测序测序流程转录组测序测序流程全转录组总RNApolyT富集mRNA去除rRNANon-coding RNA转录组mRNARNA片段化、纯化、检测产量连接两端接头序列逆转录生成cDNA选择适当长度cDNA进行扩增纯化扩增产物,评估产量上机进行高通量测序转录组测序测序流程转录组测序测序流程无参考序列测序流程无参考序列测序流程有参考序列测序流程有参考序列测序流程转录组主要分析内容转录组主要分析内容无参考序列无参考序列转录组分析内容转录组分析内容有参考序列有参考序列转录组分析内容转录组分析内容1 测序数据产量统计,数据成分和质量评估;2 Contig及Scaff

32、old长度分布3 Unigene的长度分布和功能注释,GO分类,Pathway分析,差异表达分析4 蛋白功能预测与分类,差异表达基因GO富集和 Pathway富集分析。 1 基本数据统计,比对参考序列2 序列在基因组上在分布3 测序深度分析、随机性评估和基因差异表达分析4 新基因预测,基因可变剪接鉴定和基因融合鉴定等。ReferencesMaherCA,Kumar-SinhaC,CaoX,etal.Transcriptomesequencingtodetectgenefusionsincancer.Nature,2009Mar5;458(7234):97-101.GuojieZhang,Gua

33、ngwuGuo,XuedaHu,etal.DeepRNAsequencingatsinglebase-pairresolutionrevealshighcomplexityofthericetranscriptome.GenomeRes.2010May;20(5):646-54.MurchisonEP,TovarC,HsuA,etal.TheTasmaniandeviltranscriptomerevealsSchwanncelloriginsofaclonallytransmissiblecancer.Science.2010Jan1;327(5961):84-7.BrainB.Tuch,R

34、ebeccaR.Laborde,XingXuetal.TumorTranscriptomeSequencingRevealsAllelicExpressionImbalancesAssociatedwithCopyNumberAlterations.PloSONE,2010,5(2):e9317FuchouTang,CatalinBarbacioru,EllenNordmanetal.RNA-Seqanalysistocapturethetranscriptomelandscapeofasinglecell.NatureProtocols,2010,ePubFebrary25.SohrabP.

35、Shah,RyanD.Morin,JaswinderKhattraetal.Mutationalevolutioninalobularbreasttumorprofiledatsinglenucleotideresolution.Nature,2009,461:809-813Zhaoetal.Transcriptome-guidedcharacterizationofgenomicrearrangementsinabreastcancercellline.PNAS106(6):1886-91.(2009)GregoryR,DarbyAC,IrvingH,etal.Adenovoexpressi

36、onprofilingofAnophelesfunestus,malariavectorinAfrica,using454pyrosequencing.PLoSOne.2011Feb25;6(2):e17418.CrawfordJE,GuelbeogoWM,SanouA,TraorA,VernickKD,etal.(2010)De NovoTranscriptomeSequencinginAnopheles funestusUsingIlluminaRNA-SeqTechnology.PLoSONE5(12):e14202.doi:10.1371/journal.pone.0014202有参考

37、序列转录组测序案例有参考序列转录组测序案例MaherCA,Kumar-SinhaC,CaoX,etal.Transcriptomesequencingtodetectgenefusionsincancer.Nature,2009Mar5;458(7234):97-101.此研究使用此研究使用454和和Solexa两种高通量测序平两种高通量测序平台对台对前列腺癌前列腺癌细胞系细胞系VcaP和和LNCaP转录组转录组进行测序,以检测和研究前列腺癌细胞系中进行测序,以检测和研究前列腺癌细胞系中基因融合基因融合表达情况。表达情况。 基因融合分析基因融合分析基因嵌合分析流程基因嵌合分析流程MIPOL1-

38、DGKB基因融合模式基因融合模式无参考序列转录组测序案例无参考序列转录组测序案例CrawfordJE,GuelbeogoWM,SanouA,TraorA,VernickKD,etal.(2010)De NovoTranscriptomeSequencinginAnopheles funestusUsingIlluminaRNA-SeqTechnology.PLoSONE5(12):e14202.doi:10.1371/journal.pone.0014202此研究通过对此研究通过对3个个按蚊按蚊样品进行高通量测序,样品进行高通量测序,通过拼接组装后,和相近物种进行通过拼接组装后,和相近物种进行

39、比较基因比较基因组学分析组学分析。De novo 序列拼接、组装和比对流程拼接结果统计拼接结果统计拼接和变异检测分析流程图拼接和变异检测分析流程图比较基因组分析比较基因组分析各类功能基因中氨基酸在物种间差异比例各类功能基因中氨基酸在物种间差异比例差异同源蛋白差异同源蛋白GO分类分类进化关系分析进化关系分析电子表达谱测序电子表达谱测序对特定处理条件下的全基因组基因表达谱进行分对特定处理条件下的全基因组基因表达谱进行分析,已被广泛用于功能基因组学和医学等研究领析,已被广泛用于功能基因组学和医学等研究领域。域。电子表达谱测序(电子表达谱测序(DigitalGeneExpression,DGE)又称为

40、基因表达标签测序()又称为基因表达标签测序(mRNAtagprofiling),其原理是通过两种),其原理是通过两种酶切酶切作用对基因作用对基因中一段长度为中一段长度为21nt的序列标签的序列标签进行测序。由于其进行测序。由于其测序只针对表达的基因进行测序,产生的数据量测序只针对表达的基因进行测序,产生的数据量相对较小,是研究基因表达谱的经济而快速的研相对较小,是研究基因表达谱的经济而快速的研究手段。究手段。又称又称Tag-SAGE电子表达谱测序流程图电子表达谱测序流程图NlaIII限制性酶切限制性酶切电子表达谱分析内容电子表达谱分析内容图像识别与原始碱基数据读取。图像识别与原始碱基数据读取。

41、去污染、去接头,标签序列计数统计。去污染、去接头,标签序列计数统计。基因组比对与统计基因组比对与统计,基因序列比对基因序列比对获得所表达的获得所表达的基因列表基因列表基因基因差异表达差异表达分析。分析。聚类与表达类型分析。聚类与表达类型分析。GO基因富集与分类分析。基因富集与分类分析。Pathway富集与分类分析。富集与分类分析。蛋白相互作用网络分析。蛋白相互作用网络分析。反义链转录本与反义链转录本与新转录本检测新转录本检测。 ReferencesMorrissyAS,etal.Next-generationtagsequencingforcancergeneexpressionprofili

42、ng.GenomeRes.2009.19(10):1825-1835.tHoenPA,etal.Deepsequencing-basedexpressionanalysisshowsmajoradvancesinrobustness,resolutionandinter-labportabilityoverfivemicroarrayplatforms.NucleicAcidsRes,2008.36(21):e141(1-11).style73.HegedusZ,etal.Deepsequencingofthezebrafishtranscriptomeresponsetomycobacter

43、iuminfection.MolImmunol,2009.46(15):2918-2930.AudicSandClaverieJM.Thesignificanceofdigitalgeneexpressionprofiles.GenomeRes.1997.7(10):986-995.ZhenhuaJeremyWu,CliffordA.Meyer,SibgatChoudhury,etal.GeneexpressionprofilingofhumanbreasttissuesamplesusingSAGE-Seq.GenomeRes.2010.20:1730-1739AndreaL.Eveland

44、,NamikoSatoh-Nagasawa,AlexanderGoldshmidt,etal.DigitalGeneExpressionSignaturesforMaizeDevelopment.PlantPhysiol.,2010154:1024-1039PeterRuzanovandDonaldL.Riddle.DeepSAGEanalysisoftheCaenorhabditiseleganstranscriptome.NucleicAcidsResearch,2010,Vol.38,No.10SaurabhSaha,AndrewB.Sparks,CarloRago,etal.Using

45、thetranscriptometoannotatethegenome.NatureBiotechnology(2002)20,508-512电子表达谱测序案例分析电子表达谱测序案例分析MorrissyAS,etal.Next-generationtagsequencingforcancergeneexpressionprofiling.GenomeRes.2009.19(10):1825-1835.此研究用高通量电子表达谱测序(此研究用高通量电子表达谱测序(Tag-SAGE)和传统)和传统LongSAGE测序方法对癌测序方法对癌症细胞进行研究,比较两种方法效果,揭示症细胞进行研究,比较两种方

46、法效果,揭示了电子表达谱在基因发现中的诸多优势,可了电子表达谱在基因发现中的诸多优势,可发现更多的基因,减少发现更多的基因,减少GC偏好。偏好。两种方法所检测到的基因数比较两种方法所检测到的基因数比较GC偏好性和低丰度转录本检测效果偏好性和低丰度转录本检测效果小小RNA测序测序小小 RNA是指长度在是指长度在21-31nt的内源性的内源性非蛋白质编码非蛋白质编码RNA,广泛存在于高等和低等生物体内,其对广泛存在于高等和低等生物体内,其对mRNA的转录及转的转录及转录后水平等生命过程起到调节作用。录后水平等生命过程起到调节作用。现已知小现已知小RNA可归纳成三类:微可归纳成三类:微RNA(miR

47、NA),小干扰,小干扰RNA(siRNA)和与和与piwi相互作用的相互作用的RNA(piRNA)。miRNA长度为长度为2124nt,产生于有典型茎环二级结构的原,产生于有典型茎环二级结构的原转录本转录本(pri-miRNA),在动植物的目标,在动植物的目标mRNA的的降解与抑降解与抑制制方面发挥重要作用。方面发挥重要作用。siRNA,长度在,长度在1925nt,产生于,产生于长双链长双链RNA,同样在动植物的目标,同样在动植物的目标mRNA的的降解与抑制降解与抑制方方面发挥重要作用。面发挥重要作用。piRNA,长度,长度2631nt,由与其相互作,由与其相互作用的用的Piwi蛋白定义,目前

48、研究表明其在蛋白定义,目前研究表明其在配子形成配子形成的过程中的过程中起作用。起作用。小小RNA测序流程图测序流程图小小RNA测序分析内容测序分析内容基本分析:基本分析:原始数据读取,去接头、去污染序列,长度原始数据读取,去接头、去污染序列,长度分布统计,基因组比对等。分布统计,基因组比对等。高级分析:高级分析:SmallRNA的分类注释的分类注释miRNA/siRNA/piRNA的鉴定的鉴定新新miRNA预测预测 差异表达差异表达miRNA聚类分析等聚类分析等 References1、EugeneBerezikov,NicolasRobine,AnastasiaSamsonova,etal.

49、DeepannotationofDrosophilamelanogastermicroRNAsyieldsinsightsintotheirprocessing,modification,andemergence.GenomeRes.2011.21:203-2152、MiS,CaiT,HuY,ChenY,HodgesE,etal.(2008)SortingofSmallRNAsintoArabidopsisArgonauteComplexesisDirectedbythe5TerminalNucleotide.Cell.3、MontgomeryTA,HowellMD,CuperusJT,LiD

50、,HansenJE,etal.(2008)SpecificityofARGONAUTE7-miR390InteractionandDualFunctionalityinTAS3Trans-ActingsiRNAFormation.Cell4、MorinRD,OConnorMD,GriffithM,KuchenbauerF,DelaneyA,etal.(2008)ApplicationofmassivelyparallelsequencingtomicroRNAprofilinganddiscoveryinhumanembryonicstemcells.GenomeRes.5、HafnerM,L

51、andgrafP,LudwigJ,RiceA,OjoT,etal.(2008)IdentificationofmicroRNAsandothersmallregulatoryRNAsusingcDNAlibrarysequencing.Methods44(1):3-12.小小RNA测序案例分析测序案例分析EugeneBerezikov,NicolasRobine,AnastasiaSamsonova,etal.DeepannotationofDrosophilamelanogastermicroRNAsyieldsinsightsintotheirprocessing,modification

52、,andemergence.GenomeRes.2011.21:203-215此研究对黑腹果蝇此研究对黑腹果蝇miRNA进行深度测序,进行深度测序,通过对其测序结果的注释和分析,揭示了黑通过对其测序结果的注释和分析,揭示了黑腹果蝇中腹果蝇中miRNA的的编辑、修饰编辑、修饰等机制。等机制。 果蝇三种组织中果蝇三种组织中MiRNA表达情况表达情况MiRNA表达模式分析表达模式分析新新miRNA预测预测miRNA编辑情况分析与统计编辑情况分析与统计ChIP-SeqChIP-ChromatinImmunoprecipitation染染色质免疫共沉淀,是指通过色质免疫共沉淀,是指通过蛋白免疫相互作蛋白

53、免疫相互作用用,用抗体把和染色质相互作用的蛋白,如,用抗体把和染色质相互作用的蛋白,如组蛋白、转录因子等,沉淀下来,从而所获组蛋白、转录因子等,沉淀下来,从而所获取与其相结合的取与其相结合的DNA序列。序列。ChIP-Seq就是通过高通量测序对就是通过高通量测序对ChIP所得所得到的序列进行测序,从而进行蛋白和到的序列进行测序,从而进行蛋白和DNA相互作用相关研究。相互作用相关研究。ChIP-Seq测序流程测序流程ChIP-Seq分析内容分析内容ChIPSequencing结果与结果与参考基因组参考基因组序列进行序列进行比对比对ChIPSequencingreads在在全基因组的分布全基因组的

54、分布唯一比对reads在repeats区域的分布唯一比对reads在各基因功能元件上的分布唯一比对reads的全基因组覆盖深度全基因组全基因组peak扫描扫描peak扫描peak长度分布统计peak的全基因组覆盖度peak在基因功能元件上的分布特征Peak相关基因相关基因分析筛选与分析筛选与GO功能富集分析功能富集分析多个样品的多个样品的差异分析差异分析基于peak相关基因的差异分析基于peak的差异分析ChIP-Seq分析流程分析流程原始数据数据清理序列比对Peak扫描Peak相关基因UniqueMapped序列分布分析Peak分布GenomeBrowser可视化GO功能分析多个样品的差异分

55、析多个样品的差异分析ChIP-Seq 分析结果示例分析结果示例ChIP-Seq分析结果示例分析结果示例ReferencesJohnsonDS,MortazaviAetal.(2007)Genome-widemappingofinvivoproteinDNAinteractions.Science316:14971502Jothietal.(2008)Genome-wideidentificationofinvivoproteinDNAbindingsitesfromChIP-Seqdata.NuclAcidsRes36(16)52215231.Bernstein,BEetal.(2005)Ge

56、nomicmapsandcomparativeanalysisofhistonemodificationsinhumanandmouse.Cell120,169181.RobertsonGetal.(2007)Genome-wideprofilesofSTAT1DNAassociationusingchromatinimmunoprecipitationandmassivelyparallelsequencing.NatureMethods4:651657.Schmidetal.(2007)ChIP-SeqDatarevealnucleosomearchitectureofhumanpromo

57、ters.Cell131:831832DNA甲基化测序甲基化测序DNA甲基化对甲基化对机体发育和基因表达机体发育和基因表达有很重要的调有很重要的调控作用,和各种控作用,和各种癌症的发生和发展癌症的发生和发展也有很大相关也有很大相关性,所以对基因组性,所以对基因组DNA甲基化进行研究是一直来甲基化进行研究是一直来的热门课题。的热门课题。通过高通量测序来研究通过高通量测序来研究DNA甲基化现在主要有两甲基化现在主要有两种方法,一种是种方法,一种是MeDIP,是通过与,是通过与DNA甲基化位甲基化位点相结合的抗体,进行点相结合的抗体,进行免疫共沉淀免疫共沉淀,然后对所得,然后对所得DNA序列进行测序

58、。另一种是序列进行测序。另一种是BisulfiteSequencing,是通过,是通过Bisulfite处理基因组来区分处理基因组来区分甲基化位点。甲基化位点。MeDIP 原理原理MeDIP-Seq分析内容分析内容1.MeDIP-seq序列序列与参考序列的比对与参考序列的比对2.MeDIP-seq序列数据在全序列数据在全基因组的分布趋势基因组的分布趋势2.1MeDIP-seq测序reads在全基因组上每条染色体上的分布2.2MeDIP-seq测序reads在全基因组上的覆盖深度2.3MeDIP-Seq测序reads在CG、CHG和CHH位点上的覆盖深度2.4MeDIP-Seq测序reads在不

59、同基因功能元件上的分布2.5MeDIP-Seq测序reads在不同OE含量区域中的分布3.统计统计MeDIP-seq序列富集区域(序列富集区域(peak)的信息的信息 3.1Peak扫描3.2Peak长度数量及比例分布统计3.3单个样品Peak的OE含量分布统计3.4寻找Peak相关基因3.5统计Peak在不同基因功能元件上的分布4.基于基于Peak的多样品间的多样品间差异分析差异分析4.1分析两个样品间的Peak相关差异基因4.2对两个样品间的差异基因进行GO功能富集分析及pathway功能分析89Bisulfite Sequencing原理原理90Bisulfite Sequencing分

60、析内容分析内容1.Bisulfite-seq序列序列与参考序列的比对与参考序列的比对2.深度和覆盖度分析深度和覆盖度分析2.1C碱基有效测序深度的累积分布2.2不同reads测序深度下的基因组覆盖度3.计算计算C碱基的甲基化水平碱基的甲基化水平4.全基因组全基因组甲基化数据分布趋势分析甲基化数据分布趋势分析4.1甲基化C碱基中CG,CHG与CHH的分布比例(H=A、CorT,以下同)4.2CG、CHG和CHH中的所有C的甲基化水平4.3各条染色体中CG、CHG和CHH中C的甲基化水平(该项分析目前只用于“人”)4.4统计不同基因区域内CG、CHG和CHH中C的甲基化水平4.5不同基因元件区域中

61、CG、CHG和CHH中C的甲基化水平4.6CHG,CHH中甲基化C附近的9bp序列的序列特征分析5.全全基因组基因组DNA甲基化图谱甲基化图谱5.1染色体水平的甲基化C碱基的密度分布(该项分析目前只用于“人”)5.2Scaffold的甲基化C碱基密度分布(该项分析针对物种:非人)5.3不同基因组区域的甲基化分布特征5.4基因组不同转录元件中的DNA甲基化水平6.差异差异甲基化区域(甲基化区域(DMR)分析)分析91ReferencesWeberetal.DeterminedthattheinactiveX-chromosomeinfemalesishypermethylatedonachrom

62、osomewidelevelusingMeDIPcoupledwithmicroarray.Nature Genet2005.37:853862.KeshetI,SchlesingerY,FarkashS,etal.Evidenceforaninstructivemechanismofdenovomethylationincancercells.Nat. Genet.2006.38(2):14953.ZhangX,YazakiJ,SundaresanA,et al.Genome-widehigh-resolutionmappingandfunctionalanalysisofDNAmethyl

63、ationinarabidopsis.Cell2006.126(6):1189201.NovakP,JensenT,OshiroMM,etal.EpigeneticinactivationoftheHOXAgeneclusterinbreastcancer.Cancer Res.2006.66(22):1066470.EhrichM,ZollS,SurS,vandenBoomD.AnewmethodforaccurateassessmentofDNAqualityafterbisulfitetreatment.NucleicAcidsRes2007.35(5):e29KristenH.Tayl

64、or,RobinS.Kramer,J.WadeDavis,etal.UltradeepBisulfiteSequencingAnalysisofDNAMethylationPatternsinMultipleGenePromotersby454Sequencing.CancerRes.2007.67;8511报告纲要报告纲要高通量测序简介高通量测序简介高通量测序平台的介绍高通量测序平台的介绍高通量测序的应用范围及案例分析高通量测序的应用范围及案例分析相关生物信息学分析软件介绍相关生物信息学分析软件介绍常用生物信息学分析平台与资源常用生物信息学分析平台与资源常用编程分析平台:Perl/BioPe

65、rlPython/BioPythonR/BioconductorJAVA/BioJava常用网上资源:NCBISRASequenceReadArchiveUCSCGenomeBrowserSEQanswersWiKi&ForumforNGS常用基因组拼接软件常用基因组拼接软件VelvetRayABySSSOAPdenovoSSAKESHARCGSMIRAEdena基因组比对软件基因组比对软件BLASTBLATMAQSOAPBowtieBWASSAHAELANDSNP 分析软件分析软件SAMToolsSOAPsnpNGS-BackboneMAQSeqManNGenCLCBioGenomics谢谢大家!谢谢大家!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号