高通量测序常用词汇

上传人:平*** 文档编号:16008286 上传时间:2017-11-06 格式:DOCX 页数:11 大小:112.76KB
返回 下载 相关 举报
高通量测序常用词汇_第1页
第1页 / 共11页
高通量测序常用词汇_第2页
第2页 / 共11页
高通量测序常用词汇_第3页
第3页 / 共11页
高通量测序常用词汇_第4页
第4页 / 共11页
高通量测序常用词汇_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《高通量测序常用词汇》由会员分享,可在线阅读,更多相关《高通量测序常用词汇(11页珍藏版)》请在金锄头文库上搜索。

1、高通量测序常用词汇一代测序技术:即传统的 Sanger 测序法,Sanger 法是根据核苷酸在待定序列模板上的引物点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以 A、T、C、G 结束的四组不同长度的一系列核苷酸,每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP) 。由于ddNTP 缺乏延伸所需要的 3-OH 基团,使延长的寡聚核苷酸选择性地在G、A、T 或 C 处终止,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率

2、变性凝胶电泳分离大小不同的片段,通过检测得到 DNA 碱基序列。二代测序技术:next generation sequencing(NGS)又称为高通量测序技术,与传统测序相比,二代测序技术可以一次对几十万到几百万条核酸分子同时进行序列测定,从而使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(Deep sequencing )。NGS 主要的平台有Roche(454 & 454 +),Illumina(HiSeq 2000/2500 、GA IIx、MiSeq),ABI SOLiD 等。基因:Gene,是遗传的物质基础,是 DNA 或 RNA 分子上具有遗传信息

3、的特定核苷酸序列。基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状。DNA:Deoxyribonucleic acid,脱氧核糖核酸,一个脱氧核苷酸分子由三部分组成:含氮碱基、脱氧核糖、磷酸。脱氧核糖核酸通过 3,5-磷酸二酯键按一定的顺序彼此相连构成长链,即 DNA 链,DNA 链上特定的核苷酸序列包含有生物的遗传信息,是绝大部分生物遗传信息的载体。RNA:Ribonucleic Acid,核糖核酸,一个核糖核苷酸分子由碱基,核糖和磷酸构成。核糖核苷酸经磷酯键缩合而成长链状分子称之为 RNA 链。RNA 是存在于生物细胞以及部分病毒、类病毒中的遗传信息载体。不同种类的 RNA

4、链长不同,行使各式各样的生物功能,如参与蛋白质生物合成的 RNA 有信使RNA、转移 RNA 和核糖体 RNA 等。16S rDNA:S是沉降系数,是反映生物大分子在离心场中向下沉降速度的一个指标,值越高,说明分子越大。rDNA(ribosome DNA )指的是原核生物基因组中编码核糖体 RNA(rRNA)分子对应的 DNA 序列,16S rDNA 是原核生物编码核糖体小亚基 16S rRNA 的基因。细菌 rRNA(核糖体 RNA)按沉降系数分为 3 种,分别为 5S、 16S 和 23S rRNA。16S rDNA 是细菌染色体上编码16S rRNA 相对应的 DNA 序列,存在于所有细

5、菌染色体基因中。16S rRNA 普遍存在于原核生物中。16S rRNA 分子,其大小约 1540bp,既含有高度保守的序列区域,又有中度保守和高度变化的序列区域,其可变区序列因细菌不同而异,恒定区序列基本保守,所以可利用恒定区序列设计引物,将 16S rDNA 片段扩增出来,通过高通量测序利用可变区序列的差异来对不同菌属、菌种的细菌进行分类鉴定。cDNA: complementary DNA,互补脱氧核糖核酸,与 RNA 链互补的单链DNA,以 RNA 为模板,在反转录酶的作用下所合成的 DNA。Small RNA:生物体内一类高度保守的重要的功能分子,其大小在 18-30nt,包括 mic

6、roRNA、siRNA、snRNA、snoRNA 和 piRNA(piwi-interacting RNA)等,它的主要功能是诱导基因沉默,调控细胞生长、发育、基因转录和翻译等生物学过程。以 miRNA 为例介绍它们的功能:miRNA 与 RNA 诱导沉默复合体(RNA induced silencing complex, RISC)结合,并将此复合体与其互补的mRNA 序列结合,根据靶序列与 miRNA 的互补程度,从而导致靶序列降解或干扰靶序列蛋白质的翻译过程。SD 区 域:S egment duplication,串联重复是由序列相近的一些 DNA 片段串联组成。串联重复在人类基因多样性

7、的灵长类基因中发挥重要作用。Genotype and phenotype:基因 型与 表型 ,基 因 型 是 指 某 一 生 物 个 体 全 部 基 因组 合 的 总 称 ; 表 型 , 又 称 性 状 , 是 基 因 型 和 环 境 共 同 作 用 的 结 果 。基因组:Genome,单倍体细胞核、细胞器(线粒体、叶绿体)或病毒粒子所含的全部 DNA 分子或 RNA 分子。全基因组 de novo 测序:又称从头测序,它不依赖于任何现有的序列资料,而直接对某个物种的基因组进行测序,然后利用生物信息学分析手段对序列进行拼接、组装,从而获得该物种的基因组序列图谱。全基因组重测序:对已有参考序列(

8、Reference Sequence)物种的不同个体进行基因组测序,并以此为基础进行个体或群体水平的遗传差异性分析。全基因组重测序能够发现大量的单核苷酸多态性位点(SNP)、拷贝数变异(Copy Number Variation,CNV)、插入缺失(InDel,Insertion/Deletion)、结构变异(Structure Variation,SV)等变异类型,以准确快速的方法将单个参考基因组信息上升为群体遗传特征。转录组:Transcriptome,是指特定生长阶段某组织或细胞内所有转录产物的集合;狭义上指所有 mRNA 的集合。转录组测序:对某组织在某一功能状态下所能转录出来的所有

9、RNA 进行测序,获得特定状态下的该物种的几乎所有转录本序列信息。通常转录组测序是指对mRNA 进行测序获得相关序列的过程。其根据所研究物种是否有参考基因组序列分为转录组 de novo 测序(无参考基因组序列)和转录组重测序(有参考基因组序列)。外显子组:Exome ,人类基因组全部外显子区域的集合称为外显子组,是基因中重要的编码蛋白的部分,并涵盖了与个体表型相关的大部分的功能性变异。外显子组测序:是指利用序列捕获技术将全基因组外显子区域 DNA 捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的 SNP、InDel 等具有较大的优势。目标区域

10、测序:应用相关试剂盒对基因组上感兴趣的目标区域进行捕获富集后进行大规模测序,一般需要根据目标区域专门定制捕获芯片。宏基因组:Metagenome ,指特定生活环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因。目前主要指环境样品中的细菌和真菌的基因组总和。宏基因组 16S rRNA 测序:可以对特定环境下的细菌和古细菌群体的微生物种类和风度进行有效的鉴定。对不同地点、不同条件下的多个样本 16S rRNA 的PCR 产物平行测序,可以比较不同样本间的微生物组成及成分差异,进而阐明物种丰度、种群结果等生态学信息。表观遗传学:Epigenetics ,是指在基因组 DNA

11、序列没有改变的情况下,基因的表达调控和性状发生了可遗传的变化。表观遗传的现象很多,已知的有 DNA甲基化(DNA methylation),基因组印记(genomic impriting ),母体效应(maternal effects),基因沉默(gene silencing ),核仁显性,休眠转座子激活和 RNA 编辑(RNA editing)等。全基因组甲基化测序:DNA 甲基化是指在 DNA 甲基化转移酶的作用下,在基因组 CpG 二核苷酸的胞嘧啶 5碳位共价键结合一个甲基基团。DNA 甲基化已经成为表观遗传学和表观基因组学的重要研究内容。甲基化是基因表达的主要调控方式之一,研究染色体

12、DNA 甲基化情况是了解基因调控的重要手段。对已经有参考基因组的物种的基因组 DNA 用标准亚硫酸氢盐(Bisulfite)处理后,未甲基化的胞嘧啶 C 会脱氨基形成尿嘧啶 U,经 PCR 扩增,U 替换为胸腺嘧啶 T,而发生甲基化的胞嘧啶 C 保持不变。将处理组与参考基因组序列进行比对,可发现甲基化位点并对甲基化情况进行定量分析的方法叫做全基因组甲基化测序。ChIp-Seq:Chromatin Immunoprecipitation sequencing,即染色质免疫共沉淀-测序技术,即通过染色质免疫共沉淀技术特异性地富集目的蛋白结合的 DNA 片段。对富集得到的 DNA 片段进行纯化与文库

13、构建,然后进行高通量测序,从而得到全基因组范围内可以与目的蛋白相互作用的 DNA 片段的方法叫做 ChIP-Seq。数字表达谱:Digital G ene Expression Profile, 利 用 新 一 代 高 通 量 测 序 技 术 和 高性 能 计 算 分 析 技 术 , 能 够 全 面 、 经 济 、 快 速 地 检 测 某 一 物 种 特 定 组 织 在 特 定 状态 下 的 基 因 表 达 情 况 , 即 运 用 特 定 的 酶 对 mRNA 距 polyA tail 21-25nt 的 位 置进 行 酶 切 , 所 获 得 的 带 polyA 尾 的 序 列 (Tag)通

14、过 高 通 量 测序,该 tag 被测得的次数即是对应基因的表达值。 数 字 基 因 表 达 谱 已 被 广 泛 应 用 于 基 础 科 学 研 究 、医 学 研 究 和 药 物 研 发 等 领 域 。 特 点 是 经 济 , 但 获 得 的 数 据 量 有 限 。 若 想 获 得 转录 本 的 更 多 信 息 的 话 , 一 般 都 采 用 转 录 组 测 序 的 方 法 来 测 序 。SBS: sequencing by synthesis,边合成边测序反应,是指在 DNA 聚合酶的作用下延伸碱基所进行的测序。Run:指高通量测序平台单次上机测序反应。图 1. Flow Cell 结构示意

15、图Lane:也叫 channel,单泳道,每条泳道包含 2 列( column),每列分布有多个小区(tile),如图 1。不同的测序平台 Flow Cell 中所含的 Lane 不一样,如HiSeq 2000 是 2 个 flow cell,每个 flow cell 中含有 8 个 lane;HiSeq 2500 是包含 2 个 mini flow cell(快速运行模式)和 2 个 high output flow cell,两个模式不能同时运行,其中每个 mini flow cell 包含 2 个 lane,每个 high output flow cell中包含 8 个 lane;Mis

16、eq 系统的 flow cell 仅含有 1 个 lane。Tile:小区,每条 Lane 中有 2 列 tile,合计 120 个小区。每个小区上分布数目繁多的簇结合位点,如图 1。Cluster:簇,在 Illumina 测序平台中会采用桥式 PCR 方式生产 DNA 簇,每个DNA 簇才能产生亮度达到 CCD 可以分辨的荧光点。Index:标签,在 Illumina 平台的多重测序(Multiplexed Sequencing)过程中会使用 Index 来区分样品,并在常规测序完成后,针对 Index 部分额外进行 7 个循环的测序,通过 Index 的识别,可以在 1 条 Lane 中区分 12 种不同的样品。Barcode:与 Index 同义,多指在 Roche GS FLX 454 测序平台的 16S PCR 产物的测序过程中接头序列所包含的的用来区分不同样本的序列。PF%:PF% 是指符合测序质量标准的簇的百分比,与测序的通量相关联。Fasta: 一种序列存储格式。一个序列文件若以 FA

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号