《扩增子里妥妥的C位》由会员分享,可在线阅读,更多相关《扩增子里妥妥的C位(3页珍藏版)》请在金锄头文库上搜索。
1、扩增子里妥妥的C位一一OTU君作者:美格基因一、OTU聚类OTU,即operational taxonomic units,是微生物学研究中最常见的术语之一,为了方 便研究样品的物种组成多样性信息,需对样品的有效序列进行聚类,在默认给定的相似度(默 认97%)下将clean tags聚类成OTUs,得到每个cluster的序列,并分别随机赋予一个编号 (OTU ID)。二、single ton OTU及嵌合体去除通常认为高通量测序获得的single ton OTU (只有一条代表序列的OTU),是由于测序 错误造成的,或者是来自于PCR过程中产生的嵌合体,因此聚类的同时usearch会根据UC
2、HIME 算法将single ton OTU及嵌合体去除,得到最终的Effec tive Tags。SampleIDCleanTagsSingletonTagsChimeraTagsEffectiveTagsEffec ti ve(%)OTUnumberXl.l4519006514453995%418X2.24524706114463698%402X3.23624514493579593%367C1.237496011263637097%465C2.23458829033368399%496C3.23163208633076995&463注:Effective(%)为 Effective Ta
3、gs 占 Clean Tags 的百分比。三、挑选OTU代表性序列为了下游分析可以有效地进行,利用Qiime从每个OTU的序列中抽取一条代表序列,用于 统计每个OTU的序列数和物种注释。挑选代表序列的方法包括三种:选取出现频数最高的序列、 选取最长的序列以及随机选取,默认采用第一种方法。四、建立 otu_table_raw利用usearch统计single ton OTU和嵌合体去除后每个OTU的序列数,生成原始序列分布情况表 otu_table_rawo#OTU IDBL1.1BL1.2BL1.3BL2.1BL2.2OTU1804330557773038410795OTU1035646838
4、3209418OTU1008527511OTU100000000OTU100100000OTU100200000OTU100300000注:第一列为过滤single ton OTU和嵌合体后的OT U编号,其余各列代表各个OT U在不同样品 中的序列数。五、回炉深造1、OTU是什么?OTU (operational taxonomic units),即操作分类单元。通过一定的距离度量方法计算两两 不同序列之间的距离度量或相似性,继而设置特定的分类阈值,获得同一阈值下的距离矩阵, 进行聚类操作,形成不同的分类单元。2、OTU在16S测序中有何用?高通量测序得到的16S序列有成千上万条,如果对每条序列都进行物种注释的话,工作量大、 耗时长,而且16S扩增、测序等过程中出现的错误会降低结果的准确性。在16S分析中引入 OTU,首先对相似性序列进行聚类,分成数量较少的分类单元,基于分类单元进行物种注释。 这不仅简化工作量,提高分析效率,而且OTU在聚类过程中会去除一些测序错误的序列,提高 分析的准确性。3、OTU如何聚类?OTU 聚类的方法多种多样,如 Uclust、cd-hit、BLAST、mothur、usearch 和 prefix/suffix, 这些聚类方法均可以在QIIME软件中实施。不同聚类方法基于不同的算法,得到的聚类结果虽 然不同,但是大体的聚类流程都是一致的。