S信息分析报告2-北京奥维森

上传人:ni****g 文档编号:559242647 上传时间:2023-02-22 格式:DOC 页数:13 大小:725KB
返回 下载 相关 举报
S信息分析报告2-北京奥维森_第1页
第1页 / 共13页
S信息分析报告2-北京奥维森_第2页
第2页 / 共13页
S信息分析报告2-北京奥维森_第3页
第3页 / 共13页
S信息分析报告2-北京奥维森_第4页
第4页 / 共13页
S信息分析报告2-北京奥维森_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《S信息分析报告2-北京奥维森》由会员分享,可在线阅读,更多相关《S信息分析报告2-北京奥维森(13页珍藏版)》请在金锄头文库上搜索。

1、16srDNA 信息分析1. 标准信息分析(初级)基本数据处理(使用内部撰写的程序对原始的测序数据进行基本处理)通过Illumina平台( Miseq )进行Paired-end测序,下机数据经过去除低质量reads(Q20,90%标准过滤 ) ,并 trim掉 reads2尾部 100bp 低质量序列;每个样品数据产出详细统计结果见下表:表 1-1 reads 数据统计:# Samples# HQreads (total)# HQ reads (mean SD)CA17110,6516,509 2,175HC19163,6908,615 3,081LK13127,4169,801 2,858

2、Total49401,7578,199 2,992注:原来的样本中CA15由于原始 Reads 数太少(只有23 条)而被删除,因此目前的样本总数为49 个去除barcode序列,引物序列及tags过滤通过COPE软件(Connecting Overlapped Pair-End,),利用重叠关系将双末端测序得到的成对reads组装成一条序列。利用内部编写程序去除两端barcode序列,引物序列。Paired End Reads通过reads之间的overlap( 19 个碱基)关系拼接成Tags;然后去掉barcode序列,引物序列。为了得到高质量的Tags,将拼接的Tags按照长度过滤,去

3、嵌合体等的处理。( 这里等的意思就是按照拼接条件过滤:1,碱基的ASCII value值低于33 的过滤掉。取19 个碱基,这19 个碱基相互匹配率低于98%的过滤掉。3. 去掉引物序列的时候,允许一个错配,错配多于一个的过滤掉。)表 1-2 tags 的详细信息Sample IDRaw Tag NumFinal Tag numHC11756017,319HC296729,604HC31805317,826HC41218112,107HC51155811,477HC81148811,404HC91635416,095HC102158421,270HC1179897926HC121156111,

4、449HC132490924,660HC142297922,736HC152074720,549HC161485714,728HC172117121,002HC181070010,605HC191135911,247CA81620316,040CA101092510,560CA1182547,690CA1294799,053CA1479477,584CA1682218,093CA171066610,479CA181078710,651CA51634416,154CA960475,861CA131029010,1652 高级信息分析OUT 及其丰度分析OUT 统计拼接的 Tags 经过优化后,

5、在相似度下利用qiime ()软件将其聚类为用于物种分类的 OTU(Operational Taxonomic Units),统计各个样品每个OTU中的丰度信息,OTU的丰度初步说明了样品的物种丰富程度。49 个样品共产生3029 个 OTU,其中 SingletonsOTU(即丰度为1 的 OTU)个数为0, Non singletons OTU个数为 3029。表 4. 样品 OUT统计SampleNameOTUsTagsHC154117,319HC22699,604HC353017,826HC421512,107HC520611,477HC821411,404HC945516,095HC

6、1060021,270HC1226211,449HC1329424,660CA1045310,560CA117107,690CA126509,053CA145197,584CA162408,093CA1733010,479CA1828910,651CA533616,154CA93475,861HC111427,926CA1326910,165表5 OTU 统计IndexOTU numNo. of OTUs3029Assigned to families1,708Assigned to genera1,172Assigned to species314No. of OTUs per sample

7、368147Min no. ofOTUs persample127Max no. ofOTUs persample719OTU 分布的韦恩图如下:在的相似度下,得到了每个样品的OTU个数,利用R()画图软件绘出Venn 图可以展示多样品共有和各自特有OTU数目,直观展示样品间OTU的重叠情况。 结合 OTU所代表的物种,可以找出不同环境中的核心微生物。图 2-1 OTU venn 分析。 不同颜色图形代表不同样品或者不同组别,不同颜色图形之间交叠部分数字为两个样品或两个组别之间共有的 OTU个数。同理,多个颜色图形之间交叠部分数字为多个样品或组别之间共有 OTU个数。 Venn 图容许 2-5

8、 个样品或组别。OUT 水平的 PCA图如下: R()画图软件PCA 分析 (PrincipalComponent Analysis),即主成分分析,是一种分析和简化数据集的技术。 主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。通过分析不同样品OTU( 97%相似性)组成可以反映样品的差异和距离,PCA运用方差分解, 将多组数据的差异反映在二维坐标图上,坐标轴取能够最大反映方差值两个特征值。 如果两个样品距离越近,则表示这两个样品的组成越相似。不同处理或不同环境间的样品可能表

9、现出分散和聚集的分布情况,从而可以判断相同条件的样品组成是否具有相似性。图 2-2 基于 OTU丰度的 PCA分析。横坐标表示第一主成分,括号中的百分比则表示第一主成分对样品差异的贡献值;纵坐标表示第二主成分,括号中的百分比表示第二主成分对样品差异的贡献值。图中点分别表示各个样品。不同颜色代表样品属于不同的分组。2 .2 Core microbiome分析图表都是通过qiime ()软件得到的共有 OTU数与样本数的关系:图 2-3覆盖所有样本的微生物组。横坐标表示样品占的比率,纵坐标表示包含OUT的数目。这些样本的core microbiome(即覆盖所有样本的微生物组)共包含17 个 OT

10、Us,其物种分类信息如下表2-1 。表 2-1 覆盖所有样本的 OTUsOTUTaxonomy levelTaxonomy name400850GenusStreptococcus437590GenusCapnocytophaga368428Speciesdispar645710GenusCampylobacter417699GenusFusobacterium395972GenusStreptococcus381841GenusStreptococcus140702GenusPeptostreptococcus413823GenusGranulicatella645697GenusCampy

11、lobacter414306GenusNeisseria260777GenusFusobacterium2008GenusNeisseria21908GenusNeisseria645708GenusCampylobacter414422FamilyGemellaceae1212GenusGranulicatella生物多样性分析单个样品复杂性分析通过计算 Shannon index, Chao1 index, Phylogenetic diversity (PD, whole tree)和 observed number of species共四个指数来进行生物多样性分析。通过qiime ()软件计算样品的Alpha 多样性值并用R()软件做出相应的稀释曲线,盒型图。稀释曲线是利用已测得16S rDNA序列中已知的各种OTU的相对比例,来计算抽取n 个(n 小于测得Reads 序列总数)Tags 时各Alpha指数的期望值, 然后根据一组n 值(一般为一组小于总序列数的等差数列)与其相对应的Alpha指数的期望值绘制曲线。如样品有提供分组信息,且每组样品个数不小于3,将对组间的Alpha 多样性指数进行差异分析。差异分析的检验方法为秩和检验,如果组数为2,采用两样品

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 国内外标准规范

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号