文档详情

微生物分析用图的看图说明

re****.1
实名认证
店铺
DOC
1,013KB
约18页
文档ID:481331444
微生物分析用图的看图说明_第1页
1/18

1. 稀释性曲线(RarefactionCurve)采用对测序序列进行随机抽样的方法,以抽到的序列数与它们所能代表OTU的数目构建曲线,即稀释性曲线当曲线趋于平坦时,说明测序数据量合理,更多的数据量对发现新OTU的边际贡献很小;反之则表明继续测序还可能产生较多新的OTU'MultysamplMRarefactionCurv昭3XK0圈1横轴:从某个样品中随机抽取的测序条数;"Label0.03"表示该分析是基于OTU序列差异水平在0.03,即相似度为97%的水平上进行运算的,客户可以选取其他不同的相似度水平纵轴:基于该测序条数能构建的OTU数量曲线解读:0图1中每条曲线代表一个样品,用不同颜色标记;0随测序深度增加,被发现OTU的数量增加当曲线趋于平缓时表示此时的测序数据量较为合理2. Shannon-Wiener曲线反映样品中微生物多样性的指数,利用各样品的测序量在不同测序深度时的微生物多样性指数构建曲线,以此反映各样本在不同测序数量时的微生物多样性当曲线趋向平坦时,说明测序数据量足够大,可以反映样品中绝大多数的微生物物种信息eDccflJl#Multj!1sampksShannon-WienerCurvesDMM4C00gCKKlNumbererfReadsSampledSMC图2横轴:从某个样品中随机抽取的测序条数。

纵轴:Shannon-Wiener指数,用来估算群落多样性的高低Shannon指数计算公式:其中,Sobs=实际测量出的OTU数目;ni=含有i条序列的OTU数目;N=所有的序列数曲线解读:0图2每条曲线代表一个样品,用不同颜色标记,末端数字为实际测序条数;0起初曲线直线上升,是由于测序条数远不足覆盖样品导致;0数值升高直至平滑说明测序条数足以覆盖样品中的大部分微生物3. Rank-Abundance曲线用于同时解释样品多样性的两个方面,即样品所含物种的丰富程度和均匀程度物种的丰富程度由曲线在横轴上的长度来反映,曲线越宽,表示物种的组成越丰富;物种组成的均匀程度由曲线的形状来反映,曲线越平坦,表示物种组成的均匀程度越高横轴:OTU相对丰度含量等级降序排列纵轴:相对丰度比例曲线解读:0图3与图4中每条曲线对应一个样本(参考右上角图标);0图3与图4中横坐标表示的是OTU(物种)丰度排列顺序,纵坐标对应的是OTU(物种)所占相对丰度比例(图3为相对百分比例,图4为换算后Log值),曲线趋于水平则表示样品中各物种所占比例相似;曲线整体斜率越大则表示样品中各物种所占比例差异较大4. 样本群落组成分析:多样本柱状图/单样本饼状图根据分类学分析结果,可以得知一个或多个样品在各分类水平上的物种组成比例情况,反映样品在不同分类学水平上的群落结构。

□ FinrthaAfl?Bad:曰网毬巧□ PrttwMderis□ FusobaderiaA^linobaclena口Ot吸Bid0d6frset*i37??LtIChlor^lexi^i7SVF-irricu'tM0S%1C;i-dd:!!e¥iBionBiWS31劄骼\\\\、^^^-erJrtphaerae1.37*k--.''Cyanobacleria1.S&%-'-1-NWrDtp>r»1巧绻\''-G4mrnnUm^nodvC^2\xocn#AetiRDtsjictffiia2I;叭Alpnn^foleobndlena427%Plvnct(wnyi9<9rc11fll%-柱状图(图5)横轴:各样品的编号纵轴:相对丰度比例图标解读:0颜色对应此分类学水平下各物种名称,不同色块宽度表示不同物种相对丰度比例;0可以在不同分类学水平下作图分析饼状图(图6)在某一分类学水平上,不同菌群所占的相对丰度比例。

不同颜色代表不同的物种5.样品OTU分布Venn图用于统计多个样品中共有或独有的OTU数目,可以比较直观地表现各环境样品之间的OTU组成相似程度不同样品用不同颜色标记,各个数字代表了某个样品独有或几种样品共有的OTU数量,对应的OTU编号会以EXCEL表的形式在结题报告中呈现分析要求单张分析图,样本分组至少两个,最多5个0默认设置为97%相似度水平下以OTU为单位进行分析作图6.Heatmap图用颜色变化来反映二维矩阵或表格中的数据信息,它可以直观地将数据值的大小以定义的颜色深浅表示出来将高丰度和低丰度的物种分块聚集,通过颜色梯度及相似程度来反映多个样品在各分类水平上群落组成的相似性和差异性I,UII匸*Lrt:;:l—i—7-s=狮itaoffi醉询扁£心新--.-<-.C~wav~¥^Mi*恥P^W#U-ffi8相对丰度比例:热图(图8)中每小格代表其所在样品中某个OTU的相对丰度以图8为例,红框高亮的小格所对应的信息为:样本(R11-1Z)中0丁口(OTU128)的相对丰度比例大概为0.2%丰度比例计算公式(BrayCurtis算法):_円£min(S灿Sr訂其中,SA,i=表示A样品中第i个OTU所含的序列数SB;=表示B样品中第i个OTU所含的序列数样品间聚类关系树:进化树表示在选用成图数据中,样本与样本间序列的进化关系(差异关系)。

处于同一分支内的样品序列进化关系相近物种/OTU丰度相似性树:丰度相似性树表示选用成图的数据中样品与样品中的OTU或序列在丰度上的相似程度丰度最相近的会分配到同一分支上客户自定义分组:根据研究需求对菌群物种/OTU研究样本进行二级分组0二级物种/OTU分组:将下级分类学水平物种或OTU分配到对应的上级分类学水平,以不同颜色区分;0二级样品分组:根据研究需要,对样品进行人为的分组,以不同颜色区分7.主成分分析PCA(PrincipalComponentAnalysis)在多元统计分析中,主成分分析是一种简化数据集的技术主成分分析经常用于减少数据集的维数,同时保持数据集中对方差贡献最大的特征,从而有效地找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构通过分析不同样品的OTU组成可以反映样品间的差异和距离,PCA运用方差分解,将多组数据的差异反映在二维坐标图上,坐标轴为能够最大程度反映方差的两个特征值如样品组成越相似,反映在PCA图中的距离越近ICO11-too-SO0501-00PCI41.1%FCAA»贰L.扁KWPUJL1.0-横轴和纵轴:以百分数的形式体现主成分主要影响程度。

以图9为例,主成分1(PC1)和主成分2(PC2)是造成四组样品(红色,蓝色,黄色和绿色)的两个最大差异特征,贡献率分别为41.1%和27.1%十字交叉线:在图9中作为0点基线存在,起到辅助分析的作用,本身没有意义图例解读:0PCA分析图是基于每个样品中所含有的全部OTU完成的;0图9中每个点代表了一个样本;颜色则代表不同的样品分组;0两点之间在横、纵坐标上的距离,代表了样品受主成分(PC1或PC2)影响下的相似性距离;0样本数量越多,该分析意义越大;反之样本数量过少,会产生个体差异,导致PCA分析成图后形成较大距离的分开,建议多组样品时,每组不少于5个,不分组时样品不少于10个;0图10中的圆圈为聚类分析结果,圆圈内的样品,其相似距离比较接近8. RDA/CCA分析图基于对应分析发展的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析主要用来反映菌群与环境因子之间的关系RDA是基于线性模型,CCA是基于单峰模型分析可以检测环境因子、样品、菌群三者之间的关系或者两两之间的关系ISLO-0.5-gO-0.5斥"岀出*5>甲idfl#rKWIWMd.QTJJWWfr^tKtai^utfta^pwHunA1.5-2.0GCA114.01%图11横轴和纵轴:RDA和CCA分析,模型不同,横纵坐标上的刻度为每个样品或者物种在与环境因子进行回归分析计算时产生的值,可以绘制于二维图形中。

图例解读:0冗余分析可以基于所有样品的OTU作图,也可以基于样品中优势物种作图;0箭头射线:图11中的箭头分别代表不同的环境因子(即图中的碳酸氢根离子HCO3-,醋酸根离子AC-等,图中的其它环境因子因研究不同代表的意义不同,因此不再赘述);0夹角:环境因子之间的夹角为锐角时表示两个环境因子之间呈正相关关系,钝角时呈负相关关系环境因子的射线越长,说明该影响因子的影响程度越大;0图11中不同颜色的点表示不同组别的样品或者同一组别不同时期的样品,图中的拉丁文代表物种名称,可以将关注的优势物种也纳入图中;0环境因子数量要少于样本数量,同时在分析时,需要提供环境因子的数据,比如pH值,测定的温度值等9. 单样品/多样品分类学系统组成树根据NCBI提供的已有微生物物种的分类学信息数据库,将测序得到的物种丰度信息回归至数据库的分类学系统关系树中,从整个分类系统上全面了解样品中所有微生物的进化关系和丰度差异单样品图(图12):可以了解单样品中的序列在各个分类学水平上的分布情况图图例解读:0图12中不同的层次反映不同的分类学水平;0分支处的圆面积说明了分布在该分类学水平,且无法继续往下级水平比对的序列数量,面积越大,说明此类序列越多;0每个分支上的名词后面的两组数字分别表示比对到该分支上的序列数和驻留在该节点上的序列数;0图13中为某单一水平物种分布情况,并非是序列分布。

多样品图(图14):比对多个样品在不同分类学分支上序列数量差异图例解读:0比对不同样品在某分支上的序列数量差异,通过带颜色的饼状图呈现,饼状图的面积越大,说明在分支处的序列数量越多,不同的颜色代表不同的样品0某颜色的扇形面积越大,说明在该分支上,其对应样品的序列数比其他样品多0多样品在做该分析时,建议样品数量控制在10个以内,或者将重复样本数据合并成一个样本后,总样品数在10个以内10. 系统发生进化树在分子进化研究中,基于系统发生的推断来揭示某一分类水平上序列间碱基的差异,进而构建进化树dlCNi3A血忧ufVtrEHiWUK3UatEtZDXS帕g诂jHIWUK3WTAWPW酩恥仏阳fHMUK31/Q?ECOSH;丿血曽打MJ協UtMETGKJ丽客HT^KJUDIBGOQC邑甘咖斎仪叭EMQ佃D砂crJ扫(HKJBrHfWU^U&fERYX^fcMtKCUSHWUK3UQJBSJOGHfWUKJUOlCKQW^事孰Jto肺赋LHMAQ廿軒U6W伽帥励咖札jWWU也廿041WOT口聲ugJA&M_KfWtgU£iJCYKPO^sulk^Jbui_HfWUK3UQ7BfS37Idem曲皿阻y#HIWU料3U星呂KS^B」一血TgKAVWO2畑¥Q^2"I―咖呦加f&ggW。

下载提示
相似文档
正为您匹配相似的精品文档