最全基于CANOCO的生态学数据的多元统计分析

上传人:ali****an 文档编号:118796648 上传时间:2019-12-25 格式:PDF 页数:56 大小:2.85MB
返回 下载 相关 举报
最全基于CANOCO的生态学数据的多元统计分析_第1页
第1页 / 共56页
最全基于CANOCO的生态学数据的多元统计分析_第2页
第2页 / 共56页
最全基于CANOCO的生态学数据的多元统计分析_第3页
第3页 / 共56页
最全基于CANOCO的生态学数据的多元统计分析_第4页
第4页 / 共56页
最全基于CANOCO的生态学数据的多元统计分析_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《最全基于CANOCO的生态学数据的多元统计分析》由会员分享,可在线阅读,更多相关《最全基于CANOCO的生态学数据的多元统计分析(56页珍藏版)》请在金锄头文库上搜索。

1、基于基于 CANOCO 的生态学数据的多元统计分析的生态学数据的多元统计分析 Jan Leps, Petr Smilauer 著 赖江山 编译 1 基于基于 CANOCO 的生态学数据的多元统计分析的生态学数据的多元统计分析 著者: Jan Leps 捷克南波希米亚大学植物学系和捷克科学院昆虫研究所生态学教授 Petr Smilauer 捷克南波希米亚大学多元统计分析讲师 译者:赖江山 中国科学院植物研究所生物多样性与生物安全研究组助理研究员 这本书目的主要在于帮助生态学者分析野外观测数据和实验获得的数据。 本书对于学生 或研究人员处理复杂的生态学问题非常有用, 比如生物群落随环境条件的如何变

2、化, 或是生 物群落在控制实验中的变化。 在简单介绍排序原理之后, 本书的着重介绍约束排序方法 (RDA 和 CCA)和置换统计检验在多元数据中的应用。同时介绍了如何利用分类的方法及现代回归 技术(GLM,GAM,loess)来正确解读排序图。最后,用 CANOCO 软件分析了 7 个难度不 同的研究案例。 这些案例对于大家选择排序方法及分析排序结果很有帮助。 案例的数据均可 以从网络本书的主页(http:/regent.bf.jcu.cz/maed/)上获得。 基于基于 CANOCO 的生态学数据的多元统计分析的生态学数据的多元统计分析 Jan Leps, Petr Smilauer 著 赖

3、江山 编译 2 原书前言原书前言 群落的组成的多维数据,比如种群的属性,或是环境因子的属性,是生态学家研究生涯 的面包与黄油。 这些数据被分析时候需要考虑它们的多维性。 用多元统计的方法来分析群落 数据是比较适合的。 在这本书, 我们尽量使用一套一致的方法来回答生态学家在研究中常遇到的问题。 然而, 我们也经常用自己观点来表述一些内容,同时,我们也关注一些非参数的方法,比如非度量 多维尺度分析(NMDS)的算法等等。我们并不要是强调不同的方法对于分析多元数据的差 异,而是想说明要解决一个问题,可以用很多方法。 在本书主要内容讲排序的方法,但并不意味着分类的方法没有用(译者注:排序与分类密不 可

4、分,分类分析群落的间断分布,排序分析群落的连续分布 ) 。同时,我们也对回归方做了 一些总结,包括最新发展的内容比如广义可加模型(generalized additive models) 。 在这本书的所描述的方法可以广泛被研究植物、 动物和土壤的研究人员利用, 当然也可 以是水生生物方面的人员。由于本书的两位作者的背景,本书的内容偏向植物生态学。 这本手册的材料原先是作为“生态数据多元分析”的课件。我们也希望这本书能用于其 它相关类似的课程,也期望每个学生能够从这本书提高他们的分析数据的能力。 我们希望这本书可以作为 Canoco 4.5 使用手册的简明的补充材料。 Jan Lep 和 Pe

5、tr Smilauer 译者前言译者前言 四年前,我开始接触 CANOCO 软件时候,也是菜鸟一个,自己并不是学统计出身,学 习的过程也非常缓慢。当时也不会想到四年后今天,我居然还能为大家翻译这样一本有关 CANOCO 的书。这个过程,不得不承认普兰塔()的作用,正是为了回答塔友 有关排序和 CANOCO 相关的问题,我不断翻文献、看软件说明书和自己摸索,积累了一点 关于多元统计方法和 CANOCO 软件的一些知识。我相信很多的塔友的排序知识比我丰富, CANOCO 软件用得比我熟练, 但至今不愿 “出山” 写本中文的参考书, 哪怕是翻译一本也行。 没办法,只能由我这个半桶水的家伙来承担此任务

6、。 士兵突击的许三多有口头禅: “俺就是想做有意义的事情” 。我一直觉得,翻译这本 书就是非常有意义的事情, 尽管现在的评价考核体系根本不会考虑我翻译了这本书, 但我还 是很乐意做这个事情。如果有很多 CANOCO 的初学者将从中受益,我也深感欣慰。当然, 我发现每天早上上班和晚上下班前翻译一两段这本书还是一件很惬意的事情, 而在翻译的过 程,我也学到很多的东西。 由于本人非统计科班出身,而且时间比较仓促,翻译过程中可能有不少错误。有些统计 学术语内容也可能斟酌不够,把握不准。因此,希望各个兄弟姐妹发现错误后给直接在博客 里面回复,我会尽快修改。 赖江山 2009/6/25 基于基于 CANO

7、CO 的生态学数据的多元统计分析的生态学数据的多元统计分析 Jan Leps, Petr Smilauer 著 赖江山 编译 3 1导论和数据处理(Introduction and data manipulation) 1.1 为什么排序?(Why ordination?) 当考察植物或动物群落沿着一系列环境条件下的变化情况,我们经常发现在不同条 件的群落不仅物种组成变化很大,而且这些变化往往具有连续性(consistency)和可预 测性(predictability)。例如,我们为了要考察景观尺度上的草地群落的变化,可以通过观 测样方内物种组成变化来描述,我们可以在一、两个或是三个虚拟坐标

8、轴上将这些样方 一个一个进行排列。当我们的目光在虚拟的排序轴上从一个样方移动到下一个相邻的样 方,我们就会发现群落内物种组成变化通常很小。 群落中物种组成渐变跟每个物种对环境条件有着需求不同但又有重叠的生物学性 质息息相关,这些环境因子如土壤平均湿度及随季节的波动变化、物种间竞争养分和光 照能力等等。如果我们原来排列样方的虚拟轴走向恰好能反映某种环境因子的变化规律 (比如土壤湿度或是土壤养分丰富度) ,这些排序轴便可以被称为土壤湿度梯度、养分 梯度等等。这些环境梯度偶尔恰好又能跟实际的景观联系起来,例如土壤湿度梯度与河 岸坡面,经常是沿着坡面从下到上,土壤湿度逐渐降低。但大部分情况下,我们并不

9、能 发现这些轴具体反映什么环境因子,或是反映什么空间变化,因此我们只能称这些轴为 群落组成变化梯度。 生物群落的变化可以用很多统计方法来描述,但我们如果着重考察群落变化的连续 性,所谓的“排序方法”是很好的选择。自从上个世纪五十年代开始,生态学家就开始 用排序的方法分析生态学数据,经过半个世纪的发展,现在已经创制出种类繁多排序技 术。我们利用刚才那个草地群落的例子来说明一下最简单的排序使用。当我们通过样方 调查法来描述群落物种变化规律的时候,把样方数据总结在一个表格里面形成一个物种 -样方矩阵,矩阵的列代表物种,行代表样方。如果用排序的方法分析数据矩阵并在排序 图上表示出来(图 1-1) ,我

10、们可以获得对于这个草地群落相当直观的认识。 排序图的解读规则将在随后的第 10 章进行讨论。但即使现在不知道这些规则,只 要脑子里有群落连续性分布的思想和相似相近的原则(Proximity implies similarity) ,我 们也能从这个图解读出一些信息。在图 1-1 中灰色的圆圈代表样方,我们可以相信如果 两个样方在排序图上挨得越近,它们的物种组成和种间数量比例应该越相似。 在图 1-1 中用三角型代表物种。或许这些物种的生态学特征能够帮我们解读排序轴 所表示的生态学梯度。有几个偏好丰富养分的土壤的物种(如 Urtica dioica, Aegopodium podagraria,

11、 or Filipendula ulmaria)排在图的右边, 另外一些偏好养分匮乏的土壤的物种 排在左边(如(Viola palustris, Carex echinata, or Nardus stricta)。因此,排序图中的水平 轴(第一轴)可以解读为表示土壤养分的梯度,从左到右,养分越丰富。同样的道理, 排序图下面几个物种(如Galium palustre, Scirpus sylvaticus, or Ranunculus repens)比排在 上面的一些物种(如Achillea millefolium, Trisetum flavescens, or Veronica chama

12、edrys)更 喜欢湿生环境。因此,纵轴(第二轴)可以解读为表示土壤的湿度梯度。 同样,或许大家都可以猜到,在排序图上,如果某一物种的越靠近某一个样方,表 示该物种在此样方内个体数量越多。同样,两个物种离一个样方的距离也可以代表它们 在该样方所占比例的差异,离得越近该物种相对数量越多。 上面的例子已经展示了排序方法对于群落分析的最基本的用途。通过排序分析,我 们可以认识群落格局,也可以将排序轴跟我们已知的环境条件联系起来,看是否代表某 一环境梯度。当然,也许我们必须用统计手段来检验排序轴到底是否真能代表环境因子 基于基于 CANOCO 的生态学数据的多元统计分析的生态学数据的多元统计分析 Ja

13、n Leps, Petr Smilauer 著 赖江山 编译 4 的梯度,比如,上面这个例子,我们可以这样问个问题:群落物种组成分布真的是随土 壤湿度的变化,还是仅仅是一个巧合呢?通过约束排序法(constrained ordination methods)可以帮我们回答这样的问题。这些内容通通将要在本书的后半部分介绍。 然而,这本书并没有止步于仅仅用排序的方法来探讨上述这些简单的确定性的分 析。 这本书还介绍了各种类型的回归和方差分析, 包括了固定样点重复观察的数据分析, 空间结构数据分析和各种等级的方差分析。这些方法能够让生态学家探讨更复杂、更现 实的科学问题。另外,这本书不仅是告诉如何分

14、析问题,还手把手教大家怎么做。 图 1.1 草地植被物种组成的 CA 排序图 1.2 专业术语(Terminology) 多元统计分析的专业术语非常复杂。本书内至少有两套不同的术语,一套是很多学 科领域共同使用的、纯粹统计学术语,本书中我们将这部分术语斜体并放在括号里面; 另外一套是群落生态学惯用的多元统计学术语。本书也大部分统计术语基于群落生态 学,偶尔用纯粹统计学术语来表达一些常用的统计学理论。本书中的术语跟 CANOCO 软 件中的术语是一致的。 在群落学分析中,大部分情况是下是基于样方单元(sampling units)观测的原始数 据。每个样方内包含很多物种的数量信息,或是其他属性的

15、信息。原始数据常用矩阵来 表示,一般是一行代表一个样方,一列代表一个属性特征(如物种,水分或土壤的物理 化学特征等等) 生态学原始数据一般由两个部分构成, 一组是响应变量 (response variable), 另外一 组是解释变量(explanatory variables) 。在群落学分析里面,响应变量经常是物种的组成 数据,而解释变量通常是环境因子,比如土壤或水的特征属性等。在一个模型里,我们 要利用解释变量来预测响应变量(群落的组成) 。在排序分析中,解释变量又经常可以 分为两组:一类主环境变量,我们主要关心它们与群落内物种分布的关系;另外一组叫 基于基于 CANOCO 的生态学数据的多元统计分析的生态学数据的多元统计分析 Jan Leps, Petr Smilauer 著 赖江山 编译 5 协环境变量 (在一般统计方法里面也叫协同变量 covariates)。协环境变量与主环境变量 同时对响应应变起作用,因此我们要分析主环境变量效应之前,应先将协环境变量的效 应剔除出来,以便更准确考察主环境变量与物种分布的关系。 举个例子,我们要分析一个特定区域土壤的属性特征和管理模式(刈割或放牧)对 草地群落物种组成的影响。当我们感兴趣的土壤的属性的影响,不关心管理模型的影响 时,物种组成数据作为响应变量

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号