均值比较与方差分析.ppt

上传人:枫** 文档编号:570191588 上传时间:2024-08-02 格式:PPT 页数:67 大小:2.69MB
返回 下载 相关 举报
均值比较与方差分析.ppt_第1页
第1页 / 共67页
均值比较与方差分析.ppt_第2页
第2页 / 共67页
均值比较与方差分析.ppt_第3页
第3页 / 共67页
均值比较与方差分析.ppt_第4页
第4页 / 共67页
均值比较与方差分析.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《均值比较与方差分析.ppt》由会员分享,可在线阅读,更多相关《均值比较与方差分析.ppt(67页珍藏版)》请在金锄头文库上搜索。

1、2014数学建模培训数学建模培训第第5讲讲 均值比较与方差分析均值比较与方差分析一、一、一、一、SPSSSPSS数据的录入与管理数据的录入与管理数据的录入与管理数据的录入与管理 由由于于建建立立数数据据文文件件是是SPSS分分析析的的基基础础,所所以以本本讲讲首首先先简简要要介介绍绍数数据据的录入与管理。的录入与管理。 SPSS具具有有很很强强的的数数据据处处理理和和分分析析能能力力,它它可可以以读读取取11种种不不同同类类型型的的外外部部文文件件,存存储储30种种不不同同类类型型的的数数据据文件。文件。 利利用用SPSS对对数数据据进进行行分分析析, 首首先先8/2/20244要要建建立立数

2、数据据文文件件。另另外外,有有时时还还需需要要对对已已有有数数据据文文件件进进行行编编辑辑、管管理理,如如变量、属性和文件的管理等。变量、属性和文件的管理等。1. 数据的录入与调用数据的录入与调用 下下面面用用一一个个实实例例介介绍绍建建立立数数据据文文件和录入数据的方法。件和录入数据的方法。 例例1 现现有有15人人的的体体检检资资料料,试试建建立立SPSS数据文件,并存为数据文件,并存为1_1.sav。8/2/20245 体体检检资资料料包包含含的的信信息息有有编编号号、姓姓名名、文文化化程程度度、出出生生日日期期、体体检检日日期期、身高、体重、疾病名称。身高、体重、疾病名称。 在在SPS

3、S中中,录录入入数数据据时时,首首先先要要根根据据数数据据特特征征确确定定变变量量的的名名称称、类类型型(宽度,小数宽度,小数)、标签、值等。、标签、值等。 本例中的变量特征如下:本例中的变量特征如下: 8/2/20246名称名称类型类型宽度宽度小数小数标签标签说明说明编号编号数值数值20校体检校体检姓名姓名字符字符80*8ASCII 4汉汉文化文化数值数值401-6 小学小学-博博士士出生日出生日日期日期100*mm/dd/yyyy体检日体检日日期日期100*普查普查mm/dd/yyyy身高身高数值数值52cm体重体重数值数值42kg疾病疾病数值数值40代码表示疾病代码表示疾病8/2/202

4、47 数据录入过程与方法:数据录入过程与方法: (1) 启启动动SPSS,选选择择“输输入入数数据据”,进入数据编辑器;进入数据编辑器; (2) 选择变量视图;选择变量视图; (3) 依依次次录录入入各各变变量量的的名名称称、类类型型 (宽度宽度, 小数小数)、标签、值;、标签、值; (4) 选择数据视图;选择数据视图; (5) 依次录入相应数据。依次录入相应数据。8/2/20248 保存后即生成保存后即生成.sav文件。文件。 如如果果SPSS需需调用用Excel文文件件,当当数数据据较少少时,可可直直接接复复制制;当当数数据据较多多时,可可通通过: 文文件件打打开开数数据据库新新建建查询E

5、xcel files流流程程调入入Excel 数据。数据。 调入入数数据据后后,可可按按照照前前述述方方式式对其分其分别定定义变量各属性。量各属性。8/2/20249 调调入入Excel数数据据要要特特别别注注意意第第1行行数据的变化。数据的变化。2. 数据的管理数据的管理 数数据据文文件件建建立立后后,有有时时需需要要对对变变量量进进行行管管理理,如如插插入入变变量量、定定义义变变量量属性、复制变量属性等。属性、复制变量属性等。 数数据据管管理理主主要要通通过过“数数据据”菜菜单单进行,请各位自行练习。进行,请各位自行练习。8/2/202410二、均值比较二、均值比较二、均值比较二、均值比较

6、1. 引言引言 在在科科学学实实验验中中常常常常要要研研究究不不同同实实验验条条件件或或方方法法对对实实验验结结果果的的影影响响。比比如如,几几种种不不同同药药物物对对某某种种疾疾病病的的疗疗效效;不同饲料对牲畜体重增长的效果等。不同饲料对牲畜体重增长的效果等。 研研究究上上述述问问题题的的基基本本思思路路是是比比较较不不同同实实验验条条件件或或方方法法下下样样本本均均值值间间的的差异。差异。 8/2/202412 比比较较样样本本均均值值间间的的差差异异是是否否具具有有统统计计学学意意义义的的常常用用方方法法有有均均值值比比较较和和方差分析。方差分析。 均均值值比比较较仅仅用用于于单单因因素

7、素两两水水平平设设计计和和单单组组设设计计中中均均值值的的检检验验,而而方方差差分分析析可可用用于于单单因因素素多多水水平平设设计计和和多多因因素设计中均值的检验。素设计中均值的检验。 简单地说,均值比较仅适用于两简单地说,均值比较仅适用于两8/2/202413个样本均值的比较,而方差分析适用个样本均值的比较,而方差分析适用三个及以上样本均值的比较。三个及以上样本均值的比较。2. 均值比较的原理与步骤均值比较的原理与步骤 均均值值比比较较采采用用假假设设检检验验原原理理,并并设总体均为正态分布设总体均为正态分布,比较步骤为:,比较步骤为:(1) 提出假设提出假设 通常假设差异不显著。通常假设差

8、异不显著。(2) 构造检验统计量构造检验统计量 8/2/202414 总总体体方方差差已已知知时时,构构造造的的统统计计量量服服从从正正态态分分析析,称称为为Z检检验验。大大多多数数情情况况下下,总总体体方方差差未未知知,此此时时构构造造的的统计量服从统计量服从t分布,称为分布,称为t检验检验。(3) 确定显著性水平确定显著性水平(拒真概率拒真概率) 显显著著性性水水平平 即即为为检检验验时时犯犯拒拒真真 错错误误概概率率的的最最大大允允许许值值,也也就就是是说说接接受假设的正确率至少为受假设的正确率至少为 。 8/2/202415 通常取通常取 。(4) 计算检验统计量计算检验统计量t0(5

9、) 作出推断作出推断(两种方法两种方法) 用用统统计计量量若若 , , 则拒绝假设,即差异显著。则拒绝假设,即差异显著。 用用显显著著性性概概率率P值值(sig.)若若显显著著性性概概率率 ,则则拒拒绝绝假设,即差异显著。假设,即差异显著。 8/2/202416 8/2/2024173. 单一样本均值的单一样本均值的t检验检验 单单一一样样本本均均值值的的检检验验,即即只只对对单单一一变变量量的的均均值值进进行行检检验验,用用于于检检验验样样本本均均值值是是否否与与给给定定的的总总体体均均值值之之间间存存在显著差异。在显著差异。 例例1 已已知知某某年年级级15个个学学生生身身高高数数据据如如

10、下下,检检验验其其平平均均身身高高是是否否与与全全年年级平均身高级平均身高165相同。相同。8/2/202418 解解 分分析析-比比较较均均值值-单单样样本本t检检验。验。 选选身身高高入入检检验验变变量量,检检验验值值设设为为165;选选项项中中置置信信区区间间百百分分比比默默认认为为0.95,即,即 。8/2/202419 显显然然,在在0.05水水平平下下应应接接受受假假设设,即即15个个学学生生的的平平均均身身高高与与年年级级平平均均身身高无显著差异。高无显著差异。8/2/2024204. 独立样本均值的独立样本均值的t检验检验 独独立立样样本本均均值值的的检检验验用用于于检检验验两

11、两个个来来自自独独立立正正态态总总体体的的样样本本均均值值之之间间是否存在显著差异。是否存在显著差异。 例例2 根根据据下下列列数数据据比比较较男男生生和和女女生的平均身高是否相等。生的平均身高是否相等。 解解 本题首先要注意数据格式。本题首先要注意数据格式。 可以设置三列数据。第一列为序可以设置三列数据。第一列为序8/2/202421号号(字字符符型型或或数数据据型型),第第二二列列为为身身高高(数数值值型型),第第三三列列为为性性别别(字字符符型型, 字符字符1表示男生,字符表示男生,字符0表示女生表示女生)。 此此时时一一定定要要在在数数据据视视图图的的“值值”中中进进行行值值标标签签定

12、定义义,如如1=“男男生生”, 0= “女生女生”。 分分析析-比比较较均均值值-独独立立样样本本t检检验。验。8/2/202422 选选身身高高入入检检验验变变量量,选选性性别别入入分分组组变变量量,并并在在定定义义组组中中定定义义组组1, 组组2的值分别为的值分别为1, 0。 其余默认,确定。其余默认,确定。8/2/202423 F=0.843, P=0.3750.01,按按0.01水水平平可可认认为为男男女女生生总总体体方方差差相相等等,应应选择方差相等的结果。选择方差相等的结果。 8/2/202424 显显然然,在在0.01水水平平下下应应拒拒绝绝假假设设,即男女生的平均身高有显著差异

13、。即男女生的平均身高有显著差异。8/2/2024255. 配对样本均值的配对样本均值的t检验检验 配配对对样样本本均均值值的的检检验验用用于于检检验验两两个个具具有有配配对对关关系系的的正正态态总总体体的的样样本本均均值值之间是否存在显著差异。之间是否存在显著差异。 配配对对的的两两个个样样本本值值是是一一一一对对应应的的,且且容容量量相相同同。例例如如,一一组组病病人人治治疗疗前前后后身身体体的的指指标标;一一个个年年级级学学生生的的期期中中和期末成绩。和期末成绩。8/2/202426 例例3 根根据据下下列列数数据据比比较较期期中中和和期期末成绩是否相等。末成绩是否相等。 解解 本题数据格

14、式与例本题数据格式与例2不同。不同。 分分析析-比比较较均均值值-配配对对样样本本t检检验。验。 8/2/202427 期中期末成绩高度相关且显著。期中期末成绩高度相关且显著。拒绝假设,期中期末成绩差异明显。拒绝假设,期中期末成绩差异明显。8/2/202428三、方差分析三、方差分析三、方差分析三、方差分析1. 方差分析及基本概念方差分析及基本概念 在在科科学学研研究究中中,经经常常要要分分析析多多种种因因素素对对研研究究对对象象某某些些特特征征值值的的影影响响。例例如如,医医学学界界研研究究几几种种药药物物对对某某种种疾疾病病的的疗疗效效;体体育育科科研研中中研研究究训训练练方方法法训训练练

15、时时间间和和运运动动量量对对提提高高运运动动成成绩绩的的效效果果。方方差差分分析析就就是是研研究究各各种种因因素素对对研究对象某种特征值影响大小的一种研究对象某种特征值影响大小的一种 8/2/202430统计方法。统计方法。 下下面面通通过过一一个个例例子子简简要要介介绍绍方方差差分析中的相关概念。分析中的相关概念。 引引例例 一一家家超超市市要要研研究究竞竞争争者者的的数数量量对对销销售售额额是是否否有有显显著著影影响响。抽抽取取3家家超超市市,竞竞争争者者数数量量按按0个个, 1个个, 2个个, 3个个以以上上分分为为4类类,获获得得的的年年销销售售额额如如下下表表。试试研研究究竞竞争争者

16、者的的数数量量对对销销售额售额8/2/202431是否有显著影响。是否有显著影响。 研研究究对对象象即即试试验验结结果果称称为为试试验验指指标标,简简称称指指标标,常常用用y表表示示,如如本本例例中的销售额。中的销售额。 8/2/202432 在在试试验验中中要要通通过过改改变变状状态态加加以以考考察察的的因因素素称称为为因因子子,常常用用A,B,C,表表示,如本例中的竞争者。示,如本例中的竞争者。 因因子子在在试试验验中中所所取取的的不不同同状状态态称称为为因因子子的的水水平平,常常用用A1, A2, , Ar表表示示, r称称为为因因子子A的的水水平平数数。本本例例中显然有中显然有4个水平

17、。个水平。 从平均销售额来看,好像竞争者从平均销售额来看,好像竞争者8/2/202433个个数数对对销销售售额额有有一一定定影影响响,但但仔仔细细分分析一下数据,问题就不那么简单。析一下数据,问题就不那么简单。 可可以以看看到到,在在竞竞争争者者个个数数相相同同的的条条件件下下,不不同同超超市市的的销销售售额额也也不不完完全全一一样样。由由于于试试验验时时已已考考虑虑超超市市的的其其它它条条件件基基本本相相同同,产产生生这这种种差差异异的的原原因因主主要要是是试试验验过过程程中中各各种种偶偶然然因因素素,称称之为试验误差。之为试验误差。 8/2/202434 因因此此对对不不同同竞竞争争者者个

18、个数数超超市市平平均均销销售售额额的的差差异异应应作作仔仔细细分分析析,以以确确定定差差异异究究竟竟是是由由试试验验误误差差引引起起的的,还还是是由于竞争者个数不同引起的。由于竞争者个数不同引起的。 如如果果差差异异是是由由试试验验误误差差引引起起的的,则则认认为为竞竞争争者者个个数数对对销销售售额额没没有有显显著著影响,简称影响,简称因子不显著因子不显著。 如果不同水平下销售额的不同,如果不同水平下销售额的不同,8/2/202435除除了了误误差差影影响响外外,主主要要是是由由水水平平不不同同造造成成的的,则则认认为为竞竞争争者者个个数数对对销销售售额额有显著影响,简称有显著影响,简称因子显

19、著因子显著。2. 方差分析基本思想方差分析基本思想 方方差差分分析析的的基基本本思思想想是是:假假设设待待比比较较的的均均值值都都相相等等,然然后后将将总总偏偏差差平平方方和和分分解解为为效效应应平平方方和和SA与与误误差差平平方方和和Se两部分,再利用两部分,再利用SA 和和Se 构造构造F 统统8/2/202436计计量量进进行行假假设设检检验验,从从而而判判定定均均值值之之间是否存在差异。间是否存在差异。 由由于于检检验验统统计计量量是是根根据据组组间间方方差差和和组组内内方方差差构构造造的的,所所以以称称此此方方法法为为方差分析。方差分析。3. 单因子方差分析单因子方差分析 单单因因子

20、子方方差差分分析析研研究究一一个个因因子子的的不同水平对指标是否有显著影响。不同水平对指标是否有显著影响。 8/2/202437 单因子方差分析的步骤为:单因子方差分析的步骤为:(1) 提出假设提出假设 通常假设影响不显著。通常假设影响不显著。(2) 构造检验统计量构造检验统计量 方方差差分分析析构构造造的的检检验验统统计计量量服服从从F分布。分布。(3) 确定显著性水平确定显著性水平 显著性水平显著性水平 即为检验时犯错误即为检验时犯错误8/2/202438的的概概率率,也也就就是是说说接接受受假假设设的的正正确确率率为为 。 通常取通常取 。 (4) 计算检验统计量计算检验统计量F0(5)

21、 作出推断作出推断 可以根据下列两种方法推断:可以根据下列两种方法推断: 用用统统计计量量若若 , 则则拒拒绝假设,即影响显著。绝假设,即影响显著。 8/2/202439 用用P值值若若 ,则拒绝假设,即影响显著。则拒绝假设,即影响显著。 显显著著性性水水平平 越越小小,显显著著性性越越高高, ,且有如下规则:且有如下规则: 8/2/2024408/2/202441 例例4 对引例进行方差分析。对引例进行方差分析。 解解 (1) 建建立立数数据据文文件件,格格式式为为:数数据据为为2列列,第第1列列为为因因子子的的水水平平,第第2列为对应的销售额。列为对应的销售额。 (2) 分分析析-比比较较

22、均均值值-单单因因素素ANOVA。 (3) 选选销销售售额额为为因因变变量量,竞竞争争者者为因子。为因子。8/2/202442 (4) 在在对对比比栏栏中中选选择择“多多项项式式(线线性性)”;在在两两两两比比较较栏栏中中选选择择“LSD”, 其它默认其它默认; (5) 在在选选项项中中可可选选择择“方方差差同同质质性检验性检验”和和“均值图均值图”。 8/2/202443 因因子子分分析析要要求求各各水水平平下下总总体体方方差差相等,即方差齐性。相等,即方差齐性。 本本题题中中方方差差齐齐性性检检验验统统计计量量等等于于0.746,P=0.5540.1,通通过过检检验验,即即可认为满足方差齐

23、性。可认为满足方差齐性。8/2/202444 竞争者个数对销售额影响显著。竞争者个数对销售额影响显著。8/2/2024458/2/202446 同同时时比比较较多多个个水水平平间间指指标标差差异异是是否显著称为多重比较。否显著称为多重比较。 表表中中数数据据显显示示,0和和1,0和和3,1和和3,2和和3差差异异不不显显著著,而而0和和2,1和和2差异显著。差异显著。 均均值值图图显显示示了了均均值值的的变变化化趋趋势势,也也从从一一定定程程度度上上验验证证了了多多重重比比较较的的结结论。论。8/2/2024478/2/2024484. 多因子方差分析多因子方差分析 多多因因子子方方差差分分析

24、析研研究究两两个个及及以以上上因素因素是否对指标产生显著影响。是否对指标产生显著影响。 多多因因子子方方差差分分析析不不仅仅能能分分析析多多个个因因素素对对指指标标的的独独立立影影响响,更更能能分分析析多多个个因因素素的的交交互互作作用用能能否否对对指指标标产产生生显显著著影影响响,进进而而找找到到有有利利于于指指标标的的最最优优组合。组合。8/2/202449 下下面面以以两两因因子子为为例例介介绍绍多多因因子子方方差分析。差分析。 在在两两因因子子分分析析中中,不不仅仅要要通通过过试试验验数数据据分分析析因因子子A的的r水水平平及及因因子子B的的s个个水水平平对对指指标标y是是否否有有显显

25、著著影影响响,有有时时还还要要考考虑虑两两个个因因子子联联合合起起来来对对指指标标y是是否否有有显显著著影影响响,这这种种联联合合作作用用称称为因子的交互作用,记为为因子的交互作用,记为AB。8/2/202450 若若一一个个因因子子水水平平下下的的指指标标不不受受另另一一个个因因子子不不同同水水平平的的影影响响,则则称称这这两两个个因因子子无无交交互互作作用用。否否则则,称称这这两两个个因子有交互作用。因子有交互作用。无交互作用无交互作用8/2/202451有交互作用有交互作用 无无交交互互作作用用时时双双因因子子方方差差分分析析的的步骤为:步骤为:(1) 提出假设提出假设 通常假设影响不显

26、著。通常假设影响不显著。8/2/202452(2) 构造检验统计量构造检验统计量 构造的检验统计量服从构造的检验统计量服从F分布。分布。(3) 确定显著性水平确定显著性水平(4) 计算检验统计量计算检验统计量(5) 作出推断作出推断 有有交交互互作作用用时时双双因因子子方方差差分分析析的的步骤为:步骤为:(1) 提出假设提出假设8/2/202453 通常假设影响不显著。通常假设影响不显著。(2) 构造检验统计量构造检验统计量 构造的检验统计量服从构造的检验统计量服从F分布。分布。(3) 确定显著性水平确定显著性水平(4) 计算检验统计量计算检验统计量(5) 作出推断作出推断 若若 ,则则在在

27、水水平平下下因因子子A显著;显著;8/2/202454 若若 ,则则在在 水水平平下下因因子子B显著;显著; 若若 ,则则在在 水水平平下下因因子子AB显著。显著。 例例5 有有4个个品品牌牌的的电电脑脑在在5个个地地区区销销售售,销销售售量量见见下下表表。试试分分析析电电脑脑品品牌和销售地区对销售量的影响。牌和销售地区对销售量的影响。 解解 (1) 建立数据文件,建立数据文件,格式为:格式为:8/2/202455数数据据为为3列列,第第1列列为为销销售售量量,第第2,3列分别为地区和品牌。列分别为地区和品牌。 (2) 分分析析-一一般般线线性性模模型型-单单变变量。量。注:这里的变量是指因变

28、量注:这里的变量是指因变量。 (3) 选选销销售售量量为为因因变变量量,地地区区和和品牌为固定因子。品牌为固定因子。 (4) 模模型型选选项项中中选选“设设定定”,并并将地区和品牌选入模型。将地区和品牌选入模型。8/2/202456 (5) 对比和绘制选项可以默认。对比和绘制选项可以默认。 (6) 在在两两两两比比较较选选项项中中选选地地区区或或品牌进比较框,并选择品牌进比较框,并选择LSD方法。方法。 (7) 在在选选项项栏栏中中可可选选择择输输出出“方方差齐性检验差齐性检验” 。 8/2/202457 有有时时,由由于于数数据据原原因因,SPSS无无法法进进行行方方差差齐齐性性检检验验(如

29、如本本例例)。不不过过,一一般般认认为为,方方差差齐齐性性检检验验不不太太重重要要,只要各组样本数量相等即可。只要各组样本数量相等即可。8/2/202458 地区不显著,而品牌高度显著。地区不显著,而品牌高度显著。8/2/2024598/2/202460 多重比较的解释同前。多重比较的解释同前。 例例5中中并并未未考考虑虑交交互互作作用用。若若要要考考虑虑交交互互作作用用,则则应应选选择择全全因因子子分分析析模模型型,但但并并不不是是任任何何数数据据都都可可以以进进行行全因子分析,如例全因子分析,如例5。 下下面面用用例例6说说明明如如何何进进行行交交互互作作用分析。用分析。 例例6 将超市位

30、置按商业区、居民将超市位置按商业区、居民8/2/202461区区和和写写字字楼楼分分成成3类类,并并在在不不同同位位置置分分别别随随机机抽抽取取3家家超超市市,竞竞争争者者数数量量按按0个个, 1个个, 2个个, 3个个分分为为4类类。试试分分析竞争者和超市位置对销售额的影响。析竞争者和超市位置对销售额的影响。 解解 在在模模型型选选项项中中默默认认全全因因子子, 在在绘绘制制选选项项中中选选竞竞争争者者数数量量为为水水平平轴轴,选超市位置为单图,然后添加。选超市位置为单图,然后添加。8/2/202462 本本题题中中方方差差齐齐性性检检验验统统计计量量等等于于1.282,P=0.2920.1,通通过过检检验验,即即可认为满足方差齐性。可认为满足方差齐性。8/2/202463 8/2/202464 竞竞争争者者数数量量和和超超市市位位置置与与销销售售额额高高度度显显著著,但但两两者者的的交交互互作作用用与与销销售售额一般显著。额一般显著。8/2/2024658/2/202466 从从竞竞争争者者数数量量和和超超市市位位置置交交互互影影响响折折线线图图即即轮轮廓廓图图中中可可以以看看出出,竞竞争争者者数数量量和和超超市市位位置置的的交交互互作作用用对对销销售售额有一定的影响。额有一定的影响。8/2/202467

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号