生 物 统 计 与 实 验 设 计,Biological Statistics And Experimental Designs,2,MEANS过程 单一样本T检验 (One-Sample T Test) 独立样本T检验 (Independent-Sample T Test) 配对样本T检验 (Paired-Sample T Test) 方差分析(One-Way ANOVA),SPSS均值比较与检验,3,算术平均值:,,,方差:,标准差:,,均值标准误:,有关公式(提前说明),4,有关公式,,,峰度:,偏度:,,,,N3,S0,,N2,S0,返回,5,,MEANS过程,一、 Means过程 该过程实际上更倾向于对样本进行描述,可以对需要比较的各组计算描述指标,包括均值、标准差、总和、观测量数、方差等一系列单变量统计量 二、完全窗口分析 按AnalyzeCompare MeansMeans顺序,打开Means主对话框(如图3--1)6,图31 Means主对话框,该框的变量为因变量,即用于分析的变量该框的变量为自变量,必须至少有一个变量,单击此按钮,进入下一层,返回则按Previous按钮。
见图32,,,,,7,Statistics框:供选择的统计量,Statistics for First Layer复选框: Anova table and eta: 进行分组变量的单因方差分析并计算eta 统计量 Test for linearity:产生第一层最后一个变量的R和R2图32 Options 对话框,,,,Cell Statistics框: 选入的描述统计量,默认为均值、样本数、标准差8,三、例题分析 测得某城市12岁儿童的身高及体重信息,用Means过程对其做基本的描述性统计分析9,1、操作步骤,1) 打开数据文件“data03-MEANS_01.sav” 2)按顺序Analyze Compare Means Means打开主对话框 3)单击Option, 打开Options对话框,选择统计项目 4)单击OK完成10,选h sex,按Next,进入layer 2of 2,选age,,,,,,图33 在主对话框选送变量,图34 第二层变量框,11,,选择统计项目,按此 按钮,,复选此2项,第一层次分组选择计算方差分析和线性检验,,图35 Options对话框,12,表31 观测量摘要表(性别和年龄均放第一层),2. 结果及分析,13,分析实例 两个分类变量分别放在两层中,相同年龄的男孩和女孩是否身高有所不同?是否身高随年龄的增长呈线性关系?如果解决这样的问题,只建立一个控制层就不够了。
应该考虑,选择身高h作为因变量,分类变量age作为第一层控制变量,sex为第二层控制变量两个分类变量分别放在两层中,且使用选择项14,对第一层变量的方差分析结果,,,当前表是方差分析表,共6列:第一列方差来源:组间的、组内的、总的方差;第二列为平方和;第三列为自由度;第四列为均方;第五列为F值;第六列为F统计量的显著值15,关联度测度,表36是eta统计量表,统计量表明因变量和自变量之间联系的强度,2是因变量中不同组间差异所解释的方差比,是组间平方和与总平方和之比16,一、 简介 用于检验单个变量的均值与假设检验值(给定的常数)之间是否存在差异 二、完全窗口分析 按AnalyzeCompare MeansOne-Sample T Test顺序,打开One-Sample T Test主对话框(如图3--1),一、单一样本T检验,T检验:,17,图3-6 One-Sample T Test主对话框,图3-7 Options对话框,Test Variables框:用于选取需要分析的变量,Test Value:输入已知的总体均值,默认0,,,Confidence Interval:输入置信区间,一般取90、95、99等。
Missing Values: 在检验变量中含有缺失值的观测将不被计算 在任何一个变量中含有缺失值的观测都将不被计算,,,,,18,三、例题分析 某地区12岁男孩平均身高为142.5cm1973年某市测量120名12岁男孩身高资料,数据编号data08-02假设某市12岁男孩身高与该地区12岁男孩身高平均值相等 1、操作步骤 1)按AnalyzeCompare MeansOne Sample T Test顺序,打开主对话框打开数据文件“data03-MEANS_02.sav”) 2)将变量height选入 Test Variable框 3)在Test Value中输入 142.5,后单击OK19,2、结果分析,表5-9 是12岁男孩的观测量个数、均值、标准差和均值的标准误等统计量表3-9 单个样本统计量,20,表3-10 单个样本检验,从表3-10可看出,t 值为1.032,自由度119,显著值为0.3040.05,无效假设成立样本均值与检验值的差为0.548,该差值95%的置信区间是-0.5041.600均值差值的95置信区间包括0,由此可以得出样本均值与总体均值无显著差异,21,T检验:,,22,有关公式,方差不齐使用公式:,方差齐时使用公式 :,,,,Sc是合并方差 :,,,方差齐性检验:,23,一、 简介 用于检验对于两组来自独立总体的样本,其独立总体的均值或中心位置是否一样。
如果两组样本彼此不独立,应使用配对T检验(Paired -Sample T Test )如果分组不止一个,应使用One-Way ANOVA 过程进行单变量方差分析如果想比较的变量是分类变量,应使用Crosstabs功能 独立样本T检验还要求总体服从正态分布,如果总体明显不服从正态分布,则应使用非参数检验过程(Nonparametric test) 二、完全窗口分析 按AnalyzeCompare MeansIndependent-Sample T Test顺序,打开Independent- Sample T Test主对话框(如图3--10),二、独立样本T检验,24,图510 独立样本T检验主对话框,图511 Define Groups 主对话框,从源变量框中选取要作检验的变量为分组变量,只能有一个分别输入分组变量的取值条件,如1为男,2为女等 输入分界点值,如体重60公斤等25,在检验变量中含有缺失值的观测将不被计算 在任何一个变量中含有缺失值的观测都将不被计算,输入置信区间,一般取90、95、99等图5-9 Independent-Sample T Test的Options对话框,三、例题分析 检验男女雇员现工资是否有显著性差异。
1、操作步骤 1)按AnalyzeCompare Means Independent-Sample T Test顺序,打开主对话框打开数据文件“data03-MEANS_03.sav” 2)将变量Salary选入 Test Variable框 3)在Gender选入Grouping Variable框中作为检验变量 4)打开Define Groups对话框,在Group1输入f, Group2输入m,单击Continue,再单击OK26,2、结果分析,表3-11 是男女职员当前薪水的观测量个数、均值、标准差和均值的标准误等统计量表3-11 分组统计量,27,表3-12 独立样本T检验结果,从表3-12可看出,Equal variances assumed 行是假设方差相等进行的检验,当方差相等时考察这一行的结果;Equal variances not assumed行是假设方差不等进行的检验,当方差不等时考察这一行的结果在Levenes Test for Equality of Variance列中,显著值为 0.000<0.05,可认为方差是不等的,所以应考察第二行的结果可看出,显著值为 0.000<0.05,所以认为均值是不等的。
28,均值差值的95置信区间在-18003.0 -12816.7之间,不包括0,由此可以得出样本均值与总体均值有显著差异 结论:从t检验得p值为0.000<0.05和均值之差值的95置信区间不包括0都能得出,女雇员现工资明显低于男雇员,差异有统计意义 值得注意的是在实际应用中由于存在其他条件,如职务等级、工作经验等,不能得出现平均工资差异是由性别差异造成的结论 根据分析结果得出结论要谨慎!,29,一、 简介 用于检验两个相关的样本是否来自具有相同均值的总体 二、完全窗口分析 1、主对话框 按AnalyzeCompare MeansPaired-Sample T Test顺序,打开Paired -Sample T Test主对话框(如图3--1),三、配对样本T检验,30,从源变量框中选取成对变量移入,所选变量,同图39,图310 Paired-Sample T Test 对话框,,,,31,三、例题分析 某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白鼠按性别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料,一段时期后测定其肝中维生素A含量(mol/L)如下,现在想知道饲料中缺乏维生素E对鼠肝中维生素A含量有无影响。
表3-12 配对样本T检验数据,32,1、操作步骤 1)输入数据并定义变量名:正常饲料组测定值为x1,维生素E缺乏饲料组测定值为x2(数据文件“data03-MEANS_04.sav”) 2)按AnalyzeCompare MeansPaired-Sample T Test 顺序,打开主对话框 3)单击变量x1,再单击x2,将x1,x2送入Variables框 左下方Current Selections框中出现Variable1、 Variable2 4)单击OK 2、输出结果及分析,33,表3-13 配对样本T检验描述统计量,表3-13可看出,变量x1的均数、标准差、标准误分别为34.750、6.649、2.351,变量x2的均数、标准差、标准误分别为26.238、5.821、2.058表3-14 配对样本T检验相关性,表3-14可看出,本例共有8对观测值,相关系数为0.586,相关系数的显著性检验表明显著值为0.12734,表3-15 配对样本T检验结果,表3-16说明变量x1 、x2两两相减的差值均数、标准差、差值均数的标准误差分别为8.513、5.719、2.022,95可信区间为3.731 ,13.292。
配对检验结果表明t为4.21,自由度为7,显著值为0.004,差别具高度显著性意义,即饲料中缺乏维生素E对鼠肝中维生素A含量确有影响35,E N D,。