第五讲_双变量相关分析

上传人:飞*** 文档编号:51716436 上传时间:2018-08-16 格式:PPT 页数:84 大小:724.50KB
返回 下载 相关 举报
第五讲_双变量相关分析_第1页
第1页 / 共84页
第五讲_双变量相关分析_第2页
第2页 / 共84页
第五讲_双变量相关分析_第3页
第3页 / 共84页
第五讲_双变量相关分析_第4页
第4页 / 共84页
第五讲_双变量相关分析_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《第五讲_双变量相关分析》由会员分享,可在线阅读,更多相关《第五讲_双变量相关分析(84页珍藏版)》请在金锄头文库上搜索。

1、第五讲 双变量关系统计双变量关系统计相关分析与检验双变量关系的统计类型双变量关系强度测量的主要指标第一节 平均值分析 MEANS过程单一样本T检验 (One-Sample T Test)独立样本T检验 (Independent-Sample T Test)配对样本T检验 (Paired-Sample T Test)方差分析(One-Way ANOVA)MEANS过程一、 Means过程该过程实际上更倾向于对样本进行描述,可 以对需要比较的各组计算描述指标,包括均 值、标准差、总和、观测量数、方差等一系 列单变量统计量。 二、完全窗口分析按AnalyzeCompare MeansMeans顺序,

2、 打开Means主对话框(如图5-1)。图51 Means主对话框该框的变量为因变量,即用于分析的变量。该框的变量为自 变量,必须至少 有一个变量单击此按钮, 进入下一层, 返回则按 Previous按钮 。见图52Statistics框:供选择的统计量Statistics for First Layer复选框: Anova table and eta: 进行分组变量的 单因方差分析并计 算eta 统计量。 Test for linearity:产 生第一层最后一个 变量的R和R2。 图52 Options 对话框Cell Statistics框:选入的描述统计 量,默认为均值 、样本数、标准

3、 差三、例题分析某医生测得如下血红蛋白值(g%),用 Means过程对其做基本的描述性统计分析。表5-1血红蛋白值(g%)编编号性 别别年 龄龄血红红蛋 白值值编编 号性 别别年 龄龄血红红蛋 白值值编编 号性 别别年 龄龄血红红蛋 白值值 111813.661511610.88291167.88 211810.57161189.653011812.35 311612.56172168.363111613.6542179.871811811.66322169.87 52178.99192188.543321810.09 621711.35202177.783421812.55 711714.5

4、62121611.363511816.04 811612.402211612.783611813.78 92168.052311815.093711711.67 1011814.03242188.673811710.98 1121812.83252178.56392168.78 1211615.502621812.564011611.35 1321812.252721711.56 1421710.062811614.671、操作步骤 1) 打开数据文件“Means过程.sav” 。 2)按顺序Analyze Compare Means Means打开主对话框。 3)单击Option, 打开Op

5、tions对话框,选择统 计项目。 4)单击OK完成。选hb sex按Next,进入 layer 2of 2, 选age图53 在主对话框选送变量图54 第二层变量框选 择 统 计 项 目按此 按钮复选此2 项,第一 层次分 组选择 计算方 差分析 和线性 检验 图55 Options对话框表51 观测量摘要表表51 是观测量摘要表,观测量总 个数为40,其中有效值为40个、无效值0 。2. 结果及分析表52 分组描述统计量表52 分三部分:第一、二部分先按性 别分组,再按年龄分组计算观测值合计、均 数、标准差、方差和个数;第三部分只按年 龄分组,最后一行为合计。表54 按年龄分组的描述统计量

6、表53 按性别分组的描述性统计量血红蛋白* 性别血红蛋白* 年龄表53、4是将sex和age一起放在layer 1of 1中,分别 计算男、女(不作年龄分组)。年龄分三组(不作性别 分组)的观测值合计、均数、标准差、方差和个数。表55 方差分析表表55是方差分析表,共6列:第一列方 差来源:组间的、组内的、总的方差;第二 列为平方和;第三列为自由度;第四列为均 方;第五列为F值;第六列为F统计量的显 著值,显著值小于0.05,所以性别对血红蛋白 值有显著影响。表56 eta统计量表56是eta统计量表,统计量表明因变 量和自变量之间联系的强度,0.567的值处 于中等水平,2是因变量中不同组间

7、差异所 解释的方差比,是组间平方和与总平方和之 比,即由64.5256除以 200.787得到。表57 按年龄分组的方差分析表表57是将年龄作为第一层自变量得到 的方差分析表,Linearity是假设因变量均值 是第一层自变量值的线性函数,Deviation from Linearity是不能由线性模型解释的部分 。表58 按年龄分组的eta统计量表58是将年龄作为第一层自变量得到的eta 统计量表,R和R2测度线性拟合的良好度, R是观测值与预测值之间的相关系数。一、 简介用于检验单个变量的均值与假设检 验值(给定的常数)之间是否存在差异。二、完全窗口分析按AnalyzeCompare Me

8、ansOne- Sample T Test顺序,打开One-Sample T Test主对话框(如图5-6)一、单一样本T检验图5-6 One-Sample T Test主对话框图5-7 Options对话框Test Variables 框:用于 选取需要 分析的变 量Test Value: 输入已知的 总体均值, 默认0Confidence Interval:输 入置信区间 ,一般取90 、95、99等 。Missing Values: 在检验变量中含 有缺失值的观测将 不被计算。 在任何一个变量 中含有缺失值的观 测都将不被计算三、例题分析仍以表5-1的资料来说明。已知另一地区16 -18

9、岁的少年血红蛋白平均值为11.657g%, 检验这一地区16-18岁少年血红蛋白值是否 与另一地区的平均值相等。 1、操作步骤1)按AnalyzeCompare MeansOne Sample T Test顺序,打开主对话框。(打开数 据文件“Means过程.sav”。)2)将变量hb选入 Test Variable框。3)在Test Value中输入 11.657,后单击OK 。2、结果分析 表5-9 单个样本统计量表5-9 是血红蛋白值的观测量个数、均值 、标准差和均值的标准误等统计量。表5-10 单个样本检验从表5-10可看出,t 值为-0.592,自由度39,显 著值为0.558,样本

10、均值与检验值的差为-0.2122, 该差值95%的置信区间是0.93790.5134。 一、 简介用于检验对于两组来自独立总体的样本,其独立总体的均值或中 心位置是否一样。如果两组样本彼此不独立,应使用配对T检验( Paired -Sample T Test )。如果分组不止一个,应使用One-Way ANOVA 过程进行单变量方差分析。如果想比较的变量是分类变量 ,应使用Crosstabs功能。独立样本T检验还要求总体服从正态分布,如果总体明显不服从正 态分布,则应使用非参数检验过程(Nonparametric test)二、完全窗口分析按AnalyzeCompare MeansIndepe

11、ndent-Sample T Test顺序 ,打开Independent- Sample T Test主对话框(如图5-10)二、独立样本T检验图510 独立样本T检验主对话框图511 Define Groups 主对话框从源变量框中选取 要作检验的变量。为分组变量, 只能有一个。分别输入分组变量的取值条 件,如1为男,2为女等。 输入分界点值,如体重60公 斤等。在检验变量中含有缺 失值的观测将不被计算 。 在任何一个变量中含 有缺失值的观测都将不 被计算输入置信区 间,一般取 90、95、99 等。图5-9 Independent-Sample T Test的Options对话框三、例题分

12、析仍以表5-1的资料来说明。 1、操作步骤1)按AnalyzeCompare Means Independent-Sample T Test 顺序,打开主对话框。打开数据文件“Means过程.sav”。2)将变量hb选入 Test Variable框。3)在sex选入Grouping Variable框中作为检验变量。4)打开Define Groups对话框,在Group1输入1, Group2输 入2,单击Continue,再单击OK。2、结果分析表5-11 是血红蛋白值的观测量个数、均值、标准差和均 值的标准误等统计量。表5-11 分组统计量表5-12 独立样本T检验结果从表5-12可看出

13、,Equal variances assumed 行是假设方 差相等进行的检验,当方差相等时考察这一行的结果; Equal variances not assumed行是假设方差不等进行的检验 ,当方差不等时考察这一行的结果。在Levenes Test for Equality of Variance列中,显著值为 0.5440.05,可认为方 差是相等的,所以应考察第一行的结果。可看出,显著值 为 0.0000.05,所以认为均值是不等的。 一、 简介用于检验两个相关的样本是否来自具有相同均值的总体。二、完全窗口分析1、主对话框按AnalyzeCompare MeansPaired-Samp

14、le T Test顺序, 打开Paired -Sample T Test主对话框(如图5-10)三、配对样本T检验从源变量框中选 取成对变量移入 。所选变量 。同图59图510 Paired-Sample T Test 对话框 三、例题分析某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白 鼠按性别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生 素E缺乏饲料,一段时期后测定其肝中维生素A含量(mol/L)如下,现 在想知道饲料中缺乏维生素E对鼠肝中维生素A含量有无影响。大白鼠配对编 号肝中维生素A含量(mol/L)正常饲料组维生素E缺乏组 137.225.7 220.925

15、.1 331.418.8 441.433.5 539.834.0 639.328.3 736.126.2 831.918.3表5-12 配对样本T检验数据1、操作步骤1)输入数据并定义变量名:正常饲料组测定值为x1, 维生素E缺乏饲料组测定值为x2(数据文件“饲料(配对T 检验).sav”。)2)按AnalyzeCompare MeansPaired-Sample T Test 顺序,打开主对话框。3)单击变量x1,再单击x2,将x1,x2送入Variables框 。左下方Current Selections框中出现Variable1、 Variable24)单击OK。2、输出结果及分析表5-

16、13 配对样本T检验描述统计量表5-13可看出,变量x1的均数、标准差、标准误分别为34.750、 6.649、2.351,变量x2的均数、标准差、标准误分别为26.238、5.821、 2.058。表5-14 配对样本T检验相关性表5-14可看出,本例共有8对观测值,相关系数为0.586,相关系数 的显著性检验表明显著值为0.127。表5-15 配对样本T检验结果表5-15说明变量x1 、x2两两相减的差值均数、标准差 、差值均数的标准误差分别为8.513、5.719、2.022,95可 信区间为3.731 ,13.292。配对检验结果表明t为4.21,自由 度为7,显著值为0.004,差别具高度显著性意义,即饲料中 缺乏维生素E对鼠肝中维生素A含量确有影响。第二节 列联相关一、列联分析的基本原理自变量发生变化,因变量取值是否也发 生变化。比较边缘百分比和条件百分比的差别。二、列

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号