10相关与回归分析概述

上传人:cl****1 文档编号:563780819 上传时间:2023-04-13 格式:DOC 页数:14 大小:404.50KB
返回 下载 相关 举报
10相关与回归分析概述_第1页
第1页 / 共14页
10相关与回归分析概述_第2页
第2页 / 共14页
10相关与回归分析概述_第3页
第3页 / 共14页
10相关与回归分析概述_第4页
第4页 / 共14页
10相关与回归分析概述_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《10相关与回归分析概述》由会员分享,可在线阅读,更多相关《10相关与回归分析概述(14页珍藏版)》请在金锄头文库上搜索。

1、精选优质文档-倾情为你奉上10 相关与回归分析研究两个或多个变量之间的关系时,常常用到相关分析和回归分析。本章介绍在SPSS中进行相关分析和回归分析的计算方法。10.1 双变量相关分析若两变量是计量资料且均服从正态分布,其相关密切程度可用Pearson积差相关系数(简单相关系数)描述,而等级资料或不满足正态性的计量资料相关性研究是使用Spearman和Kendall相关系数。在SPSS中,先对两变量作正态性检验,再选择菜单AnalyzeCorrelate(相关)Bivariate(两两相关),进行相关分析。例10-1 某研究所研究某种代乳粉的营养价值时,用10只大白鼠作试验,得到大白鼠进食量(

2、g)和增加体重(g)的数据如表10-1,试研究进食量与增加体重的相关关系。表10-1 大白鼠进食量与增加体重编号12345678910进食量820780720867690787934679639820增重165158130180134167186145120158解:首先建立配对格式数据文件如图10-1。经检验两变量均服从正态分布;选择菜单AnalyzeCorrelateBivariate,弹出Bivariate Correlations对话框,见图10-2;将左边框中的变量x、y送入Variables框中;单击OK。 图10-1 例10-1数据文件 图10-2 Bivariate Corre

3、lations对话框图10-2对话框中,Correlation Coefficients(相关系数)框中,Pearson:皮尔逊积差相关系数,系统默认;Kendalls tau-b:肯德尔等级相关系数;Spearman:斯皮尔曼等级相关系数。若选择Flag significance Correlations(标记显著性),则用“*”、“*”分别表示P0.01、0.01P0.05。主要结果见图10-3,Pearson相关系数r=0.940、P=0.0000.001,可以认为大白鼠进食量与增加体重呈正向直线相关。 图10-3 例10-1计算结果 图10-4 例10-2计算结果例10-2 测得27岁

4、急性白血病患儿的血小板数x与出血症状y资料如表10-2所示。研究血小板数x与出血症状y之间有无联系。表10-2 血小板数x与出血症状y资料x54270137901650031050426001216074240y解 y是等级资料,将等级、分别用0、1、2、3表示,将表10-2中数据建立成2列12行的数据文件。仿例10-1操作,在图10-2所示Bivariate Correlations对话框中选中Kendalls tau-b和Spearman。运行结果见图10-4。Kendall相关系数0.377、P0.1170.05,Spearman相关系数0.422、P0.1720.05,不能认为27岁急

5、性白血病患儿的血小板数与出血症状之间有直线关系。10.2 偏相关分析多变量相关分析时,有时需要在剔除其它变量影响的情况下,研究两个变量之间的相关关系,这就是偏相关分析。经偏相关分析计算出的相关系数为偏相关系数。偏相关系数在原始数据是随机的多元正态分布时才是有效的,在计算偏相关系数前应该先检验各变量的正态性。偏相关分析不分自变量和因变量。在SPSS中选择菜单Analyze Correlate Partial(偏相关)命令,可以完成偏相关分析的计算。例10-3 10名17岁女生的体重x1(kg)、胸围x2(cm)、胸围的呼吸差x3(cm)、肺活量y(ml)的数据如表10-3所示。试分析y与x1、x

6、2、x3的关系。表10-3 女中学生的数据编号12345678910x135404042374543374442x269746474726878667065x30.72.5231.11.54.323.23y1600260021002650240022002750160027502500解 将表10-3中数据建立成10行4列的数据文件,如图10-5。经检验四个变量均服从正态分布;选择菜单AnalyzeCorrelatePartial(偏相关),弹出Partial Correlations对话框,见图10-6;将计算偏相关系数的变量(y、x3)送入Variables(检验变量)框中、扣除影响的变量

7、(x1、x2)送入Controlling(控制变量)框中;单击Options按钮,选中Zero-order correlations(零阶相关系数),则可以输出简单相关系数,单击Continue;单击OK。 图10-5 例10-3数据文件 图10-6 Partial Correlations对话框图10-7 例10-3计算结果输出结果见图10-7。y与x3的简单相关系数为0.729,在剔除x1、x2影响后,y与x3的偏相关系数是0.321。再选择Partial命令,这次将y、x2送入Variables框,x1、x3送入Controlling框,单击Options按钮,取消Zero-order

8、correlations。可得剔除x1、x3影响后y与x2的偏相关系数为0.558,y与x2的简单相关系数为0.586(见图10-7)。类似计算,剔除x2、x3影响后y与x1的偏相关系数为0.565,y与x1简单相关系数为0.695。在3个简单相关系数中y与x3的最大(0.729),而剔除其它变量的影响后,在3个偏相关系数中y与x3的最小(0.321),y与x1、y与x2的偏相关系数接近(0.565、0.558),说明y与x1、x2的相关关系接近,y与x3的相关关系最不密切。10.3 一元线性回归一元线性回归分析研究一个自变量和一个因变量之间是否存在线性关系以及存在什么样的线性关系,建立一元线

9、性回归方程:。在SPSS中选择菜单AnalyzeRegression(回归)Linear(线性回归)命令可以完成一元线性回归的计算。例10-4 对例10-1中大白鼠的进食量与增加体重进行回归分析。解:数据文件同例10-1。选择菜单AnalyzeRegressionLinear,弹出Linear Regression(线性回归)主对话框,将因变量y送入Dependent(因变量)框中,自变量x送入Independent(s)(自变量)框中,如图10-8所示;单击OK。图10-8 Linear Regression主对话框主要输出结果见图10-9、10、11。图10-9输出回归模型摘要,相关系数r

10、=0.940,决定系数r2=0.883,调整的决定系数r2=0.868,剩余标准差=7.879。图10-10输出回归方程的方差分析,F=60.197,P=0.0000.001,回归方程有高度统计学意义。图10-11输出回归方程的参数估计,回归方程的常数项(Constant)是-17.357,回归方程的斜率(回归系数)是0.222,据此可以写出回归方程:。表中还用t检验对截距和回归系数进行了检验,其中对截距的检验中,t=0.780,P=0.458,不能拒绝“截距为0”的原假设。对回归系数的检验中,t=7.759,P=0.000,拒绝“回归系数为0”的原假设,t=7.759的平方就等于方差分析中的

11、F值,在一元线性回归中,对回归系数的t检验、方差分析以及例10-1中的相关性检验完全等价。表中还给出标准化的回归系数(Standardized Coefficients)为0.940。图10-9 例10-4回归模型摘要图10-10 例10-4回归方程的方差分析图10-11 例10-4回归方程的参数估计图10-8所示Linear Regression主对话框其他选项的说明:单击Statistics按钮,弹出如图10-12所示的线性回归统计量对话框,可以选择输出的统计量。单击Save按钮,弹出如图10-13所示的线性回归保存对话框,可以选择要保存为新变量的统计量。单击Plots按钮,弹出线性回归绘

12、图对话框,可指定绘制残差图、正态概率图等。单击Options按钮,弹出的线性回归选项对话框将在后面的逐步回归中讲解。线性回归:统计量回归系数估计置信区间协方差矩阵模型拟合R2改变描述部分及偏相关共线性诊断继续取消帮助残差Durbin-Watson检验观测诊断异常点超过均数加减3倍标准差全部观测图10-12 线性回归统计对话框线性回归:保存预测值非标准化标准化调整值预测值均数的标准误残差非标准化标准化学生化剔除学生化剔除继续取消帮助距离马氏距离Cook距离杠杆值影响统计量Df标准化DfDf拟合标准化Df拟合协方差比率预测值可信区间均数 个体值置信区间 95%系数统计量创建系数统计量创建为一个新数

13、据集 数据集名保存为一个新数据文件文件输出模型信息到XML文件 浏览图10-13 线性回归保存对话框10.4 多元线性回归多元线性回归分析研究多个自变量和一个因变量之间是否存在线性关系以及存在什么样的线性关系,建立多元线性回归方程:。在SPSS中选择菜单AnalyzeRegressionLinear(线性回归)可以完成多元线性回归的计算。例10-5 对例10-3中体重x1、胸围x2、胸围的呼吸差x3、肺活量y进行回归分析。解:数据文件同例10-3。选择菜单AnalyzeRegressionLinear(线性回归),弹出如图10-8所示的Linear Regression主对话框,将因变量y送入

14、Dependent(因变量)框中,自变量x1、x2、x3均送入Independent(s)(自变量)框中;单击OK。输出结果的格式和例10-4类似。由回归方程的方差分析,F=5.617,P=0.0350.05,拒绝,所以、不全为0,拟合的回归方程有统计学意义。由图10-14知,、的估计值 b0、b1、b2、b3分别为-3035.536、60.932、37.808、101.379,据此可以写出回归方程:。由图10-14中回归系数的t检验,P均0.05,不能否定(i=1、2、3)为0的假设,这与方差分析的结果有出入,所以要对自变量作进一步的筛选(见下一节逐步回归)。图10-14 例10-5回归方程的参数估计10.5 逐步回归多元线性回归方程中,可能有的自变量对因变量的影响很强,而有的影响很弱,甚至完全没有影响,这就需要对自变量进行筛选,尽可能将回归效果显著的自变量选入回归方程,将作用不显著的自变量剔除在外。筛选的方法有:向前法(Forward)、向后法

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号