第7章-回归分析(压缩)

上传人:桔**** 文档编号:567916506 上传时间:2024-07-22 格式:PPT 页数:62 大小:1.55MB
返回 下载 相关 举报
第7章-回归分析(压缩)_第1页
第1页 / 共62页
第7章-回归分析(压缩)_第2页
第2页 / 共62页
第7章-回归分析(压缩)_第3页
第3页 / 共62页
第7章-回归分析(压缩)_第4页
第4页 / 共62页
第7章-回归分析(压缩)_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《第7章-回归分析(压缩)》由会员分享,可在线阅读,更多相关《第7章-回归分析(压缩)(62页珍藏版)》请在金锄头文库上搜索。

1、SPSS 16实用教程第第7章章 回归分析回归分析2021/6/71回归分析基本概念回归分析基本概念7.1一元线性回归分析一元线性回归分析7.2多元线性回归分析多元线性回归分析7.3非线性回归分析非线性回归分析7.42021/6/727.1 7.1 回归分析基本概念回归分析基本概念 相关分析和回归分析都是研究变量间关系相关分析和回归分析都是研究变量间关系的统计学课题。在应用中,两种分析方法经常的统计学课题。在应用中,两种分析方法经常相互结合和渗透,但它们研究的侧重点和应用相互结合和渗透,但它们研究的侧重点和应用面不同。面不同。 在回归分析中,变量在回归分析中,变量y y称为称为因变量因变量,处

2、,处于于被解释被解释的特殊地位;而在相关分析中,变量的特殊地位;而在相关分析中,变量y y与变量与变量x x处于处于平等的地位平等的地位,研究变量,研究变量y y与变量与变量x x的密切程度和研究变量的密切程度和研究变量x x与变量与变量y y的密切程度是的密切程度是一样的。一样的。2021/6/73 在回归分析中,因变量在回归分析中,因变量y y是随机变量,是随机变量,自变量自变量x x可以是随机变量,可以是随机变量,也可以是非随机的也可以是非随机的确定变量确定变量;而在相关分析中,变量;而在相关分析中,变量x x和变量和变量y y都都是随机变量。是随机变量。 相关分析是测定变量之间的关系密

3、切程相关分析是测定变量之间的关系密切程度,所使用的工具是相关系数;而回归分析则度,所使用的工具是相关系数;而回归分析则是侧重于考察变量之间的是侧重于考察变量之间的数量变化规律数量变化规律,并通,并通过一定的数学表达式来描述变量之间的关系,过一定的数学表达式来描述变量之间的关系,进而确定一个或者几个变量的变化对另一个特进而确定一个或者几个变量的变化对另一个特定变量的定变量的影响程度影响程度。2021/6/74 具体地说,回归分析主要解决以下几方面具体地说,回归分析主要解决以下几方面的问题。的问题。 通过分析大量的样本数据,确定变量之通过分析大量的样本数据,确定变量之间的间的数学关系式数学关系式。

4、 对所确定的数学关系式的可信程度进行对所确定的数学关系式的可信程度进行各种各种统计检验统计检验,并区分出对某一特定变量影响,并区分出对某一特定变量影响较为较为显著显著的变量和影响的变量和影响不显著不显著的变量。的变量。 利用所确定的数学关系式,根据一个或利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变量的几个变量的值来预测或控制另一个特定变量的取值,并给出这种预测或控制的取值,并给出这种预测或控制的精确度精确度。 2021/6/75 在实际中,根据变量的个数、变量的类型在实际中,根据变量的个数、变量的类型以及变量之间的相关关系,回归分析通常分为以及变量之间的相关关系,回归

5、分析通常分为一元线性回归分析、多元线性回归分析、非线一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、性回归分析、曲线估计、时间序列的曲线估计、时间序列的曲线估计、含虚拟自变量的回归分析和逻辑回归分析等类含虚拟自变量的回归分析和逻辑回归分析等类型。型。2021/6/767.2 7.2 一元线性回归分析一元线性回归分析7.2.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:一元线性回归分析是在排除其他影定义:一元线性回归分析是在排除其他影响因素或假定其他影响因素确定的条件下,分响因素或假定其他影响因素确定的条件下,分析某一个因素(自变量)是如何影响另一事物析某一个因素(自

6、变量)是如何影响另一事物(因变量)的过程,所进行的分析是比较理想(因变量)的过程,所进行的分析是比较理想化的。其实,在现实社会生活中,任何一个事化的。其实,在现实社会生活中,任何一个事物(因变量)总是受到其他多种事物(多个自物(因变量)总是受到其他多种事物(多个自变量)的影响。变量)的影响。2021/6/772021/6/78 通过样本数据建立一个回归方程后,不能通过样本数据建立一个回归方程后,不能立即就用于对某个实际问题的预测。必须对其立即就用于对某个实际问题的预测。必须对其作各种统计检验。一般经常作以下的统计检验。作各种统计检验。一般经常作以下的统计检验。 2021/6/79 (1 1)拟

7、合优度检验)拟合优度检验 回归方程的拟合优度检验就是要检验样本回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度,从数据聚集在样本回归直线周围的密集程度,从而判断回归方程对样本数据的代表程度。而判断回归方程对样本数据的代表程度。 回归方程的拟合优度检验一般用判定系数回归方程的拟合优度检验一般用判定系数R R2 2实现。该指标是建立在对总离差平方和进行实现。该指标是建立在对总离差平方和进行分解的基础之上。分解的基础之上。 2021/6/710 (2 2)回归方程的显著性检验()回归方程的显著性检验(F F检验)检验) 回归方程的显著性检验是对因变量与所有回归方程的显著性检验

8、是对因变量与所有自变量之间的线性关系是否显著的一种假设检自变量之间的线性关系是否显著的一种假设检验。验。回归方程的显著性检验一般采用回归方程的显著性检验一般采用F F检验,利用检验,利用方差分析的方法进行。方差分析的方法进行。 2021/6/711 (3 3)回归系数的显著性检验()回归系数的显著性检验(t t检验)检验) 所谓回归系数的显著性检验,就是根据样所谓回归系数的显著性检验,就是根据样本估计的结果对总体回归系数的有关假设进行本估计的结果对总体回归系数的有关假设进行检验。检验。 2021/6/712 研究问题研究问题 合成纤维的强度与其拉伸倍数有关,测得合成纤维的强度与其拉伸倍数有关,

9、测得试验数据如表试验数据如表7-17-1所示。求合成纤维的强度与所示。求合成纤维的强度与拉伸倍数之间是否存在显著的线性相关关系。拉伸倍数之间是否存在显著的线性相关关系。7.2.2 SPSS中实现过程中实现过程2021/6/713表表表表7-17-1强度与拉伸倍数的试验数据强度与拉伸倍数的试验数据强度与拉伸倍数的试验数据强度与拉伸倍数的试验数据序序 号号拉拉 伸伸 倍倍 数数强度(强度(kg/mm2)12.01.622.52.432.72.543.52.754.03.564.54.275.25.086.36.497.16.5108.07.3119.08.01210.08.12021/6/714

10、实现步骤实现步骤图图图图7-1 7-1 在菜单中选择在菜单中选择在菜单中选择在菜单中选择“ “Linear”Linear”命令命令命令命令2021/6/715图图图图7-2 “Linear Regression”7-2 “Linear Regression”对话框(一)对话框(一)对话框(一)对话框(一)2021/6/716图图图图7-3 “Linear Regression7-3 “Linear Regression:Statistics”Statistics”对话框对话框对话框对话框2021/6/717 图图图图7-4 “Linear Regression7-4 “Linear Regre

11、ssion:Plots”Plots”对话框对话框对话框对话框 2021/6/718图图图图7-5 “Linear Regression7-5 “Linear Regression:Save”Save”对话框对话框对话框对话框 2021/6/719图图图图7-6 “Linear Regression7-6 “Linear Regression:Options”Options”对话框对话框对话框对话框 2021/6/720 (1 1)输出结果文件中的第一个表格如下)输出结果文件中的第一个表格如下表所示。表所示。 7.2.3 结果和讨论结果和讨论2021/6/721 (2 2)输出的结果文件中第二个

12、表格如下)输出的结果文件中第二个表格如下表所示。表所示。2021/6/722 (3 3)输出的结果文件中第三个表格如下)输出的结果文件中第三个表格如下表所示。表所示。 2021/6/723 (4 4)输出的结果文件中第四个表格如下)输出的结果文件中第四个表格如下表所示。表所示。2021/6/7247.3 7.3 多元线性回归分析多元线性回归分析7.3.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:在上一节中讨论的回归问题只涉及定义:在上一节中讨论的回归问题只涉及了一个自变量,但在实际问题中,影响因变量了一个自变量,但在实际问题中,影响因变量的因素往往有多个。例如,商品的需求除了受

13、的因素往往有多个。例如,商品的需求除了受自身价格的影响外,还要受到消费者收入、其自身价格的影响外,还要受到消费者收入、其他商品的价格、消费者偏好等因素的影响;影他商品的价格、消费者偏好等因素的影响;影响水果产量的外界因素有平均气温、平均日照响水果产量的外界因素有平均气温、平均日照时数、平均湿度等。时数、平均湿度等。2021/6/725 因此,在许多场合,仅仅考虑单个变量是因此,在许多场合,仅仅考虑单个变量是不够的,还需要就一个因变量与多个自变量的不够的,还需要就一个因变量与多个自变量的联系来进行考察,才能获得比较满意的结果。联系来进行考察,才能获得比较满意的结果。这就产生了测定多因素之间相关关

14、系的问题。这就产生了测定多因素之间相关关系的问题。2021/6/726 研究在线性相关条件下,两个或两个以上研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。多元线性回归模式,称为多元线性回归模型。多元线性回归模型是一元线性回归模型的扩展,其基本原理与型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上更为复一元线性回归模型类似,只是在计算上更为复杂,一般需借助计算机来完成。杂,一般需借助计算机来完成。

15、 2021/6/727 研究问题研究问题 用多元回归分析来分析用多元回归分析来分析3636个员工多个心理个员工多个心理变量值(变量值(z1z1z8z8)对员工满意度)对员工满意度mymy的预测效果,的预测效果,测得试验数据如表测得试验数据如表7-27-2所示。所示。7.3.2 SPSS中实现过程中实现过程2021/6/728表表表表7-27-2员工多个心理变量值和员工满意度数据员工多个心理变量值和员工满意度数据员工多个心理变量值和员工满意度数据员工多个心理变量值和员工满意度数据z1z2z3z4z5z6z7Z8满满 意意 度度66.0064.0062.0050.0058.0056.001.081

16、.0025.0055.0050.0059.0059.0053.0051.001.001.1122.0050.0047.0049.0045.0046.0046.001.311.2020.0055.0059.0050.0054.0052.0069.001.001.0020.0055.0059.0048.0056.0047.0050.001.001.0024.0062.0054.0068.0046.0046.0051.001.081.0023.0060.0060.0056.0053.0052.0051.001.081.0021.0052.0052.0069.0058.0057.0062.001.00

17、1.0023.0056.0055.0057.0039.0044.0046.001.691.0015.0050.0050.0068.0046.0045.0056.001.081.1425.0058.0054.0060.0059.0052.0051.001.001.0025.0053.0052.0055.0057.0065.0064.001.081.0022.0052.0056.0053.0057.0063.0051.001.461.4320.0056.0065.0052.0051.0062.0047.001.001.0022.0050.0063.0059.0053.0055.0048.001.0

18、01.0020.0063.0057.0060.0066.0051.0056.001.001.0026.0056.0046.0058.0050.0045.0052.002.231.2921.0047.0050.0057.0049.0050.0048.002.081.1420.0053.0066.0053.0059.0055.0045.001.001.0025.002021/6/729z1z2z3z4z5z6z7z8满满 意意 度度61.0055.0058.0061.0058.0061.001.151.1423.0059.0064.0060.0052.0054.0056.001.081.0026.

19、0055.0060.0072.0060.0055.0067.001.081.0026.0056.0052.0068.0040.0051.0055.001.851.7130.0059.0051.0061.0056.0052.0056.001.001.0025.0060.0053.0062.0055.0047.0063.001.311.1427.0052.0051.0057.0045.0055.0059.001.231.1420.0056.0057.0057.0052.0059.0055.001.001.1426.0068.0058.0071.0068.0053.0061.001.001.0030

20、.0060.0053.0061.0060.0056.0051.001.001.0027.0064.0056.0074.0050.0059.0057.001.851.1418.0067.0053.0060.0053.0053.0051.001.001.0024.0056.0056.0067.0067.0056.0052.001.001.0024.0053.0046.0049.0043.0050.0048.001.311.1419.0053.0057.0065.0052.0067.0059.001.771.4317.0060.0040.0071.0057.0056.0058.001.081.002

21、4.0054.0045.0044.0049.0042.0046.001.001.0023.002021/6/730 实现步骤实现步骤图图图图7-7 “Linear Regression”7-7 “Linear Regression”对话框(二)对话框(二)对话框(二)对话框(二)2021/6/731 (1 1)输出结果文件中的第一个表格如下)输出结果文件中的第一个表格如下表所示。表所示。7.3.3 结果和讨论结果和讨论2021/6/732 2 2)输出的结果文件中第二个表格如下表)输出的结果文件中第二个表格如下表所示。所示。2021/6/733 (3 3)输出的结果文件中第三个表格如下)输出的

22、结果文件中第三个表格如下表所示。表所示。2021/6/734 (4 4)输出的结果文件中第四个表格如下)输出的结果文件中第四个表格如下表所示。表所示。2021/6/735 (5 5)输出的结果文件中第五个表格如下)输出的结果文件中第五个表格如下表所示。表所示。2021/6/736 (6 6)输出的结果文件中第六个表格为回)输出的结果文件中第六个表格为回归系数分析,如下表所示归系数分析,如下表所示 2021/6/737 (7 7)输出的结果文件中第七个表格如下)输出的结果文件中第七个表格如下表所示。表所示。2021/6/738 (8 8)输出的结果文件中第八部分为图形,)输出的结果文件中第八部分

23、为图形,为回归因变量和每个自变量之间的关系点图。为回归因变量和每个自变量之间的关系点图。图图7-87-8为自变量为自变量z1z1和和mymy之间的关系点图。之间的关系点图。2021/6/7397.4.1 统计学上的定义和计算公式统计学上的定义和计算公式7.4 7.4 非线性回归分析非线性回归分析 定义:研究在非线性相关条件下,自变量定义:研究在非线性相关条件下,自变量对因变量的数量变化关系,称为非线性回归分对因变量的数量变化关系,称为非线性回归分析。析。 在实际问题中,变量之间的相关关系往往在实际问题中,变量之间的相关关系往往不是线性的,而是非线性的,因而不能用线性不是线性的,而是非线性的,因

24、而不能用线性回归方程来描述它们之间的相关关系,而要采回归方程来描述它们之间的相关关系,而要采用适当的非线性回归分析。用适当的非线性回归分析。2021/6/740 非线性回归问题大多数可以化为线性回归非线性回归问题大多数可以化为线性回归问题来求解,也就是通过对非线性回归模型进问题来求解,也就是通过对非线性回归模型进行适当的变量变换,使其化为线性模型来求解。行适当的变量变换,使其化为线性模型来求解。一般步骤为:一般步骤为:2021/6/741 根据经验或者绘制散点图,选择适当的根据经验或者绘制散点图,选择适当的非线性回归方程;非线性回归方程; 通过变量置换,把非线性回归方程化为通过变量置换,把非线

25、性回归方程化为线性回归;线性回归; 用线性回归分析中采用的方法来确定各用线性回归分析中采用的方法来确定各回归系数的值;回归系数的值; 对各系数进行显著性检验。对各系数进行显著性检验。2021/6/742 计算公式如下。计算公式如下。 在本节中介绍几种常见的非线性回归模型,在本节中介绍几种常见的非线性回归模型,并分别给出其线性化方法及图形。并分别给出其线性化方法及图形。 2021/6/7432021/6/7442021/6/7452021/6/7462021/6/7472021/6/7482021/6/7492021/6/7502021/6/751 研究问题研究问题 研究民用汽车总量与国内生产总

26、值的关系。研究民用汽车总量与国内生产总值的关系。数据如表数据如表7-37-3所示。(资料来源:所示。(资料来源:中国统计中国统计年鉴年鉴20072007,中国统计出版社,中国统计出版社,20072007年)年)7.4.2 SPSS中实现过程中实现过程2021/6/752 实现步骤实现步骤图图图图7-9 “Simple Scatterplot”7-9 “Simple Scatterplot”对话框对话框对话框对话框2021/6/753图图图图7-10 7-10 散点图散点图散点图散点图2021/6/754图图图图7-11 “Curve Estimation”7-11 “Curve Estimat

27、ion”对话框(一)对话框(一)对话框(一)对话框(一)2021/6/7557.4.3 结果和讨论结果和讨论 (1 1)第一部分输出相关统计量和参数的)第一部分输出相关统计量和参数的值,如下表所示。值,如下表所示。2021/6/756 (2 2)第二部分输出的是观察值和)第二部分输出的是观察值和CubicCubic,PowerPower两种曲线预测值的对比图,如图两种曲线预测值的对比图,如图7-127-12所所示。示。2021/6/757小小 结结 回归分析是研究变量与变量之间联系的最回归分析是研究变量与变量之间联系的最为广泛的模型。在实际中,根据变量的个数、为广泛的模型。在实际中,根据变量的

28、个数、类型,以及变量之间的相关关系。类型,以及变量之间的相关关系。2021/6/758小小 结结 一元线性回归只涉及一个自变量的回归问一元线性回归只涉及一个自变量的回归问题;多元线性回归用于解决两个或两个以上自题;多元线性回归用于解决两个或两个以上自变量对一个因变量的数量变化关系问题;非线变量对一个因变量的数量变化关系问题;非线性回归主要解决在非线性相关条件下,自变量性回归主要解决在非线性相关条件下,自变量对因变量的数量变化关系。对因变量的数量变化关系。2021/6/759小小 结结 SPSS SPSS中中“AnalyzeAnalyze”/ /“RegressionRegression”菜单菜

29、单可用于回归统计分析。其中,一元线性回归、可用于回归统计分析。其中,一元线性回归、多元线性回归和含虚拟变量的回归分析可由多元线性回归和含虚拟变量的回归分析可由“LinearLinear”子菜单完成;非线性回归分析可由子菜单完成;非线性回归分析可由“Curve EstimationCurve Estimation”子菜单完成。子菜单完成。2021/6/760习题习题习题1 1:相关分析:相关分析对对3333名产妇产前检查及婴儿体重测值,骼前上棘间径(名产妇产前检查及婴儿体重测值,骼前上棘间径(X1X1)、骼脊间径()、骼脊间径(X2X2)、)、止骼外径(止骼外径(X3X3)、坐骨节间径()、坐骨

30、节间径(X4X4)、血红蛋白()、血红蛋白(X5X5)和婴儿体重()和婴儿体重(X6X6)等)等6 6个个指标,计算指标,计算X1X4X1X4的的PearsonPearson相关性。(文件:相关性。(文件:Hong1.savHong1.sav)习题习题2 2:偏相关分析:偏相关分析某地某地2929名名1313岁南通身高(岁南通身高(x1x1)、体重()、体重(X2X2)、肺活量()、肺活量(Y Y)的数据。试计算期简)的数据。试计算期简单相关系数。当体重被控制时,计算身高与肺活量的偏相关系数单相关系数。当体重被控制时,计算身高与肺活量的偏相关系数r r。(数据文件:。(数据文件:Partial

31、.savPartial.sav)习题习题3 3:多元线性回归:多元线性回归随机测量随机测量3232名名4040岁以上男性的血压、年龄、身高、体重及吸烟史,其中岁以上男性的血压、年龄、身高、体重及吸烟史,其中1 1为吸烟,为吸烟,0 0为不吸烟。体重指数为为不吸烟。体重指数为100100* *(体重(体重/ /身高身高2 2)试建立)试建立X1X1、x2x2、x3x3对对Y Y的多重线性的多重线性回归方程。(数据文件:回归方程。(数据文件:mreg2.savmreg2.sav)习题习题4 4:非线性回归分析(曲线估计):非线性回归分析(曲线估计)钩虫病复查阳性率钩虫病复查阳性率Y Y和治疗次数的关系,试分析他们之间的关系。(数据文件:和治疗次数的关系,试分析他们之间的关系。(数据文件:curve1.savcurve1.sav)2021/6/761部分资料从网络收集整理而来,供大家参考,感谢您的关注!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号