第6章回归分析资料讲解

上传人:yuzo****123 文档编号:142638079 上传时间:2020-08-21 格式:PPT 页数:114 大小:1.63MB
返回 下载 相关 举报
第6章回归分析资料讲解_第1页
第1页 / 共114页
第6章回归分析资料讲解_第2页
第2页 / 共114页
第6章回归分析资料讲解_第3页
第3页 / 共114页
第6章回归分析资料讲解_第4页
第4页 / 共114页
第6章回归分析资料讲解_第5页
第5页 / 共114页
点击查看更多>>
资源描述

《第6章回归分析资料讲解》由会员分享,可在线阅读,更多相关《第6章回归分析资料讲解(114页珍藏版)》请在金锄头文库上搜索。

1、2020/8/21,统计学第3章参数估计,6-1,统计学,费宇,石磊 主编 高等教育出版社,2020/8/21,统计学第3章参数估计,6-2,第6章 回归分析,6.1 相关分析 6.2 一元线性回归 6.3 多元线性回归 6.4 虚拟变量回归 6.5 Logistic回归 6.6 回归分析的扩展 6.7 可化为线性情形的非线性回归,2020/8/21,统计学第3章参数估计,6-3,【引例6.0】,(数据文件为example 6.0)某公司经理想研究公司员工的年薪问题,根据初步分析,他认为员工的当前年薪y(元)与员工的开始年薪x1(元)、在公司的工作时间x2(月)、先前的工作经验x3(月)和受教

2、育年限x4(年)有关系,他随机抽样调查了36个员工,收集到以下数据:,2020/8/21,统计学第3章参数估计,6-5,问题,经理想根据以上样本数据,构建一个模型来反映y与x1、x2、x3和x4之间关系,并希望利用该模型在给定一个员工的x2、x3和x4的条件下,预测该员工的当前年薪y。 此外,经理认为,公司男女员工的薪水结构不同,他想在建立模型的时候能把性别因素考虑进来,这是否可行?,2020/8/21,统计学第3章参数估计,6-6,6.1 相关分析,6.1.1 相关的概念 1. 人的身高与体重有相关关系。 2. 居民可支配收入与支出有相关关系。 3. 粮食产量与施肥量有相关关系。,2020/

3、8/21,统计学第3章参数估计,6-7,6.1.2 相关的种类,1. 按相关程度划分: 分为完全相关、不完全相关和不相关;如图6.1所示。 2. 按相关方向划分: 分为正相关和负相关。如图6.2所示。 3. 按相关形式划分: 分为线性相关和非线性相关;如图6.3所示 。 4. 按变量多少划分: 分为简单相关和复相关。,2020/8/21,统计学第3章参数估计,6-8,6.1.3 相关关系的度量,1. 简单线性相关系数,2020/8/21,统计学第3章参数估计,6-9,2020/8/21,统计学第3章参数估计,6-10,2020/8/21,统计学第3章参数估计,6-11,2. 偏相关系数,202

4、0/8/21,统计学第3章参数估计,6-12,【例6.1】,2020/8/21,统计学第3章参数估计,6-13,2020/8/21,统计学第3章参数估计,6-14,2020/8/21,统计学第3章参数估计,6-15,6.2 一元线性回归,6.2.1 回归的含义 回归(regression)一词最早由英国生物学家兼统计学家高尔顿(F.Galton)于1886年在论文“Regression towards mediocrity in hereditary stature”中正式提出。 回归分析(regression analysis)是通过建立回归模型来研究相关变量的关系并作出相应估计和预测的一种

5、统计方法,,2020/8/21,统计学第3章参数估计,6-16,6.2.2 一元线性回归,2020/8/21,统计学第3章参数估计,6-17,2020/8/21,统计学第3章参数估计,6-18,6.2.3 最小二乘估计,图6.4 x和y的散点图,2020/8/21,统计学第3章参数估计,6-19,2020/8/21,统计学第3章参数估计,6-20,2020/8/21,统计学第3章参数估计,6-21,2020/8/21,统计学第3章参数估计,6-22,2020/8/21,统计学第3章参数估计,6-23,2020/8/21,统计学第3章参数估计,6-24,【例6.2】,(数据文件为example

6、6.2) 已知我国2007年31个地区城镇居民年人均可支配收入和年人均消费性支出数据如下表(单位:元),试分析城镇居民年人均可支配收入和年人均消费性支出之间的关系,如果有线性相关关系,试建立一元线性回归模型。,2020/8/21,统计学第3章参数估计,6-25,2020/8/21,统计学第3章参数估计,6-26,图6.5人均可支配收入x和人均消费性支出y散点图,2020/8/21,统计学第3章参数估计,6-27,2020/8/21,统计学第3章参数估计,6-28,2020/8/21,统计学第3章参数估计,6-29,2020/8/21,统计学第3章参数估计,6-30,6.2.4 回归方程的检验,

7、2020/8/21,统计学第3章参数估计,6-31,1. F检验,2020/8/21,统计学第3章参数估计,6-32,2020/8/21,统计学第3章参数估计,6-33,2020/8/21,统计学第3章参数估计,6-34,2020/8/21,统计学第3章参数估计,6-35,2. t检验,2020/8/21,统计学第3章参数估计,6-36,3.r检验,2020/8/21,统计学第3章参数估计,6-37,2020/8/21,统计学第3章参数估计,6-38,【例6.3】,给定显著水平,对例6.2的回归方程进行检验。,2020/8/21,统计学第3章参数估计,6-39,2020/8/21,统计学第3章

8、参数估计,6-40,2020/8/21,统计学第3章参数估计,6-41,6.2.5 估计与预测,2020/8/21,统计学第3章参数估计,6-42,2020/8/21,统计学第3章参数估计,6-43,图6.6 回归预测的预测区间,2020/8/21,统计学第3章参数估计,6-44,6.3 多元线性回归,6.3.1 多元线性回归模型,2020/8/21,统计学第3章参数估计,6-45,引入矩阵符号,2020/8/21,统计学第3章参数估计,6-46,2020/8/21,统计学第3章参数估计,6-47,2020/8/21,统计学第3章参数估计,6-48,6.3.2 多元线性回归方程的检验,2020

9、/8/21,统计学第3章参数估计,6-49,2020/8/21,统计学第3章参数估计,6-50,2. 方程显著性检验,2020/8/21,统计学第3章参数估计,6-51,2020/8/21,统计学第3章参数估计,6-52,表6.11 多元回归方程显著性检验的方差分析表,2020/8/21,统计学第3章参数估计,6-53,3. 回归系数显著性检验,2020/8/21,统计学第3章参数估计,6-54,【例6.5】,(数据文件为example 6.0) 沿用本章引例中的资料,建立多元线性回归方程并对回归方程进行检验(给定显著水平=0.05)。 解: 1. 先点散点图,用SPSS打开数据文件examp

10、le 6.0,选择GraphsLegacy DialogsScatter/Dot.Simple Scatter,点Define,将两个变量开始年薪x和当前年薪y分别选入X Axis和Y Axis,点OK。,2020/8/21,统计学第3章参数估计,6-55,图6.7 当前年薪对开始年薪的散点图,2020/8/21,统计学第3章参数估计,6-56,2做多元线性回归:,选择AnalyzeRegressionLinear,将自变量开始年薪、工作时间、先前工作经验和受教育年限选入Independent,再将因变量当前年薪y选入Dependent中,然后选择Method为默认值Enter,点OK即可得3

11、个主要表格 :表6.12至6.14。,2020/8/21,统计学第3章参数估计,6-57,表6.12 员工年薪问题的回归方程的可决系数,2020/8/21,统计学第3章参数估计,6-58,表6.13 员工年薪问题的方差分析表,2020/8/21,统计学第3章参数估计,6-59,表6.14 员工年薪问题的多元回归方程回归系数表,2020/8/21,统计学第3章参数估计,6-60,于是可得如下回归方程:,从回归方程可以看出:当前年薪y与开始年薪x1和受教育年限x4正相关(回归系数为正),这是合理的;但与工作时间x2和先前工作经验x3负相关(回归系数为负),这是不合理的,为什么?,2020/8/21

12、,统计学第3章参数估计,6-61,3对回归方程进行检验。,2020/8/21,统计学第3章参数估计,6-62,6.3.3 估计与预测,1. 均值E(y0)的估计,2020/8/21,统计学第3章参数估计,6-63,2. 个值 y0的预测,2020/8/21,统计学第3章参数估计,6-64,6.4 虚拟变量回归,2020/8/21,统计学第3章参数估计,6-65,【例6.6】,在例6.5中,将性别作为虚拟变量引入回归方程,建立当前年薪y关于受教育年限和性别虚拟变量的线性回归模型。 解: 性别x5是虚拟变量,所以这是虚拟变量回归问题;将性别变量“量化”, x5=0表示男性, x5=1表示女性,统计

13、模型设定为,2020/8/21,统计学第3章参数估计,6-66,用SPSS打开数据文件example 6.0,选择AnalyzeGeneral Linear ModelUnivariate,将因变量当前年薪y选入Dependent Variable中,把定量自变量受教育年限x4选入Covariate中,把虚拟变量性别x5选入Fixed Factor中,在Options中选择Parameter Estimates,点击Model,在Specify Model中选Custom,再把定量自变量x4和虚拟变量x5选入右边,在Building Term中选Main effect,然后点Continue回

14、到主对话框,在Options中的Display中选择Parameter estimates,点ContinueOK即可得参数估计值表表6.15。,2020/8/21,统计学第3章参数估计,6-67,表6.15 引入性别虚拟变量的线性回归模型回归系数表,2020/8/21,统计学第3章参数估计,6-68,由表6.15容易得如下回归方程,显然,这两条线是截距不同的两条平行线,截距的差异表示男女职工年薪的差别。,2020/8/21,统计学第3章参数估计,6-69,6.5 Logistic回归,本节讨论因变量是二值定性变量的回归,即Logistic 回归。,2020/8/21,统计学第3章参数估计,6

15、-70,【例6.7】,为了研究家庭年收入与是否有私家车的关系,随机调查了50个家庭的情况得结果如表6.16,以是否有私家车为因变量(它是一个二值定性变量),年收入为自变量建立回归方程,并估计年收入为12万元的家庭有私家车的可能性。,2020/8/21,统计学第3章参数估计,6-71,表6.15 抽样调查得到的50个家庭的数据资料,2020/8/21,统计学第3章参数估计,6-72,2020/8/21,统计学第3章参数估计,6-73,2020/8/21,统计学第3章参数估计,6-74,利用SPSS软件实现Logistic回归,具体操作如下: 打开数据文件example 6.6,选择Analyze

16、RegressionBinary Logistic,将因变量y选入Dependent中,把自变量x选入Covariate中,点OK即可得参数估计表表6.17。,2020/8/21,统计学第3章参数估计,6-75,表6.17 Logistic回归方程回归系数表,2020/8/21,统计学第3章参数估计,6-76,如果要估计年收入为12万元的家庭有私家车的可能性,可以打开数据文件example 6.6,在x变量末尾增加一个值12,选择AnalyzeRegressionBinary Logistic,将因变量y选入Dependent中,把自变量x选入Covariate中,点Save在Predicted Values里选 Probabilities,返回主对话框,点OK,在原数据文件里就会得到一列预测值(PRE_1),对应于x=12的PRE值为0.18237,这就是年收入为12万元的家庭有私家车的可能性的估计值。,2020/8/21,统计学第3章参数估计,6-77,6.6 回归分析的扩展,6.6.1 异方差 1. 异方差的概念,2020/8/21,统计学第3章参数估计,6-78,异方差

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号