统计学第7章相关与回归解读

上传人:我** 文档编号:115723002 上传时间:2019-11-14 格式:PPT 页数:53 大小:595.50KB
返回 下载 相关 举报
统计学第7章相关与回归解读_第1页
第1页 / 共53页
统计学第7章相关与回归解读_第2页
第2页 / 共53页
统计学第7章相关与回归解读_第3页
第3页 / 共53页
统计学第7章相关与回归解读_第4页
第4页 / 共53页
统计学第7章相关与回归解读_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《统计学第7章相关与回归解读》由会员分享,可在线阅读,更多相关《统计学第7章相关与回归解读(53页珍藏版)》请在金锄头文库上搜索。

1、 第7章 相关与回归分析 学习目标 v知识目标 理解相关与回归分析的基本概念及其区别与联系 掌握相关系数的计算与检验 掌握一元线性回归和多元线性回归的模型、估计 及检验 理解复相关系数和偏相关系数及其与单相关系数 的区别 应用Excel软件进行相关与回归分析 v能力目标 能够正确区分相关与回归分析的区别与联系; 能够熟练运用相关与回归分析的方法进行统计分析 ,解决社会经济问题;能够熟练应用Excel软件进行 相关与回归分析。 导入案例 根据2007年的统计数据,首都机场全年出港航 班正常率为86.28%,其中,衡量航班起飞情况的航 班放行正常率高达94.49%。中国民航总局代局长李 家祥表示,

2、我国航空公司的正点率在世界上处于中 等略微偏上的水平。但是,近两年因航班延误造成 的旅客与航空公司激烈冲突接连不断,甚至出现旅 客霸机、冲击机场停机坪等极端事件。日前,中国 消费者协会和中国民用航空局运输局共同发布的 2011年航空服务消费者调查报告显示,最令消费者 满意的航空服务是客舱服务,而最不满意的航空服 务为航班正点率及延误后续服务。这一结果表明, 提高航班正点率已成为改进航空服务的首要任务。 民航总局于2004年出台了国内航空公司航班 延误补偿意见,要求航空公司对航班延误给顾客 造成的损失给予补偿。调查显示,如果按航班延误 每客补偿200元计,仅南航一家2007年就要付出1.6 亿元

3、的巨额赔款,这对于国内很多航空公司而言是 难以承受的,其结果必然导致企业为减少成本而降 低服务,引发恶性竞争。为此,对于航空公司航班 正点率和顾客投诉率之间关系的研究就显得至关重 要。 那么,究竟应该如何分析航空公司航班正点率 和顾客投诉率之间的关系呢?相关和回归分析是非 常有用的工具。通过本章的学习,可以找到问题的 答案。 7.1 7.2 7.3 7.4 7.1 7.1 相关与回归分析概述相关与回归分析概述 7.1.1 函数关系与相关关系 1.函数关系 2.相关关系 7.1.2 函数关系与相关关系 1.按照变量多少划分 2.按照相关方向划分 3.按照相关密切程度划分 4.按照相关表现形式划分

4、 7.1.3 相关分析的内容 1.确定变量之间有无相关关系 2.判定相关关系的表现形式 3.判定相关关系的密切程度 4.选择数学模型 5.测定变量估计值的准确程度 6.显著性检验 7.1 7.1 相关与回归分析概述相关与回归分析概述 7.1.4 回归分析的内容及种类 1.回归分析的内容 v 确定变量之间相关关系的数学模型 v 测定数学模型的拟合优度 2.回归分析的种类 v按照具有相关关系的变量个数划分 v按照回归的表现形式划分 7.1 7.1 相关与回归分析概述相关与回归分析概述 7.1.5 相关分析的内容 1.相关分析与回归分析的联系 v相关分析是回归分析的基础和前提 v回归分析则是相关分析

5、的深入和继续 2.相关分析与回归分析的区别 v相关分析主要通过相关系数来判断两个变量之间是否存在相关关系及其 关系的密切程度,其前提条件是两个变量都是随机变量,且变量之间不 必区别自变量和因变量。而回归分析研究一个随机变量与一个非随机变 量之间的相互关系,且变量之间必须区别自变量和因变量。 v相关系数只能表明变量之间相关关系的密切程度和方向,不能估计推算 其具体数值。而回归分析则可以根据回归方程,用自变量的数值推算因 变量的估计值。 v互为因果关系的两个变量,可以拟合两个回归方程,且互相独立、不能 互相替换。而相关系数只有一个,即当自变量与因变量互换时相关系数 不变。 7.1 7.1 相关与回

6、归分析概述相关与回归分析概述 7.2.1 相关图与相关表 1.相关表:相关表是一种反映变量之间相关关系的 统计表。 【例7-1】通过对10家航空公司最近一年的航班正 点率和顾客投诉次数进行调查所得到的原始数据如 表7.1所示,试根据原始数据编制相关表。 7.2 7.2 简单线性相关与一元线性回归分析 根据以上原始资料,将航班正点率按照从低 到高的顺序排列,可以编制相关表如表7.2所示。 根据表7.2可以看出,随着航班正点率的提高, 顾客投诉次数从总体上呈现出下降的趋势。因此, 市场顾客投诉次数与航班正点率之间存在一定的负 相关关系。 7.2 7.2 简单线性相关与一元线性回归分析 7.2.1

7、相关图与相关表 2.相关图:相关图也称相关散点图,简称散点图, 是指根据相关表中的观测数据在直角坐标系中绘制 的点状图形。 【例7-2】根据表7.2所示的航空公司航班正点率与 顾客投诉次数相关表,试绘制相关图,并分析航空 公司顾客投诉次数与航班正点率之间的关系。 7.2 7.2 简单线性相关与一元线性回归分析 根据以上原始资料,将航班正点率按照从低 到高的顺序排列,可以编制相关表如表7.2所示。 根据表7.2可以看出,随着航班正点率的提高, 顾客投诉次数从总体上呈现出下降的趋势。因此, 市场顾客投诉次数与航班正点率之间存在一定的负 相关关系。 7.2 7.2 简单线性相关与一元线性回归分析 根

8、据表7.2中的数据绘制散点图,就可以比较 直观地看出两个变量之间的关系,如图8.2所示。 由图7.2可以明显看出,航空公司的航班正 点率与顾客投诉次数之间总体呈现出负线性相 关关系。 7.2 7.2 简单线性相关与一元线性回归分析 7.2.2 相关系数及检验 1.相关系数的定义 相关系数是指在直线相关条件下,两个变量之 间相关关系密切程度和方向的统计分析指标。 总体相关系数的定义公式是: 样本相关系数的定义公式是: 7.2 7.2 简单线性相关与一元线性回归分析 相关系数的特点: (1) 相关系数的取值于-1与1之间。 (2) 相关系数的绝对值越接近于1,表明两个变量之 间的相关关系越密切;的

9、绝对值越接近于0,表明 相关关系越不密切。 (3) 相关系数为1或-1,表明两个变量完全线性相关, 即函数关系。 (4)相关系数等于0,表明两个变量无直线相关关系。 (5)相关系数大于0 ,表明两个变量呈正线性相关; 相关系数小于0 ,表明两变量呈负线性相关。 7.2 7.2 简单线性相关与一元线性回归分析 7.2.2 相关系数及检验 2.相关系数的计算 v根据资料的分组情况,相关系数的计算既可采用定 义公式,也可采用简捷公式。 v分别见【例7-3】 和【例7-4】 7.2 7.2 简单线性相关与一元线性回归分析 7.2.2 相关系数及检验 3.相关系数的检验 v相关系数的显著性检验问题可以分

10、为两类:一类是 对总体相关系数是否等于0进行检验;另一类是对 总体相关系数是否等于某一个给定的不为0的数值 进行检验。本书只介绍如何对总体相关系数是否等 于0进行检验。 7.2 7.2 简单线性相关与一元线性回归分析 v检验基本步骤 v(1) 原假设: 。备择假设: ; v(2) 计算检验统计量: ,其中 为自由 度; v(3) 根据给定的显著性水平 和自由度 ,查找 t分布表中相应的临界值 ; v(4) 若 ,则拒绝原假设,接受备择假设,即 认为样本的相关系数r在统计上是显著的,可以说 明总体两个变量间存在着线性相关关系。若 , 则表明样本的相关系数r在统计上是不显著的。 7.2 7.2 简

11、单线性相关与一元线性回归分析 7.2.3 一元线性回归分析 1.一元线性回归模型 v(1) 总体回归函数 v进行回归分析通常要设定一定的数学模型。一元线 性回归分析的主要任务是在唯一的自变量x和因变 量y之间建立一个直线函数,即一元线性回归模型 。该模型假定因变量主要受自变量的影响,它们之 间存在着近似的线性函数关系,其表现形式为: 7.2 7.2 简单线性相关与一元线性回归分析 7.2.3 一元线性回归分析 1.一元线性回归模型 v(2) 样本回归函数 v根据样本数据拟合的直线称为样本回归直线。一元 线性回归模型的样本回归线可表示为: 7.2 7.2 简单线性相关与一元线性回归分析 7.2.

12、3 一元线性回归分析 1.一元线性回归模型 v(3) 误差项的标准假定 v因为,随机误差项是无法直接观测的。所以,在进 行回归分析时,通常需要对其概率分布提出一些假 定。德国数学家高斯最早提出了相关的假定,因此 也称为高斯假定或标准假定。 7.2 7.2 简单线性相关与一元线性回归分析 这些假定有: v假定1:误差项的期望值为0,即 v假定2:误差项的方差为常数,即 v假定3:误差项之间不存在序列相关关系,其协方差 为零,即当 时有 v假定4:自变量是给定的变量,与随机误差项线性无 关。 v假定5:随机误差项服从正态分布。 满足以上标准假定的一元线性模型,称为标准的 一元线性回归模型。 7.2

13、 7.2 简单线性相关与一元线性回归分析 7.2.3 一元线性回归分析 2.一元线性回归模型的估计 (1) 回归系数的估计 v回归分析的主要任务就是建立能够近似反映真实总 体回归函数的样本回归函数。也就是是确定样本回 归函数中的系数。 v通过使残差平方和为最小来估计回归系数,也就是 所谓的最小二乘法。 7.2 7.2 简单线性相关与一元线性回归分析 7.2.3 一元线性回归分析 2.一元线性回归模型的估计 (1) 回归系数的估计 v回归分析的主要任务就是建立能够近似反映真实总 体回归函数的样本回归函数。也就是是确定样本回 归函数中的系数。 v通过使残差平方和为最小来估计回归系数,也就是 所谓的

14、最小二乘法。 7.2 7.2 简单线性相关与一元线性回归分析 v残差平方和 v将对和求偏导数,并令其等于零 7.2 7.2 简单线性相关与一元线性回归分析 v整理可得 v求解该方程组可得: 7.2 7.2 简单线性相关与一元线性回归分析 7.2.3 一元线性回归分析 2.一元线性回归模型的估计 (2) 总体方差的估计 v总体随机误差项的方差 的无偏估计 为 v一般采用以下的公式计算残差平方和 7.2 7.2 简单线性相关与一元线性回归分析 7.2.3 一元线性回归分析 3.一元线性回归模型的检验 (1) 回归模型检验的种类 v回归模型的检验包括理论意义检验、一级检验和二 级检验。 (2)拟合优

15、度评价 v拟合优度是指样本回归直线对观测数据拟合的优劣 程度,即样本观测值聚集在样本回归线周围的紧密 程度。判断回归模型拟合程度优劣最常用的数量尺 度是样本判定系数。 7.2 7.2 简单线性相关与一元线性回归分析 7.2.3 一元线性回归分析 3.一元线性回归模型的检验 (1) 回归模型检验的种类 v回归模型的检验包括理论意义检验、一级检验和二 级检验。 (2)拟合优度评价 v拟合优度是指样本回归直线对观测数据拟合的优劣 程度,即样本观测值聚集在样本回归线周围的紧密 程度。判断回归模型拟合程度优劣最常用的数量尺 度是样本判定系数。 (3) 假设检验 7.2 7.2 简单线性相关与一元线性回归

16、分析 7.2.3 一元线性回归分析 4.一元线性回归模型的预测 (1) 点预测 v一元线性回归预测的基本公式如下: 【例7.10】 7.2 7.2 简单线性相关与一元线性回归分析 7.2.3 一元线性回归分析 4.一元线性回归模型的预测 (2) 区间预测 v用 表示预测标准误差的估计值,则 v按照确定置信区间的方法,可以得出 的 的置信区间为: 【例7.11】 7.2 7.2 简单线性相关与一元线性回归分析 7.3.1 多元线性回归模型及估计 1.多元线性回归模型 v多元线性回归模型总体回归函数的一般形式: v多元线性回归模型的样本回归函数如下: 7.3 7.3 多元线性回归分析 7.3.1 多元线性回归模型及估计 2.多元线性回归模型的参数估计 (1)回归系数的估计 v多元线性回归方程中的系数仍然是采用最小二乘法 求得。 (2)总体方差的估计 v多元线性回归模

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号