第九讲相关分析与回归分析.

上传人:今*** 文档编号:106859236 上传时间:2019-10-16 格式:PPT 页数:20 大小:394.50KB
返回 下载 相关 举报
第九讲相关分析与回归分析._第1页
第1页 / 共20页
第九讲相关分析与回归分析._第2页
第2页 / 共20页
第九讲相关分析与回归分析._第3页
第3页 / 共20页
第九讲相关分析与回归分析._第4页
第4页 / 共20页
第九讲相关分析与回归分析._第5页
第5页 / 共20页
点击查看更多>>
资源描述

《第九讲相关分析与回归分析.》由会员分享,可在线阅读,更多相关《第九讲相关分析与回归分析.(20页珍藏版)》请在金锄头文库上搜索。

1、第六章 回归和回归分析,6.1 相关分析概述 6.2 相关分析 6.3 多元线性回归 6.4 曲线回归 6.5 逐步回归,1. 散点图 散点图是描述变量之间关系的一种直观方法。我们用坐标的横轴代表自变量X,纵轴代表因变量Y,每组数据(xi,yi)在坐标系中用一个点表示,由这些点形成的散点图描述了两个变量之间的大致关系,从中可以直观地看出变量之间的关系形态及关系强度。,6.1 相关分析概述,图6-1 不同形态的散点图 (a) (b) (c) (d) 就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关,如图6-1(a)和(b);如果变量之间的关系近似地表现为一条曲线,则称为非线

2、性相关或曲线相关;如图6-1(c);如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图6-l(d)。,2. 相关系数 相关系数是对变量之间关系密切程度的度量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为;总体相关系数的计算公式为: 其中COV(X,Y)为变量X和Y的协方差,D(X)和D(Y)分别为X和Y的方差。,若相关系数是根据样本数据计算的,则称为样本相关系数(简称为相关系数),记为r。样本相关系数的计算公式为: 一般情况下,总体相关系数是未知的,我们通常是将样本相关系数r作为的近似估计值。,相关系数r有如下性质: 1)相关系数的取值范围:1 r 1,若0

3、 r 1,表明X与Y之间存在正线性相关关系,若1 r 0,表明X与Y之间存在负线性相关关系。 2)若r = 1,表明X与Y之间为完全正线性相关关系;若 r = 1,表明X与Y之间为完全负线性相关关系;若r = 0,说明二者之间不存在线性相关关系。,3)当1 r 1时,为说明两个变量之间的线性关系的密切程度,通常将相关程度分为以下几种情况:当| r | 0.8时,可视为高度相关;0.5 | r | 0.8时,可视为中度相关;0.3 | r | 0.5时,视为低度相关;当| r | 0.3时,说明两个变量之间的相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数进行显著性检验的基础之上。,3

4、. 相关系数的显著性检验 相关系数的显著性检验也就是检验总体相关系数是否显著为0,通常采用费歇尔(Fisher)提出的t分布检验,该检验可以用于小样本,也可以用于大样本。检验的具体步骤如下: 1) 提出假设:假设样本是从一个不相关的总体中随机抽取的,即 H0: = 0;H1: 0,2) 由样本观测值计算检验统计量: 的观测值t0和衡量观测结果极端性的p值: p = P| t | | t0 | = 2Pt |t0| 3) 进行决策:比较p和检验水平作判断:p ,拒绝原假设H0;p ,不能拒绝原假设H0。,相关分析的实质: 反映各变量之间相关密切程度。,简单相关:研究两变量直线相关的密切程度和性质

5、,也称直线相关。 偏相关:排除其余的影响因子,求出x 与y的纯相关,这种相关称偏相关。 复相关:研究一个变量与一组变量之间的相关性关系。 典型相关:研究两组变量间的相关关系。,1 简单相关 2 偏相关 3 复相关,6.2 相关分析,(Analysis of Correlation),1 简单相关,简单相关: 是对有联系的两类事物(x与y)表面关系密切程度的衡量。,(Simple Correlation),一、简单相关系数,二、简单相关系数r的显著性测验,由d.f=n-2查出相关系数的临界值r0.05 、r0.01 (degree of freedom),SAS直接输出prob|r|概率值,记为

6、.,统计假设H0:总体相关系数=0,若 0.05,接受H0,相关不显著,即总体x与y间不存在相关关系。 若0.01 0.05,拒绝H0,相关显著,即总体x与y间存在相关关系。 若 0.01,拒绝H0,相关极显著,即总体x与y间存在相关关系。,data li6_1; input x y; cards; 77 8.8 64 7.9 73 3.5 ;,例6-1 橡胶树幼苗期刺检干胶产量(x,毫克)与正式割胶量(y,克)如下表,试求x与y的相关系数并画出y关于x的散点图。,三、简单相关实例,proc corr; var x y; /*求r*/ run; proc gplot; plot y*x; /*

7、散点图*/ run;,PLOT的用法 PLOT * = /;,表 PLOT语句的选项,PLOT语句的注意事项,PLOT语句用以对两个变量绘制散点图,表达式中位置在前(在乘号“*”之前)的变量作为散点图的y轴,位置在后的变量作为散点图的x轴。,Correlation Analysis 2 VAR Variables: X Y Simple Statistics Variable N Mean Std Dev Sum X 26 92.0385 30.4427 2393.0000 Y 26 9.1115 3.3269 236.9000 Variable Minimum Maximum X 61.00

8、00 188.0000 y 3.5000 17.7000,SAS输出结果:,Pearson Correlation Coefficients / Prob |R| under Ho: Rho=0 / N = 26 X Y X 1.00000 0.71019 0.0 0.0001 Y 0.71019 1.00000 0.0001 0.0,结论:因r=0.71019,其出现的概率=0.00010.01,极显著,表示刺检干胶量与正式割胶量存在极显著的简单相关关系。,实 验 1,以下给出了美国14个州一年内吸烟支数与患肺癌死亡人数的相关数据(见数据sy6_1) 根据数据sy6_1说明吸烟支数与患肺癌死亡人数的相关性。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号