变量间的相关关系

上传人:人*** 文档编号:505654014 上传时间:2024-01-04 格式:DOCX 页数:11 大小:112.77KB
返回 下载 相关 举报
变量间的相关关系_第1页
第1页 / 共11页
变量间的相关关系_第2页
第2页 / 共11页
变量间的相关关系_第3页
第3页 / 共11页
变量间的相关关系_第4页
第4页 / 共11页
变量间的相关关系_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《变量间的相关关系》由会员分享,可在线阅读,更多相关《变量间的相关关系(11页珍藏版)》请在金锄头文库上搜索。

1、变量间的相关关系1、相关关系的理解我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个 函数值,这两者之间是一种确定关系。生活中的任何两个变量之间是不是只有 确定关系呢?如:学生成绩与教师水平之间存在着某种联系,但又不是必然联 系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。 这就是我们这节课要共同探讨的内容变量间的相关关系。例1、根据样本数据作出散点图,直观感知变量之间的相关关系。在研究相关关 系前,先回忆一下函数的表示方法有哪些一一列表,画图象,求解析式。下面我 们就用这些方法来研究相关关系。看这样一组数据:在一次对人体脂肪含量和 年龄关系的研究中,研究人员

2、获得了一组样本数据,根据样本数据,人体的脂肪含 量与年龄之间有怎样的关系?年龄2327394145495053545657586061脂肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6结论:随着年龄增长,脂肪含量在增加。用x轴表示年龄,y轴表示脂肪。一组 样本数据就对应着一个点。2、散点图这个图跟我们所学过的函数图象有区别,它叫作散点图。3、判断正、负相关、线性相关:请观察这4幅图,看有什么特点?4 图 6 3 78911-0.00.0.0.0.11.图4图1呈上升趋势,图2呈下降趋势。这就像函数中的增函数和减函数。即 一个变量从

3、小到大,另一个变量也从小到大,或从大到小。对于图1中的两个 变量的相关关系,我们称它为正相关。图2中的两个变量的相关关系,称为负 相关。后面两个图很乱,前面两个图中点的分布呈条状。从数学的角度来解释: 即图1、2中的点的分布从整体上看大致在一条直线附近。我们称图1、2中的 两个变量具有线性相关关系。这条直线叫做回归直线。图3、4中的两个变量 是非线性相关关系1、找回归直线下面我们再来看一下年龄与脂肪的散点图, 从整体上看,它们是线性相关的。如果可以求出回归直线的方程,我们就可以清 楚地了解年龄与体内脂肪含量的相关性。这条直线可以作为两个变量具有线性相 关关系的代表。能否画出这条直线?多种方法展

4、示总结:所有的点离这条直线最近的方案最好。从整体上看,各点与此直线的距离 和最小。利用最小二乘法推导回归系数公式假设我们已经得到两个具有线性相关关系的变量的一组数据:(x ,y ) (x , y )(x ,y )。当自变量% 取x ( i = 1, 2, ,n)时,可以得到1122n niy = bxi +。( i =1,2,,n),它与实际收集到的y,之间的偏差是yi -yi = y(bx + a)( i =1,2,,n),这样用n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。总的偏差为E(yy,偏差有正有负,i=1易抵消,所以采用绝对值Ey.- yj,由于带绝对值计算不方便所以换

5、成平方,i=1n ,、2Q= (y -y) = (y -bx-a) +(y -bx -a)2 +(y -bx-a)2 +(y -bx -a)2现在的问题就归 i i 112233n ni=1结为:当a,b取什么值时Q最小。将上式展开、再合并,就可以得到可以求出Q取最小值时2 +(x -X)2ii =1(x - x)(y - y)iib 4=1 (x - x)2ii =1(x - x)(y - y)iiLi=1 (x - x)2ii =1 (y - y)2ii=14(x -x)(y -y) Jxy -nxyiii ib = 4= = -i=1 - 1(x -x)2x2 -nx2 (其中x=nxi

6、ii = 1_ i=Li=1a = y - bxy=1 y,)i =1推导过程用到偏差的平方,由于平方又叫二乘方,所以这种使“偏差的和”最小的方法叫“最小二乘法”。3、求出回归直线方程,并分析它的意义利用最小二乘法就可以求出回归系数,进一步求出回归方程。下面我们具体操作一下。我们先明确几个符号的含义:x表示年龄,x是23, x是27,直到i12工14是61。i从1到14,y,表示脂肪y是17.8。xy表示年龄与2i i脂肪的成绩,x.2表示 年龄的平方年龄脂肪239.52717.83921.24125.94527.54926.35028.25329.65430.25631.45730.8583

7、3.56035.26134.6Xi48.07127.264286218.5529480.6729826.815211061.916811237.520251288.72401141025001568.828091630.829161758.431361755.6324919433364211236002110.6372119403.234181A1 表示自变量年龄的平均数,亍 二1 y表示因变量脂肪的平均数, =1i=1 X:表示自变量的平方和,气七表示自变量与因变量乘积的和。要求出a,b, i=1i =1必须先求出这些量。数学实验2:求出下列各式的值(n=14)y-1y=n ii=1 xy

8、=i i - i=1a = y - bx =x =1 x =xxni=1 一一 x -xii=1x y -nxyi ib = 4=1x 2 - nx2ii=1y = bx+a通过计算,求出了 a -0.448,b = 0.5765y = 0.5765x-0.448求出回归直线方程有什么用呢?表格中选取年龄x的一个值代入上述回归 直线的方程,看看得出的数据与真实数值之间的关系。y 0.5765 x 50 - 0.44829.272估计值是29.272,与实际值28.2有偏差,为什么会出现这样的结果?回归直线 是估计出的,把a带入肯定有误差。试预测某人37岁时,他体内的脂肪含量。 并说明结果的含义

9、。代入计算y 0.5765 x 37 - 0.44820.882我们不能说他的体内脂肪含量的百分比一定是20.882%?只能说他体内的脂肪 含量在20.90%,附近的可能性比较大。*4、利用相关系数判断线性相关程度非线性相关,直线不能很好地反映图中两个变量之间的关系。显然求回归直线的 方程是没有意义的。有些变量线性相关,有些非线性相关,怎样衡量变量的线性 相关程度呢?危-孙V -3这时我们引入一个量:相关系数,r =t (气M)2 (厂亍)2* i=1j=1注意它的符号:当r 0时,x,y正相关,当r 0时,x,y负相关,统计学认为:对于r,若r e-1, -0.75,那么负相关很强,若r e

10、0.75,1,那么正相关很强,若 rc (-0.75,-0.30或了 e【0.30,0.75),那么相关性一般,若r e -0.25,0.25,那么相关性较弱,5、线性回归方程具体如何应用线性回归方程为v = bx+a的求法:1(1)先求变量x的平均值,既x = (x +x + x + x )n 1 2 3n(2)求变量v的平均值,既V = L(y + V + V + V )n123n(3)求变量x的系数人,有两个方法 (x - x)(v - V)- 人ii.法1 b=r(题目给出不用记忆) (x - x)2ii=1(无)(十顼)+ (气-无)(。-V) +.+3广:)(上顼)(需理解并会代入

11、数 (X - X)2 + (x - X)2 + . + (x - X)212n据) (X - X)(V - V)- 人ii.法2b =十、(题目给出不用记忆) (X - X)2ii=1x V + X V + .X V - nX V=一二土一二,(这个公式需要自己记忆,稍微简单些)I X2 + X2 + . + X2 - nX212n(4)求常数a,既a = v -bx最后写出写出回归方程V = bx+a。可以改写为:v = bx-a(V与v不做区分)总结:1. 函数关系与相关关系的区别?函数关系是一种确定性关系, (X - X)(y - y)ii2. 回归公式b = (X - X)2ii=13

12、. 回归分析的步骤?而相关关系是一种非确定性关系.x V - nxyi i4=1x 2 - nx 2ii=1八一,一a = y - bx人人T. 人y = bx + a回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法, 其步骤:收集数据T作散点图T求回归直线方程T利用方程进行预报.,一.,一人4.回归直线的性质 V = bx + ay = bx + a回归直线过样本点的中心&V) 其中解释变量乂的平均数为: X = 1亏 预报变量的平均数为:y =1 V=1i=1 . 人 一 、回归直线的斜率的估计值b的意义:. . . 一、一 . . 人 、 一一解释变量X每增加一个单位,预报变

13、量y就增加b个单位.例:已知x, j之间的一组数据:X0123j1357求j与x的回归方程:解:(1)先求变量x的平均值,既X = 4(0 +1 + 2 + 3) = 1.51(2)求变量j的平均值,既j = 4(1+3 + 5 + 7) = 4K 一无)(ji(3)求变量x的系数b,有两个方法顼)+(*2 X)( J2 刃 + 电X)( J3 J)+ (XZ X)(J4 J r (X X )2 + (X X )2 + (X X )2 + (X X )2 L 1234(0 1.5)(1 4) + (11.5)(3 4) + (2 1.5)(5 4) + (3 1.5)(7 4) 5f=;=(0 1.5)2 + (11.5)2 + (2 1.5)2 + (3 1.5)2 7法2b =x j + x j + .x j nX - y14-2-n=r X 2 + X 2 + . + X 2L 12n -1nX 20x1 + 1x3 + 2x5 + 3x7 4x 1.5x4 _ 57

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号