相关性、最小二乘估计、回归分析与独立性检验

上传人:F****n 文档编号:96001322 上传时间:2019-08-23 格式:PPT 页数:62 大小:2.19MB
返回 下载 相关 举报
相关性、最小二乘估计、回归分析与独立性检验_第1页
第1页 / 共62页
相关性、最小二乘估计、回归分析与独立性检验_第2页
第2页 / 共62页
相关性、最小二乘估计、回归分析与独立性检验_第3页
第3页 / 共62页
相关性、最小二乘估计、回归分析与独立性检验_第4页
第4页 / 共62页
相关性、最小二乘估计、回归分析与独立性检验_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《相关性、最小二乘估计、回归分析与独立性检验》由会员分享,可在线阅读,更多相关《相关性、最小二乘估计、回归分析与独立性检验(62页珍藏版)》请在金锄头文库上搜索。

1、第三节 相关性、最小二乘估计、回归分析与 独立性检验,三年9考 高考指数: 1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(不记公式). 3.了解独立性检验的基本思想、方法及其初步应用. 4.了解回归分析的基本思想、方法及其简单应用.,1.线性回归方程的建立及应用和独立性检验的应用是考查重点; 2.题型以选择题和填空题为主,主要是求线性回归方程的系数或利用线性回归方程进行预测,在给出临界值的情况下判断两个变量是否有关.,1.相关性 (1)散点图:在考虑两个量的关系时,为了对_之间的关系 有一个

2、大致的了解,人们通常将_的点描出来, 这些点就组成了变量之间的一个图,通常称这种图为变量之间 的散点图. (2)曲线拟合:从散点图上可以看出,如果变量之间_ _,这些点会有一个_的大致趋势,这种趋势通常可 以用一条_来近似,这种近似的过程称为曲线拟合.,变量所对应,存在着某,种关系,光滑的曲线,变量,集中,(3)线性相关:若在两个变量x和y的散点图中,所有点看上去 都在_附近波动,则称变量间是线性相关的.此时, 我们可以用_来近似. (4)非线性相关:若散点图上所有点看上去都在_ _附近波动,则称此相关为非线性相关.此时, 可以用_来拟合. (5)不相关:如果所有的点在散点图中_,则 称变量间

3、是不相关的.,一条直线,一条直线,某条曲线,(不是一条直线),一条曲线,没有显示任何关系,【即时应用】 (1)思考:相关关系与函数关系有什么异同点? 提示:相同点:两者均是指两个变量的关系. 不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.,(2)判断下列各关系是否是相关关系.(请在括号内填“是”或“否”) 路程与时间、速度的关系; ( ) 加速度与力的关系; ( ) 产品成本与产量的关系; ( ) 圆周长与圆面积的关系; ( ) 广告费支出与销售额的关系. ( ),【解析】是确定的函数关系,成本与产量,广告费

4、支出与销售额是相关关系. 答案:否 否 是 否 是,2.回归直线方程与相关系数 (1)最小二乘法 如果有n个点(x1,y1),(x2,y2),(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度: _ 使得上式达到_的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.,y1-(a+bx1)2+y2-(a+bx2)2+yn-(a+bxn)2.,最小值,(2)线性回归方程 假设样本点为(x1,y1),(x2,y2),(xn,yn),则 直线方程y=a+bx称为线性回归方程,a、b是线性回归方程的 _.,系数,(3)相关系数r ,当r0时,称两个变量_. 当r0时,

5、称两个变量_. 当r=0时,称两个变量_. r的绝对值越接近于1,表明两个变量之间的线性相关程度越 高;r的绝对值越接近于0,表明两个变量之间的线性相关程度 越低.,正相关,负相关,线性不相关,【即时应用】 (1)由一组样本数据(x1,y1),(x2,y2),(xn,yn)得到回 归直线方程yabx,判断下面说法是否正确.(请在括号内打 “”或“”) 任何一组观测值都能得到具有代表意义的回归直线方程; ( ) 直线yabx至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点; ( ),直线yabx的斜率 ( ) 直线yabx和各点(x1,y1),(x2,y2),(xn,yn)的偏

6、 差 是该坐标平面上所有直线与这些点的偏差 中最小的. ( ) (2)已知回归方程y4.4x838.19,则可估计x与y的增长速度 之比约为_.,【解析】(1)任何一组观测值都能利用公式得到直线方程,但 这个方程可能无意义,不正确;回归直线方程ybxa经过 样本点的中心 可能不经过(x1,y1),(x2,y2), (xn,yn)中的任何一点,这些点分布在这条直线附近,不正 确;正确;正确 (2)x与y的增长速度之比即约为回归方程的斜率的倒数 答案:(1) (2),3.独立性检验 (1)22列联表 设A,B为两个变量,每一个变量都可以取两个值,变量A:A1, A2= ;变量B:B1,B2= 通过

7、观察得到如表所示的数据:,a,b,a+b,c,d,c+d,a+c,b+d,n=a+b+c+d,(2)独立性判断方法 选取统计量_,用它的大小来检验 变量之间是否独立. 当2_时,没有充分的证据判定变量A,B有关联, 可以认为变量A,B是没有关联的; 当2_时,有90%的把握判定变量A,B有关联; 当2_时,有95%的把握判定变量A,B有关联; 当2_时,有99%的把握判定变量A,B有关联.,2.706,2.706,3.841,6.635,【即时应用】 (1)下面是一个22列联表 则表中a、b处的值分别为_.,(2)在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算2的观测值为27.6

8、3,根据这一数据分析,我们有理由认为打鼾与患心脏病是_的(填“有关”或“无关”). 【解析】(1)a+21=73,a=52. 又a+2=b,b=54. (2)27.636.635, 有99%的把握认为“打鼾与患心脏病有关”. 答案:(1)52、54 (2)有关,相关关系的判断 【方法点睛】利用散点图判断相关关系的技巧 利用散点图判断两个变量是否有相关关系是比较简便的方法: (1)在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系;,(2)如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系; (3)如果所有的样本点都落在某一直线附

9、近,变量之间就有线性相关关系.,【例1】关于人体的脂肪含量(百分比)和年龄关系的研究中,得到如下一组数据: 判断它们是否有相关关系.,【解题指南】判断有无相关关系,一种常用的简便方法就是绘制散点图. 【规范解答】本题涉及两个变量:年龄与脂肪含量,可以以年龄为自变量,考查脂肪含量的变化趋势,分析相关关系通常借助散点图.,以年龄作为x轴,脂肪含量作为y轴,可得相应的散点图如图所示. 由散点图可知,两者之间具有相关关系.,【反思感悟】粗略判断相关性,可以观察一个变量随另一个变量变化而变化的情况.画出散点图能够更直观的判断是否相关,相关时是正相关还是负相关.,【变式训练】5个学生的数学和物理成绩如下表

10、: 画出散点图,并判断它们是否有相关关系,【解析】把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中描点(xi,yi)(i1,2,5),作出散点图如图 从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩增大时,物理成绩也在由小变大,即它们正相关.,线性回归方程及其应用 【方法点睛】求样本数据的线性回归方程的步骤 第一步,计算平均数 第二步,求和 第三步,计算 第四步,写出回归方程y=bx+a.,【提醒】对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数

11、据,应先作散点图,在具有线性相关关系的前提下再求回归方程.,【例2】(1)(2011广东高考)某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm. (2)测得某国10对父子身高(单位:英寸)如下:,画出散点图,说明变量y与x的相关性; 如果y与x之间具有线性相关关系,求线性回归方程. (已知: 4 490.34, =44 794, =44 941.93, =44 842.4),【解题指南】(1)求出回归方程,代入相关数据求得; (2)根据散点图判断相关性. 根据已知

12、数据和提示的公式数据求解,写出线性回归方程. 【规范解答】(1)由题设知:设相对的父亲的身高为x,相对的儿子的身高为y,它们对应的取值如表所示 于是有 a=176-1731=3,得回归方程为y=x+3,所以当x=182时,y=185. 答案:185,(2)散点图如图所示: 观察散点图中点的分布可以看出:这些点在一条直线的附近分布,所以变量y与x之间具有线性相关关系.,设回归方程为y=bx+a. 由 =67.01-0.464 666.835.974 7. 得所求的线性回归方程为y=0.464 6x+35.974 7.,【互动探究】若本例(2)题干不变,如果父亲的身高为73英寸,试估计儿子的身高.

13、 【解析】由本例(2)可知回归方程为y=0.464 6x+35.974 7. 当x=73时,y=0.464 673+35.974 769.9(英寸). 所以当父亲身高为73英寸时,儿子的身高约为69.9英寸.,【反思感悟】求线性回归方程,主要是利用公式,求出回归系数b,a,求解过程中注意计算的准确性和简便性.利用回归方程预报,就是求函数值.,【变式训练】一般来说,一个人脚越长,他的身高就越高现对10名成年人的脚长x与身高y进行测量,得如下数据(单位:cm):,作出散点图后,发现散点在一条直线附近经计算得到一些数据: 某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长26.5 cm,请你估计案

14、发嫌疑人的身高为_cm.,【解析】由已知 故y=7x. 当x=26.5时,y=185.5. 答案:185.5,独立性检验的基本思想及其应用 【方法点睛】利用统计量2进行独立性检验的步骤 (1)根据数据列出22列联表; (2)根据公式计算2的值; (3)比较2与临界值的大小关系,作出统计推断.,【例3】某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析,其中设备改造前的合格品有36件,不合格品有49件,设备改造后生产的合格品有65件,不合格品有30件根据所给数据: (1)写出22列联表; (2)判断产品是否合格与设备改造是否有关 【解题指南】列表后利用2的值进行检验.,【规范解答】(1)由已知数据得 (2) 12.38. 由于12.386.635,所以有99%以上的把握认为产品是否合格与设备改造有关,【反思感悟】准确计算2的值是关键.能有多大的把握认为两个变量有关,应熟悉常用的几个临界值.,【变式训练】为研究是否喜欢饮酒与性别之间的关系,在某地区随机抽取290人,得到如下列联表: 利用列联表的独立性检验判断是否喜

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号