变量的相关性回归分析独立性检验试题.ppt

上传人:F****n 文档编号:96551046 上传时间:2019-08-27 格式:PPT 页数:37 大小:885KB
返回 下载 相关 举报
变量的相关性回归分析独立性检验试题.ppt_第1页
第1页 / 共37页
变量的相关性回归分析独立性检验试题.ppt_第2页
第2页 / 共37页
变量的相关性回归分析独立性检验试题.ppt_第3页
第3页 / 共37页
变量的相关性回归分析独立性检验试题.ppt_第4页
第4页 / 共37页
变量的相关性回归分析独立性检验试题.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《变量的相关性回归分析独立性检验试题.ppt》由会员分享,可在线阅读,更多相关《变量的相关性回归分析独立性检验试题.ppt(37页珍藏版)》请在金锄头文库上搜索。

1、1,本资料来源,新课标高中一轮总复习,第七单元 计算原理、概率与统计,第55讲,变量的相关性、回归分析、独立性检验,1.会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.了解独立性检验的含义,知道什么是22列联表. 4.会运用独立性检验的方法判断事件A与B的关系. 5.会求回归方程模型,并能进行相关性检验. 6.掌握相关性检验的步骤.,1.下列两个变量之间的关系是相关关系的是( ),A,A.人的年龄和身高 B.正方形的边长和面积 C.正n边形的边数与其内角和 D.某角度与它的余弦值,人的年龄和身

2、高是一种不确定的关系,其他三组两个变量之间都是确定的函数关系,故选A.,2.回归直线方程表示直线必定过点( ),D,A.(0,0) B.( ,0) C.(0,) D.( , ),回归直线必定经过样本中心点( , ).,3.某装饰品的广告费投入x(单位:万元)与销售y(单位:万元)之间有如下表所示的对应数据: 则回归直线方程为( ),A,A. =7.5x+24.5 B. =7.5x-24.5 C. =-7.5x+24.5 D. =-7.5x-24.5,通过公式b= , ,a= - b,求之.,4.下列说法中正确的是( ),C,A.K2在任何相互独立问题中都可以用于检验有关还是无关 B.K2的值越

3、大,两个事件的相关性就越大 C.K2是用来判断两个分类变量是否有关系的随机变量 D.K2的观测值k=,5.用A和B两种药物各治疗9个病人,结果如下: 则这两种药物的疗效 显著差别.(答“有” 或“无”),由表中看出,使用A药痊愈的概率高于B药,故可以粗略估计两种药的疗效是有显著差别的.,有,1.两个变量间的相关关系 如果两个变量之间确实存在关系,但又没有函数关系所具有的确定性,它们的关系带有随机性,则称这两个变量具有 . 有相关关系的两个变量,若一个变量的值由小到大时,另一个变量的值也是由小到大,这种相关称为 ;反之,一个变量的值由小到大,另一个变量的值由大到小,这种相关称为 .,相关关系,正

4、相关,负相关,2.散点图 在平面直角坐标系中描点,得到关于两个变量的一组数据的图形,这样的图形叫做 . 如果散点图中,相应于具有相关关系的两个变量所有观察值的数据点,分布在一条直线附近,则称这两个变量具有 ,这条直线叫做 ,方程为 =bx+a, 其中b= = , a= - b.,散点图,线性相关关系,回归直线,3.最小二乘法 使残差平方和Q= (yi-bxi-a)2为最小的方法,叫做 . 4.线性回归模型 (1)样本的相关系数r= .,最小二乘法,当r0时,表示两个变量正相关,当r0时,表示两个变量负相关,r越近于1,表明两个变量的线性相关性越强:r越近于0,表明两个变量之间几乎不存在线性相关

5、关系. (2)线性回归模型y=bx+a+e(e为随机误差). (3)总体偏差平方和= (yi- )2,残差 =yi- ,残差平方和 (yi- )2,回归平方和= .,总偏差平方和-残差平方和,5.相关指数 R2=1- . 用R2来刻画回归的效果,R2 ,表示 . 6.分类变量 变量的不同“值”,表示个体所属的不同类别.,越大,拟合效果越好,7.列联表(即列出两个分类变量的频率表) 其中n为样本容量. 8.建立回归模型的基本步骤 (1)确定研究对象,明确解释变量与预报变量; (2)画出解释变量与预报变量的散点图; (3)由经验确定回归方程的类型; (4)估计回归方程中的参数;,(5)分析残差图是

6、否异常,若存在异常,则检查数据是否有误,或模型是否合适等. 9.利用随机变量K2进行判断检验 K2= . 先假设两个分类变量x与y无关系,若K2的值较大,则拒绝假设,只要K22.706,就认为x与y有关系. 利用K2来确定在多大程度可以认为“两个分类变量有关系”的方法称为独立性检验.,题型一 变量的相关性,例1,汽车的重量和汽车消耗一升汽油所行驶的路程成负相关,这说明( ),A.汽车越重,每消耗1升汽油所行驶的路程越短 B.汽车越轻,每消耗1升汽油所行驶的路程越短 C.汽车越重,消耗汽油越多 D.汽车越轻,消耗汽油越多,A,要透彻理解一些常见参概念的意义.,题型二 回归分析,例2,某车间为了规

7、定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,根据试验数据得到如下图所示的散点图,其中x表示零件的个数,y表示加工时间. (1)求出y关于x的线性 回归方程 =bx+a; (2)试预测加工10个零 件需多长时间?,(1) = =3.5, = =3.5, 所以b= = =0.7, a=-b=3.5-0.73.5=1.05, 所以线性回归方程为 =0.7x+1.05.,(2)当x=10时, =0.710+1.05=8.05, 故加工10个零件大约需8.05小时.,求出回归直线方程后,往往用来作为现实生产中的变量之间相关关系的近似关系,从而可用来指导生产实践.,为了研究某种细菌随时间x

8、变化繁殖的个数,收集数据如下: (1)以x为解释变量,y为预报变量作这些数据的散点图; (2)求y关于x的回归方程.,用所学函数看变化趋势.,(1)画散点图,(2)若建立线性模型 =a+bx,则得到 =-56.467+34.086x,若建立指数函数模型=menx, 则得到 =3.0519e0.6902x.,回归方程不一定惟一,该题还可以用二次函数为模型.,题型二 独立性检验,例2,在对人群的休闲方式的一次调查中,共调查了124人,其中女性70人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中21人主要的休闲方式是看电视,其余男性的主要休闲方式是运动. (1)根据以

9、上数据建立一个22列联表; (2)判断性别与休闲方式是否有关系,并说明理由.,是否有关系取决于K2的大小.,(1) 22列联表为,( 2) K2= = 6.2 设H1:性别与不同运动方式有关系. 假设H0:性别与不同的运动方式没有关系,在H0的前提下,K2应该很小, 而P(K25.024)0.025. 所以有97.5的把握认为性别与不同的运动方式之间有关系.,对判断过程和计算方式要清楚,计算K2时勿将(ad-bc)2中的平方运算漏掉.,下面是两个变量间的一组数据:,(1)在同一直角坐标系中画出散点图、直线 =24+2.5x和曲线 = ; (2)比较所画直线与曲线,哪一条更能表现这组数据之间的关

10、系? (3)分别计算用直线方程与曲线方程得到在5个x点处的预测值与实际预测之间的误差,比较两个误差绝对值之和的大小.,(1)所求作图型如下:,(2)从图形上看,曲线 = 比直线 =24+2.5x更能表现这组数据间的关系. (3)用直线 =24+2.5x近似数据时,误差绝对值的和为27.5,用曲线 = 时,误差绝对值的和为12.5,比前者小得多.,由散点图可比较直观地看出更能表现所给数据的关系的曲线,再通过比较误差绝对值之和的大小,则显得更有说服力.,1.计算回归直线方程中的参数a、b时应分层进行,避免因计算错误而产生误差. 2.求线性回归方程之前,应对数据进行线性相关分析. 3.回归分析的关键

11、是根据散点图选择函数模型,用相关系数判定哪种模型更好. 4.独立性检验不能用比例余数来判定,a、b、c、d成比例扩大,K2的值是不同的,正确列出22列联表是解题的关键步骤.,(2009辽宁卷)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:,甲厂: 乙厂:,(1)试分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填下面22列联表,并分析是否有99%的把握认为“两个分厂生产的零件的质量有差异”.,附:K2= ,(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为 =72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为 =64%.,(2) 22列联表如下: K2= 7.356.635, 所以有99%的把握认为“两个分厂生产的零件的质量有差异”.,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号