高考第一轮复习变量间的相关关系与独立检验演示课件

上传人:W**** 文档编号:150512768 上传时间:2020-11-06 格式:PPT 页数:34 大小:330.50KB
返回 下载 相关 举报
高考第一轮复习变量间的相关关系与独立检验演示课件_第1页
第1页 / 共34页
高考第一轮复习变量间的相关关系与独立检验演示课件_第2页
第2页 / 共34页
高考第一轮复习变量间的相关关系与独立检验演示课件_第3页
第3页 / 共34页
高考第一轮复习变量间的相关关系与独立检验演示课件_第4页
第4页 / 共34页
高考第一轮复习变量间的相关关系与独立检验演示课件_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《高考第一轮复习变量间的相关关系与独立检验演示课件》由会员分享,可在线阅读,更多相关《高考第一轮复习变量间的相关关系与独立检验演示课件(34页珍藏版)》请在金锄头文库上搜索。

1、1,第5课时 变量间的相关关系回归分析及独立性检验,赵建文,2,1.会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.了解独立检验(只要求22列联表)的基本思想、方法简单应用. 4.了解假设检验的基本思想、方法简单应用. 5.会求回归方程,并能进行回归分析,3,、 (3)正相关 在散点图中,点散布在从 到 的区域对于两个变量的这种相关关系,我们将它称为正相关,基础知识梳理,左上角,右下角,1两个变量的线性相关,(1)相关关系,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,则称这

2、两个变量具有 . 注意:相关关系是一种不确定性关系,相关关系,(2)散点图,在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做 .,散点图,4,(5)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,一条直线附近,(4)负相关 在散点图中,点散布在从 到 的区域,两个变量的这种相关关系称为负相关,右上角,左下角,(6)相关系数 相关系数r用来衡量两个变量的相关程度,其公式为:,5,0r1; 当r0时,表示两个变量正相关; 当r0时,表示两个变量负相关 ; r越近于1,表明两个变量的线性相关性越强:r越近于0

3、,表明两个变量之间几乎不存在线性相关关系. 一般的r0.75,1,表明两个变量有较强线性相关性越强;r(0.25,0.75,表明两个变量相关性一般;|r|0,0.3),表明两个变量相关性较弱。,(7)相关性判定 散点图法;相关系数法,相关系数具有性质:,6,思考?,相关关系与函数关系有什么异同点? 【思考提示】相同点:两者均是指两个变量的关系 不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系,7,2回归模型 (1)最小二乘法:求回归直线使得样本数据的点到回归直线的 的方法叫做最小二乘法,距离的平方和最小,(2)回归

4、方程 具有线性相关关系的两个变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程为: 其中a,b是待定参数,称为样本点的中心。,回归方程一定过样本中心点,8,(3)线性回归模型 y=bx+a+e(e为随机误差).,其中,9,(4)建立回归模型的基本步骤 确定研究对象,明确解释变量与预报变量; 画出解释变量与预报变量的散点图; 由经验确定回归方程的类型; 估计回归方程中的参数; 对回归模型进行进行残差分析,若存在异常,则检验数据是否有误,或模型是否合适。,(5)随机误差产生的原因 用回归模型近似真实模型差异产生误差; 忽略了某些因素的影响; 观测误差。上面三项误差越小,说明我们

5、的回归模型的拟合效果越好。,10,3回归分析 (1)回归分析 对具有 的两个变量进行统计分析的一种常用方法,相关关系,(2)残差分析,回归模型中随机误差 的估计值 (其中 )叫相应点(xi,yi)的残差。,残差图 在直角坐标系中,以样本编号或解释变量为横坐标,残差为纵轴坐标作出的图像叫残差图。,残差分析 若残差点比较均匀的分布在横轴附近很窄的区域内,说明回归模型拟合较好,若个别点离横轴较远,需要检查数据收集是否有误差,若取样有误差作出修行正,并对回归模型进行修改,否则,分析其他原因.,11,(3)拟合效果分析,总体偏差平方和,残差平方和,回归平方和,用R2来刻画回归的效果,R2 ,表示 .,越

6、大,拟合效果越好,相关指数,方差估计,用 来刻画回归效果, 值越小,表明拟合效果越好.,12,4独立性检验 (1)分类变量的定义 如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为 (2)22列联表 一般地,假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为,分类变量,ac,bd,ab,cd,abcd,13,(3)二维条形图,(4)三维柱状图,将分类变量X取值x1,x2与Y的取值y1,y2的取值用条形图表示出来,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例 ,也可以估计满足条件Xx2的个体中具有Yy2的个体所占的比例

7、 .“两个比例的值相差越大,H1成立的可能性就越大”,在坐标系中作出分类变量X、Y取值的柱形图,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大,通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度,14,基础知识梳理,(5)独立性检验 用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度具体步骤是: 根据实际问题需要的可信程度确定临界值k0; 利用公式K2 ,由观测数据计算得到随机变量K2的观测值k; 如果kk0,就以(1P(K2k0)100%的把握认为“X

8、与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据,利用K2来确定在多大程度可以认为“两个分类变量有关系”的方法称为独立性检验.,15,1在对两个变量x,y进行线性回归分析时有下列步骤: 对所求出的回归方程作出解释;收集数据(xi,yi),i1,2,n;求线性回归方程;求相关系数;根据所搜集的数据绘制散点图如果根据可靠性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是() A B C D 答案:D,16,2对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),(xn,yn),则下列说法中不正确的是() A由样本数据得到的回归方程 b

9、xa必过样本中心(x,y) B残差平方和越小的模型,拟合的效果越好 C用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好 D若变量y和x之间的相关系数为r0.9362,则变量y和x之间具有线性相关关系 答案:C,17,3(2009宁夏、海南)对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量u、v有观测数据(ui,vi)(i1,2,10),得散点图(2)由这两个散点图可以判断(),A变量x与y正相关,u与v正相关 B变量x与y正相关,u与v负相关 C变量x与y负相关,u与v正相关 D变量x与y负相关,u与v负相关 解析:由图(1)可知,各点整体呈递减趋势

10、,x与y负相关,由图(2)可知,各点整体呈递增趋势,u与v正相关 答案:C,18,4下面是一个22列联表 则表中a、b处的值分别为() A94,96 B52,50 C52,54 D54,52 答案:C,19,判断两个变量正相关还是负相关,有三种方法: 1利用散点图; 2利用相关系数r的符号;当r0时,正相关;r0时,负相关; 3在已知两变量线性相关时,也可以利用回归方程 abx.当b0时, abx是增函数,两变量是正相关,当b0时, abx是减函数, 两变量是负相关,20,【例1】山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如

11、下表所示的一组数据(单位:kg) (1)画出散点图; (2)判断是否具有相关关系,21,思维点拨:用施化肥量x作为横轴,产量y为纵轴可作出散点图,由散点图即可分析是否具有线性相关关系 解答:(1)散点图如右图所示, (2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.,22,对具有相关关系的两个变量进行统计分析时,首先要作出散点图,然后进行相关性检验,在确认具有线性相关关系后,再求其回归直线,【例2】 一台机器使用时间较长,但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结

12、果:,(1)对变量y与x进行相关性检验; (2)如果y与x有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?,23,(2) 0.728 6x0.857 1. (3)要使 100.728 6x0.857 110,所以x14.901 3. 所以机器的转速应控制在14.901 3转/秒以下,解答:,思维点拨:利用相关系数r进行线性相关检验(也可利用散点图)如果线性相关,再求回归直线方程并加以判断,24,变式2.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料: (1)y与x间是否有线性相关

13、关系?若有,求出线性回归方程; (2)估计使用年限为10年时的维修费用,25,26,所谓独立性检验,就是根据采集样本的数据,先利用三维柱形图和二维条形图粗略判断两个分类变量是否有关系,再利用公式计算K2的值,比较它与临界值的大小关系,来判断事件X与Y是否有关的问题,27,【例3】(2009辽宁)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: 甲厂:,乙厂: (1)试分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填下面22列联表,并问是否有99%的把握认为“

14、两个分厂生产的零件的质量有差异”.,28,解答:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为 72%; 乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为 64%.,所以有99%的把握认为“两个分厂生产的零件的质量有差异”,(2),29,变式3.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动 (1)根据以上数据建立一个22列联表; (2)画出二维条形图; (3)检验休闲方式是否与性别有关

15、,可靠性有多大,30,解答:(1)22列联表如图:,(2)二维条形图如图:,(3)假设休闲方式与性别无关,则 K2 6.2015.024,所以有理由认为休闲方式与性别无关是不合理的,即我们有97.5%的把握认为休闲方式与性别有关,31,【方法规律】 1求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误(注意回归直线方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同) 2回归分析是处理变量相关关系的一种数学方法主要解决:确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;根据一组观察值,预测变量的取值及判断变量

16、取值的变化趋势;求出回归直线方程 3独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的随机变量,对假设的正确性进行判断.,32,为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议现对他前7次考试的数学成绩x、物理成绩y进行分析下面是该生7次考试的成绩.,(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明; (2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.,33,【答题模板】,(2)由于x与y之间具有线性相关关系,根据回归系数公式得到 b 0.5,a1000.510050, 线性回归方程为 0.5x50. 当y115时,x130. 建议:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号