55变量间的相关关系、统计案例

上传人:公**** 文档编号:512999554 上传时间:2024-01-05 格式:DOCX 页数:8 大小:108.08KB
返回 下载 相关 举报
55变量间的相关关系、统计案例_第1页
第1页 / 共8页
55变量间的相关关系、统计案例_第2页
第2页 / 共8页
55变量间的相关关系、统计案例_第3页
第3页 / 共8页
55变量间的相关关系、统计案例_第4页
第4页 / 共8页
55变量间的相关关系、统计案例_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《55变量间的相关关系、统计案例》由会员分享,可在线阅读,更多相关《55变量间的相关关系、统计案例(8页珍藏版)》请在金锄头文库上搜索。

1、变量间的有关关系、记录案例一、考点梳理1变量间的有关关系(1)常用的两变量之间的关系有两类:一类是函数关系,另一类是有关关系;与函数关系不同,有关关系是一种非拟定性关系(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种有关关系称为正有关,点分布在左上角到右下角的区域内,两个变量的有关关系为负有关两个变量的线性有关(1)从散点图上看,如果这些点从整体上看大体分布在通过散点图中心的一条直线附近,称两个变量之间具有线性有关关系,这条直线叫回归直线.(2)使得样本数据的点到它的距离的平方和最小,这一措施叫做最小二乘法.(3)回归方程为x,其中=,=.()有关系数:当时,表白两个变量正

2、有关;当r时,表白两个变量负有关r的绝对值越接近于1,表白两个变量的线性有关性越强.的绝对值越接近于0时,表白两个变量之间几乎不存在线性有关关系一般|r不小于0.5时,觉得两个变量有很强的线性有关性.3 独立性检查y总计x1aba+bxcdc总计da+c+d假设有两个分类变量X和Y,它们的取值分别为1,2和1,y,其样本频数列联表(称为2列联表)为: K2= (其中na+bc+d为样本容量)4.易错点1.易混淆有关关系与函数关系,两者的区别是函数关系是一种拟定的关系,而有关关系是一种非拟定的关系,函数关系是一种因果关系,而有关关系不一定是因果关系,也也许是随着关系2回归分析中易误觉得样本数据必

3、在回归直线上,实质上回归直线必过(,)点,也许所有的样本数据点都不在直线上3.运用回归方程分析问题时,所得的数据易误觉得精确值,而实质上是预测值(盼望值)5.技巧措施求回归直线方程的环节: ()根据样本数据画出散点图,拟定两个变量具有线性有关关系;(2)计算出,;(3)计算回归系数,;(4)写出回归直线方程x.独立性检查的一般环节(1)根据样本数据制成22列联表;()根据公式K=计算的值;()查表比较K2与临界值的大小关系,作记录判断二、基本自测.下列结论对的的是()函数关系是一种拟定性关系;有关关系是一种非拟定性关系;回归分析是对具有函数关系的两个变量进行记录分析的一种措施;回归分析是对具有

4、有关关系的两个变量进行记录分析的一种常用措施.x1234y82.53.3.8 C. D2.已知x,y之间的数据如表所示,则回归直线过点( )A(,0) B(,.) C.(,2.) (4,)3.在研究吸烟与患肺癌的关系中,通过收集数据、整顿分析数据得“吸烟与患肺癌有关”的结论,并且在出错误概率不超过.1的前提下觉得这个结论是成立的,则下列说法中对的的是()A1个吸烟者中至少有99人患有肺癌 B.1个人吸烟,那么这人有99的概率患有肺癌在10个吸烟者中一定有患肺癌的人 D.在10个吸烟者中也许一种患肺癌的人也没有在伦敦奥运会期间,某网站针对性别与否与看奥运会直播有关进行了一项问卷调查,得出如下表格

5、: 性别与否看奥运会直播 男女看奥运会直播6002 000不看奥运会直播2 00 00(附:K2=),则K2=( ) A00 B750C.8 D850三、考点解读考点一有关关系的判断【例】 1.对变量x,y有观测数据(xi,yi)(=1,2,,10),得散点图;对变量u,v有观测数据(u,vi)(i1,2,,0),得散点图.由这两个散点图可以判断( ) .变量与正有关,u与正有关 B.变量x与y正有关,u与v负有关 C.变量x与y负有关,u与v正有关 D.变量x与y负有关,u与v负有关2已知变量x,y呈线性有关关系,线性回归方程为y=0.2x,则变量,y是( )A.线性正有关关系 B由回归方程

6、无法判断其正负有关.线性负有关关系D不存在线性有关关系如图所示,有A,C,5组数据,去掉_组数据后,剩余的4组数据具有较强的线性有关关系.类题通法 有关关系的直观判断措施就是作出散点图,若散点图呈带状且区域较窄,阐明两个变量有一定的线性有关性,若呈曲线型也是有有关性,若呈图形区域且分布较乱则不具有有关性.考点二回归方程的求法及回归分析【例2】某爱好小组欲研究昼夜温差大小与患感冒人数多少之间的关系,她们分别到气象局与某医院抄录了1到6月份每月0号的昼夜温差状况与因患感冒而就诊的人数,得到如下资料:日期1月10日月10日3月10日4月1日5月10日6月10日昼夜温差x()0113186就诊人数y(

7、个)22229212该爱好小组拟定的研究方案是:先从这6组数据中选用2组,用剩余的4组数据求线性回归方程,再用选用的2组数据进行检查()若选用的是1月与6月的2组数据,请根据2至5月份的数据,求出y有关x的线性回归方程;(2)若由线性回归方程得到的估计数据与所选出的检查数据的误差均不超过2,则觉得得到的线性回归方程是抱负的,试求该小组所得的线性回归方程与否抱负?(3)试预测昼夜温差为5时,因感冒而就诊的人数约为多少?类题通法运用线性回归方程可以对总体进行预测估计,线性回归方程将部分观测值所反映的规律进行延伸,是我们对有线性有关关系的两个变量进行分析和控制的根据,根据自变量的取值估计和预测因变量

8、的值,在现实生活中有广泛的应用【针对训练】已知下列表格所示数据的回归直线方程为3.8x+a,则a的值为_x245y254257266考点三独立性检查【例】(福建)某工厂有2周岁以上(含25周岁)工人300名,25周岁如下工人2名为研究工人的日平均生产量与否与年龄有关,现采用分层抽样的措施,从中抽取了0名工人,先记录了她们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含2周岁)”和“5周岁如下”分为两组,再将两组工人的日平均生产件数提成5组:,),60,),70,80),80,90),0,100分别加以记录,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数局限性60件的工人中随

9、机抽取2人,求至少抽到一名“25周岁如下组”工人的概率;()规定日平均生产件数不少于件者为“生产能手”,请你根据已知条件完毕2列联表,并判断与否有0%的把握觉得“生产能手与工人所在的年龄组有关”?(K2k)0.1000.50.010.01k03.84163510.28附: 类题通法1在22列联表中,如果两个变量没有关系,则应满足ad-c|ad-b|越小,阐明两个变量之间关系越弱;|adbc越大,阐明两个变量之间关系越强.2.解决独立性检查的应用问题,一定要按照独立性检查的环节得出结论【针对训练】 欧洲杯期间,某一电视台对年龄高于40岁和不高于40岁的人与否喜欢西班牙队进行调查,40岁以上调查了

10、50人,不高于40岁调查了5人,所得数据制成如下列联表:不喜欢西班牙队喜欢西班牙队总计4岁以上q50不高于4岁15355总计a100已知工作人员从所有记录成果中任取一种,取到喜欢西班牙队的人的概率为,则有超过_的把握觉得年龄与西班牙队的被喜欢限度有关附:K2=P(K2k)0.150.10.050.2.000.000.001k2.072.06381504.3.710.28四、当堂检测1设(x1,1),(x,2),,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归方程(如图),如下结论中对的的是( )Ax和y正有关 Bx和的有关系数为直线l的斜率Cx和y的有

11、关系数在到0之间D当n为偶数时,分布在l两侧的样本点的个数一定相似2.变量U与V相相应的一组样本数据为(1,.4),(2,.),(,3),(4,3.8),由上述样本数据得到与V的线性回归分析,2表达解释变量对于预报变量变化的奉献率,则R2=()A. B . .3浙江卫视为了调查评价“中国好声音”栏目播出前后浙江卫视的收视率有无明显提高,在播出前后分别从居民点抽取了10位居民,调核对浙江卫视的关注状况,制成列联表,通过计算2.9,根据这一数据分析,下列说法对的的是( )有9%的人觉得该栏目优秀B.有9%的人觉得“中国好声音”栏目播出前后浙江卫视的收视率有明显提高有9%的把握觉得“中国好声音”栏目

12、播出前后浙江卫视的收视率有明显提高D没有理由觉得“中国好声音”栏目播出前后浙江卫视的收视率有无明显提高(2).0500.0100.001k.816310.8附表:4在一项打鼾与患心脏病的调查中,共调查了1 67人,通过计算K2的观测值k2.,根据这一数据分析,我们有理由觉得打鼾与患心脏病是_的(有关,无关)5.为了判断高中三年级学生与否选修文科与性别的关系,现随机抽取50名学生,得到如下列联表:理科文科合计男1310女7202合计2005已知P(K23.841)0.05,(K5.024).05.根据表中数据,得到K24.84.则觉得选修文科与性别有关系出错的也许性为_y1y2总计x1a21x222254总计b46120五、 课后巩固1下面是22列联表:则表中,b的值分别为( )4,2 B52, C.5,7 D.7,522.下列说法:将一组数据中的每个数据都加上或减去同一种常数后,方差恒不变;设有一种回归方程35x,变量增长个单位时,平均增长5个单位;线性回归方程=x+必过样本点的中心(,);在一种22列联表中,由计算得K2=3.079,则有99的把握确认这两个变量间有关系其中错误的个数是( ) A0 B1 .2 D.本题可以参照独立性检查临界值表P(K2k)0.5400.25.10100

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号