学年高中数学人教a版选修12同步辅导与检测:12独立性检验的基本思想及其初步应用

上传人:san****019 文档编号:83645277 上传时间:2019-02-28 格式:PPT 页数:63 大小:937.50KB
返回 下载 相关 举报
学年高中数学人教a版选修12同步辅导与检测:12独立性检验的基本思想及其初步应用_第1页
第1页 / 共63页
学年高中数学人教a版选修12同步辅导与检测:12独立性检验的基本思想及其初步应用_第2页
第2页 / 共63页
学年高中数学人教a版选修12同步辅导与检测:12独立性检验的基本思想及其初步应用_第3页
第3页 / 共63页
学年高中数学人教a版选修12同步辅导与检测:12独立性检验的基本思想及其初步应用_第4页
第4页 / 共63页
学年高中数学人教a版选修12同步辅导与检测:12独立性检验的基本思想及其初步应用_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《学年高中数学人教a版选修12同步辅导与检测:12独立性检验的基本思想及其初步应用》由会员分享,可在线阅读,更多相关《学年高中数学人教a版选修12同步辅导与检测:12独立性检验的基本思想及其初步应用(63页珍藏版)》请在金锄头文库上搜索。

1、1.2 独立性检验的基本思想及其初步应用,1了解独立性检验(只要求22列联表)的基本思想,记住K2的计算公式 2了解实际推断原理和假设检验的基本思想及其初步应用 3通过实际问题培养学生的学习兴趣,激发学生学习的积极性和主动性,增强社会实践能力,培养分析问题、解决问题的能力,1分类变量的定义 如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为_,分类变量,222列联表 一般地,假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:,abcd,ab,cd,ac,bd,3独立性检验.,kk0,abcd,临界值k0,观测值k,1重点: 通

2、过案例理解分类变量、列联表、独立性检验的含义;利用列联表的独立性检验进行估计 2难点: 独立性检验的基本思想;随机变量K2的含义,3知识结构图,4思维总结 (1)22列联表是传统的调查研究中最常用的手法之一,用于研究两个变量之间是相互独立还是存在某种关联性,它适用于分析两个变量之间的关系 由于分类变量的独立性检验是建立在22列联表基础之上的,因而设计22列联表是独立性检验的关键所在 (2)独立性检验 所谓独立性检验,就是根据采集样本的数据,先利用三维柱形图和二维条形图粗略判断两个分类变量是否有关系,再利用公式计算K2的值,比较与临界值的大小关系,来判定事件x与y是否无关的问题,三维柱形图:如下

3、图所示,三维柱形图的特点是直观易懂,但用手工制作较麻烦,如有条件可用计算机作图人们对吸烟与患肺癌是否有关系很感兴趣,并且在抽样调查整理数据后绘制了此图,那么我们能从图中获得什么信息呢?如果我们假设吸烟与患肺癌没有关系,则在吸烟者中患肺癌的与不患肺癌的比例应该与不吸烟者中患肺癌的与不患肺癌的比例差不多,即,二维条形图:二维条形图相对来说比较简单,其画法主要有两种,一种是根据抽样调查的数据直接成图,另一种是根据抽样调查的数据算出各部分所占的比例然后成图,通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度 利用独立性检验来考察两个分类变量是

4、否有关系,能较精确地给出这种判断的可靠程度,具体的做法是:a.根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.b.计算随机变量K2的观测值k.c.如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”,图形的应用,打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每晚都打鼾与患心脏病有关吗?用图表加以分析.,解析:法一:其三维柱形图如右上: 由图可知,主对角线上柱体高度之积与副对角线上柱体高

5、度之积差距较大,可在很大程度上认为患心脏病与每晚都打鼾有关,法二:其二维条形图如下:,从图表中可以粗略地看出每晚都打鼾与患心脏病有关,点评:(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,x与y有关系的可能性就越大 (2)在二维条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例 ,也可以估计满足条件Xx2的个体中具有Yy2的个体所占的比例 .两个比例的值相差越大,x与y有关的可能性就越大 (3)三维柱形图及二维图的区别,要注意图表互化,加强识图能力的培养,跟踪训练,1为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表

6、: 药物效果试验列联表,试用图形判断服用药和患病之间是否有关系?,解析:相应的等高条形图如下:,从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为:服用药和患病之间有关系,独立性检验方法K2公式,在调查的480名男士中有38名患有色盲,520名女士中有6名患有色盲,能否在犯错误的概率不超过0.001的前提下认为性别与患色盲有关系?,分析:,解析:根据题目所给的数据作出如下的列联表:,根据列联表中所给的数据可以得: a38,b442,c6,d514,ab480,cd520,ac44,bd956,n1 000.,由于27.13910.828,所以在犯错误的概

7、率不超过0.001的前提下,认为性别与患色盲有关系但这个结论只对所调查的这480名男士和520名女士有效,点评:解决一般的独立性检验问题的步骤: (1)通过列联表确定a,b,c,d,n的值;根据实际问题需要的可信程度确定临界值k0;,(3)如果kk0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“两个分类变量有关系”,跟踪训练,2(2011广东执信中学)某中学一位高三班主任对本班50名学生学习积极性和对待班级工作的态度进行长期的调查,得到的统计数据如下表所示:,(1)如果随机调查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是

8、多少?抽到不太积极参加班级工作且学习积极性一般的学生的概率是多少? (2)能否在犯错误的概率不超过0.001的前提下认为学生的积极性与对待班级工作的态度有关系?,所以,在犯错误的概率不超过0.001的前提下,认为“学生的学习积极性与对待班级工作的态度”有关系,1独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法,其分析方法有:等高条形图法和利用假设的思想方法,计算出某一个随机变量K2的观测值来进行判断 2在等高条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例为 ,也可以估计满足条件Xx2的个体中具有Yy1的个体所占的比例为 ,两个比例,的值相差越大,两个分类变量相

9、关的可能性就越大,3独立性检验的一般步骤: (1)根据样本数据制成22列联表; (2)根据公式K2 计算K2的观测值; (3)比较K2与临界值的大小关系作统计推断 4对于两个分类变量: (1)如果k10.828,则在犯错误的概率不超过0.001的前提下,认为X与Y有关系;,(2)如果k6.635,则在犯错误的概率不超过0.010的前提下,认为X与Y有关系; (3)如果k3.841,则在犯错误的概率不超过0.050的前提下,认为X与Y有关系; (4)如果k2.706,则在犯错误的概率不超过0.10的前提下,认为X与Y有关系; (5)如果k2.706,在样本数据中没有发现足够证据支持结论“X与Y有

10、关系”,基础训练,1在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( ) A散点图 B等高条形图 C22列联表 D以上均不对,B,2下列关于三维柱形图和二维条形图的叙述正确的是( ) A从三维柱形图可以精确地看出两个分类变量是否有关系 B从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小 C从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系 D以上说法都不对,C,3对分类变量X与Y的随机变量K2的观测值k,说法正确的是( ) Ak越大,“ X与Y有关系”可信程度越小 Bk越小,“ X与Y有关系”可信程度越小 Ck越接近于0,“

11、X与Y无关”程度越小 Dk越大,“X与Y无关”程度越大,B,4下面是一个22列联表:,则表中a、b的值分别为( ) A94、96 B52、50 C52、54 D54、52,C,5性别与身高列联表如下:,那么,检验随机变量K2的值约等于 ( ) A0.043 B0.367 C22 D26.87,C,6给出列联表如下:,根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( ) A0.4 B0.5 C0.75 D0.85,B,7若由一个22列联表中的数据计算得K24.013,那么在犯错误的概率不超过0.05的前提下认为两个变量_关系(填“有”或“没有”),有,8(2013韶关二模)以下四个

12、命题: 在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样; 样本数据:3,4,5,6,7的方差为2; 对于相关系数r,|r|越接近1,则线性相关程度越强; 通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:,附表,答案:,9某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:,为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2,4.844,因为,K23.841,根据下表中的参考数据:,所以判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为_,5%,10某学校课题组为了

13、研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表所示:,若单科成绩85以上(含85分),则该科成绩优秀 (1)根据上表完成下面的22列联表(单位:人),(2)根据题(1)中表格的数据计算,能否在犯错误的概率不超过0.005的前提下认为学生的数学成绩与物理成绩之间有关系? 参数数据: 假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表(称为22列联表)为:,则随机变量K2 ,其中nabcd为样本容量; 独立检验随机变量K2的临界值参考表:,解析:(1)22列联表为(单位:人):,在犯错误的概率不超过0.0

14、05的前提下认为:学生的数学成绩与物理成绩之间有关系,11(2013深圳二模)2013年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关数据如下表:,(1)根据表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关? (2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少? 参考数据:,解析:(1)提出假设H0:使用淡化海砂与混凝土耐久性

15、是否达标无关. 根据表中数据,求得K2的观测值,能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关. (2)用分层抽样的方法在使用淡化海砂的样本中抽取6个,其中应抽取“混凝土耐久性达标”的为 6=5,“混凝土耐久性不达标”的为6-5=1, “混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.,在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种. 设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.,12(2011揭阳一模)某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号