2017-2018年高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修1-2

上传人:小** 文档编号:34190556 上传时间:2018-02-21 格式:DOC 页数:15 大小:779.55KB
返回 下载 相关 举报
2017-2018年高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修1-2_第1页
第1页 / 共15页
2017-2018年高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修1-2_第2页
第2页 / 共15页
2017-2018年高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修1-2_第3页
第3页 / 共15页
2017-2018年高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修1-2_第4页
第4页 / 共15页
2017-2018年高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修1-2_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《2017-2018年高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修1-2》由会员分享,可在线阅读,更多相关《2017-2018年高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修1-2(15页珍藏版)》请在金锄头文库上搜索。

1、112 独立性检验的基本思想及其初步应用独立性检验的有关概念提出问题问题 1:观察教材第 10 页的探究,其中的频数表叫什么?提示:列联表问题 2:由表中数据,你能说吸烟对患肺癌有影响吗?提示:能问题 3:如何用数字分析此类问题?提示:利用随机变量 K2进行分析导入新知1分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量222 列联表假设有两个分类变量 X 和 Y,它们的取值分别为 x1, x2和 y1, y2,其样本频数列联表(也称 22 列联表)为:y1 y2 总计x1 a b a bx2 c d c d总计 a c b d a b c d3等高条形图将列联表中的数据

2、用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图4 K2统计量为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量 K2,其中 n a b c d 为样本容量n ad bc 2 a b c d a c b d5独立性检验利用随机变量 K2来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类变量独立性检验化解疑难反证法原理与独立性检验原理的比较2反证法原理在假设 H0下,如果推出一个矛盾,就证明了 H0不成立独立性检验原理在假设 H0下,如果出现一个与 H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过小概率.独立性检

3、验的步骤提出问题问题:利用随机变量 K2进行独立性检验需要几步?提示:三步导入新知独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界 ,然后查右表确定临界值 k0.P(K2 k0) 0.50 0.40 0.25 0.15 0.10k0 0.455 0.708 1.323 2.072 2.706P(K2 k0) 0.05 0.025 0.010 0.005 0.001k0 3.841 5.024 6.635 7.879 10.828(2)利用公式 K2 ,计算随机变量 K2的观测值 k.n ad bc 2 a b c d a c b d(3)如果 k

4、k0,就推断“ X 与 Y 有关系” ,这种推断犯错误的概率不超过 ;否则,就认为在犯错误的概率不超过 的前提下不能推断“ X 与 Y 有关系” ,或者在样本数据中没有发现足够证据支持结论“ X 与 Y 有关系” 化解疑难详析独立性检验(1)通过列联表或观察等高条形图判断两个分类变量之间有关系,属于直观判断,不足之处是不能给出推断“两个分类变量有关系”犯错误的概率,而独立性检验可以弥补这个不足(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体3列联表和等高条形图的应用例 1某学校对高三学生作了一项调查,发现:在平时的模拟

5、考试中,性格内向的学生 426 人中有 332 人在考前心情紧张,性格外向的学生 594 人中有 213 人在考前心情紧张作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系解作列联表如下:性格内向 性格外向 总计考前心情紧张 332 213 545考前心情不紧张 94 381 475总计 426 594 1 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关类题通法细解等高条形图(1)绘制等高条形图时,列联表的行对应的是高

6、度,两行的数据不相等,但对应的条形图的高度是相同的;两列的数据对应不同的颜色(2)等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显即 和 相差很大,就判断两个分类变量之aa b cc d间有关系活学活用为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟 父母不吸烟 总计子女吸烟 237 83 320子女不吸烟 678 522 1 2004总计 915 605 1 520利用等高条形图判断父母吸烟对子女吸烟是否有影响解:等高条形图如下:由图形观察可以看出子女吸烟者中父母吸烟的比例要比子女不吸烟者中父母吸烟

7、的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.独立性检验的原理例 2(辽宁高考节选)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品 不喜欢甜品 合计南方学生 60 20 80北方学生 10 10 20合计 70 30 100根据表中数据,问:是否有 95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”?解将 22 列联表中的数据代入公式计算,得 k 4.762.100 6010 2010 270308020 10021由于 4.7623.841,所以有 95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯

8、方面有差异” 类题通法解决独立性检验问题的思路解决一般的独立性检验问题,首先由题目所给的 22 列联表确定 a, b, c, d, n 的值,然后代入随机变量 K2的计算公式求出观测值 k,将 k 与临界值 k0进行对比,确定有多大的把握认为“两个分类变量有关系” 活学活用某医院对治疗支气管肺炎的两种方案 A, B 进行比较研究,将志愿者分为两组,分别采用方案 A 和方案 B 进行治疗,统计结果如下:5有效 无效 总计使用方案 A 组 96 120使用方案 B 组 72总计 32(1)完成上述列联表;(2)能否在犯错误的概率不超过 0.05 的前提下认为治疗是否有效与方案选择有关?解:(1)列

9、联表如下:有效 无效 总计使用方案 A 组 96 24 120使用方案 B 组 72 8 80总计 168 32 200(2)K2 3.5713.841,200 968 2472 21208016832所以不能在犯错误的概率不超过 0.05 的前提下认为治疗是否有效与方案选择有关1.独 立 性 检 验 与 统 计 的 综 合 应 用典例(12 分)某工厂有工人 1 000 名,其中 250 名工人参加过短期培训(称为 A 类工人),另外 750 名工人参加过长期培训(称为 B 类工人)现用分层抽样的方法(按 A 类、B 类分两层)从该工厂的工人中抽取 100 名工人,调查他们的生产能力(此处生

10、产能力指一天加工的零件数),结果如下表表 1:A 类工人生产能力的频数分布表生产能力分组 110,120) 120,130) 130,140) 140,150)人数 8 x 3 2表 2:B 类工人生产能力的频数分布表生产能力分组 110,120) 120,130) 130,140) 140,150)人数 6 y 27 18(1)确定 x, y 的值;6(2)完成下面 22 列联表,并回答能否在犯错误的概率不超过 0.001 的前提下认为工人的生产能力与工人的类别有关系.生产能力分组工人类别 110,130) 130,150)总计A 类工人B 类工人总计附: K2 ,n ad bc 2 a b

11、 c d a c b dP(K2 k0) 0.050 0.010 0.001k0 3.841 6.635 10.828解题流程规范解答(1)从该工厂的工人中抽取 100 名工人,且该工厂中有 250 名 A 类工人,750 名 B 类工人,要从 A 类工人中抽取 25 名,从 B 类工人中抽取 75 名,(2 分) x2583212, y756271824.(4 分)(2)根据所给的数据可以完成列联表,如下表所示:生产能力分组工人类别110,130) 130,150) 总计A 类工人 20 5 25B 类工人 30 45 75总计 50 50 1007由列联表中的数据,得 K2的观测值为k 1

12、210.828.(10 分)100 2045 530 225755050因此,在犯错误的概率不超过 0.001 的前提下,认为工人的生产能力与工人的类别有关系(12 分)名师批注要确定 x, y 的值,应先确定 A 类工人及 B 类工人中应各抽取多少人,此处易误认为x25, y75,从而导致解题错误6 分此处易犯错误有两点:计算失误;将公式中的数据搞错活学活用电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了 100 名观众进行调查,其中女性有 55 名下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于 40 分的观众称为“体育迷”

13、 ,已知“体育迷”中有10 名女性根据已知条件完成下面的 22 列联表,据此资料,你是否认为“体育迷”与性别有关?非体育迷 体育迷 总计男女总计8附:P(K2 k0) 0.05 0.01k0 3.841 6.635解:由频率分布直方图可知,在抽取的 100 名观众中, “体育迷”有 25 名, “非体育迷”有 75 名,又已知 100 名观众中女性有 55 名,女“体育迷”有 10 名,所以男性有 45 名,男“体育迷”有 15 名,从而可完成 22 列联表,如下表:非体育迷 体育迷 总计男 30 15 45女 45 10 55总计 75 25 100由 22 列联表中的数据,得 K2的观测值

14、为k 3.030.100 3010 1545 245557525因为 3.0303.841,所以没有充分的证据表明“体育迷”与性别有关随堂即时演练1下面是一个 22 列联表:y1 y2 总计x1 a 21 73x2 2 25 27总计 b 46则表中 a, b 处的值分别为()A94,96 B52,50C52,54 D54,52解析:选 C由Error!得Error!2博士生和硕士生毕业情况的一个随机样本给出了关于所获取的学位类别与学生性别的分类数据如下表由表中的数据,可得()硕士 博士 总计男 162 27 1899女 143 8 151总计 305 35 340A性别与获取学位类别有关B性

15、别与获取学位类别无关C性别决定获取学位的类别D以上说法都不正确解析:选 A由列联表中的数据,得 K2的观测值为 k7.346.635, 1628 14327 234030535189151所以在犯错误的概率不超过 0.01 的前提下,认为性别与获取学位类别有关而选项 C中的表述不恰当,因为性别与获取学位类别不是因果关系,只是统计学上的一种非确定性关系,故不能用“决定”二字描述3独立性检验所采用的思路是:要研究 A, B 两类变量彼此相关,首先假设这两类变量彼此_在此假设下构造随机变量 K2,如果 K2的观测值较大,那么在一定程度上说明假设_答案:无关不成立4在吸烟与患肺病是否相关的判断中,有下面的说法:若 K2的观测值 k6.635,则在犯错误的概率不超过 0.01 的前提下,认为吸烟与患肺病有关系,那么在 100 个吸烟的人中必有 99 人患有肺病;从独立性检验可知,在犯错误的概率不超过 0.01 的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有 99%的可能患有肺

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号