2017-2018年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修2-3

上传人:小** 文档编号:34169032 上传时间:2018-02-21 格式:DOC 页数:15 大小:722.05KB
返回 下载 相关 举报
2017-2018年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修2-3_第1页
第1页 / 共15页
2017-2018年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修2-3_第2页
第2页 / 共15页
2017-2018年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修2-3_第3页
第3页 / 共15页
2017-2018年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修2-3_第4页
第4页 / 共15页
2017-2018年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修2-3_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《2017-2018年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修2-3》由会员分享,可在线阅读,更多相关《2017-2018年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案(含解析)新人教a版选修2-3(15页珍藏版)》请在金锄头文库上搜索。

1、13.2 立性检验的基本思想及其初步应用独立性检验的有关概念在某次调查中,480 名男人中有 38 名患有色盲,520 名女人中有 6 名患有色盲问题 1:患色盲与性别有关系吗?提示:有问题 2:通过怎样比较看出患色盲与性别有关系?提示:通过患色盲的人数占性别类型的比例1分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量222 列联表假设有两个分类变量 X 和 Y,它们的取值分别为 x1, x2和 y1, y2,其样本频数列联表(也称为 22 列联表)为:y1 y2 总计x1 a b a bx2 c d c d总计 a c b d a b c d3.K2统计量为了使不同样

2、本容量的数据有统一的评判标准,我们构造一个随机变量 K2 ,其中 n a b c d 为样本容量n ad bc 2 a b c d a c b d4独立性检验利用随机变量 K2来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类变量独立性检验122 列联表的特征2在列联表中,如果两个分类变量没有关系,则应满足 ad bc0.因此| ad bc|越小,说明两个分类变量之间的关系越弱;| ad bc|越大,说明两个分类变量之间的关系越2强.独立性检验的思想吸烟与患肺癌“列联表”中,事件 A 表示不吸烟, B 表示不患肺癌问题 1:事件 A, B 发生的频率可求吗?提示:可以问题 2

3、:通常情况下,为研究问题方便,常用什么近似于概率?提示:频率问题 3:事件 A, B 无关有怎样的概率公式?提示: P(AB) P(A)P(B)独立性检验的思想:要确定“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立在该假设下我们构造的随机变量 K2应该很小,如果由观测数据计算得到的 K2观测值 k 很大,那么在一定程度上说明假设不合理,根据随机变量 K2的含义,可以通过可信度表评价该假设不合理的程度,即“两个分类变量有关系”的可信程度1 P(K26.635)0.01 表明 H0成立的概率很小,是小概率事件,可以判断 H0不成立,也就是“

4、两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过 0.01,也可以理解为“有 99%的把握认为两个分类变量之间有关系” 2利用独立性检验解决问题的基本步骤:(1)根据相关数据作列联表;(2)求 K2的观测值;(3)与临界值作比较,得出结论列联表和等高条形图的应用某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426 人中有 332 人在考前心情紧张,性格外向的学生 594 人中有 213 人在考前心情紧3张作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系作列联表如下:性格内向 性格外向 总计考前心情紧张 332 213 545考前心

5、情不紧张 94 381 475总计 426 594 1 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关进行独立性检验的前提是根据题中数据获得 22 列联表,常用等高条形图展示列联表数据的频率特征,即将 与 (或 与 )的值相比,由此能直观地反映出两个分aa b cc d ba b dc d类变量间是否相互影响,但是此方法较粗劣为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟 父母不吸烟 总计子女

6、吸烟 237 83 320子女不吸烟 678 522 1 200总计 915 605 1 520利用等高条形图判断父母吸烟对子女吸烟是否有影响解:等高条形图如下:4由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系” 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品 不喜欢甜品 合计南方学生 60 20 80北方学生 10 10 20合计 70 30 100根据表中数据,问能否在犯错误的概率不超过 0.05 的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有

7、差异” 将 22 列联表中的数据代入公式计算,得 kn ad bc 2 a b c d a c b d 4.762.100 6010 2010 270308020 10021由于 4.7623.841,故在犯错误的概率不超过 0.05 的前提下认为南方学生和北方学生在选用甜品的饮食习惯方面有差异根据题意列出 22 列联表,计算 K2的观测值,如果 K2的观测值很大,说明两个分类变量有关系的可能性很大;如果 K2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系这需要给出正确的计算,避免计算失误在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有 24 人,不晕机

8、的有 31 人;女乘客晕机的有 8 人,不晕机的有 26 人请你根据所给数据判定:在天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?解:根据题意,列出 22 列联表如下:晕机 不晕机 总计男乘客 24 31 55女乘客 8 26 345总计 32 57 89假设在天气恶劣的飞机航程中男乘客不比女乘客更容易晕机由公式可得 K2的观测值kn ad bc 2 a b c d a c b d 3.6892.706,89 2426 318 255343257故在犯错误的概率不超过 0.10 的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.4.独 立 性 检 验 与 统 计 的 综

9、合 应 用(12 分)某工厂有工人 1 000 名,其中 250 名工人参加过短期培训(称为 A 类工人),另外 750 名工人参加过长期培训(称为 B 类工人)现用分层抽样的方法(按 A 类、 B 类分两层)从该工厂的工人中抽取 100 名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表表 1 A 类工人生产能力的频数分布表生产能力分组 110,120) 120,130) 130,140) 140,150)人数 8 x 3 2表 2 B 类工人生产能力的频数分布表生产能力分组 110,120) 120,130) 130,140) 140,150)人数 6 y 27 18

10、(1)确定 x, y 的值;(2)完成下面 22 列联表,并回答能否在犯错误的概率不超过 0.001 的前提下认为工人的生产能力与工人的类别有关系.生产能力分组工人类别 110,130) 130,150)总计A 类工人B 类工人总计6(1)从该工厂的工人中抽取 100 名工人,且该工厂中有250 名 A 类工人,750 名 B 类工人,要从 A 类工人中抽取 25 名,从 B 类工人中抽取 75 名,(2 分) x2583212,y756271824.(4 分)(2)根据所给的数据可以完成列联表,如下表所示:生产能力分组工人类别110,130) 130,150) 总计A 类工人 20 5 25

11、B 类工人 30 45 75总计 50 50 100 6分 由列联表中的数据,得 K2的观测值为k 1210.828.(10 分)100 2045 530 225755050因此,在犯错误的概率不超过 0.001 的前提下认为工人的要确定 x, y 的值,应先确定 A 类工人及B 类工人中应各抽取多少人,此处易误认为x25, y75,从而导致解题错误.此处易犯错误有两点:计算失误;7生产能力与工人的类别有关系(12 分) 将公式中的数据搞错.某学生对其亲属 30 人的饮食进行了一次调查,并用如图所示的茎叶图表示 30 人的饮食指数(说明:图中饮食指数低于 70 的人,饮食以蔬菜为主;饮食指数高

12、于 70 的人,饮食以肉类为主)(1)根据以上数据完成下面 22 列联表:主食蔬菜 主食肉类 总计50 岁以下50 岁以上总计(2)能否在犯错误的概率不超过 0.01 的前提下认为其亲属的饮食习惯与年龄有关?请写出简要分析解:(1)22 列联表如下:主食蔬菜 主食肉类 总计50 岁以下 4 8 1250 岁以上 16 2 18总计 20 10 30(2)因为 K2 106.635,30 8 128 212182010P(K26.635)0.01.所以可以在犯错误的概率不超过 0.01 的前提下认为其亲属的饮食习惯与年龄有关81下面是一个 22 列联表:y1 y2 总计x1 a 21 73x2

13、2 25 27总计 b 46 100则表中 a, b 处的值分别为()A94,96 B52,50C52,54 D54,52解析:选 C由Error!得Error!2某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:文化程度与月收入列联表(单位:人)月收入 2 000元以下月收入 2 000元及以上总计高中文化以上 10 45 55高中文化及以下 20 30 50总计 30 75 105由上表中数据计算得 K2的观测值k 6.109,请估计有多少把握认为文化程度与月105 1030 4520 255503075收入有关系()A1% B99%C2.5% D97.5%解析

14、:选 D由于 6.1095.024,所以在犯错误的概率不超过 0.025 的前提下,即有97.5%的把握认为文化程度与月收入有关系3独立性检验所采用的思路是:要研究 A, B 两类型变量彼此相关,首先假设这两类变量彼此无关,在此假设下构造随机变量 K2,如果 K2的观测值较大,那么在一定程度上说明假设不成立4在吸烟与患肺病是否相关的判断中,有下面的说法:若 K2的观测值 k6.635,则在犯错误的概率不超过 0.01 的前提下,认为吸烟与患肺病有关系,那么在 100 个吸烟的人中必有 99 人患有肺病;从独立性检验可知在犯错误的概率不超过 0.01 的前提下,认为吸烟与患肺病有关系时,若某人吸

15、烟,则他有 99%的可能患有肺病;9从独立性检验可知在犯错误的概率不超过 0.05 的前提下,认为吸烟与患肺病有关系时,是指有 5%的可能性使得推断错误其中说法正确的是_(填序号)解析: K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法不正确;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确答案:5下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析实验效果.70 分及 70 分以下 70 分以上 总计对照班 32 18 50实验班 12 38 50总计 44 56 100附:P(K2 k0) 0.025 0.010 0.005k0 5.024 6.635 7.879解:根据列联表中的数据,由公式得 K2的观测值kn ad bc 2 a b c d a c b d 16.234.100 3238 1812 250504456因为 16.2346.635,所以,在犯错误的概率不超过 0.010 的前提下认为高二年级统计

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号