2018-2019版数学新导学笔记人教A全国通用版选修2-3讲义:第三章 统计案例3.2

上传人:猪子****y 文档编号:90878420 上传时间:2019-06-19 格式:PDF 页数:17 大小:542.54KB
返回 下载 相关 举报
2018-2019版数学新导学笔记人教A全国通用版选修2-3讲义:第三章 统计案例3.2 _第1页
第1页 / 共17页
2018-2019版数学新导学笔记人教A全国通用版选修2-3讲义:第三章 统计案例3.2 _第2页
第2页 / 共17页
2018-2019版数学新导学笔记人教A全国通用版选修2-3讲义:第三章 统计案例3.2 _第3页
第3页 / 共17页
2018-2019版数学新导学笔记人教A全国通用版选修2-3讲义:第三章 统计案例3.2 _第4页
第4页 / 共17页
2018-2019版数学新导学笔记人教A全国通用版选修2-3讲义:第三章 统计案例3.2 _第5页
第5页 / 共17页
点击查看更多>>
资源描述

《2018-2019版数学新导学笔记人教A全国通用版选修2-3讲义:第三章 统计案例3.2 》由会员分享,可在线阅读,更多相关《2018-2019版数学新导学笔记人教A全国通用版选修2-3讲义:第三章 统计案例3.2 (17页珍藏版)》请在金锄头文库上搜索。

1、3.2 独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用 学习目标 1.了解分类变量的意义.2.了解 22 列联表的意义.3.了解随机变量 K2的意义.4. 通过对典型案例分析,了解独立性检验的基本思想和方法 知识点一 分类变量及 22 列联表 思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的 课外活动方式,结果整理成下表: 体育文娱合计 男生210230440 女生60290350 合计270520790 如何判定“喜欢体育还是文娱与性别是否有联系”? 答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断 梳理 (1)分类变量 变量的不

2、同“值”表示个体所属的不同类别,像这样的变量称为分类变量 (2)列联表 定义:列出的两个分类变量的频数表,称为列联表 22 列联表 一般地,假设有两个分类变量 X 和 Y,它们的取值分别为x1,x2和y1,y2,其样本频数列 联表(也称为 22 列联表)为下表. y1y2总计 x1abab x2cdcd 总计acbdabcd 知识点二 等高条形图 1与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展 示列联表数据的频率特征 2如果通过直接计算或等高条形图发现和相差很大,就判断两个分类变量之间有 a ab c cd 关系 知识点三 独立性检验 1定义:利用随机变量 K2

3、来判断“两个分类变量有关系”的方法称为独立性检验 2K2,其中 nabcd 为样本容量 nadbc2 abcdacbd 3独立性检验的具体做法 (1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界 ,然后查 表确定临界值 k0. (2)利用公式计算随机变量 K2的观测值 k. (3)如果 kk0,就推断“X 与 Y 有关系” ,这种推断犯错误的概率不超过 ;否则,就认为在 犯错误的概率不超过 的前提下不能推断“X 与 Y 有关系” ,或者在样本数据中没有发现足 够证据支持结论“X 与 Y 有关系” 1列联表中的数据是两个分类变量的频数( ) 2事件 A 与 B 的独立性检

4、验无关,即两个事件互不影响( ) 3K2的大小是判断事件 A 与 B 是否相关的统计量( ) 类型一 等高条形图的应用 例 1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿 棕色素定性检查,结果如下: 组别阳性数阴性数总计 铅中毒病人29736 对照组92837 总计383573 试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒 病人与尿棕色素为阳性是否有关系? 考点 定性分析的两类方法 题点 利用图形定性分析 解 等高条形图如图所示: 其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率 由图可以直观地看出铅中毒

5、病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中 毒病人与尿棕色素为阳性有关系 反思与感悟 在等高条形图中,可以估计满足条件 Xx1的个体中具有 Yy1的个体所占的 比例,也可以估计满足条件 Xx2的个体中具有 Yy1的个体所占的比例.两个比例 a ab c cd 的值相差越大,X 与 Y 有关系成立的可能性就越大 跟踪训练 1 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成 绩的影响,某地区教育主管部门从辖区初中生中随机抽取了 1 000 人调查,发现其中经常上 网的有 200 人,这 200 人中有 80 人期末考试不及格,而另外 800 人中有 120 人不

6、及格利 用图形判断学生经常上网与学习成绩有关吗? 考点 定性分析的两类方法 题点 利用图形定性分析 解 根据题目所给的数据得到如下 22 列联表: 经常上网不经常上网总计 不及格80120200 及格120680800 总计2008001 000 得出等高条形图如图所示: 比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此 可以认为经常上网与学习成绩有关 类型二 独立性检验 例 2 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查 结果如下表所示: 喜欢甜品不喜欢甜品合计 南方学生602080 北方学生101020 合计7030100 根

7、据表中数据,问是否在犯错误的概率不超过 0.05 的前提下认为“南方学生和北方学生在 选用甜品的饮食习惯方面有差异” 考点 独立性检验及其基本思想 题点 独立性检验的方法 解 将 22 列联表中的数据代入公式计算,得 K2的观测值 k nadbc2 abcdacbd 100 60 1020 102 70 30 80 20 4.762. 100 21 因为 4.7623.841,所以在犯错误的概率不超过 0.05 的前提下认为“南方学生和北方学生在 选用甜品的饮食习惯方面有差异” 反思与感悟 (1)独立性检验的关注点 在 22 列联表中,如果两个分类变量没有关系,则应满足 adbc0,因此|ad

8、bc|越小, 关系越弱;|adbc|越大,关系越强 (2)独立性检验的具体做法 根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界 ,然后 查表确定临界值 k0. 利用公式 K2计算随机变量 K2的观测值 k. nadbc2 abcdacbd 如果 kk0,推断“X 与 Y 有关系”这种推断犯错误的概率不超过 ;否则,就认为在犯 错误的概率不超过 的前提下不能推断“X 与 Y 有关系” ,或者在样本数据中没有发现足够 的证据支持结论“X 与 Y 有关系” 跟踪训练 2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情 况,某一教育机构对某学校的教师关于新

9、课程教学模式的使用情况进行了问卷调查,共调查 了 50 人,其中有老教师 20 人,青年教师 30 人老教师对新课程教学模式赞同的有 10 人, 不赞同的有 10 人;青年教师对新课程教学模式赞同的有 24 人,不赞同的有 6 人 (1)根据以上数据建立一个 22 列联表; (2)判断是否有 99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系 考点 独立性检验及其基本思想 题点 独立性检验的方法 解 (1)22 列联表如下所示: 赞同不赞同总计 老教师101020 青年教师24630 总计341650 (2)假设“对新课程教学模式的赞同情况与教师年龄无关” 由公式得 K24.9636.

10、635, 故有 99%的把握认为箱产量与养殖方法有关 反思与感悟 两个分类变量相关关系的判断 (1)等高条形图法:在等高条形图中,可以估计满足条件 Xx1的个体中具有 Yy1的个体所 占的比例,也可以估计满足条件 Xx2的个体中具有 Yy1的个体所占的比例.两个 a ab c cd 比例的值相差越大,X 与 Y 有关系成立的可能性就越大 (2)观测值法:通过 22 列联表,先计算 K2的观测值 k,然后借助 k 的含义判断“两个分类 变量有关系”这一结论成立的可信程度 跟踪训练 3 为了解某班学生喜爱打篮球是否与性别有关,对本班 48 人进行了问卷调查得 到了如下的 22 列联表: 喜爱打篮球

11、不喜爱打篮球合计 男生6 女生10 合计48 已知在全班 48 人中随机抽取 1 人,抽到喜爱打篮球的学生的概率为 . 2 3 (1)请将上面的 22 列联表补充完整(不用写计算过程); (2)能否在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关?说明你的理由; (3)现从女生中抽取 2 人进一步调查,设其中喜爱打篮球的女生人数为 X,求 X 的分布列与 均值 考点 独立性检验思想的应用 题点 分类变量与统计、概率的综合性问题 解 (1)列联表补充如下: 喜爱打篮球不喜爱打篮球合计 男生22628 女生101020 合计321648 (2)由 K24.286. 48 22060

12、2 28 20 32 16 因为 4.2863.841,所以,能在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有 关 (3)喜爱打篮球的女生人数 X 的可能取值为 0,1,2. 其概率分别为 P(X0), C 2 10 C 2 20 9 38 P(X1), C 1 10C 1 10 C 2 20 10 19 P(X2), C 2 10 C 2 20 9 38 故 X 的分布列为 X012 P 9 38 10 19 9 38 X 的均值为 E(X)01. 10 19 9 19 1某机构调查中学生的近视情况,了解到某校 150 名男生中有 80 名近视,140 名女生中有 70 名近

13、视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A平均数 B方差 C回归分析 D独立性检验 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 D 2对于分类变量 X 与 Y 的随机变量 K2的观测值 k,下列说法正确的是( ) Ak 越大, “X 与 Y 有关系”的可信程度越小 Bk 越小, “X 与 Y 有关系”的可信程度越小 Ck 越接近于 0, “X 与 Y 没有关系”的可信程度越小 Dk 越大, “X 与 Y 没有关系”的可信程度越大 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 B 解析 k 越大, “X 与 Y 没有关系”的可信程度越

14、小,则“X 与 Y 有关系”的可信程度越大, k 越小, “X 与 Y 有关系”的可信程度越小 3用等高条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系 最强的是( ) 考点 定性分析的两类方法 题点 利用图形定性分析 答案 D 解析 由等高条形图易知,D 选项两个分类变量关系最强 4若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的 结论,并且有 99%以上的把握认为这个结论是成立的,则下列说法中正确的是( ) A100 个吸烟者中至少有 99 人患有肺癌 B1 个人吸烟,那么这个人有 99%的概率患有肺癌 C在 100 个吸烟者中一定有患肺癌

15、的人 D在 100 个吸烟者中可能一个患肺癌的人也没有 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 D 解析 独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具 体到一个个体,则不一定发生 5高中流行这样一句话“文科就怕数学不好,理科就怕英语不好” 下表是一次针对高三文 科学生的调查所得的数据. 总成绩好总成绩不好总计 数学成绩好478a490 数学成绩不好39924423 总计bc913 (1)计算 a,b,c 的值; (2)文科学生总成绩不好与数学成绩不好有关系吗? 考点 独立性检验及其基本思想 题点 独立性检验的方法 解 (1)由 478a490,得 a12. 由 a24c,得 c122436. 由 bc913,得 b91336877. (2)计算随机变量 K2的观测值 k6.2335.024, 913 478 24399 122 490 423 877 36 因为 P(K25.024)0.025, 所以在犯错误的概率不超过 0.025 的前提下,认为文科学生总成绩不好与数学成绩不好有关 系 1列联表与等高条形图 列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系,而利用等高 条形图能形象直观地反映它

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题 > 高中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号