独立性检验最新版本ppt课件

上传人:资****亨 文档编号:133960154 上传时间:2020-06-01 格式:PPT 页数:59 大小:2.13MB
返回 下载 相关 举报
独立性检验最新版本ppt课件_第1页
第1页 / 共59页
独立性检验最新版本ppt课件_第2页
第2页 / 共59页
独立性检验最新版本ppt课件_第3页
第3页 / 共59页
独立性检验最新版本ppt课件_第4页
第4页 / 共59页
独立性检验最新版本ppt课件_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《独立性检验最新版本ppt课件》由会员分享,可在线阅读,更多相关《独立性检验最新版本ppt课件(59页珍藏版)》请在金锄头文库上搜索。

1、1 2独立性检验的基本思想及其初步应用 1 掌握2 2列联表的独立性检验 能利用给出的数据列出列联表并会求K2的观测值 2 了解独立性检验的基本思想和方法 1 本节课的重点是理解独立性检验的基本思想及实施步骤 2 本节课的难点是了解随机变量K2的含义和根据K2的值得出结论的意义 1 分类变量变量的不同 值 表示个体所属的 像这样的变量称为分类变量 2 列联表 1 定义 列出的两个分类变量的 称为列联表 不同类别 频数表 2 2 2列联表 一般地 假设两个分类变量X和Y 它们的取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称2 2列联表 为 3 独立性检验 1 定义 利用随机变量K2

2、来判断 两个分类变量有关系 的方法称为两个分类变量的独立性检验 2 公式 K2 其中n a b c d 1 在独立性检验中 计算得k 29 78 在判断变量相关时 P K2 6 635 0 01的含义是什么 提示 P K2 6 635 0 01的含义是在犯错误的概率不超过0 01的前提下认为两个变量相关 2 列联表中 ad bc 的值与两个分类变量之间相关的强弱有什么关系 提示 在列联表中 若两个分类变量没有关系 则 ad bc 0 所以 ad bc 的值越小 两个分类变量之间的关系越弱 ad bc 的值越大 两个分类变量之间的关系越强 3 作散点图的主要目的是 解析 散点图可以形象地展示两个

3、变量之间的关系 所以它的主要目的就是直观了解两个变量之间的关系 答案 直观了解两个变量之间的关系 4 若由一个2 2列联表中的数据计算得K2的观测值k 4 013 则认为 两个变量有关系 犯错误的概率不超过 解析 P K2 3 841 0 05 认为 两个变量有关系 犯错误的概率不超过0 05 答案 0 05 1 对于 分类变量 的理解 1 这里的 变量 和 值 都应作为 广义 的变量和值进行理解 例如 对于性别变量 其取值为男和女两种 那么这里的变量指的是性别 同样这里的 值 指的是 男 和 女 因此 这里所说的 变量 和 值 不一定取的是具体的数值 2 独立性检验与反证法的异同点独立性检验

4、的思想来自于统计学的假设检验思想 它与反证法类似 假设检验和反证法都是先假设结论不成立 然后根据是否能够推出 矛盾 来断定结论是否成立 但二者 矛盾 的含义不同 反证法中的 矛盾 是指不符合逻辑的事件的发生 而假设检验中的 矛盾 是指不符合逻辑的小概率事件的发生 即在结论不成立的假设下 推出利用结论成立的小概率事件的发生 3 判断两个分类变量是否有关系的两种方法比较判断两个分类变量是否有关系的两种方法是 等高条形图和独立性检验 1 通过等高条形图 可以粗略地判断两个分类变量是否有关系 但是这种判断无法精确地给出所得结论的可靠程度 2 利用独立性检验来判断两个分类变量是否有关系 能够精确地给出这

5、种判断的可靠程度 也常与图形分析法结合 等高条形图的应用 技法点拨 1 判断两个分类变量是否有关系的两个常用方法 1 利用数形结合思想 借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法 2 一般地 在等高条形图中 与相差越大 两个分类变量有关系的可能性就越大 2 利用等高条形图判断两个分类变量是否相关的步骤 典例训练 1 从发生交通事故的司机中抽取2000名司机作随机样本 根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下 相应的等高条形图如图所示 试结合等高条形图分析血液中含有酒精与对事故负有责任是否有关系 2 某学校对高三学生进行了一项调查发现 在平时的模拟

6、考试中 性格内向的学生426人中有332人在考前心情紧张 性格外向的学生594人中有213人在考前心情紧张 作出等高条形图 利用图形判断考前心情紧张与性格类别是否有关系 解析 1 比较来说 两者差距较大 在 有酒精 和 无酒精 两个矩形中 阴影部分的面积不同 由此可以看出在某种程度上认为血液中含有酒精与对事故负有责任有关系 2 作列联表如下 相应的等高条形图如图所示 图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例 从图中可以看出 考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高 可以认为考前紧张与性格类型有关 归纳 等高条形图的作法及作用小结 提示 1 首

7、先作2 2列联表 注意对涉及的变量分清类别 其次要注意计算的准确性 第三画等高条形图 注意各变量的顺序与所画位置 2 通过等高条形图可以粗略地判断两个分类变量是否有关系 但无法精确地给出所得结论的可靠程度 变式训练 为了了解铅中毒病人是否有尿棕色素增加现象 分别对病人组和对照组的尿液做尿棕色素定性检查 结果如下表 问铅中毒病人组和对照组的尿棕色素阳性数有无差别 解析 根据列联表作出等高条形图 如图 由图形可知 铅中毒病人组与对照组相比较 尿棕色素为阳性差异明显 因此铅中毒病人与尿棕色素为阳性存在相关关系 独立性检验 技法点拨 解决一般的独立性检验问题的步骤 典例训练 1 2012 武汉高二检测

8、 在独立性检验中 若随机变量K2的观测值k 6 635 则 A X与Y有关系 犯错的概率不超过1 B X与Y有关系 犯错的概率超过1 C X与Y没有关系 犯错的概率不超过1 D X与Y没有关系 犯错的概率超过1 2 2012 厦门高二检测 在对人们休闲方式的一次调查中 共调查120人 其中女性70人 男性50人 女性中有40人主要的休闲方式是看电视 另外30人主要的休闲方式是运动 男性中有20人主要的休闲方式是看电视 另外30人主要的休闲方式是运动 1 根据以上数据建立一个2 2的列联表 2 休闲方式与性别是否有关 解析 1 选A k 6 635 说明两个变量X与Y有关系 这种说法犯错误的概率

9、不超过0 01 即1 故选A 2 1 2 的列联表为 休闲方式 2 计算K2的观测值为而2 706 3 429 3 841 因为P K2 2 706 0 10 P K2 3 841 0 05 所以 在犯错误的概率不超过0 10的前提下 认为休闲方式与性别有关 互动探究 本题条件不变的情况下 画出等高条形图 解析 思考 1 求k的值的关键是什么 2 k的大小对 两个变量有关 有什么影响 提示 1 求K2的观测值k的关键是要准确列出2 2列联表 即找准表达式中的各个量的数值 2 利用K2的观测值进行独立性检验可以精确地给出这种判断的可靠程度 而且k的值越大 说明 X与Y有关系 成立的可能性越大 变

10、式训练 2012 琼海高二检测 为了调查某地区老年人是否需要志愿者帮助 用简单随机抽样方法从该地区调查了500位老年人 结果如下 性别 1 估计该地区老年人中 需要志愿者提供帮助的老年人的比例 2 能否在犯错误的概率不超过0 01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关 附 解析 1 需要帮助的老年人的比例估计值为 2 P K2 6 635 0 010 在犯错误的概率不超过0 01的前提下认为该地区的老年人是否需要帮助与性别有关 独立性检验的综合应用 技法点拨 判断两个变量是否有关的三种方法 典例训练 1 某高校 统计初步 课程的教师随机调查了选该课的一些学生情况 具体数据如

11、下表 为了判断主修统计专业是否与性别有关系 根据表中的数据 得到因为P k 3 841 0 05 所以判定主修统计专业与性别有关系 那么这种判断出错的可能性为 2 为了调查某生产线上质量监督员甲对产品质量好坏有无影响 现统计数据如下 甲在生产现场时 990件产品中有合格品982件 次品8件 甲不在生产现场时 510件产品中有合格品493件 次品17件 试分别用列联表 等高条形图 独立性检验的方法分析监督员甲对产品质量好坏有无影响 能否在犯错误的概率不超过0 001的前提下 认为质量监督员甲是否在生产现场与产品质量有关 解析 1 根据独立性检验的思想 假设没关系正确的可能性为5 所以 判断有关系

12、错误的可能性也为5 答案 5 2 1 2 2列联表如下 由列联表可得 ad bc 982 17 493 8 12750 相差较大 可在某种程度上认为 质量监督员甲是否在现场与产品质量有关系 2 画等高条形图 如图可知 在某种程度上认为 质量监督员甲是否在生产现场与产品质量有关系 3 由2 2列联表中数据 计算得到K2的观测值为因此 在犯错误的概率不超过0 001的前提下 认为质量监督员甲在不在生产现场与产品质量好坏有关系 想一想 在独立性检验中 容易出现的错误有哪些 提示 容易因不能准确列出列联表而犯错误 用等高条形图粗略估计代替准确结论而犯错误 由于记错K2公式 计算出错而犯错误 由于不能利

13、用K2的值与临界值k0比较而出错 变式训练 对某校学生进行心理障碍测试得到如下列联表 试说明在这三种心理障碍中哪一种与性别关系最大 解题指南 分别计算三种心理障碍的K2观测值k1 k2 k3 比较它们的值与3 841的关系 回答问题 解析 对于上述三种心理障碍分别构造三个随机变量K2的观测值 k1 k2 k3 则所以 在犯错误的概率不超过0 05的前提下 认为焦虑与性别无关 说谎与性别有关 懒惰与性别无关 规范解答 独立性检验 典例 12分 2012 荆州高二检测 调查某医院某段时间内婴儿出生的时间与性别的关系 得到下面的数据 出生时间在晚上的男婴为24人 女婴为8人 出生时间在白天的男婴为3

14、1人 女婴为26人 1 将下面的2 2列联表补充完整 出生时间 2 能否在犯错误的概率不超过0 1的前提下认为婴儿性别与出生时间有关系 解题指导 规范解答 1 6分 出生时间 2 由所给数据计算K2的观测值 8分根据临界值表知P K2 2 706 0 10 9分因此在犯错误的概率不超过0 1的前提下认为婴儿的性别与出生的时间有关系 12分 阅卷人点拨 通过阅卷后分析 对解答本题的失分警示和解题启示总结如下 注 此处的 见规范解答过程 规范训练 12分 2012 大庆高二检测 调查在2 3级风时的海上航行中男女乘客的晕船情况 共调查了71人 其中女性34人 男性37人 女性中有10人晕船 另外2

15、4人不晕船 男性中有12人晕船 另外25人不晕船 判断晕船是否与性别有关系 解题设问 1 本题两个分类变量是什么 2 题中数据取值明确吗 性别和是否晕船 明确 规范答题 列出2 2的列联表 8分 晕船情况 计算 11分因为k 2 706 所以在样本数据中没有发现足够的证据支持结论 晕船与性别有关系 12分 1 在研究两个分类变量之间是否有关时 可以粗略地判断两个分类变量是否有关的是 A 散点图 B 等高条形图 C 2 2列联表 D 以上均不对 解析 选B 等高条形图可以粗略地判断两个分类变量之间是否有关 2 分类变量X和Y的列联表如下 则下列说法中正确的是 A ad bc越小 说明X与Y关系越

16、弱 B ad bc越大 说明X与Y关系越强 C ad bc 2越大 说明X与Y关系越强 D ad bc 2越接近于0 说明X与Y关系越强 解析 选C ad bc 2越大 则K2越大 X与Y关系越强 故选C 3 在吸烟与患肺病这两个分类变量的计算中 下列说法中正确的是 A 若随机变量K2的观测值k 6 635 我们说吸烟与患肺病有关的概率为0 99 则某人吸烟 那么他可能患有肺病的概率为0 99 B 若从统计量中求出吸烟与患肺病有关的概率为0 99 则在100个吸烟者中必有99人患有肺病 C 若从统计量中求出吸烟与患肺病有关的概率为0 95 是指推断错误的概率为0 05 D 以上说法均错误 解析 选C 根据随机变量K2的意义可知 A与B均错误 C正确 4 某班主任对全班50名学生进行了一次调查 所得数据如表 由表中数据计算得到K2的观测值k 5 059 于是 填 能 或 不能 在犯错误的概率不超过0 01的前提下认为性别与按时完成作业有关 解析 查表知若要在犯错误的概率不超过0 01的前提下认为性别与按时完成作业有关 则临界值k0 6 635 本题中 k 5 059 6 635 所以不能

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号