数学同步优化指导(人教选修1-2)课件:1.2 独立性检验的基本思想及其初步应用

上传人:tang****xu2 文档编号:126185253 上传时间:2020-03-23 格式:PPT 页数:47 大小:1.98MB
返回 下载 相关 举报
数学同步优化指导(人教选修1-2)课件:1.2 独立性检验的基本思想及其初步应用_第1页
第1页 / 共47页
数学同步优化指导(人教选修1-2)课件:1.2 独立性检验的基本思想及其初步应用_第2页
第2页 / 共47页
数学同步优化指导(人教选修1-2)课件:1.2 独立性检验的基本思想及其初步应用_第3页
第3页 / 共47页
数学同步优化指导(人教选修1-2)课件:1.2 独立性检验的基本思想及其初步应用_第4页
第4页 / 共47页
数学同步优化指导(人教选修1-2)课件:1.2 独立性检验的基本思想及其初步应用_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《数学同步优化指导(人教选修1-2)课件:1.2 独立性检验的基本思想及其初步应用》由会员分享,可在线阅读,更多相关《数学同步优化指导(人教选修1-2)课件:1.2 独立性检验的基本思想及其初步应用(47页珍藏版)》请在金锄头文库上搜索。

1、第一章 统计统计 案例 1 2 独立性检验检验 的基本思想及其初步应应用 1 了解独立性检验的基本思想 方法及其简单应用 重 点 2 通过收集数据 并依据独立性检验的原理作出合理推 断 培养学生良好的思维习惯 难点 1 分类变量和列联表 1 分类变量 变量的不同 值 表示个体所属的 像这样的变 量称为 不同类别 分类变量 2 列联表 定义 列出的两个分类变量的 称为列联表 2 2列联表 一般地 假设有两个分类变量X和Y 它们 的取值分别为 x1 x2 和 y1 y2 其样本频数列联表 称为2 2 列联表 为 频数表 数据 数据 相互影响 频率特征 想一想 1 如何理解分类变量 提示 1 这里的

2、 变量 和 值 都应作为 广义 的变量和值来 理解 例如 对于性别变量 其取值有 男 和 女 两种 这里的 变量 指的是 性别 这里的 值 指的是 男 或 女 因此 这里 说的 变量 和 值 不一定是取具体的数值 2 分类变量是大量存在的 例如 吸烟变量有吸烟与不吸 烟两种类别 而国籍变量则有多种类别 2 利用等高条形图能否精确地判断两个分类变量是否有 关系 为什么 提示 不能 因为通过等高条形图 可以粗略地判断两个 分类变量是否有关系 但这种判断无法精确地给出所得结论的 可靠程度 3 独立性检验 两个分类变量有关系 a b c d 具 体 步 骤 根据实际问题的需要 确定容许推断 两个分类

3、变量有关系 犯错误概率的上界a 然后查表确定 利用公式计算随机变量K2的 如果 就推断 X与Y有关系 这种推 断 不超过a 否则就认为在 犯错误的概率不超过a的前提下不能推断 X与Y有关 系 或者在样本数据中 支持结 论 X与Y有关系 临界值k0 观测值k k k0 犯错误的概率 没有发现足够证据 想一想 3 从本质上说 独立性检验是对两个分类变量 是否有关系的判断吗 提示 独立性检验是对两个分类变量有关系的可信程度的 判断 而不是对其是否有关系的判断 独立性检验的结论只能 是有多大的把握认为两个分类变量有关系 而不能是两个分类 变量一定有关系或没有关系 4 在判断两个分类变量是否有关系时 等

4、高条形图与独 立性检验各有什么特点 提示 1 通过等高条形图 可以粗略地判断两个分类变量 是否有关系 但是这种判断无法精确地给出所得结论的可靠程 度 2 利用独立性检验来判断两个分类变量是否有关系 能够 精确地给出这种判断的可靠程度 也常与图形分析法结合 5 在判断变量相关时 若K2的观测值k 56 632 则 P K2 6 635 0 01和P K2 10 828 0 001 哪种说法是正确的 提示 两种说法均正确 P K2 6 635 0 01的含义是在犯错误的概率不超过0 01的前 提下 认为两变量相关 而P K2 10 828 0 001的含义是在犯错误的概率不超过 0 001的前提下

5、 认为两变量相关 1 在研究吸烟与患肺癌的关系中 通过收集数据 整理 分析数据得 吸烟与患肺癌有关 的结论 并且在犯错误的概率 不超过0 01的前提下认为这个结论是成立的 下列说法中正确 的是 A 100个吸烟者中至少有99人患有肺癌 B 1个人吸烟 那么这个人有99 的概率患有肺癌 C 在100个吸烟者中一定有患肺癌的人 D 在100个吸烟者中可能一个患肺癌的人也没有 解析 独立性检验的结果与实际问题有差异 即独立性检 验的结论是一个数学统计量 它与实际问题中的确定性存在差 异 答案 D 答案 C 解析 a 21 73 a 52 又a 22 b b 74 a b 126 答案 126 4 若

6、由一个2 2列联表中的数据计算得K2的观测值k 4 013 那么在犯错误的概率不超过 的前提下认为两个 变量有关系 解析 因为k 4 013 3 841 故在犯错误的概率不超过0 05 的前提下认为两个变量有关系 答案 0 05 1 在2 2列联表中 如果两个分类变量没有关系 则应满 足ad bc 0 因此 ad bc 越小 关系越弱 ad bc 越大 关 系越强 2 独立性检验的基本思想 1 独立性检验的基本思想类似于数学中的反证法 要确认 两个分类变量有关系 这一结论成立的可信程度 首先假设该 结论不成立 即假设结论 两个分类变量没有关系 成立 在该 假设下我们构造的随机变量K2应该很小

7、如果由观测数据计算 得到的K2的观测值很大 则在一定程度上说明假设不合理 根 据随机变量K2的含义 可以通过P K2 6 635 0 01来评价假设 不合理的程度 由实际计算出k 6 635 说明假设不合理的程度 约为99 即 两个分类变量有关系 这一结论成立的可信程度 约为99 2 在实际问题中要记住以下几个常用值 k 6 635有99 的把握认为 X与Y有关系 k 3 841有95 的把握认为 X与Y有关系 k 2 706有90 的把握认为 X与Y有关系 k 2 706就认为没有充分证据显示 X与Y有关系 3 反证法原理与独立性检验原理的比较 反证法原理 在假设H0下 如果推出一个矛盾 就

8、证明了 H0不成立 独立性检验原理 在假设H0下 如果出现一个与H0相矛盾 的小概率事件 就推断H0不成立 且该推断犯错误的概率不超 过这个小概率 3 两个分类变量相关性检验方法 利用独立性检验来考察两个分类变量是否有关系 能较精 确地给出这种判断的可靠程度 具体的做法是 根据实际问 题的需要确定容许推断 两个分类变量有关系 犯错误概率的上 界a 然后查表确定临界值k0 计算随机变量K2的观测值k 如 果k k0 就推断 X与Y 有关系 这种推断犯错误的概率不超过a 否则就认为在犯错误的概率不超过a的前提下不能推断 X与Y 有关系 或者在样本数据中没有发现足够证据支持结论 X与Y 有关系 用2

9、 2列联表分析两变量间的关系 1 题中条件不变 尝试用 ad bc 的大小判断饮食习惯与 年龄是否有关 解 将本例2 2列联表中的数据代入可得 ad bc 43 33 21 27 852 相差较大 可在某种程度上认为饮食习惯与年 龄有关系 某学校对高三学生作了一项调查 发现 在平时的模拟考试中 性格内向的学生426人中有332 人在考前心情紧张 性格外向的学生594人中有213人在考前心 情紧张 作出等高条形图 利用图形判断考前心情紧张与性格 类别是否有关系 用等高条形图分析两变量间的关系 自主解答 作列联表如下 性格内向性格外向总计 考前心情紧张332213545 考前心情不紧张943814

10、75 总计4265941 020 相应的等高条形图如图所示 图中阴影部分表示考前心情紧张与考前心情不紧张中性格 内向的比例 从图中可以看出 考前紧张的样本中性格内向占 的比例比考前心情不紧张样本中性格内向占的比例高 可以认 为考前紧张与性格类型有关 2 观察下列各图 其中两个分类变量x y之间关系最强 的是 解析 在四幅图中 D图中两个阴影条的高度相差最明显 说明两个分类变量之间的关系最强 答案 D 下表是某地区的一种传染病与饮 用水的调查表 独立性检验 得病不得病总计 干净水52466518 不干净水94218312 总计146684830 1 这种传染病是否与饮用水的卫生程度有关 请说明理

11、由 2 若饮用干净水得病的有5人 不得病的有50人 饮用不 干净水得病的有9人 不得病的有22人 按此样本数据分析这 种疾病是否与饮用水有关 并比较两种样本在反映总体时的差 异 2 依题意得2 2列联表 得病不得病总计 干净水55055 不干净水92231 总计147286 因为5 785 5 024 P K2 5 024 0 025 所以我们有97 5 的把握认为该地区这种传染病与饮用不 干净水有关 两个样本都能统计得到传染病与饮用不干净水有关这一相 同结论 但 1 中我们有99 9 的把握肯定结论的正确性 2 中 我们只有97 5 的把握肯定 3 在国家未实施西部开发战略前 一新闻单位在应

12、届大 学毕业生中随机抽取1 000人进行问卷调查 只有80人志愿加入 国家西部建设 而国家公布实施西部开发战略后 随机抽取1 200名应届大学毕业生进行问卷调查 有400人志愿加入国家西 部建设 问 实施西部开发战略的公布是否对应届大学毕业生的选 择产生了影响 1 列联表与等高条形图 列联表由两个分类变量之间频率大小差异说明这两个变量 之间是否有关联关系 而利用等高条形图能形象直观地反映它 们之间的差异 进而推断它们之间是否具有关联关系 2 对独立性检验思想的理解 独立性检验的基本思想类似于数学中的反证法 先假设 两个分类变量没有关系 成立 计算随机变量K2的值 如果K2值 很大 说明假设不合理 K2值越大 两个分类变量有关系的可 能性越大 谢谢观看

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号