广东省揭阳市第三中学高中数学选修1-2:1.2独立性检验的基本思想及其初步应用 课件

上传人:tang****xu4 文档编号:126181274 上传时间:2020-03-23 格式:PPT 页数:20 大小:698KB
返回 下载 相关 举报
广东省揭阳市第三中学高中数学选修1-2:1.2独立性检验的基本思想及其初步应用 课件_第1页
第1页 / 共20页
广东省揭阳市第三中学高中数学选修1-2:1.2独立性检验的基本思想及其初步应用 课件_第2页
第2页 / 共20页
广东省揭阳市第三中学高中数学选修1-2:1.2独立性检验的基本思想及其初步应用 课件_第3页
第3页 / 共20页
广东省揭阳市第三中学高中数学选修1-2:1.2独立性检验的基本思想及其初步应用 课件_第4页
第4页 / 共20页
广东省揭阳市第三中学高中数学选修1-2:1.2独立性检验的基本思想及其初步应用 课件_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《广东省揭阳市第三中学高中数学选修1-2:1.2独立性检验的基本思想及其初步应用 课件》由会员分享,可在线阅读,更多相关《广东省揭阳市第三中学高中数学选修1-2:1.2独立性检验的基本思想及其初步应用 课件(20页珍藏版)》请在金锄头文库上搜索。

1、 对于性别变量 其取值为男和女两种 这种变量 的不同 值 表示个体所属的不同类别 像这样的变量 称为分类变量 在日常生活中 主要考虑分类变量之间是否有关系 如是否吸烟 是否患肺癌 宗教信仰 国籍等等 例如 吸烟是否与患肺癌有关系 性别是否对于喜欢数学课程有影响 等等 在统计学中 独立性检验就是检验两个分类变量 是否有关系的一种统计方法 为调查吸烟是否对患肺癌有影响 某肿瘤研究所随机 地调查了9965人 得到如下结果 单位 人 表1 7 吸烟与患肺癌列联表 那么吸烟是否对患肺癌有影响 因此 直观上得到结论 吸烟者和不吸烟者患肺癌的可能性存在差异 在不吸烟者中患肺癌的比例是 在吸烟者中患肺癌的比例

2、是 0 54 2 28 9965919874总计 2148492099吸烟 7817427775不吸烟 总计患肺癌不患肺癌 列联表 两个 分类变量的 频数表 探究 等高条形图 患病比例 不患病比 例 0 54 2 28 上面我们通过分析数据和图形 得到的直观印象是 吸烟 和患肺癌有关 这一直觉来自于观测数据 即样本 问题是它能够在多大程度上代表总体呢 能否用数量刻画出有关的程度 H0 吸烟与患肺癌没有关系 我们假设 看看能推出什么样的结论 a b c db da c总计 c ddc吸烟 a bba不吸烟 总计患肺癌不患肺癌 为了研究的一般性 在列联表1 7中用字母代替数字 结论 ad bc 越

3、小 说明吸烟与患肺癌之间关系越弱 ad bc 越大 说明吸烟与患肺癌之间关系越强 如果 吸烟与患肺癌没有关系 则在吸烟样本中不患肺 癌的比例应该与不吸烟样本中相应的比例差不多 即 a b c db da c总计 c ddc吸烟 a bba不吸烟 总计患肺癌不患肺癌 为了使不同样本容量的数据有统一的评判标准 基于上 述分析 我们构造一个随机变量 若H0成立 即 吸烟与患肺癌没有关系 则K2应很小 由列联表中数据 利用公式 1 计算得K2的观测值为 1 其中n a b c d为样本容量 在H0成立的情况下 统计学家估算出如下的概率 也就是说 在H0成立的情况下 随机变量K2超过6 635的 概率约

4、为0 01 是一个小概率事件 现在K2的观测值为 56 632 远远大于6 635 所以有理由断定H0不成立 即认为 吸烟与患肺癌有关系 但这种判断会犯错误 犯错误的概率不会超过0 01 即 我们有99 的把握认为 吸烟与患肺癌有关系 利用随机变量K2来确定在多大程度上可以认为 两个分类变量有关系 的方法称为两个分类变量 的独立性检验 独立性检验 a b c db da c总计 c ddc a bba 总计 若要推断的结论为H1 X与Y有关系 可进行如下操作 2 图形分析法 通过等高条形图 你能从上述探究过程中总结出判断两个分类变量 有关系的思路吗 1 频率比较法 根据列联表 思考 3 独立性

5、检验法 查对临界值表 作出判断 如果K2值很大 就断言H0不 成立 即认为 两个分类变量有关系 如果很小 则说明 在样本数据中没有发现足够证据拒绝H0 具体做法是 首先假设该结论不成立 即 H0 X与Y没有关系 根据观测数据计算 10 8287 8796 6355 0243 8412 7062 0721 3230 7080 445 k 0 0010 0050 0100 0250 050 100 150 50 400 50 1 如果k 10 828 就有99 9 的把握认为 X与Y有关系 2 如果k 7 879 就有99 5 的把握认为 X与Y有关系 3 如果k 6 635 就有99 的把握认为

6、 X与Y有关系 4 如果k 5 024 就有97 5 的把握认为 X与Y有关系 5 如果k 3 841 就有95 的把握认为 X与Y有关系 6 如果k 2 706 就有90 的把握认为 X与Y有关系 7 如果k 2 706 就认为没有充分的证据显示 X与Y有关系 临界值 例1 在某医院 因为患心脏病而住院的665名男性病人 中 有214人秃顶 而另外772名不是因为患心脏病而住院 的男性病人中 有175人秃顶 利用图形判断秃顶与患 心脏病是否有关系 能否在犯错误的概率不超过0 010 的前提下认为秃顶与患心脏病有关系 解 根据题目所得数据得到列联表 1437772665总计 104859745

7、1不秃顶 389175214秃顶 总计患其他病患心脏病 秃顶与患心脏病列联表 例题解析 1 等高条形图 从图中可以看出 秃顶样本中患心脏病的频率明显高于 不秃顶样本中患心脏病的频率 因此可直观地认为秃顶 与患心脏病有关系 因此 在犯错误的概率不超过0 010的前提下认为 秃顶与患心脏病有关 即有99 的把握认为 秃顶与 患心脏病有关 2 独立性检验法 1437772665总计 1048597451不秃顶 389175214秃顶 总计患其他病患心脏病 例2 为考察高中生的性别与是否喜欢数学课程之 间的关系 在某城市的某校高中生中随机抽取300 名学生 得到如下联表 喜欢欢数学课课 程 不喜欢欢数

8、学 课课程 总计总计 男3785122 女35143178 总计总计72228300 由表中数据计算K2的观测值k 4 513 在多大程度上可以认为高中生的性别与是否喜 欢数学课程之间有关系 为什么 这一结论只适用于被调查的学校 练习练习 在一次天气恶劣的飞行航程中 调查了男女乘客在飞机上晕 机的情况 男乘客晕机的有24人 不晕机的有31人 女乘客晕机的有8 人 不晕机的有26人 请你根据所给数据判定 在天气恶劣的飞行航程 中 男乘客是否比女乘客更容易晕机 变式训练变式训练 某单位餐厅的固定餐椅经常有损坏 于是该单位领 导决定在餐厅墙壁上张贴文明标语 并对文明标语张贴前后餐椅的 损坏情况作了一个统计 具体数据如下 损损坏餐 椅数 未损损坏餐 椅数 总计总计 文明标语张贴标语张贴 前 39157196 文明标语张贴标语张贴 后 29167196 总计总计68324392 n1 通过频率比较法 图 形分析法判断两个分类 变量是否有关系 不 精准 1 ad bc 2 a a b c c d a b c db da c总计 c ddcx2 a bbax1 总计y2y1 n2 利用独立性检验判 断两个分类变量是否有 关系 1 假设无关 2 求k值 3 下结论 判断两分类变 量是否有关的 方法 小结

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号