独 立性检验的基本思想及其初步应用课件

上传人:小** 文档编号:44749300 上传时间:2018-06-14 格式:PPT 页数:25 大小:861KB
返回 下载 相关 举报
独 立性检验的基本思想及其初步应用课件_第1页
第1页 / 共25页
独 立性检验的基本思想及其初步应用课件_第2页
第2页 / 共25页
独 立性检验的基本思想及其初步应用课件_第3页
第3页 / 共25页
独 立性检验的基本思想及其初步应用课件_第4页
第4页 / 共25页
独 立性检验的基本思想及其初步应用课件_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《独 立性检验的基本思想及其初步应用课件》由会员分享,可在线阅读,更多相关《独 立性检验的基本思想及其初步应用课件(25页珍藏版)》请在金锄头文库上搜索。

1、独立性检验的基本思想及其初步应用 学习目标 变量 情境引入 临界值表 卡方统计量K2 独立性检验 反证法与独立性检验类比 小结学习目标 了解分类变量的概念; 会从22列联表,等高条形图直观地判断出两个 分类变量是否有关; 了解独立性检验的基本思想及步骤。定量变量的取值一定为实数,如身高,体重, 考试成绩等; 分类变量又称属性变量或定性变量,不同的取 值仅代表个体所属的类别,如性别变量,只取男 、女两个值。变 量 研究两个变量之间的相关关系:定量变量回归分析分类变量独立性检验本节研究的是两分类变量之间的独立性检验问题。 假设性检验 假设检验问题由两个互斥的假设构成,其中一 个叫做原假设,用H0表

2、示;另一个叫做备择假设 ,用H1表示。最新研究发现,很多人由于经常使用手机,易患时下流行的手机 焦虑症,影响工作学习时注意力的集中。特别是处于青少年的学生, 习惯用手机与他人进行交流,一旦手机没有声音,就会想手机是否坏 了,是否没信号,严重者坐立不安,影响平常的学习生活,特别是上 课时的注意力无法集中。1、在你看来,手机是否会影响平时上课时的注意力集中呢?根 据不同观点,学生组成小组以便后面问题的合作讨论。 2、为了研究手机是否影响青少年上课时的注意力集中,研究人 员对1323名年龄在1317岁的青少年进行调查,小组内讨论你认为 应该要收集哪些数据?情境引入3、研究人员记录下他们在这12个月内

3、有无手机的情况,同时教 师记下这些学生出现的注意力不集中的问题,统计获得下列数据:利用上述统计结果进行推测,手机是否对注意力有影响?有多大 的把握认为你所得的结论正确?注意力不集中注意力集中总 计有手机489209698无手机268357625总 计7575661323 从列联表中分别计算注意力不集中在两类中的频率:在有手机的学生中,注意力不集中的比重为 在无手机的学生中,注意力不集中的比重为 上述结果能说明有无手机与注意力是否集中有关吗?注意力不集中注意力集中总 计有手机489209698无手机268357625总 计757566132370.05% 42.88% 三维柱状图二维条形图等高条

4、形图注意力不集 中的比例上面我们通过分析数据和图形,得到的直观印象是吸烟 和患肺癌有关,那么事实是否真的如此呢?这需要用统计观 点来考察这个问题。现在想要知道能够以多大的把握认为“手 机与注意力的集中有关”,为此先假设 H0:有手机与注意力不集中无关 用事件A表示有手机,事件B表示注意力不集中,则假设 H0表示事件A与B独立,H0等价于P(AB)=P(A)P(B)。 对于一般的事件A和B,要判断两者之间是否相关,将列 联表中数据用字母代替得:总 计aba+bcdc+d总 计a+cb+da+b+c+d在表中,a恰好为事件AB发生的频数;a+b和a+c恰好分别为事件A和B发生 的频数。由于频率接近

5、于概率,所以在H0成立的条件下应该有(其中n=a+b+c+d为样本容量, H0:A与B无关)因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱 ;|ad-bc|越大,说明吸烟与患肺癌之间关系越强 。|ad-bc|小到什么程度才可以判定两分类变量无关?有没 有一个具体数值作为评判标准?广东省中山市一位彩民用168元购买6倍投注的“7+2” 双色球复式彩票,竟然一次中6注500万(每注一等奖), 共获奖金3170万,有人计算过,中双色球一等奖的概率为 1/17721088,二等奖的概率为1/1181406,三等奖的概率为 1/109389。可见,中一等奖的概率几乎为0,属于不折不扣 的小概率事件

6、,但是这个小概率事件确实是发生了。在确定统一评判标准之前,先认识临界值表 在H0(X与Y无关)成立的前提下0.500.400.250.150.10.0.4550.7081.3232.0722.706.临界值表在H0成立的前提下,即X与Y无关表示在假设 H0 成立的前提下,K2的值大于等于6.635的概率非常小,为 0.010,这是一个小概率事件,但是也有可能发生,相对应的K2的值小于6.635 的概率为1-0.010 =0.990。为了使不同样本容量的数据有一个统一的评判标准, 基于之前的分析|ad-bc|越小,两分类变量的关系越弱,构 造随机变量卡方统计量卡方统计量K2其中n=a+b+c+d

7、,为样本容量。疑问:卡方统计量公式怎么来的,合理吗? 类比于概率的定义 随机事件 :掷一枚硬币,正面向上。 联想其概率的确定过程,在经过大量的重复试验之后 ,频率在常数0.5附近摆动并趋于稳定,这时称0.5为随机 事件的概率。统计学中的结论公式都是在大量重复试验之后并结合我们现在还不知道 的统计学相关知识后得出的,同样,卡方统计量公式也是如此得出的,因此 这个公式是合乎常理合乎实际的。 类比方差公式的结构防止正负抵消,掩盖事实的真相防止因样本容量的不同而使方差的值差异太大,意在取平均值 卡方统计量使最后结果为正,方便查表防止样本不同而导致差异太大,协调样本容量大小带来的差异。从结构上来看,卡方

8、统 计量公式是合理的 根据之前表中的数据,由公式有k2的观测值那么这个数值到底告诉我们什么呢?统计学家总结得到 临界值表,查表知 ,也就是说,在H0成立 的情况下,对随机变量 k2 进行多次观测,观测值超过6.635 的频率约为0.01,其中6.635为观测的临界值 K0 。现在观测 值远大于6.635,故可判断假设不成立,即两分类变量有关。答:判断出错的概率为0.01思考: 判断H0是否成立的标准: 如果 ,就判断 不成立,即认为有手机 与注意力不集中有关系;否则就判断 成立,即认为有 手机与注意力不集中无关。在该规则下,把结论“ 成立”错判成“ 不成立”的 概率不会多过 即犯错的概率为 0

9、.01,有99%的把握认为不会判错。结论时总有“在犯错误不超过XX的前提下,我们认为 XXX”这样的术语。在具体题目中,若算出k的值为9.261, 这时是否有足够条件下结论这两分类变 量相关? 定义 上面这种利用随机变量K2来确定在多大程度上可以认为“两个分 类变量有关系”的方法,称为两个分类变量的独立性检验。 基本步骤独立性检验返回反证法与独立性检验对比l反 证 法l独立性检验目 标证明结论成立构造两种情况: 假设成立 ;假设的反面成立结 果一种:结论成立l两变量有关 l两变量无关理论依据矛盾双方不可能同时成立, 但有且仅有一个成立在一次试验中小概率事件( 观测值大于等于临界值)几 乎是不可

10、能发生的操作原理l假设结论反面成立 l推导出矛盾,从而推翻假 设 l假设不成立,说明结论成 立l假设成立两者没关系 l若出现一个与假设相矛盾 的小概率事件,则假设推翻 ,且此推断犯错误的概率不 会超过这个小概率,否则假 设成立 l假设不成立,两者有关, 假设 成立,两者独立 小结 判断两分类变量相关的方法 (1)通过图形粗略的判断,无法给出精确程度; (2)利用独立性检验,精确给出判断的准确程度。 例1.在500人身上试验某种血清预防感冒作用,把他们一 年中的感冒记录与另外500名未用血清的人的感冒记录作 比较,结果如表所示。未感冒感冒合计使用血清252248500未使用血清224276500合计4765241000试画出列联表的条形图,并通过图形判断这种血清能否起到预防感冒 的作用?并进行独立性检验。谢 谢 ! 再 见 !

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号