独立性检验的基本思想及其初步应用PPT参考课件

上传人:夏** 文档编号:567919081 上传时间:2024-07-22 格式:PPT 页数:28 大小:2.97MB
返回 下载 相关 举报
独立性检验的基本思想及其初步应用PPT参考课件_第1页
第1页 / 共28页
独立性检验的基本思想及其初步应用PPT参考课件_第2页
第2页 / 共28页
独立性检验的基本思想及其初步应用PPT参考课件_第3页
第3页 / 共28页
独立性检验的基本思想及其初步应用PPT参考课件_第4页
第4页 / 共28页
独立性检验的基本思想及其初步应用PPT参考课件_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《独立性检验的基本思想及其初步应用PPT参考课件》由会员分享,可在线阅读,更多相关《独立性检验的基本思想及其初步应用PPT参考课件(28页珍藏版)》请在金锄头文库上搜索。

1、3.2 独立性检验的基本思想及其初步应用 我们经常听到这些说法:我们经常听到这些说法:l吸烟对患肺癌有影响;吸烟对患肺癌有影响;l数学好的人物理一般也很好;数学好的人物理一般也很好;l是否喜欢数学课程与性别之间有关系;是否喜欢数学课程与性别之间有关系;l人的血型会决定人的性格;人的血型会决定人的性格;l星座与人的命运之间有某种联系星座与人的命运之间有某种联系.这些说法都有道理吗?这些说法都有道理吗?探究点探究点1 1 独立性检验的基本思想独立性检验的基本思想 对于性别变量,其取值为男和女两种对于性别变量,其取值为男和女两种. .这种变量这种变量的不同的不同“值值”表示个体所属的不同类别,像这样

2、的变表示个体所属的不同类别,像这样的变量称为量称为 . . 分类变量在现实生活中是大量存在的,如是否分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等月份等. .分类变量分类变量不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟7 7757 77542427 8177 817吸烟吸烟2 0992 09949492 1482 148总计总计9 8749 87491919 9659 965问题:问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究为了研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了所随机地调查了9 9

3、659 965人,得到如下结果:人,得到如下结果:吸烟与患肺癌列联表(单位:人)吸烟与患肺癌列联表(单位:人)在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是_._. 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大吸烟者患肺癌的可能性大. .2.28%2.28%在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是_,_, 0.54%0.54%通过图形直观判断两个分类变量是否相关:通过图形直观判断两个分类变量是否相关:等高条形图等高条形图 通过数据和图形分析,得到结论是:吸烟与患通过数据和图形分析,得到结论是:吸烟与患肺癌有关肺

4、癌有关. .那么这种判断是否可靠呢?我们可以通过那么这种判断是否可靠呢?我们可以通过统计分析回答这个问题统计分析回答这个问题. .假设假设H H0 0:吸烟与患肺癌之间没有关系:吸烟与患肺癌之间没有关系, ,吸烟与患肺癌列联表吸烟与患肺癌列联表( (单位:人单位:人) ) 不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟a ab ba+ba+b吸烟吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d 如果如果“吸烟与患肺癌没有关系吸烟与患肺癌没有关系”,那么吸烟样,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比本中不患肺癌的比例应该与不吸烟样本中相应

5、的比例差不多例差不多. .即即引入一个随机变量引入一个随机变量 它是检验在多大程度上可以认为它是检验在多大程度上可以认为“两个变量两个变量有关系有关系”的标准的标准. .ad-bcad-bc越小,说明吸烟与患肺癌之间的关系越弱越小,说明吸烟与患肺癌之间的关系越弱; ;ad-bcad-bc越大,说明吸烟与患肺癌之间的关系越强越大,说明吸烟与患肺癌之间的关系越强. .其中其中n=a+b+c+dn=a+b+c+d为样本容量为样本容量. .不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟7 7757 77542427 8177 817吸烟吸烟2 0992 09949492 1482 148总计总计9

6、8749 87491919 9659 965通过公式计算通过公式计算吸烟与患肺癌列联表(单位:人)吸烟与患肺癌列联表(单位:人)已知在已知在 成立的情况下,成立的情况下, 即在即在 成立的情况下,成立的情况下,K K2 2的观测值大于的观测值大于6.6356.635的概率非常小,近似为的概率非常小,近似为0.010.01,是一个小概率事件,是一个小概率事件. .思考:思考:这个值到底告诉我们什么呢?这个值到底告诉我们什么呢?现在现在K K2 2的观测值的观测值k k56.63256.632,远远大于,远远大于6.6356.635,所以有理,所以有理由断定由断定H H0 0不成立,即认为不成立,

7、即认为“吸烟与患肺癌有关系吸烟与患肺癌有关系”. .独立性检验的定义独立性检验的定义利用随机变量利用随机变量K K2 2来判断来判断“两个分类变量有关系两个分类变量有关系”的方法称为的方法称为独立性检验独立性检验. .独立性检验的一般步骤独立性检验的一般步骤(1)1)假设两个分类变量没有关系假设两个分类变量没有关系. .(3 3)把)把k k的值与临界值比较确定的值与临界值比较确定X X与与Y Y有关的程度或有关的程度或无关系无关系. .(2)(2)计算出计算出K K2 2的观测值的观测值k k 如如P(k10.828)= 0.001P(k10.828)= 0.001表示在犯错误的概率不表示在

8、犯错误的概率不超过超过0.0010.001的前提下,认为的前提下,认为“X X与与Y Y有关系有关系”.”. 如如P(k6.635)= 0.010P(k6.635)= 0.010表示在犯错误的概率不超表示在犯错误的概率不超过过0.0100.010的前提下,认为的前提下,认为“X X与与Y Y有关系有关系”.”.临界值表:临界值表:0.500.500.400.400.250.250.150.150.100.100.050.050.0250.0250.0100.0100.0050.0050.0010.0010.4550.7081.3232.0722.7063.8415.0246.6357.8791

9、0.828独立性检验的基本思想类似反证法独立性检验的基本思想类似反证法(1)(1)假设结论不成立假设结论不成立, ,即即“两个分类变量没有关系两个分类变量没有关系”. .(2)(2)在此假设下随机变量在此假设下随机变量K K2 2应该很小应该很小, ,如果由观测数据如果由观测数据计算得到计算得到K K2 2的观测值的观测值k k很大很大, ,则在一定程度上说明假则在一定程度上说明假设不合理设不合理. .(3)(3)根据随机变量根据随机变量K K2 2的含义的含义, ,可以通过评价该假设不合可以通过评价该假设不合理的程度理的程度, ,如由实际计算出的如由实际计算出的k10.828.k10.828

10、.说明假设不说明假设不合理的程度为合理的程度为99.9%,99.9%,即即“两个分类变量有关系两个分类变量有关系”这这一结论成立的可信度约为一结论成立的可信度约为99.9%.99.9%.探究点探究点2 2 独立性检验的初步应用独立性检验的初步应用 例例. .在在某某医医院院, ,因因为为患患心心脏脏病病而而住住院院的的665665名名男男性性病病人人中中, ,有有214214人人秃秃顶顶, ,而而另另外外772772名名不不是是因因为为患患心心脏脏病病而而住住院院的的男男性性病病人人中中有有175175人人秃秃顶顶.(1).(1)利利用用图图形形判判断断秃秃顶顶与与患患心心脏脏病病是是否否有有

11、关关系系;(2);(2)能能否否在在犯犯错错误误的的概概率率不超过不超过0.010.01的前提下认为秃顶与患心脏病有关系?的前提下认为秃顶与患心脏病有关系?患心脏病患心脏病患其他病患其他病总计总计秃顶秃顶214214175175389389不秃顶不秃顶4514515975971 0481 048总计总计6656657727721 4371 437(1)(1)相应的等高条形图如下所示,相应的等高条形图如下所示,秃顶秃顶不秃顶不秃顶不患心脏病不患心脏病患心脏病患心脏病解:解:根据题目所给数据得到如下列联表:根据题目所给数据得到如下列联表:由图可认为秃顶与患心脏病有关系由图可认为秃顶与患心脏病有关系

12、 因此,在犯错误的概率不超过因此,在犯错误的概率不超过0.010.01的前提下,的前提下,认为秃顶与患心脏病有关系认为秃顶与患心脏病有关系. .(2)(2)根据列联表中的数据,得到根据列联表中的数据,得到C C3 3下列说法中正确的是下列说法中正确的是( () )独立性检验的基本思想是带有概率性质的反证法;独立性检验的基本思想是带有概率性质的反证法;独立性检验就是独立性检验就是在假设在假设H H0 0下,如果出现一个与下,如果出现一个与H H0 0相相矛盾的小概率事件,就推断矛盾的小概率事件,就推断H H0 0不成立,且该推断犯错不成立,且该推断犯错误的概率不超过这个小概率误的概率不超过这个小

13、概率, ,则作出拒绝则作出拒绝H H0 0的推断;的推断;独立性检验一定能给出明确的结论独立性检验一定能给出明确的结论 A A B B C C D D4 4有两个分类变量有两个分类变量X X与与Y Y的一组数据,由其列联表的一组数据,由其列联表计算得计算得K K2 24.5234.523,则认为,则认为X X与与Y Y有关系是错误的有关系是错误的可信度为可信度为( () )A A95% 95% B B90% 90% C C5% 5% D D10%10%5 5在对人们的休闲方式的一次调查中,共调查了在对人们的休闲方式的一次调查中,共调查了124124人,其中女性人,其中女性7070人,男性人,男

14、性5454人,女性中有人,女性中有4343人人主要的休闲方式是看电视,另外主要的休闲方式是看电视,另外2727人主要的休闲方式人主要的休闲方式是运动;男性中有是运动;男性中有2121人主要的休闲方式是看电视,人主要的休闲方式是看电视,另外另外3333人主要的休闲方式是运动人主要的休闲方式是运动(1)(1)根据以上数据建立一个根据以上数据建立一个2222的列联表的列联表. .(2)(2)判断休闲方式与性别是否有关系判断休闲方式与性别是否有关系 性别性别看电视看电视运动运动总计总计女女434327277070男男212133335454总计总计64646060124124休闲方式休闲方式( )独立性检验的一般步骤独立性检验的一般步骤: :(1 1)假设两个分类变量)假设两个分类变量X X与与Y Y没有关系;没有关系;(2 2)计算出)计算出K K2 2的观测值的观测值k k;(3 3)把)把k k的值与临界值比较确定的值与临界值比较确定X X与与Y Y有关的程度或有关的程度或无关系无关系. . 当你无法从一楼蹦到三楼时,不要忘记走楼梯.要记住伟大的成功往往不是一蹴而就的,必须学会分解你的目标,逐步实施. 素材和资料部分来自素材和资料部分来自网络,如有帮助请下载网络,如有帮助请下载!282021/3/10

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号