人教A版选修23课件3.2独立性检验的基本思想及其初步应用共16张PPT

上传人:人*** 文档编号:578524028 上传时间:2024-08-24 格式:PPT 页数:16 大小:758.50KB
返回 下载 相关 举报
人教A版选修23课件3.2独立性检验的基本思想及其初步应用共16张PPT_第1页
第1页 / 共16页
人教A版选修23课件3.2独立性检验的基本思想及其初步应用共16张PPT_第2页
第2页 / 共16页
人教A版选修23课件3.2独立性检验的基本思想及其初步应用共16张PPT_第3页
第3页 / 共16页
人教A版选修23课件3.2独立性检验的基本思想及其初步应用共16张PPT_第4页
第4页 / 共16页
人教A版选修23课件3.2独立性检验的基本思想及其初步应用共16张PPT_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《人教A版选修23课件3.2独立性检验的基本思想及其初步应用共16张PPT》由会员分享,可在线阅读,更多相关《人教A版选修23课件3.2独立性检验的基本思想及其初步应用共16张PPT(16页珍藏版)》请在金锄头文库上搜索。

1、3.2独立性检验的基本思想及其初步应用 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸

2、烟者患说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。肺癌的可能性大。0.54%0.54%2.28%2.28%探究探究分类变量分类变量患肺癌比例不患肺癌比例不吸烟不吸烟吸烟吸烟不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟7775427817吸烟吸烟2099492148总计总计98749199651、列联表通过图形直观判断两个分类变量是否相关:2、等高条形图等高条形图更清晰地表达了两种情况下患肺癌的比例。 上上面面我我们们通通过过分分析析数数据据和和图图形形,得得到到的的直直观观印印象象是是吸吸烟烟和和患患肺肺癌癌有有关关,那那么么事事实实是是否否真真的的如如此此呢呢?

3、这这需要用统计观点来考察这个问题。需要用统计观点来考察这个问题。 现在想要知道能够以多大的把握认为现在想要知道能够以多大的把握认为“吸烟与患肺癌有关吸烟与患肺癌有关”,为此先假设为此先假设 H0:吸烟与患肺癌没有关系:吸烟与患肺癌没有关系. 用用A表示不吸烟,表示不吸烟,B表示不患肺癌,则表示不患肺癌,则“吸烟与患肺癌没有关系吸烟与患肺癌没有关系”等价于等价于“吸烟与患肺癌独立吸烟与患肺癌独立”, 即假设即假设H0等价于等价于 P(AB)=P(A)P(B).因此因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关

4、系越强。越大,说明吸烟与患肺癌之间关系越强。不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟aba+b吸烟吸烟cdc+d总计总计a+cb+da+b+c+d=nA表示不吸烟,B表示不患肺癌H0成立时(n=a+b+c+d) 为为了了使使不不同同样样本本容容量量的的数数据据有有统统一一的的评评判判标标准准,基基于于上上述述分分析,我们构造一个随机变量析,我们构造一个随机变量(1) 若若 H0成立,即成立,即“吸烟与患肺癌没有关系吸烟与患肺癌没有关系”,则,则K2应很小。应很小。根据表根据表3-7中的数据,利用公式(中的数据,利用公式(1)计算得到)计算得到K2的观测值为:的观测值为:那么这个值到底能

5、告诉我们什么呢?那么这个值到底能告诉我们什么呢?(2) 独立性检验独立性检验在在H0成立的情况下,统计学家估算出如下的概率成立的情况下,统计学家估算出如下的概率 即即在在H0成成立立的的情情况况下下,K2的的值值大大于于6.635的的概概率率非非常常小小,近近似似于于0.01。 也也就就是是说说,在在H0成成立立的的情情况况下下,对对随随机机变变量量K2进进行行多多次次观观测,观测值超过测,观测值超过6.635的频率约为的频率约为0.01。思考 答:判断出错的概率为0.01。独立性检验的基本思想(类似独立性检验的基本思想(类似反证法反证法)(1)(1)假设结论不成立假设结论不成立, ,即即H0

6、 “两个分类变量没有关系两个分类变量没有关系”. .(2)(2)在此假设下我们所构造的随机变量在此假设下我们所构造的随机变量 K K2 2 应该很小应该很小, ,如果如果由观测数据计算得到由观测数据计算得到K K2 2的的观测值观测值k k很大很大, ,则说明则说明 H0 不成立不成立. .即认为即认为“两个分类变量有关系两个分类变量有关系”;如果;如果k k的值很小,则说明的值很小,则说明由样本观测数据没有发现反对由样本观测数据没有发现反对H0的充分证据。的充分证据。(3)(3)判断随机变量判断随机变量K K2 2的观测值的观测值k k是大还是小,需要确定一个正是大还是小,需要确定一个正数数

7、k k0,由实际计算出的由实际计算出的k kk k0 时时, ,就认为就认为K K2 2的观测值的观测值k k大大. .就认就认为为 “两个分类变量有关系两个分类变量有关系”判断错误的概率不超过判断错误的概率不超过 P( K K2 2 k k0 )上面这种利用随机变量上面这种利用随机变量K2来判断来判断“两个分类变量有关系两个分类变量有关系”的方法,称为两个分类变量的的方法,称为两个分类变量的独立性检验独立性检验。反证法原理与独立性检验原理的比较反证法原理反证法原理在假设在假设H0下下, ,如果推出了矛盾,就证明了如果推出了矛盾,就证明了H0不成立不成立独立性检验独立性检验原理原理在假设在假设

8、H0下下, ,如果出现了一个与如果出现了一个与H0相矛盾的相矛盾的小概率事件,就推断小概率事件,就推断H0不成立,且该推断犯不成立,且该推断犯错误的概率不超过这个小概率错误的概率不超过这个小概率. .独立性检验的步骤独立性检验的步骤1.确定容许推断“两个分类变量有关系”的犯错误概率的上界,查表确定临界值k0 .2.利用公式计算随机变量K2观测值k .3.如果k k0,就推断“x与y有关系”,这种推断犯错误的概率不超过,否则,就认为在犯错误的概率不超过的前提下,不能推断“x与y有关系”,或者在样本数据中没有发现足够证据支持结论“x与y有关系” .P(K2k)0.500.400.250.150.1

9、00.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828独立性检验的步骤计算计算K2的观测值的观测值k; 将观测值将观测值k与与临界值临界值k0进行比较,并作出判断进行比较,并作出判断.如下:如下:(1)当当K22.706,有有_的把握判定两个分类变量有关系的把握判定两个分类变量有关系;(2) 当当K23.841,有有_ 的把握判定两个分类变量有关系的把握判定两个分类变量有关系;(3) 当当K26.635,有有_ 的把握判定两个分类变量有关系的把握判定两个分类变量有关系;P(K2k)0.500.

10、400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.82890%95%99%例1在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?解:根据题目所给数据得到如下列联表:患心脏病患心脏病不患心脏病不患心脏病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437 根据联表1

11、-13中的数据,得到所以有所以有99%的把握认为的把握认为“秃顶患心脏病有关秃顶患心脏病有关”。P(K2k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828课堂练习课堂练习1. 1.为考察高中生性别与是否喜欢数学课程之间的关系为考察高中生性别与是否喜欢数学课程之间的关系, ,在某城市的某校高中生中随机抽取在某城市的某校高中生中随机抽取300300名学生名学生, ,得到如得到如下列联表下列联表: :喜欢数学课程不喜欢数学课程总计男3785122女351

12、43178总计72228300由表中数据计算得由表中数据计算得由表中数据计算得由表中数据计算得K K K K2 2 2 24.513.4.513.4.513.4.513. 问:问:问:问:能够有能够有9595的把握认为高中生的性别与是否的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?喜欢数学课程之间有关系吗? 为调查某地区老年人是否需要志愿者提供帮助,用简单的随机抽样方法从该地区调查了500名老年人,结果如下:(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能够有99%的把握认为该地区老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法

13、来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由。是是否需要志愿者否需要志愿者男男女女需要需要4030不需要不需要160270为调查某地区老年人是否需要志愿者提供帮助,用某地区老年人是否需要志愿者提供帮助,用简单的随机的随机抽抽样方法从方法从该地区地区调查了了500名老年人,名老年人,结果如下:果如下:(1)估估计该地区老年人中,需要志愿者提供帮助的老年人的比例地区老年人中,需要志愿者提供帮助的老年人的比例(2)能能够有有99%的把握的把握认为该地区老年人是否需要志愿者提供帮地区老年人是否需要志愿者提供帮助与性助与性别有关有关?(3)根据根据(2)的的结论,能否提出更好的,能否提出更好的调查方法来估方法来估计该地区的老地区的老年人中,需要志愿者提供帮助的老年人的比例年人中,需要志愿者提供帮助的老年人的比例?说明理由。明理由。独立性检验独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心在日常生活中,我们常常关心分类变量之间是否有关系分类变量之间是否有关系:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号