独立性检验例题

上传人:cl****1 文档编号:569844849 上传时间:2024-07-31 格式:PPT 页数:62 大小:5.01MB
返回 下载 相关 举报
独立性检验例题_第1页
第1页 / 共62页
独立性检验例题_第2页
第2页 / 共62页
独立性检验例题_第3页
第3页 / 共62页
独立性检验例题_第4页
第4页 / 共62页
独立性检验例题_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《独立性检验例题》由会员分享,可在线阅读,更多相关《独立性检验例题(62页珍藏版)》请在金锄头文库上搜索。

1、 1.1.判断分类变量及其关系的方法:判断分类变量及其关系的方法:(1)(1)利用数形结合思想,借助等高条形图来判断两个分类变量利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法是否相关是判断变量相关的常见方法. .(2)(2)一般地,在等高条形图中,一般地,在等高条形图中, 与与 相差越大,两个相差越大,两个分类变量有关系的可能性就越大分类变量有关系的可能性就越大. .分类变量关系的分析分类变量关系的分析2.2.分析分类变量关系的步骤:分析分类变量关系的步骤:(1)(1)作大量的调查、研究,统计出结果作大量的调查、研究,统计出结果. .(2)(2)列出列联表利

2、用频率粗略估计列出列联表利用频率粗略估计. .(3)(3)作出等高条形图,从直观上进一步判断分类变量之间的关作出等高条形图,从直观上进一步判断分类变量之间的关联关系联关系. . 通过等高条形图可以粗略地判断两个分类变量通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出所得结论的可靠程度是否有关系,但无法精确地给出所得结论的可靠程度. .【例例1 1】从发生交通事故的司机中抽取从发生交通事故的司机中抽取2 0002 000名司机作随机样名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:责任将

3、数据整理如下:试分析血液中含有酒精与对事故负有责任是否有关系试分析血液中含有酒精与对事故负有责任是否有关系. .【审题指导审题指导】题目已给出了题目已给出了2 22 2列联表,可利用等高条形图列联表,可利用等高条形图定性分析两个分类变量之间的相关性定性分析两个分类变量之间的相关性. .【规范解答规范解答】作等高条形图如下,图中阴影部分表示有酒精作等高条形图如下,图中阴影部分表示有酒精负责任与无酒精负责任的比例,从图中可以看出,两者差距负责任与无酒精负责任的比例,从图中可以看出,两者差距较大,由此我们可以在某种程度上认为较大,由此我们可以在某种程度上认为“血液中含有酒精与血液中含有酒精与对事故负

4、有责任对事故负有责任”有关系有关系. . 有关有关“相关性检验相关性检验” 解决一般的独立性检验问题的步骤:解决一般的独立性检验问题的步骤:(1)(1)根据实际问题的需要确定容许推断根据实际问题的需要确定容许推断“两个分类变量有关系两个分类变量有关系”犯错误概率的上界犯错误概率的上界,然后查下表确定临界值,然后查下表确定临界值k k0 0. .(2)(2)根据根据2 22 2列联表,利用公式列联表,利用公式 计算随机变量计算随机变量K K2 2的观测值的观测值k.k.(3)(3)如果如果kkkk0 0,就推断,就推断“X X与与Y Y有关系有关系”,这种推断犯错误的,这种推断犯错误的概率不超过

5、概率不超过;否则,就认为在犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前的前提下不能推断提下不能推断“X X与与Y Y有关系有关系”,或者在样本数据中没有发现,或者在样本数据中没有发现足够证据支持结论足够证据支持结论“X X与与Y Y有关系有关系”. . 通常认为通常认为k2.706k10.828,12.3810.828,所以在犯错误的概率不超过所以在犯错误的概率不超过0.0010.001的前提下认为的前提下认为“生产合格品生产合格品与设备改造有关系与设备改造有关系”. .【例例】为调查某地区老年人是否需要志愿者提供帮助,用简为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方

6、法从该地区调查了单随机抽样方法从该地区调查了500500位老年人,结果如下:位老年人,结果如下:(1)(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比估计该地区老年人中,需要志愿者提供帮助的老年人的比例;例;(2)(2)能否在犯错误的概率不超过能否在犯错误的概率不超过0.010.01的前提下认为该地区的老的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?年人是否需要志愿者提供帮助与性别有关?(3)(3)根据根据(2)(2)的结论,能否提出更好的调查方法来估计该地区的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理的老年人中,需要志愿

7、者提供帮助的老年人的比例?说明理由由. .附:附:【审题指导审题指导】解答第解答第(2)(2)问时问时, ,可先计算可先计算K K2 2的值,再对照表格作的值,再对照表格作出判断出判断. .【规范解答规范解答】(1)(1)调查的调查的500500位老年人中有位老年人中有7070位需要志愿者提位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为人的比例的估计值为 (2) 9.967.(2) 9.967.由于由于9.9676.635,9.9676.635,所所以在犯错误的概率不超过以在犯错误的概率不超过0.010.

8、01的前提下认为该地区的老年人的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关是否需要志愿者提供帮助与性别有关. .(3)(3)由由(2)(2)的结论知,该地区的老年人是否需要志愿者提供帮的结论知,该地区的老年人是否需要志愿者提供帮助与性别有关,并且从样本数据能看出该地区男性老年人与助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,这比采用简单随机抽样

9、方法更女两层并采用分层抽样方法,这比采用简单随机抽样方法更好好. . 独立性检验的综合应用独立性检验的综合应用 判断变量判断变量X X与与Y Y有无关系的三种方法:有无关系的三种方法:(1)2(1)22 2列联表:由列联表:由2 22 2列联表中列联表中ad-ad-bcbc的大小判断的大小判断. .(2)(2)等高条形图:观察条形图中的阴影比例大小判断等高条形图:观察条形图中的阴影比例大小判断. .(3)(3)独立性检验:计算独立性检验:计算K K2 2的观测值的观测值k k,再利用临界值的大小判断,再利用临界值的大小判断. .其中独立性检验的方法相对较准确其中独立性检验的方法相对较准确. .

10、【例例3 3】为了调查某生产线上质量监督员甲对产品质量好坏有为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,无影响,现统计数据如下:甲在生产现场时,990990件产品中有件产品中有合格品合格品982982件,次品件,次品8 8件;甲不在生产现场时,件;甲不在生产现场时,510510件产品中有件产品中有合格品合格品493493件,次品件,次品1717件件. .试分别用列联表、等高条形图、独试分别用列联表、等高条形图、独立性检验的方法分析监督员甲对产品质量好坏有无影响立性检验的方法分析监督员甲对产品质量好坏有无影响. .能否能否在犯错误的概率不超过在犯错误的概

11、率不超过0.0010.001的前提下,认为质量监督员甲是的前提下,认为质量监督员甲是否在生产现场与产品质量有关?否在生产现场与产品质量有关?【审题指导审题指导】本题要求分别用列联表、等高条形图、独立性本题要求分别用列联表、等高条形图、独立性检验的方法分析,要注意三种方法的判断思路检验的方法分析,要注意三种方法的判断思路. .【规范解答规范解答】(1)2(1)22 2列联表如下:列联表如下:由列联表可得由列联表可得ad-ad-bcbc|=|982|=|98217-49317-4938|=12 750.8|=12 750.相差较大,可在某种程度上认为相差较大,可在某种程度上认为“质量监督员甲是否在

12、现场质量监督员甲是否在现场与产品质量有关系与产品质量有关系”. .(2)(2)画等高条形图画等高条形图. .如图可知,在某种程度上认为如图可知,在某种程度上认为“质量监督员甲是否在生产现质量监督员甲是否在生产现场与产品质量有关系场与产品质量有关系”. .(3)(3)由由2 22 2列联表中数据,计算得到列联表中数据,计算得到K K2 2的观测值为的观测值为 因此,在犯错误的概率不超过因此,在犯错误的概率不超过0.0010.001的前提下,认为质量监的前提下,认为质量监督员甲在不在生产现场与产品质量好坏有关系督员甲在不在生产现场与产品质量好坏有关系. .【典例典例】(12(12分分)(1)(1)

13、下表是某地区的一种传染病与饮用水的下表是某地区的一种传染病与饮用水的调查表:调查表:这种传染病是否与饮用水的卫生程度有关,请说明理由;这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)(2)若饮用干净水得病若饮用干净水得病5 5人,不得病人,不得病5050人,饮用不干净水得病人,饮用不干净水得病9 9人,不得病人,不得病2222人人. .按此样本数据分析这种疾病是否与饮用水有按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异关,并比较两种样本在反映总体时的差异. .【审题指导审题指导】(1)(1)根据表中的信息计算根据表中的信息计算K K2 2的观测值,并根据临的

14、观测值,并根据临界值表来分析相关性的大小,对于界值表来分析相关性的大小,对于(2)(2)要列出要列出2 22 2列联表,方列联表,方法同法同(1).(1).【规范解答规范解答】(1)(1)假设假设H H0 0:传染病与饮用水无关:传染病与饮用水无关. .把表中数据代把表中数据代入公式得:入公式得:K K2 2的观测值的观测值 54.21, 54.21, 3 3分分54.2110.82854.2110.828,所以拒绝,所以拒绝H H0 0. .因此在犯错误的概率不超过因此在犯错误的概率不超过0.0010.001的前提下认为该地区这种传的前提下认为该地区这种传染病与饮用不干净水有关染病与饮用不干

15、净水有关. . 5 5分分(2)(2)依题意得依题意得2 22 2列联表:列联表:此时,此时,K K2 2的观测值的观测值 5.785. 5.785. 9 9分分由于由于5.7852.7065.7852.706所以在犯错误的概率不超过所以在犯错误的概率不超过0.10.1的前提下认为该种疾病与饮用的前提下认为该种疾病与饮用不干净水有关不干净水有关. . 1010分分两个样本都能统计得到传染病与饮用不干净水有关这一相同两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但结论,但(1)(1)中在犯错误的概率不超过中在犯错误的概率不超过0.0010.001的前提下肯定结的前提下肯定结论的正确性

16、,论的正确性,(2)(2)中在犯错误的概率不超过中在犯错误的概率不超过0.10.1的前提下肯定的前提下肯定结论的正确性结论的正确性. . 1212分分【误区警示误区警示】对解答本题时易犯错误具体分析如下:对解答本题时易犯错误具体分析如下:1.1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得数据得“吸烟与患肺癌有关吸烟与患肺癌有关”的结论,并且在犯错误的概率的结论,并且在犯错误的概率不超过不超过0.010.01的前提下认为这个结论是成立的,下列说法中正的前提下认为这个结论是成立的,下列说法中正确的是确的是( )( )(A)100(A)

17、100个吸烟者中至少有个吸烟者中至少有9999人患有肺癌人患有肺癌(B)1(B)1个人吸烟,那么这个人有个人吸烟,那么这个人有99%99%的概率患有肺癌的概率患有肺癌(C)(C)在在100100个吸烟者中一定有患肺癌的人个吸烟者中一定有患肺癌的人(D)(D)在在100100个吸烟者中可能一个患肺癌的人也没有个吸烟者中可能一个患肺癌的人也没有【解析解析】选选D.D.独立性检验的结果与实际问题有差异,即独立独立性检验的结果与实际问题有差异,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性性检验的结论是一个数学统计量,它与实际问题中的确定性存在差异存在差异. .2.2.分类变量分类变量X

18、X和和Y Y的列联表如下,则的列联表如下,则( )( )( (A)ad-bcA)ad-bc越小,说明越小,说明X X与与Y Y的关系越弱的关系越弱( (B)ad-bcB)ad-bc越大,说明越大,说明X X与与Y Y的关系越强的关系越强(C)(ad-bc)(C)(ad-bc)2 2越大,说明越大,说明X X与与Y Y的关系越强的关系越强(D)(ad-bc)(D)(ad-bc)2 2越接近于越接近于0 0,说明,说明X X与与Y Y的关系越强的关系越强【解析解析】选选C.C.由由K K2 2的计算公式可知,的计算公式可知,(ad-bc)(ad-bc)2 2越大,则越大,则K K2 2越大,越大,

19、故相关关系越强故相关关系越强. .3.3.若由一个若由一个2 22 2列联表中的数据计算得列联表中的数据计算得K K2 24.013,4.013,则两个变量则两个变量有关系的概率为有关系的概率为_._.【解析解析】因随机变量因随机变量K K2 2的观测值的观测值k=4.0133.841.k=4.0133.841.所以在犯错误所以在犯错误的概率不超过的概率不超过0.050.05的前提下,认为两个变量有关系的前提下,认为两个变量有关系. .答案答案: :0.950.954.4.根据下表计算根据下表计算k_.k_.【解析解析】根据列联表中的数据得根据列联表中的数据得K K2 2的观测值的观测值1.7

20、8.1.78.答案答案: :1.781.785.5.运动员参加比赛前往往做热身运动,下表是一体育运动的运动员参加比赛前往往做热身运动,下表是一体育运动的研究机构对研究机构对160160位专业运动员追踪而得的数据,试问:由此数位专业运动员追踪而得的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?据,你认为运动员受伤与不做热身运动有关吗?思考题思考题4 4在对人们的休闲方式的一次调查在对人们的休闲方式的一次调查中,共调查了中,共调查了124124人,其中女性人,其中女性7070人,男性人,男性5454人,女性中有人,女性中有4343人主要的休闲方式是看人主要的休闲方式是看电视,另外电视,另外2727人主要的休闲方式是运动;人主要的休闲方式是运动;男性中有男性中有2121人主要的休闲方式是看电视,人主要的休闲方式是看电视,另外另外3333人主要的休闲方式是运动人主要的休闲方式是运动(1)(1)根据以上数据建立一个根据以上数据建立一个2222的列联表;的列联表;(2)(2)试判断性别与休闲方式是否有关系试判断性别与休闲方式是否有关系

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号