3.2独立性检验的基本思想及其初步应用课件

上传人:枫** 文档编号:567612307 上传时间:2024-07-21 格式:PPT 页数:38 大小:750.50KB
返回 下载 相关 举报
3.2独立性检验的基本思想及其初步应用课件_第1页
第1页 / 共38页
3.2独立性检验的基本思想及其初步应用课件_第2页
第2页 / 共38页
3.2独立性检验的基本思想及其初步应用课件_第3页
第3页 / 共38页
3.2独立性检验的基本思想及其初步应用课件_第4页
第4页 / 共38页
3.2独立性检验的基本思想及其初步应用课件_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《3.2独立性检验的基本思想及其初步应用课件》由会员分享,可在线阅读,更多相关《3.2独立性检验的基本思想及其初步应用课件(38页珍藏版)》请在金锄头文库上搜索。

1、3.2独立性检验的独立性检验的基本思想及其初基本思想及其初步应用步应用高二数学高二数学 选修选修2-3 第三章第三章 统计案例统计案例独立性检验独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心在日常生活中,我们常常关心分类变量之间是否有关系分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系?例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。性别是否对于喜欢数学课程有影响?等等。 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟2099209949492148214

2、8总计总计98749874919199659965探究探究: :为了调查为了调查吸烟吸烟是否对是否对肺癌肺癌有影响,某肿瘤研究所随有影响,某肿瘤研究所随机地调查了机地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列列联联表表分类变量分类变量 1下面是一个22列联表:y1y2总计x1a2173x222527总计b46100则表中a、b的值分别为()A94、96 B52、50C52、54 D54、52C 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟209920994949214821

3、48总计总计98749874919199659965探究探究: :为了调查为了调查吸烟吸烟是否对是否对肺癌肺癌有影响,某肿瘤研究所随有影响,某肿瘤研究所随机地调查了机地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列列联联表表在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是 吸烟者和不吸烟者都可能患肺癌,吸烟者和不吸烟者都可能患肺癌,吸烟者患肺癌的可能性较大吸烟者患肺癌的可能性较大0.54%0.54%2.28%2.28%分类变量分类变量 42/7817通过图形直观判断两个分类变量是否相关:通过图形直观判断两个

4、分类变量是否相关:等高条等高条形图形图在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是 0.54%0.54%2.28%2.28%不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟aba+b吸烟吸烟cdc+d总计总计a+cb+dn=a+b+c+d独立性独立性检验检验在不吸烟者中不患肺癌的比重是在不吸烟者中不患肺癌的比重是 在吸烟者中不患肺癌的比重是在吸烟者中不患肺癌的比重是 H H0 0:假设:假设吸烟吸烟和和患肺癌患肺癌没有关系没有关系独立性独立性检验检验H H0 0:假设:假设吸烟吸烟和和患肺癌患肺癌没有关系没有关系构造随机变量构造随机变量

5、( (卡方统计量卡方统计量) ) 作为检验在多大程度上可以认为作为检验在多大程度上可以认为“两个变量有关系两个变量有关系”的标准的标准 。 若若H H0 0( (吸烟吸烟和和患肺癌患肺癌没有关系没有关系) )成立,则成立,则K K2 2应该很小应该很小. .独立性独立性检验检验H H0 0:假设:假设吸烟吸烟和和患肺癌患肺癌没有关系没有关系 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965随机变量随机变量-卡方统计量卡方统计量0

6、.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828临界值表临界值表0.1%0.1%把握认为把握认为A A与与B B无关无关1%1%把握认为把握认为A A与与B B无关无关99.9%99.9%把握认把握认A A与与B B有关有关99%99%把握认为把握认为A A与与B B有关有关90%90%把握认为把握认为A A与与B B有关有关10%10%把握认为把握认为A A与与B B无关无关即在即在 成立的情况下,成立的情况下,K K2 2 大于大于6.6356.635

7、概率非常小,近概率非常小,近似为似为0.010.01 现在的现在的K K2 256.63256.632的观测值远大于的观测值远大于6.6356.635,小概率事,小概率事件的发生说明假设件的发生说明假设H H0 0不成立!不成立!0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828临界值表临界值表独立性独立性检验检验H H0 0:假设:假设吸烟吸烟和和患肺癌患肺癌没有关系没有关系所以所以吸烟吸烟和和患肺癌患肺癌有关!有关!1对分类变量对分类变量X与与Y的随机

8、变量的随机变量K2的观测值的观测值k,说法正确,说法正确的是的是()Ak越大,越大,“ X与与Y有关系有关系”可信程度越小可信程度越小Bk越小,越小,“ X与与Y有关系有关系”可信程度越小可信程度越小Ck越接近于越接近于0,“X与与Y无关无关”程度越小程度越小Dk越大,越大,“X与与Y无关无关”程度越大程度越大B例例1.在在某某医医院院,因因为为患患心心脏脏病病而而住住院院的的665名名男男性性病病人人中中,有有214人人秃秃顶顶,而而另另外外772名名不不是是因因为为患患心心脏脏病病而而住住院院的的男男性性病病人人中中有有175人人秃秃顶顶.分分别别利利用用图图形形和和独独立立性性检检验验方

9、方法判断是否有关法判断是否有关?你所得的结论在什么范围内有效你所得的结论在什么范围内有效?患心脏病患心脏病不患心脏病不患心脏病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437在秃顶中患心脏病的比重是在秃顶中患心脏病的比重是 在不秃顶中患心脏病的比重是在不秃顶中患心脏病的比重是 55.01%43.03%例例1.在在某某医医院院,因因为为患患心心脏脏病病而而住住院院的的665名名男男性性病病人人中中,有有214人人秃秃顶顶,而而另另外外772名名不不是是因因为为患患心心脏脏病病而而住住院院的的男男性性病病人人中中有有175人人秃秃顶顶.分分别别利利用用

10、图图形形和和独独立立性性检检验验方方法判断是否有关法判断是否有关?你所得的结论在什么范围内有效你所得的结论在什么范围内有效?患心脏病患心脏病不患心脏病不患心脏病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437 根据联表的数据,得到根据联表的数据,得到所以有所以有99%的把握认为的把握认为“秃顶与患心脏病有关秃顶与患心脏病有关”。A所以根据列所以根据列联表的数据,可以有表的数据,可以有 %的把握的把握认为该学校学校15至至16周周岁的男生的身高和体重之的男生的身高和体重之间有关系。有关系。97.5 由独立性由独立性检验随机随机变量量值的的计算公式得:

11、算公式得: 1(20132013深圳二模深圳二模)2013年年3月月14日,日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了某大学实验室随机抽取了60个样本,得到了相关数据如下表:个样本,得到了相关数据如下表:混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂25530使用未经淡化海砂151530总计402060(1)根据表中数据,利用独立性检验的方法判断,能否在)根据表中数据,利用独立性检验的方法判

12、断,能否在犯错误的概率不超过犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?耐久性是否达标有关?(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这个,现从这6个样本中任取个样本中任取2个,则取出的个,则取出的2个样本混凝土耐久个样本混凝土耐久性都达标的概率是多少?性都达标的概率是多少?参考数据:参考数据:P(k2k)0.100.0500.0250.0100.001k2.7063.8415.0246.63510.828解析:解析:(1)提出假设)提出假设H0:使用淡化海砂与

13、混凝土耐久性:使用淡化海砂与混凝土耐久性是否达标无关是否达标无关.根据表中数据,求得根据表中数据,求得K2的观测值的观测值能在犯错误的概率不超过能在犯错误的概率不超过1%的前提下,认为使用淡化海的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关砂与混凝土耐久性是否达标有关.(2)用分层抽样的方法在使用淡化海砂的样本中抽取)用分层抽样的方法在使用淡化海砂的样本中抽取6个,个,其中应抽取其中应抽取“混凝土耐久性达标混凝土耐久性达标”的为的为 6=5,“混凝土混凝土耐久性不达标耐久性不达标”的为的为6-5=1,“混凝土耐久性达标记混凝土耐久性达标记”为为A1,A2,A3,A4,A5”;“混凝土耐久

14、性混凝土耐久性不达标不达标”的记为的记为B.在这在这6个样本中任取个样本中任取2个,有以下几种可能:(个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)()(A5,B),共共15种种.设设“取出的取出的2个样本混凝土耐久性都达标个样本混凝土耐久性都达标”为事件为事件A,它的,它的对立事件对立事件A为为“取出的取出的2个样本至少有个样本至少有1个混凝土耐久性不达标个混凝土耐久性不达标”,包含(,包含(A1,B),(

15、A2,B),(A3,B),(A4,B),(A5,B),),共共5种可能种可能.2(2011揭阳一模揭阳一模)某食品厂为了检查甲乙两条自动包装某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取流水线的生产情况,随机在这两条流水线上各抽取40件产品件产品作为样本称出它们的重量作为样本称出它们的重量(单位:克单位:克),重量值落在,重量值落在(495,510的的产品为合格品,否则为不合格品表产品为合格品,否则为不合格品表1是甲流水线样本频数分是甲流水线样本频数分布表,图布表,图1是乙流水线样本的频率分布直方图是乙流水线样本的频率分布直方图产品重量/克频数(490,4956(

16、495,5008(500,50514(505,5108(510,5154表表1甲流水线样本频数分布表甲流水线样本频数分布表(1)根据上表数据作出甲流水线样本的频率分布直方图;根据上表数据作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据完成下面由以上统计数据完成下面22列联表,能否在犯错误列联表,能否在犯错误的概率不超过的概率不超过0.1的前提下认为产品的包装质量与两条自动包的前提下认为产品的包装质量与两条自

17、动包装流水线的选择有关?装流水线的选择有关?甲流水线乙流水线合计合格品ab不合格品cd合计n附:下面的临界值表供参考:附:下面的临界值表供参考:p(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828解析:解析:(1)甲流水线样本的频率分布直方图如下:甲流水线样本的频率分布直方图如下:(2)由表由表1知甲样本中合格品数为知甲样本中合格品数为814830,由图,由图1知知乙样本中合格品数为乙样本中合格品数为(0.060.090.03)54036,故甲样本,故甲样本合格品的频率为合格品的频率为 0.75,乙样本合格品的频率为乙样本合格品的频率为 0.9,据此可估计从甲流水线任取据此可估计从甲流水线任取1件产品,该产品恰好是合格件产品,该产品恰好是合格品的概率为品的概率为0.75.从乙流水线任取从乙流水线任取1件产品,该产品恰好是合格件产品,该产品恰好是合格品的概率为品的概率为0.9.(3)22列联表如下:列联表如下:甲流水线乙流水线合计合格品a30b3666不合格品c10d414合计4040n80在犯错误的概率不超过在犯错误的概率不超过0.1的前提下认为产品的包装质的前提下认为产品的包装质量与两条自动包装流水线的选择有关量与两条自动包装流水线的选择有关

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号