21独立性检验22独立性检验的基本思想23独立性检验的应用

上传人:M****1 文档编号:569321090 上传时间:2024-07-28 格式:PPT 页数:40 大小:2.04MB
返回 下载 相关 举报
21独立性检验22独立性检验的基本思想23独立性检验的应用_第1页
第1页 / 共40页
21独立性检验22独立性检验的基本思想23独立性检验的应用_第2页
第2页 / 共40页
21独立性检验22独立性检验的基本思想23独立性检验的应用_第3页
第3页 / 共40页
21独立性检验22独立性检验的基本思想23独立性检验的应用_第4页
第4页 / 共40页
21独立性检验22独立性检验的基本思想23独立性检验的应用_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《21独立性检验22独立性检验的基本思想23独立性检验的应用》由会员分享,可在线阅读,更多相关《21独立性检验22独立性检验的基本思想23独立性检验的应用(40页珍藏版)》请在金锄头文库上搜索。

1、日常生活中我们关心这样一些问题:日常生活中我们关心这样一些问题:1.吸烟与患呼吸道疾病有无关系?吸烟与患呼吸道疾病有无关系?2.秃顶与心脏病之间有无关系?秃顶与心脏病之间有无关系?3.性别与喜欢数学课之间有无关系?性别与喜欢数学课之间有无关系?以上问题用什么知识来解决呢?以上问题用什么知识来解决呢?统计学中检验两个变量统计学中检验两个变量是否有关系是否有关系的一的一种统计方法种统计方法独立性检验独立性检验22.1 独立性检验2.2 独立性检验的基本思想2.3 独立性检验的应用 人们都认可人们都认可“吸烟具有危害性吸烟具有危害性”,那么,人们认,那么,人们认可这个观点,有什么根据么?吸烟是否对患

2、肺癌有影可这个观点,有什么根据么?吸烟是否对患肺癌有影响呢?下面我们用数学知识来分析一下,这个观点是响呢?下面我们用数学知识来分析一下,这个观点是否具有科学根据否具有科学根据1.1.掌握利用掌握利用2222列联表进行独立性检验,会用列联表进行独立性检验,会用2222列联表解决实际问题列联表解决实际问题. .(重点)(重点) 2.2.了解独立性检验的基本思想及实施步骤了解独立性检验的基本思想及实施步骤. .(重点)(重点)3. 3. 掌握独立性检验的简单应用掌握独立性检验的简单应用(难点)(难点)探究点探究点1 1 独立性检验独立性检验为了调查吸烟与患肺癌是否有联系,某机构随机调为了调查吸烟与患

3、肺癌是否有联系,某机构随机调查了查了6 5786 578人,得到表中的数据(单位:人)人,得到表中的数据(单位:人)患肺癌患肺癌不患肺癌不患肺癌吸烟吸烟56561 9321 932不吸烟不吸烟23234 5674 5672 22 2列联表列联表这一问题称为这一问题称为2222列联表的独立性检验列联表的独立性检验. .患肺癌情况患肺癌情况吸烟情况吸烟情况思考:思考:如何根据表格中的数据来判断吸烟与患肺如何根据表格中的数据来判断吸烟与患肺癌是否有联系?癌是否有联系? 为了讨论的方便,我们引入以下记号:为了讨论的方便,我们引入以下记号:变量变量A A:A A1 1= =吸烟,吸烟,变量变量B B:B

4、 B1 1= =患肺癌,患肺癌,计算得如下表格:计算得如下表格:患肺癌患肺癌B B1 1未患肺癌未患肺癌B B2 2总计总计吸烟吸烟A A1 156561 9321 9321 9881 988不吸烟不吸烟A A2 223234 5674 5674 5904 590总计总计79796 4996 4996 5786 578我们假设吸烟与患肺癌是独立的,即吸烟不影响患我们假设吸烟与患肺癌是独立的,即吸烟不影响患肺癌肺癌. .根据直观的经验,我们把吸烟人群中患肺癌的根据直观的经验,我们把吸烟人群中患肺癌的人所占百分比,与不吸烟人群中患肺癌的人所占百人所占百分比,与不吸烟人群中患肺癌的人所占百分比作比较

5、分比作比较. .如果吸烟不影响患肺癌,就意味着,无如果吸烟不影响患肺癌,就意味着,无论吸烟与否,患肺癌的人所占的百分比应该是基本论吸烟与否,患肺癌的人所占的百分比应该是基本一样的,就此题而言:一样的,就此题而言:患肺癌情况患肺癌情况吸烟情况吸烟情况通过表格中的数据计算可得通过表格中的数据计算可得吸烟人群中患肺癌的人所占百分比是:吸烟人群中患肺癌的人所占百分比是:不吸烟人群中患肺癌的人所占百分比是:不吸烟人群中患肺癌的人所占百分比是:结论:结论:吸烟人群中患肺癌的人所占的百分比,与不吸吸烟人群中患肺癌的人所占的百分比,与不吸烟人群中患肺癌的人所占百分比不等,且相差较大烟人群中患肺癌的人所占百分比

6、不等,且相差较大. .由由此我们可以推断,开始的假设是不成立的此我们可以推断,开始的假设是不成立的. .也就是说,也就是说,患肺癌与吸烟是有关系的患肺癌与吸烟是有关系的. .由吸烟人群中患肺癌的人所由吸烟人群中患肺癌的人所占的百分比较多,我们认为吸烟会对肺癌的发病率造占的百分比较多,我们认为吸烟会对肺癌的发病率造成一定的影响成一定的影响. .另一方面,如果吸烟与患肺癌是独立的,那么有另一方面,如果吸烟与患肺癌是独立的,那么有都成立,由上表数据可得:都成立,由上表数据可得:患肺癌情况患肺癌情况吸烟情况吸烟情况既吸烟又患肺癌的人频率为:既吸烟又患肺癌的人频率为:吸烟的人频率为:吸烟的人频率为:患肺

7、癌的人频率为:患肺癌的人频率为:显然显然两边相差很大,可以估计两边相差很大,可以估计结论:结论:患肺癌与吸烟有关患肺癌与吸烟有关.设设 A,BA,B为两个变量,每个变量都可取两个值,为两个变量,每个变量都可取两个值,变量变量A A:变量变量B B:,= ; , = .【概括总结概括总结】B BA AB B1 1B B2 2总计总计A A1 1a ab b_A A2 2c cd dc+dc+d总计总计a+ca+c_n=_n=_ a+ba+ba+b+c+da+b+c+db+db+d设设 ,用,用 估计估计 , 估计估计 , 估计估计 . 若有式子若有式子,则可认为则可认为 与与 独立独立.同理,若

8、同理,若 则可认为则可认为A A1 1与与B B2 2独立;若独立;若 则可认为则可认为A A2 2与与B B1 1独立;若独立;若则可认为则可认为A A2 2与与B B2 2独立独立. .在在 中,中,由于由于 , , 表表示的是频率,不同于概率,即使变量之间独立示的是频率,不同于概率,即使变量之间独立,式子两式子两边也不一定恰好相等,但是当两边相差很大时,变量边也不一定恰好相等,但是当两边相差很大时,变量之间就不独立之间就不独立. 考察棉花种子经过处理跟棉花生病之间的关系,考察棉花种子经过处理跟棉花生病之间的关系, 得到数据如下:得到数据如下:则判断种子处理与得病之间的独立性则判断种子处理

9、与得病之间的独立性.【练一练练一练】种子处理情况种子处理情况得病情况得病情况解:解:由题意可知由题意可知a=32a=32,b=101b=101,c=61c=61,d=213d=213,从而,从而可得可得 ,所以,所以种子处理与得病种子处理与得病之间是独立的之间是独立的. .在上面吸烟是否对患肺癌有影响的问题中在上面吸烟是否对患肺癌有影响的问题中探究点探究点2 2 独立性检验的基本思想独立性检验的基本思想当上面的值较大时,变量当上面的值较大时,变量A,BA,B不独立不独立. .思考思考 :当这些量多大时才能说明变量间不独立呢?当这些量多大时才能说明变量间不独立呢?我们能不能选择一个量,用它的大小

10、来检验变量之我们能不能选择一个量,用它的大小来检验变量之间是否独立呢?间是否独立呢?统计学家选取以下统计量,用它的大小来检验变统计学家选取以下统计量,用它的大小来检验变量之间是否独立:量之间是否独立:当当2较大大时,说明明变量之量之间不独立不独立.当数据量较大时,在统计中,用以下结果对变量的独当数据量较大时,在统计中,用以下结果对变量的独立性进行判断立性进行判断.1.1.如果如果 2.706,2.706,没有充分的证据判定变量没有充分的证据判定变量A,BA,B有关联,有关联,可以认为变量可以认为变量A A,B B是没有关联的;是没有关联的;3.3.如果如果 3.8413.841,有,有95%9

11、5%的把握判定变量的把握判定变量A,BA,B有关联有关联; ;2.2.如果如果 2.7062.706,有,有90%90%的把握判定变量的把握判定变量A,BA,B有关联有关联; ;4.4.如果如果 6.6356.635,有,有99%99%的把握判定变量的把握判定变量A,BA,B有关联有关联. .患肺癌患肺癌B B1 1未患肺癌未患肺癌B B2 2总计总计吸烟吸烟A A1 156561932193219881988不吸烟不吸烟A A2 223234567456745904590总计总计79796499649965786578对于吸烟和患肺癌的问题对于吸烟和患肺癌的问题所以有所以有99%99%以上的

12、把握认为吸烟与患肺癌是有关的以上的把握认为吸烟与患肺癌是有关的. .患肺癌情况患肺癌情况吸烟情况吸烟情况参加体育参加体育锻炼情况情况 性性别喜喜欢参加参加体育体育锻炼不喜不喜欢参加参加体育体育锻炼男男19748女女135120为了了解高中生是否喜欢参加体育锻炼与性别之间为了了解高中生是否喜欢参加体育锻炼与性别之间的关系,调查者随机调查了的关系,调查者随机调查了500500名高中生的情况,名高中生的情况,调查结果如下调查结果如下(单位:人):(单位:人):试问:试问:高中生是否喜欢参加体育锻炼与性别之高中生是否喜欢参加体育锻炼与性别之间有关系吗间有关系吗?【变式练习变式练习】解:解:根据表中的数

13、据得根据表中的数据得a=197,b=48,c=135,d=120a=197,b=48,c=135,d=120所以有所以有99%99%以上的把握认为以上的把握认为高中生是否喜欢参加体高中生是否喜欢参加体育锻炼与性别之间是育锻炼与性别之间是有关的有关的. .例例1.1.某组织对男女青年是否喜爱古典音乐进行了一某组织对男女青年是否喜爱古典音乐进行了一个调查,调查者随机调查了个调查,调查者随机调查了146146名青年,下表中给出名青年,下表中给出了调查的结果(单位:人):了调查的结果(单位:人):喜爱喜爱不喜爱不喜爱男青年男青年46463030女青年女青年20205050试问:男女青年喜爱古典音乐的程

14、度是否有差异?试问:男女青年喜爱古典音乐的程度是否有差异?探究点探究点3 3 独立性检验的应用独立性检验的应用喜欢古典音乐情况喜欢古典音乐情况青年青年解:解:根据表中的数据计算得下表根据表中的数据计算得下表(单位:人):(单位:人):喜爱喜爱不喜爱不喜爱总计总计男青年男青年464630307676女青年女青年202050507070总计总计66668080146146 所以有所以有99%99%以上的把握认为是否喜爱古典音乐与青以上的把握认为是否喜爱古典音乐与青年的性别有关年的性别有关. .喜欢古典音乐情况喜欢古典音乐情况青年青年例例2.2.容易生气的人更有可能患心脏病吗?某机构随机容易生气的人

15、更有可能患心脏病吗?某机构随机调查了调查了2 7962 796人,下表给出了调查的结果(单位:人):人,下表给出了调查的结果(单位:人):患心脏病患心脏病未患心脏病未患心脏病易怒易怒2727606606不易怒不易怒53532 1102 110试问:容易生气的人是否更有可能患心脏病?试问:容易生气的人是否更有可能患心脏病?患心脏病情况患心脏病情况是否易怒是否易怒解:解:根据表中的数据计算得下表根据表中的数据计算得下表(单位:人):(单位:人):患心脏病患心脏病未患心脏病未患心脏病总计总计易怒易怒2727606606633633不易怒不易怒53532 1102 1102 1632 163总计总计8

16、0802 7162 7162 7962 796所以有所以有95%95%以上的把握认为患心脏病与易怒有关以上的把握认为患心脏病与易怒有关. .患心脏病情况患心脏病情况是否易怒是否易怒眼睛虹膜眼睛虹膜颜色色头发颜色色蓝色色棕色棕色红金黄色金黄色1561561212黑色黑色20202424例例3.3.生物学上对于人类头发的颜色与眼睛虹膜的颜生物学上对于人类头发的颜色与眼睛虹膜的颜色是否有关进行了调研,以下是一次调查结果,调色是否有关进行了调研,以下是一次调查结果,调查人数共查人数共212212人,调查记录如表人,调查记录如表(单位:人):(单位:人):试问:头发的颜色与眼睛虹膜的颜色有关吗?试问:头

17、发的颜色与眼睛虹膜的颜色有关吗?解:解:根据表中的数据计算得下表根据表中的数据计算得下表(单位:人):(单位:人):眼睛虹膜颜色眼睛虹膜颜色 头发颜色头发颜色蓝色蓝色棕色棕色总计总计红红金黄色金黄色1561561212168168黑色黑色202024244444总计总计1761763636n=212n=212 因为因为55.5766.635,55.5766.635,所以有所以有99%99%以上的把握认为以上的把握认为头发的颜色与眼睛虹膜的颜色有关头发的颜色与眼睛虹膜的颜色有关. .要推断要推断“和和是否有关系是否有关系”,可按下面的步骤进行:,可按下面的步骤进行:(1 1)根据根据2222列联

18、表得出合计总表列联表得出合计总表;(2 2)用公式计算)用公式计算 的值;的值;(3 3)查对临界值,作出判断)查对临界值,作出判断. . 由于抽样的随机性,由样本得到的推断有可能正由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误确,也有可能错误. .利用利用 进行独立性检验,可以进行独立性检验,可以对推断的正确性作出估计,样本量对推断的正确性作出估计,样本量n n越大,估计越准确越大,估计越准确. .【总结总结】有甲乙两个班级进行一门课程的考试,按照学生考试有甲乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:成绩优秀和不优秀统计成绩后,得到如下

19、列联表:优秀优秀不优秀不优秀甲班甲班10103535乙班乙班7 73838试问:学生的学习成绩与所在的班级有关吗?试问:学生的学习成绩与所在的班级有关吗?【变式练习变式练习】成绩成绩班级班级优秀优秀不优秀不优秀总计总计甲班甲班101035354545乙班乙班7 738384545总计总计171773739090解:解:根据表中的数据计算得下表根据表中的数据计算得下表 因为因为0.6532.706,0.6533.841.=4.0133.841.所以有所以有95%95%的把握判定的把握判定两个变量有关联两个变量有关联. .95%95%4.4.根据下表计算根据下表计算 _._.解解: :由由 的计算

20、公式,得的计算公式,得1.781.78发病情况发病情况手术情况手术情况5.5.下表是某地区的一种传染病与饮用水的调查表:下表是某地区的一种传染病与饮用水的调查表:试问:这种传染病与饮用水的卫生程度有关吗?试问:这种传染病与饮用水的卫生程度有关吗?得病情况得病情况饮用水卫生程度饮用水卫生程度解:解:根据表中的数据计算得下表根据表中的数据计算得下表所以有所以有99%99%以上的把握认为以上的把握认为这种传染病与饮用水的卫这种传染病与饮用水的卫生程度有关生程度有关. .得病情况得病情况饮用水卫生程度饮用水卫生程度B BA AB B1 1B B2 2总计总计A A1 1a ab ba+ba+bA A2

21、 2c cd dc+dc+d总计总计a+ca+cb+db+dn=a+b+c+dn=a+b+c+d 根据根据2 22 2列联表中的数据,来判断两个变量列联表中的数据,来判断两个变量A,BA,B是是否独立的问题否独立的问题1.221.22列联表的定义列联表的定义变量变量A A:A A1 1, ;, ;变量变量B:BB:B1 1, , ,用如下数据用如下数据: :2.2.统计量统计量2 2的计算公式的计算公式3.3.独立性检验判断方法独立性检验判断方法2 2= =2 2= =作业:作业:P94 P94 习题习题3.2 3.2 第第2 2、3 3、4 4、5 5题题 人生难免遇风雨,天空难免有阴云,别因雨水湿透衣衫而难过,别为坎坷阻力而叹息,用乐观心态面对人生遭遇,用积极的拼搏迎接雨后的彩虹,相信自己.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号