《独立性检验(上课)ppt精选课件》由会员分享,可在线阅读,更多相关《独立性检验(上课)ppt精选课件(28页珍藏版)》请在金锄头文库上搜索。
1、课堂讲练互动课堂讲练互动探究学习探究学习1.2独立性检验的基本思想独立性检验的基本思想 及其初步应用及其初步应用课堂讲练互动课堂讲练互动探究学习探究学习在日常生活中,我们常常关心在日常生活中,我们常常关心分类变量之间是否有关系分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系?例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?性别是否对于喜欢数学课程有影响?课堂讲练互动课堂讲练互动探究学习探究学习独立性检验独立性检验本节研究的是两个分类变量的独立性检验问题。课堂讲练互动课堂讲练互动探究学习探究学习 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟
2、77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。肺癌的可能性大。0.54%0.54%2.28
3、%2.28%探究探究课堂讲练互动课堂讲练互动探究学习探究学习等高条形图等高条形图不患肺癌不患肺癌患肺癌患肺癌课堂讲练互动课堂讲练互动探究学习探究学习 上上面面我我们们通通过过分分析析数数据据和和图图形形,得得到到的的直直观观印印象象是是吸吸烟烟和和患患肺肺癌癌有有关关,那那么么事事实实是是否否真真的的如如此此呢呢?这这需需要要用用统统计计观观点点来考察这个问题。来考察这个问题。 现在想要知道能够以多大的把握认为现在想要知道能够以多大的把握认为“吸烟与患肺癌有关吸烟与患肺癌有关”,为此先为此先假设假设 H0:吸烟与患肺癌:吸烟与患肺癌没有没有关系关系.不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不
4、吸烟aba+b吸烟吸烟cdc+d总计总计a+cb+da+b+c+d把表中的数字用字母代替,得到如下用字母表示的列联表把表中的数字用字母代替,得到如下用字母表示的列联表课堂讲练互动课堂讲练互动探究学习探究学习因此因此|ad-bc|越越小小,说明吸烟与患肺癌之间关系越,说明吸烟与患肺癌之间关系越弱弱; |ad-bc|越越大大,说明吸烟与患肺癌之间关系越,说明吸烟与患肺癌之间关系越强强。不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟aba+b吸烟吸烟cdc+d总计总计a+cb+da+b+c+d若若“吸烟与患肺癌没有关系吸烟与患肺癌没有关系”,则吸烟样本中患肺,则吸烟样本中患肺癌的比例应该与不吸烟患
5、肺癌的比例差不多,即:癌的比例应该与不吸烟患肺癌的比例差不多,即:课堂讲练互动课堂讲练互动探究学习探究学习 为为了了使使不不同同样样本本容容量量的的数数据据有有统统一一的的评评判判标标准准,基基于于上上述述分分析,我们构造一个随机变量:析,我们构造一个随机变量:(1) 若若 H0成立,即成立,即“吸烟与患肺癌吸烟与患肺癌没有没有关系关系”,则,则K2应很小。应很小。根据表根据表3-7中的数据,利用公式(中的数据,利用公式(1)计算得到)计算得到K2的观测值为:的观测值为:那么这个值到底能告诉我们什么呢?那么这个值到底能告诉我们什么呢?(2) 独立性检验独立性检验课堂讲练互动课堂讲练互动探究学习
6、探究学习0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828独立性检验临界值表:独立性检验临界值表:1%1%把握认为把握认为A A与与B B无关无关99%99%把握认为把握认为A A与与B B有关有关90%90%把握认为把握认为A A与与B B有关有关10%10%把握认为把握认为A A与与B B无关无关没有充分的依据显示没有充分的依据显示A A与与B B有关,但也不能显示有关,但也不能显示A A与与B B无关无关其中其中A:吸烟吸烟 ,B:患肺癌:患肺癌课堂
7、讲练互动课堂讲练互动探究学习探究学习思考 答:判断出错的概率不超过0.01。课堂讲练互动课堂讲练互动探究学习探究学习独立性检验的定义独立性检验的定义 上面这种利用随机变量上面这种利用随机变量K2来确定在多大程度上来确定在多大程度上可以认为可以认为“两个分类变量有关系两个分类变量有关系”的方法,称为两的方法,称为两个分类变量的个分类变量的独立性检验独立性检验。课堂讲练互动课堂讲练互动探究学习探究学习 一一般般地地,假假设设有有两两个个分分类类变变量量X和和Y,它它们们的的值值域域分分别别为为x1,x2和和y1,y2,其其样样本本频频数数列列联联表表(称称为为2x2列列联联表)为:表)为:y1y2
8、总计总计x1aba+bx2cdc+d总计总计a+cb+da+b+c+d归纳:归纳:课堂讲练互动课堂讲练互动探究学习探究学习在实际应用中,独立性检验临界值将给出:在实际应用中,独立性检验临界值将给出:0.500.400.250.150.100.4550.7081.3232.0722.7060.050.0250.0100.0050.0013.8415.0246.6367.87910.828具体作法是:具体作法是:(1)根据实际问题需要的可信程度确定临界值根据实际问题需要的可信程度确定临界值 ;(2)计算得到随机变量计算得到随机变量 的观测值;的观测值;(3)如果如果 ,就以,就以 的把握认为的把握
9、认为“X与与Y有关系有关系”;否则就说样本观测数据没有提供;否则就说样本观测数据没有提供“X与与Y有关系有关系”的充分证据。的充分证据。课堂讲练互动课堂讲练互动探究学习探究学习题型一有关“相关的检验”【例1】 某校对学生课外活动进行调查,结果整理成下表:试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?体育 文娱 总计男生212344女生62935总计275279课堂讲练互动课堂讲练互动探究学习探究学习课堂讲练互动课堂讲练互动探究学习探究学习且且P(K K27.879)0.005即我们得到的即我们得到的K K2的观测值的观测值k k8
10、.106超过超过7.879,这就意味着:这就意味着:“喜欢体育还是文娱与性别喜欢体育还是文娱与性别没有没有关系关系”这一这一结论成结论成立的可能性小于立的可能性小于0.005,即在,即在犯错误的概率不超过犯错误的概率不超过0.005的前提下认的前提下认为为“喜欢体育还是喜欢文娱与性别喜欢体育还是喜欢文娱与性别有有关关”独立性检验临界值表:独立性检验临界值表:0.050.0250.0100.0050.0013.8415.0246.6367.87910.828课堂讲练互动课堂讲练互动探究学习探究学习回顾:回顾:独立性检验的步骤:独立性检验的步骤:课堂讲练互动课堂讲练互动探究学习探究学习【变式】 为
11、研究学生的数学成绩与对学习数学的兴趣是否有关,为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据:对某年级学生作调查得到如下数据:判断学生的数学成绩好坏与对学习数学的兴趣是否有关?判断学生的数学成绩好坏与对学习数学的兴趣是否有关?成绩优秀成绩优秀 成绩较差成绩较差 总计总计兴趣浓厚的兴趣浓厚的643094 兴趣不浓厚的兴趣不浓厚的227395总计总计86103189题型独立性的检验课堂讲练互动课堂讲练互动探究学习探究学习成绩优秀成绩优秀成绩较差成绩较差总计总计兴趣浓厚的兴趣浓厚的643094 兴趣不浓厚的兴趣不浓厚的227395总计总计86103189课堂讲练互动课
12、堂讲练互动探究学习探究学习【例】 为为了了探探究究学学生生选选报报文文、理理科科是是否否与与对对外外语语的的兴兴趣趣有有关关,某某同同学学调调查查了了361名名高高二二在在校校学学生生,调调查查结结果果如如下下:理理科科对对外外语语有有兴兴趣趣的的有有138人人,无无兴兴趣趣的的有有98人人,文文科科对对外外语语有有兴兴趣趣的的有有73人人,无无兴兴趣趣的的有有52人人试试分分析析学学生生选选报报文文、理理科科与与对对外语的兴趣是否有关?外语的兴趣是否有关?理理文文总计总计有兴趣有兴趣13873211无兴趣无兴趣9852150总计总计236125361解:列出22列联表:课堂讲练互动课堂讲练互
13、动探究学习探究学习解列出22列联表理理文文总计总计有兴趣有兴趣13873211无兴趣无兴趣9852150总计总计236 125361课堂讲练互动课堂讲练互动探究学习探究学习题型独立性检验的基本思想【例】 某某企企业业有有两两个个分分厂厂生生产产某某种种零零件件,按按规规定定内内径径尺尺寸寸(单单位位:mm)的的值值落落在在(29.94,30.06)的的零零件件为为优优质质品品从从两两个个分分厂厂生生产产的零件中各抽出的零件中各抽出500件,量其内径尺寸,结果如下表:件,量其内径尺寸,结果如下表:甲厂:甲厂:分组分组29.86,2990)29.90,2994)29.94,2998)29.98,3
14、002)30.02,3006)30.06,3010)30.10,3014)频数频数12638618292614课堂讲练互动课堂讲练互动探究学习探究学习乙厂乙厂分组分组29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3010)30.10,3014)频数频数297185159766218课堂讲练互动课堂讲练互动探究学习探究学习(1)试分别估计两个分厂生产的零件的试分别估计两个分厂生产的零件的优质品率优质品率;(2)由由以以上上统统计计数数据据填填下下面面22列列联联表表,并并问问是是否否有有99%的的把把握握认认为为“两两个
15、个分分厂厂生生产产的的零零件件的的质质量量有有差异差异”甲厂甲厂 乙厂乙厂 总计总计优质品优质品非优质品非优质品总计总计课堂讲练互动课堂讲练互动探究学习探究学习课堂讲练互动课堂讲练互动探究学习探究学习课堂讲练互动课堂讲练互动探究学习探究学习【示例】 某某小小学学对对232名名小小学学生生调调查查中中发发现现:180名名男男生生中中有有98名名有有多多动动症症,另另外外82名名没没有有多多动动症症,52名名女女生生中中有有2名名有有多多动动症症,另另外外50名名没没有有多多动动症症,用用独独立立性性检检验验方方法法判判断多动症与性别是否有关系?断多动症与性别是否有关系?解: 由题可列出如下列联表:多动症多动症 无多动症无多动症 总计总计男生男生9882180女生女生25052总计总计100132232课堂讲练互动课堂讲练互动探究学习探究学习