高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修2-3 .ppt

上传人:re****.1 文档编号:569801742 上传时间:2024-07-31 格式:PPT 页数:77 大小:1.03MB
返回 下载 相关 举报
高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修2-3 .ppt_第1页
第1页 / 共77页
高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修2-3 .ppt_第2页
第2页 / 共77页
高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修2-3 .ppt_第3页
第3页 / 共77页
高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修2-3 .ppt_第4页
第4页 / 共77页
高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修2-3 .ppt_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修2-3 .ppt》由会员分享,可在线阅读,更多相关《高中数学 3.2 独立性检验的基本思想及其初步应用课件 新人教A版选修2-3 .ppt(77页珍藏版)》请在金锄头文库上搜索。

1、3.2独立性检验的基本思想及其初步应用问题引航引航1.1.分分类变量与列量与列联表分表分别是如何定是如何定义的的? ?2.2.独立性独立性检验的基本思想是怎的基本思想是怎样的的? ?独立性独立性检验的常用方的常用方法有哪些法有哪些? ?3.3.如何运用你所学知如何运用你所学知识对具体案例具体案例进行行检验? ?1.1.与列与列联表相关的概念表相关的概念(1)(1)分分类变量量: :变量的不同量的不同“_”“_”表示个体所属的表示个体所属的_,_,像像这样的的变量称量称为分分类变量量. .(2)(2)列列联表表: :列出的列出的_分分类变量的量的_,_,称称为列列联表表. .值不同不同类别两个两

2、个频数表数表一般地一般地, ,假假设有两个分有两个分类变量量X X和和Y,Y,它它们的取的取值分分别为xx1 1,x,x2 2 和和yy1 1,y,y2 2,其其样本本频数列数列联表表( (称称为2222列列联表表) )为: :Y YX Xy y1 1y y2 2总计x x1 1a ab b_x x2 2c cd d_总计_a+b+c+da+b+c+da+ba+bc+dc+da+ca+cb+db+d2.2.等高条形等高条形图等高条形等高条形图与表格相比与表格相比, ,图形更能直形更能直观地反映出两个分地反映出两个分类变量量间是否是否_,_,常用等高条形常用等高条形图展示列表数据的展示列表数据的

3、_._.相互影响相互影响频率特征率特征3.3.独立性独立性检验的基本思想的基本思想(1)(1)定定义: :利用随机利用随机变量量_来判断来判断“两个分两个分类变量量_”_”的的方法称方法称为独立性独立性检验. .(2)(2)公式公式:K:K2 2=_,=_,其中其中n=_.n=_.K K2 2有关系有关系a+b+c+da+b+c+d(3)(3)独立性独立性检验的具体做法的具体做法: :根据根据实际问题的需要确定容的需要确定容许推断推断“两个分两个分类变量有关系量有关系”犯犯错误概率的上界概率的上界,然后然后查表确定表确定_k_k0 0. .利用公式利用公式计算随机算随机变量量K K2 2的的_

4、k._k.如果如果_,_,就推断就推断“X“X与与Y Y有关系有关系”,”,这种推断犯种推断犯错误的概率的概率不超不超过;否否则, ,就就认为在在_不超不超过的前提下不的前提下不能推断能推断“X“X与与Y Y有关系有关系”,”,或者在或者在样本数据中本数据中_支持支持结论“X“X与与Y Y有关系有关系”.”.临界界值观测值kkkk0 0犯犯错误的概率的概率没有没有发现足足够证据据1.1.判一判判一判( (正确的打正确的打“”,“”,错误的打的打“”)“”)(1)(1)分分类变量中的量中的变量与函数中的量与函数中的变量是同一概念量是同一概念. .( () )(2)(2)列列联表表频率分析法、等高

5、条形率分析法、等高条形图可初步分析两分可初步分析两分类变量是量是否有关系否有关系, ,而独立性而独立性检验中中K K2 2取取值则可通可通过统计表从数据上表从数据上说明明两分两分类变量的相关性的大小量的相关性的大小. .( () )(3)(3)独立性独立性检验的方法就是反的方法就是反证法法. .( () )【解析】【解析】(1)(1)错误错误. .分类变量分类变量, ,如性别变量如性别变量, ,可取值为男、女可取值为男、女, ,这这里的性别为变量里的性别为变量, ,它不一定为数值它不一定为数值. .而函数中的变量一定为实数而函数中的变量一定为实数. .(2)(2)正确正确. .列联表或等高条形

6、图能直观地感受两分类变量是否相列联表或等高条形图能直观地感受两分类变量是否相关关. .具体可用独立性检验的方法从可信度上检验两分类变量相具体可用独立性检验的方法从可信度上检验两分类变量相关性的大小关性的大小. .(3)(3)错误错误. .独立性检验是在假设两分类变量无关的基础上推出一独立性检验是在假设两分类变量无关的基础上推出一个小概率事件个小概率事件, ,在一定可信度的基础上说明假设是否成立的方在一定可信度的基础上说明假设是否成立的方法法, ,而反证法是按照一定的逻辑推出与已知或已经成立的结论而反证法是按照一定的逻辑推出与已知或已经成立的结论相矛盾的证明方法相矛盾的证明方法, ,两者不尽相同

7、两者不尽相同. .故此种说法错误故此种说法错误. .答案答案: :(1)(1)(2)(2)(3)(3)2.2.做一做做一做( (请把正确的答案写在横把正确的答案写在横线上上) )(1)(1)为了了调查高中生的性高中生的性别与是否喜与是否喜欢踢足球之踢足球之间有无关系有无关系, ,一一般需要收集以下数据般需要收集以下数据. .(2)(2)若若观测值k7.8,k7.8,得到的正确得到的正确结论是在犯是在犯错误的概率不超的概率不超过的前提下的前提下认为“爱好好该项运运动与性与性别有关有关”.”.(3)(3)独立性独立性检验中中, ,假假设H H0 0: :变量量x x与与变量量y y没有关系没有关系

8、. .则在在H H0 0成立成立的情况下的情况下, ,估估计概率概率P(KP(K2 26.635)0.016.635)0.01表示的意表示的意义是是变量量x x与与变量量y y( (填填“有关系有关系”或或“无关系无关系”)”)的概率是的概率是99%.99%.【解析】【解析】(1)(1)为了调查高中生的性别与是否喜欢踢足球之间有为了调查高中生的性别与是否喜欢踢足球之间有无关系无关系, ,一般需要收集男女生中喜欢和不喜欢踢足球的人数一般需要收集男女生中喜欢和不喜欢踢足球的人数, ,再再得出得出2222列联表列联表, ,最后代入随机变量的观测值公式最后代入随机变量的观测值公式, ,得出结果得出结果

9、. .答案答案: :男女生中喜欢和不喜欢踢足球的人数男女生中喜欢和不喜欢踢足球的人数(2)(2)因为因为7.86.635,7.86.635,所以这个结论有所以这个结论有0.01=1%0.01=1%的机会说错的机会说错, ,在犯在犯错误的概率不超过错误的概率不超过1%1%的前提下认为的前提下认为“爱好该项运动与性别有关爱好该项运动与性别有关”.”.答案答案: :1%1%(3)(3)因为概率因为概率P(KP(K2 26.635)0.01,6.635)0.01,所以两个变量有关系的可信所以两个变量有关系的可信度是度是1-0.01=99%,1-0.01=99%,即两个变量有关系的概率是即两个变量有关系

10、的概率是99%.99%.答案答案: :有关系有关系【要点探究】【要点探究】知知识点点1 1 分分类变量与列量与列联表表1.1.对分分类变量的三点量的三点说明明(1)(1)分分类变量的取量的取值一定是离散的一定是离散的, ,而且不同的取而且不同的取值仅表示个体表示个体所属的所属的类别, ,如性如性别变量量, ,只取男、女两个只取男、女两个值, ,商品的等商品的等级变量量只取一只取一级、二、二级、三、三级等等. .(2)(2)分分类变量的取量的取值有有时可用数字来表示可用数字来表示, ,但但这时的数字除了分的数字除了分类以外没有其他的含以外没有其他的含义. .如用如用“0”“0”表示表示“男男”,

11、”,用用“1”“1”表示表示“女女”.”.(3)(3)分分类变量存在的广泛性量存在的广泛性: :在在现实生活中生活中, ,分分类变量是大量存量是大量存在的在的, ,如吸烟如吸烟变量、国籍量、国籍变量等量等. .2.222.22列列联表表在在2222列列联表中表中, ,如果两个分如果两个分类变量没有关系量没有关系, ,则应满足足ad-ad-bc0,bc0,因此因此|ad-bc|ad-bc|越小越小, ,关系越弱关系越弱;|ad-bc|;|ad-bc|越大越大, ,关系越关系越强强. .【微思考】【微思考】在交通事故中在交通事故中, ,司机的血液中是否含有酒精和是否有事故司机的血液中是否含有酒精和

12、是否有事故责任任是分是分类变量量吗? ?提示提示: :是是. .是否含有酒精是否含有酒精, ,其取值为含有酒精和不含有酒精其取值为含有酒精和不含有酒精; ;是否是否有责任有责任, ,其取值为有责任和无责任其取值为有责任和无责任. .【即时练】【即时练】考察黄烟考察黄烟经过培养液培养液处理与是否理与是否发生青花病的关系生青花病的关系. .调查了了457457株黄烟株黄烟, ,得到表格中数据得到表格中数据, ,请根据数据分析根据数据分析: :黄烟是否黄烟是否经过培养培养液液处理与理与发生青花病有无关系生青花病有无关系. .培养液培养液处理理未未处理理总计青花病青花病2525210210235235

13、无青花病无青花病8080142142222222总计105105352352457457由列由列联表可粗略地看出表可粗略地看出(1)(1)有青花病的黄烟有有青花病的黄烟有株未株未处理理. .(2)(2)无青花病的黄烟有无青花病的黄烟有株未株未处理理. .由此得出由此得出结论 . .【解析】【解析】(1)210(1)210(2)142,(2)142,因为因为 , ,故黄烟是否经过培养故黄烟是否经过培养液处理与发生青花病有关系液处理与发生青花病有关系. .答案答案: :(1)210(1)210(2)142(2)142黄烟是否经过培养液处理与发生青花黄烟是否经过培养液处理与发生青花病有关系病有关系知

14、知识点点2 2 独立性独立性检验的基本思想的基本思想1.1.在在实际问题中常用的几个数中常用的几个数值(1)k6.635(1)k6.635表示表示认为“X“X与与Y Y有关系有关系”犯犯错误的概率不超的概率不超过0.01.0.01.(2)k3.841(2)k3.841表示表示认为“X“X与与Y Y有关系有关系”犯犯错误的概率不超的概率不超过0.05.0.05.(3)k2.706(3)k2.706表示表示认为“X“X与与Y Y有关系有关系”犯犯错误的概率不超的概率不超过0.1.0.1.2.2.独立性检验的基本思想与反证法的思想的相似之处独立性检验的基本思想与反证法的思想的相似之处反反证法法假假设

15、检验要要证明明结论A A要确要确认“两个分两个分类变量有关系量有关系”在在A A不成立的前提不成立的前提下下进行推理行推理假假设该结论不成立不成立, ,即假即假设结论“两个分两个分类变量没有关系量没有关系”成立成立, ,在在该假假设下下计算算K K2 2推出矛盾推出矛盾, ,意味着意味着结论A A成立成立由由观测数据数据计算得到的算得到的K K2 2的的观测值k k很大很大, ,则在一定可信程度上在一定可信程度上说明假明假设不合理不合理没有找到矛盾没有找到矛盾, ,不不能能对A A下任何下任何结论, ,即反即反证法不成功法不成功根据随机根据随机变量量K K2 2的含的含义, ,可以通可以通过概

16、率概率P(KP(K2 2kk0 0) )的大小来的大小来评价价该假假设不合理的程不合理的程度有多大度有多大, ,从而得出从而得出“两个分两个分类变量有关系量有关系”这一一结论成立的可信程度有多大成立的可信程度有多大【微思考】【微思考】(1)(1)独立性独立性检验的必要性即的必要性即为什么不能只凭列什么不能只凭列联表的数据和表的数据和图形下形下结论? ?提示提示: :列联表中的数据是样本数据列联表中的数据是样本数据, ,它只是总体的代表它只是总体的代表, ,具有随具有随机性机性, ,故需要用列联表检验的方法确认所得结论在多大程度上故需要用列联表检验的方法确认所得结论在多大程度上适用于总体适用于总

17、体. .(2)(2)在在K K2 2运算运算时, ,在判断在判断变量相关量相关时, ,若若K K2 2的的观测值k=56.632,k=56.632,则P P(K(K2 26.635)0.016.635)0.01和和P(KP(K2 210.828)0.001,10.828)0.001,哪种哪种说法是正确法是正确的的? ?提示提示: :两种说法均正确两种说法均正确. P(K. P(K2 26.635)0.016.635)0.01的含义是在犯错误的含义是在犯错误的概率不超过的概率不超过0.010.01的前提下的前提下, ,认为两变量相关认为两变量相关; ;而而P(KP(K2 210.828)0.00

18、110.828)0.001的含义是在犯错误的概率不超过的含义是在犯错误的概率不超过0.0010.001的的前提下前提下, ,认为两变量相关认为两变量相关. .【即时练】【即时练】(2014(2014珠海高二珠海高二检测) )某班主任某班主任对全班全班5050名学生名学生进行了作行了作业量量多少的多少的调查, ,数据如下表数据如下表: :认为作作业多多认为作作业不多不多总计喜喜欢玩玩电脑游游戏18189 92727不喜不喜欢玩玩电脑游游戏8 815152323总计262624245050根据表中数据得到根据表中数据得到k= 5.059,k= 5.059,参考下表参考下表: :则认为喜欢玩电脑游戏

19、与认为作业量多少有关系犯错误的概率则认为喜欢玩电脑游戏与认为作业量多少有关系犯错误的概率大约为大约为( () )A.0.025A.0.025B.0.05B.0.05C.0.1C.0.1D.0.01D.0.01P(KP(K2 2kk0 0) )0.0500.0500.0250.0250.0100.0100.0010.001k k0 03.8413.8415.0245.0246.6356.63510.82810.828【解析】【解析】选选A.A.因为根据表中数据得到因为根据表中数据得到k= k= 5.059,5.059,且且P(KP(K2 25.024)=0.025,5.024)=0.025,所以

20、认为喜欢玩电脑游戏与认为作业量多少有关系犯错误的概所以认为喜欢玩电脑游戏与认为作业量多少有关系犯错误的概率大约为率大约为0.025.0.025.故选故选A.A.【题型示范】型示范】类型一型一 关于关于“相关相关”的的检验【典例【典例1 1】(1)(2014(1)(2014湛江高二湛江高二检测) )利用独立性利用独立性检验来考来考虑两个分两个分类变量量X X和和Y Y是否有关系是否有关系时, ,通通过查阅表格来确定表格来确定“X“X和和Y Y有关系有关系”的的可信度可信度. .如果如果k3.841,k3.841,那么在犯那么在犯错误的概率不超的概率不超过多少的前提多少的前提下下认为“X“X和和Y

21、 Y有关系有关系”( () )A.5%A.5%B.75%B.75%C.99.5%C.99.5%D.95%D.95%P(KP(K2 2kk0 0) )0.500.500.400.400.250.250.150.150.100.100.050.050.0250.0250.0100.0100.0050.0050.0010.001k k0 00.4550.4550.7080.7081.3231.3232.0722.0722.7062.7063.8413.8415.0245.0246.6356.6357.8797.87910.82810.828(2)(2)在在对人人们的休的休闲方式的一次方式的一次调查中

22、中, ,共共调查了了124124人人, ,其中女其中女性性7070人人, ,男性男性5454人人. .女性中有女性中有4343人主要的休人主要的休闲方式是看方式是看电视, ,另另外外2727人主要的休人主要的休闲方式是运方式是运动; ;男性中有男性中有2121人主要的休人主要的休闲方式方式是看是看电视, ,另外另外3333人主要的休人主要的休闲方式是运方式是运动. .根据以上数据建立一个根据以上数据建立一个2222的列的列联表表; ;并估并估计, ,以运以运动为主的主的休休闲方式的人的比例方式的人的比例; ;能否在犯能否在犯错误的概率不超的概率不超过0.0250.025的前提下的前提下, ,认

23、为性性别与休与休闲方式有关系方式有关系? ?附表附表: :P(KP(K2 2kk0 0) )0.500.500.400.400.250.250.150.150.100.100.050.050.0250.0250.0100.0100.0050.0050.0010.001k k0 00.4550.4550.7080.7081.3231.3232.0722.0722.7062.7063.8413.8415.0245.0246.6356.6357.8797.87910.82810.828【解题探究】【解题探究】1.1.题题(1)(1)中中k3.841k3.841对应附表中的哪个数值对应附表中的哪个数值

24、? ?2.2.题题(2)(2)中中以运动为主要的休闲方式的比例为多少以运动为主要的休闲方式的比例为多少?犯错误犯错误的概率不超过的概率不超过0.0250.025对应的临界值是多少对应的临界值是多少? ?【探究提示】【探究提示】1.3.8411.3.841与与0.050.05对应对应, ,即对应表中的即对应表中的0.05.0.05.2.2.根据所给的条件中的数据写出列联表根据所给的条件中的数据写出列联表, ,得到以运动为主要得到以运动为主要的休闲方式的比例为的休闲方式的比例为1531.1531.对应的临界值为对应的临界值为5.024.5.024.【自主解答】【自主解答】(1)(1)选选A.A.因

25、为因为k3.841,k3.841,所以有所以有0.050.05的几率说明这的几率说明这两个变量之间的关系是不可信的两个变量之间的关系是不可信的, ,即有即有1-0.05=95%1-0.05=95%的把握说明的把握说明两个变量之间有关系两个变量之间有关系. .(2)(2)由所给的数据得到列联表由所给的数据得到列联表所以以运动为主要的休闲方式的人的比例为所以以运动为主要的休闲方式的人的比例为1531.1531.休闲方式休闲方式性别性别看电视看电视运动运动总计总计女女434327277070男男212133335454总计总计64646060124124假设休闲与性别无关假设休闲与性别无关, ,因为

26、因为k5.024,k5.024,所以在犯错误的概率不超过所以在犯错误的概率不超过0.0250.025的前提下认为休闲方式与性的前提下认为休闲方式与性别有关别有关. .【方法技巧】【方法技巧】两个分类变量相关关系的判断两个分类变量相关关系的判断(1)(1)等高条形图法等高条形图法: :在等高条形图中在等高条形图中, ,可以估计满足条件可以估计满足条件X=xX=x1 1的的个体中具有个体中具有Y=yY=y1 1的个体所占的比例的个体所占的比例 , ,也可以估计满足条件也可以估计满足条件X=xX=x2 2的个体中具有的个体中具有Y =yY =y1 1的个体所占的比例的个体所占的比例 . .两个比例的

27、两个比例的值相差越大值相差越大,X,X与与Y Y有关系成立的可能性就越大有关系成立的可能性就越大. .(2)(2)观测值法观测值法: :通过通过2222列联表列联表, ,先计算先计算K K2 2的观测值的观测值k,k,然后借助然后借助k k的含义判断的含义判断“两个分类变量有关系两个分类变量有关系”这一结论成立的可信程度这一结论成立的可信程度. .【变式训练】【变式训练】(2014(2014江西高考江西高考) )某人研究中学生的性别与成绩、某人研究中学生的性别与成绩、视力、智商、阅读量这视力、智商、阅读量这4 4个变量之间的关系个变量之间的关系, ,随机抽查随机抽查5252名中学名中学生生,

28、,得到统计数据如表得到统计数据如表1 1至表至表4,4,则与性别有关联的可能性最大的则与性别有关联的可能性最大的变量是变量是( () )A.A.成绩成绩 B. B.视力视力 C. C.智商智商 D. D.阅读量阅读量【解题指南】【解题指南】根据独立性检验公式分别求出相应的根据独立性检验公式分别求出相应的K K2 2, ,数据大的数据大的与性别有关联的可能性大与性别有关联的可能性大. .【解析】【解析】选选D. D. 分析判断分析判断 最大,所以选择最大,所以选择D.D.【补偿训练】为了了调查某地区老年人是否需要志愿者提供帮助某地区老年人是否需要志愿者提供帮助, ,用用简单随机抽随机抽样方法从方

29、法从该地区地区调查了了200200位老年人位老年人, ,结果如下果如下: :参照附表参照附表, ,得到的正确得到的正确结论是是( () )性性别是否需要志愿者是否需要志愿者男男女女需要需要70704040不需要不需要30306060附附: :P(KP(K2 2kk0 0) ) 0.0500.050 0.0100.0100.0010.001k k0 03.8413.841 6.6356.635 10.82810.828A A在犯错误的概率不超过在犯错误的概率不超过0.1%0.1%的前提下,认为的前提下,认为“该地区的老该地区的老年人是否需要志愿者提供帮助与性别有关年人是否需要志愿者提供帮助与性别

30、有关”B B在犯错误的概率不超过在犯错误的概率不超过0.1%0.1%的前提下,认为的前提下,认为“该地区的老该地区的老年人是否需要志愿者提供帮助与性别无关年人是否需要志愿者提供帮助与性别无关”C C在犯错误的概率不超过在犯错误的概率不超过0.010.01的前提下,认为的前提下,认为“该地区的老该地区的老年人是否需要志愿者提供帮助与性别有关年人是否需要志愿者提供帮助与性别有关”D D在犯错误的概率不超过在犯错误的概率不超过0.010.01的前提下,认为的前提下,认为“该地区的老该地区的老年人是否需要志愿者提供帮助与性别无关年人是否需要志愿者提供帮助与性别无关”【解析】【解析】选选A.A.由题意,

31、由题意, 18.18 18.18因为因为18.1818.1810.82810.828,所以有所以有0.001=0.1%0.001=0.1%的机会错误,的机会错误,即在犯错误的概率不超过即在犯错误的概率不超过0.1%0.1%的前提下认为的前提下认为“该地区的老年该地区的老年人是否需要志愿者提供帮助与性别有关人是否需要志愿者提供帮助与性别有关”,故选,故选A.A.类型二型二 关于关于“无关无关”的的检验【典例【典例2 2】(1)(1)为了研究性格和血型的关系了研究性格和血型的关系, ,抽抽查8080人做人做实验, ,血型和性格血型和性格情况如下表情况如下表: :则在犯在犯错误的概率不超的概率不超过

32、多少的前提下多少的前提下认为性格性格与血型有关系与血型有关系( () )A.0.001 B.0.01 C.0.05 A.0.001 B.0.01 C.0.05 D. D.没有充分的没有充分的证据据显示有关示有关O O型或型或A A型型B B型或型或ABAB型型总计内向型内向型181812123030外向型外向型222228285050总计404040408080(2)(2)为了探究学生了探究学生选报文、理科是否与文、理科是否与对外外语的的兴趣有关趣有关, ,某同某同学学调查了了361361名高二在校学生名高二在校学生, ,调查结果如下果如下: :理科理科对外外语有有兴趣的有趣的有138138人

33、人, ,无无兴趣的有趣的有9898人人, ,文科文科对外外语有有兴趣的有趣的有7373人人, ,无无兴趣的有趣的有5252人人. .能否在犯能否在犯错误的概率不超的概率不超过0.10.1的前提下的前提下, ,认为“学生学生选报文、理科与文、理科与对外外语的的兴趣有关趣有关”?”?【解题探究】【解题探究】1.1.计算计算K K2 2的观测值的观测值k,k,再与哪个值进行比较再与哪个值进行比较? ?2.“2.“犯错误的概率不超过犯错误的概率不超过0.1”0.1”对应的临界值是多少对应的临界值是多少? ?【探究提示】【探究提示】1.1.利用表中数据利用表中数据, ,结合公式结合公式, ,计算计算K

34、K2 2的观测值的观测值k,k,再再与临界值比较与临界值比较, ,即可作出判断即可作出判断. .2.“2.“犯错误的概率不超过犯错误的概率不超过0.1”0.1”对应的临界值是对应的临界值是2.706.2.706.【自主解答】【自主解答】(1)(1)选选D.D.由题意由题意, ,利用公式可得利用公式可得k=k=1.922.706,=1.922.706,所以我们没有充分的证据显示性格与血型有关系所以我们没有充分的证据显示性格与血型有关系, ,故选故选D.D.(2)(2)根据题目所给的数据得到如下列联表根据题目所给的数据得到如下列联表: :理科理科文科文科总计总计有兴趣有兴趣138138737321

35、1211无兴趣无兴趣98985252150150总计总计236236125125361361根据列联表中数据由公式计算得根据列联表中数据由公式计算得k= 1.87110k= 1.87110-4-4. .因为因为1.871101.87110-4-42.706,2.706,所以所以, ,在犯错误的概率不超过在犯错误的概率不超过0.10.1的前提下的前提下, ,不能认为不能认为“学生选学生选报文、理科与对外语的兴趣有关报文、理科与对外语的兴趣有关”.”.【方法技巧】【方法技巧】有关有关“无关无关”的检验方法的检验方法“无关无关”的检验方法与的检验方法与“有关有关”的检验方法相同的检验方法相同, ,也

36、可以利用也可以利用“等高条形图等高条形图”和和“观测值观测值k”,k”,只是选取的判断点不一样罢了只是选取的判断点不一样罢了. .【变式式训练】为考察喜考察喜欢黑色的人是否易患抑郁症黑色的人是否易患抑郁症, ,对9191名大名大学生学生进行行调查, ,得到如下得到如下2222列列联表表: :患抑郁症患抑郁症未患抑郁症未患抑郁症总计喜喜欢黑色黑色151532324747不喜不喜欢黑色黑色141430304444总计292962629191附表附表: :则在犯在犯错误的概率的概率为多少的前提下多少的前提下认为喜喜欢黑色与患抑郁症有黑色与患抑郁症有关系关系( () )A.0.01 B.0.05A.0

37、.01 B.0.05C.0.1 D.C.0.1 D.不能判断不能判断P(KP(K2 2kk0 0) )0.10.10.0500.0500.0100.0100.0010.001k k0 02.7062.7063.8413.8416.6356.63510.82810.828【解析】【解析】选选D.D.由于当观测值小于由于当观测值小于2.7062.706时时, ,认为没有充分证据显认为没有充分证据显示两变量有关系示两变量有关系, ,而而0.00009790.0000979远远小于远远小于2.706,2.706,所以不能认为喜所以不能认为喜欢黑色与患抑郁症有关系欢黑色与患抑郁症有关系. .【补偿训练】

38、考察棉花种子考察棉花种子经过处理跟生病之理跟生病之间的关系得到如的关系得到如表数据表数据: :种子种子处理理种子未种子未处理理总计得病得病3232101101133133不得病不得病6161213213274274总计9393314314407407根据以上数据根据以上数据, ,则( () )A.A.种子种子经过处理跟是否生病有关理跟是否生病有关B.B.种子种子经过处理跟是否生病无关理跟是否生病无关C.C.种子是否种子是否经过处理决定是否生病理决定是否生病D.D.以上都是以上都是错误的的【解析】【解析】选选B.B.由公式计算得由公式计算得,k= ,k= 0.16412.706.0.16412.

39、706,103.372.706,此时两个分类变量此时两个分类变量A A和和B B有关系有关系; ;当当a=720a=720时时,k= =0,k= =0,由由k2.706k2.706知此时没有充分证据显示两个分类变量知此时没有充分证据显示两个分类变量A A和和B B有关有关系系, ,则则a a的可能值是的可能值是720.720.(2)(2)由题意知本题是一个等可能事件的概率由题意知本题是一个等可能事件的概率, ,试验发生包含的事件是从不低于试验发生包含的事件是从不低于8686分的成绩中随机抽取两个包分的成绩中随机抽取两个包含的基本事件是含的基本事件是(86,93),(86,96),(86,97)

40、,(86,99),(86,99),(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),99),(97,99),(97,99),(99,99),共有共有1515种结果种结果, ,符合条件的事件数符合条件的事件数(93,96),(93,97),(93,99),(93,99),(96,(93,96),(93,97

41、),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),97),(96,99),(96,99),(97,99),(97,99),(99,99),共有共有1010种种结果结果, ,根据等可能事件的概率得到根据等可能事件的概率得到P= .P= .由已知数据得由已知数据得根据列联表中的数据根据列联表中的数据, ,k= =3.137,k= =3.137,由于由于3.1372.706,3.1372.706,所以在犯错误的概率不超过所以在犯错误的概率不超过0.10.1的前提下认的前提下认为为:“:“成绩优秀成绩优秀”与教学方式有关

42、与教学方式有关. .甲班甲班乙班乙班总计总计成绩优秀成绩优秀1 15 56 6成绩不优秀成绩不优秀191915153434总计总计202020204040【方法技巧】【方法技巧】解独立性检验问题的基本步骤解独立性检验问题的基本步骤(1)(1)认真读题认真读题, ,指出相关数据指出相关数据, ,得出得出2222列联表列联表. .(2)(2)根据根据2222列联表中的数据列联表中的数据, ,计算计算K K2 2的观测值的观测值k.k.(3)(3)观测值观测值k k与临界值与临界值k k0 0进行比较进行比较. .(4)(4)在犯错误的概率不超过在犯错误的概率不超过的前提下能否推断的前提下能否推断“

43、X“X与与Y Y有关系有关系”.”.【变式式训练】为调查某市学生百米运某市学生百米运动成成绩, ,从从该市学生中按市学生中按照男女生比例随机抽取照男女生比例随机抽取5050名学生名学生进行百米行百米测试, ,学生成学生成绩全部全部都介于都介于1313秒到秒到1818秒之秒之间, ,将将测试结果按如下方式分成五果按如下方式分成五组, ,第一第一组13,14),13,14),第二第二组14,15)14,15)第五第五组17,18,17,18,如如图是按上述分是按上述分组方法得到的方法得到的频率分布直方率分布直方图. .(1)(1)设m,nm,n表示表示样本中两个学生的百米本中两个学生的百米测试成成

44、绩, ,已知已知m,nm,n13,14)17,18,13,14)17,18,求事件求事件“|m-n|2”“|m-n|2”的概率的概率. .(2)(2)根据有关根据有关规定定, ,成成绩小于小于1616秒秒为达达标. .如果男女生使用相同的达如果男女生使用相同的达标标准准, ,则男女生达男女生达标情况如表情况如表: :性性别是否达是否达标男男女女总计达达标a=24a=24b=6b=63030不达不达标c=8c=8d=12d=122020总计32321818n=50n=50根据上表数据根据上表数据, ,在犯在犯错误的概率不超的概率不超过0.010.01的前提下的前提下认为“体体育达育达标与性与性别

45、有关有关”?”?若有若有, ,你能否提出一个更好的解决方法来你能否提出一个更好的解决方法来? ?附附:K:K2 2= =P(KP(K2 2kk0 0) )0.0500.0500.0100.0100.0010.001k k0 03.8413.8416.6256.62510.82810.828【解题指南】【解题指南】(1)(1)成绩在成绩在13,14)13,14)的人数有的人数有2 2人人, ,设为设为a,b.a,b.成绩在成绩在17,1817,18的人数有的人数有3 3人人, ,设为设为A,B,C;A,B,C;基本事件总数为基本事件总数为10,10,事件事件“|m-n|2”“|m-n|2”由由6

46、 6个基本事件组成个基本事件组成. .根据古典概型公式可求出所根据古典概型公式可求出所求求. .(2)(2)根据列联表所给的数据根据列联表所给的数据, ,代入随机变量的观测值公式代入随机变量的观测值公式, ,得到得到观测值的结果观测值的结果, ,把观测值的结果与临界值进行比较把观测值的结果与临界值进行比较, ,即可求得即可求得. .【解析】【解析】(1)(1)成绩在成绩在13,14)13,14)的人数有的人数有:500.04=2:500.04=2人人, ,设为设为a,a,b.b.成绩在成绩在17,1817,18的人数有的人数有:500.06=3:500.06=3人人, ,设为设为A,B,C.m

47、,nA,B,C.m,n13,14)13,14)时有时有abab一种情况一种情况.m,n17,18.m,n17,18时有时有AB,AC,BCAB,AC,BC三种情三种情况况. .m,nm,n分别在分别在13,14)13,14)和和17,1817,18时有时有aA,aB,aC,bA,bB,bCaA,aB,aC,bA,bB,bC六种情六种情况况. .基本事件总数为基本事件总数为10,10,事件事件“|m-n|2”“|m-n|2”由由6 6个基本事件组成个基本事件组成. .所所以以P(|m-n|2)=P(|m-n|2)=(2)(2)依据题意得依据题意得k= 8.3336.625,k= 8.3336.6

48、25,故在犯错误的概率不超过故在犯错误的概率不超过0.010.01的前提下认为的前提下认为“体育达标与性别体育达标与性别有关有关”.”.故可以根据男女生性别划分达标的标准故可以根据男女生性别划分达标的标准. .【补偿训练】某中学某中学对高二甲、乙两个同高二甲、乙两个同类班班级进行行“加加强强语文文阅读理解理解训练对提高提高数学数学应用用题得分率作用得分率作用”的的试验, ,其中甲班其中甲班为试验班班( (加加强强语文文阅读理解理解训练),),乙班乙班为对比比班班( (常常规教学教学, ,无无额外外训练),),在在试验前的前的测试中中, ,甲、乙两班学甲、乙两班学生在数学生在数学应用用题上的得分

49、率基本一致上的得分率基本一致, ,试验结束后束后, ,统计几次数几次数学学应用用题测试的平均成的平均成绩( (均取整数均取整数) )如下表所示如下表所示: :6060分以下分以下 61617070分分 71718080分分 81819090分分 9191100100分分甲班甲班( (人数人数) )3 36 6111118181212乙班乙班( (人数人数) )4 48 8131315151010现规定平均成定平均成绩在在8080分以上分以上( (不含不含8080分分) )的的为优秀秀. .(1)(1)试分分别估估计两个班两个班级的的优秀率秀率. .(2)(2)由以上由以上统计数据填写下面数据填

50、写下面2222列列联表表, ,并并问是否有是否有75%75%的把的把握握认为“加加强强语文文阅读理解理解训练对提高提高数学数学应用用题得得分率分率”有帮助有帮助. .优秀人数秀人数非非优秀人数秀人数总计甲班甲班乙班乙班总计【解析】【解析】(1)(1)由题意由题意, ,甲、乙两班均有学生甲、乙两班均有学生5050人人, ,甲班优秀人数为甲班优秀人数为3030人人, ,优秀率为优秀率为 =60%, =60%,乙班优秀人数为乙班优秀人数为2525人人, ,优秀率为优秀率为 =50%, =50%,所以甲、乙两班的优秀率分别为所以甲、乙两班的优秀率分别为60%60%和和50%.50%.(2)(2)根据题

51、意得出列联表根据题意得出列联表因为因为k= 1.010,k= 1.010,所以在样本数据中没有足够证据认为所以在样本数据中没有足够证据认为“加强加强语文阅读理解语文阅读理解训练对提高训练对提高数学应用题数学应用题得分率得分率”有帮助有帮助. .优秀人数优秀人数非优秀人数非优秀人数总计总计甲班甲班303020205050乙班乙班252525255050总计总计55554545100100【易错误区】【易错误区】因不理解独立性检验的含义致误因不理解独立性检验的含义致误【典例】【典例】某医某医疗研究所研究所为了了检验某种血清某种血清预防感冒的作用防感冒的作用, ,把把500500名使用血清的人与另外

52、名使用血清的人与另外500500名未使用血清的人一年中的感冒名未使用血清的人一年中的感冒记录进行比行比较, ,提出假提出假设H:“H:“这种血清不能起到种血清不能起到预防感冒的作防感冒的作用用”,”,利用利用2222列列联表表计算得算得k3.918,k3.918,经查临界界值表知表知P(KP(K2 23.841)0.05.3.841)0.05.则下列表述中正确的是下列表述中正确的是( () )A.A.在犯在犯错误的概率不超的概率不超过0.050.05的前提下的前提下认为“这种血清能起到种血清能起到预防感冒的作用防感冒的作用”B.B.若有人未使用若有人未使用该血清血清, ,那么他一年中有那么他一

53、年中有95%95%的可能性得感冒的可能性得感冒C.C.这种血清种血清预防感冒的有效率防感冒的有效率为95%95%D.D.这种血清种血清预防感冒的有效率防感冒的有效率为5%5%【解析】【解析】选选A.A.由题意可知根据由题意可知根据k3.9183.841,k3.9183.841,又又P(KP(K2 23.841)0.05,3.841)0.05,因此说明了在犯错误的概率不超过因此说明了在犯错误的概率不超过0.050.05的前提的前提下认为下认为“这种血清能起到预防感冒的作用这种血清能起到预防感冒的作用”,B,C,D”,B,C,D表达有误表达有误. .【常见误区】【常见误区】错解错解错因剖析错因剖析

54、选选B B或或C C或或D D搞不清搞不清P(KP(K2 23.841)0.053.841)0.05的含义的含义, ,从而错选从而错选B B或或C C或或D D【防范措施】【防范措施】强化对概念或原理的理解强化对概念或原理的理解要确认要确认“两个分类变量有关系两个分类变量有关系”这一结论成立的可信程度这一结论成立的可信程度, ,首首先假设该结论不成立先假设该结论不成立, ,即假设结论即假设结论“两个分类变量没有关系两个分类变量没有关系”成立成立. .在该假设下我们构造的随机变量在该假设下我们构造的随机变量K K2 2应该很小应该很小, ,如果由观测如果由观测数据计算得到的数据计算得到的K K2

55、 2的观测值很大的观测值很大, ,则在一定程度上说明假设不合则在一定程度上说明假设不合理理. .例如例如, ,本例的求解主要涉及独立性检验的思想本例的求解主要涉及独立性检验的思想, ,即对即对“P(K“P(K2 23.841)0.05”3.841)0.05”的含义理解是解题的关键的含义理解是解题的关键. .【类题试解】解】在吸烟与患肺病在吸烟与患肺病这两个分两个分类变量的量的计算中算中,“,“若若K K2 2的的观测值为6.635,6.635,我我们在犯在犯错误的概率不超的概率不超过0.010.01的前提下的前提下认为吸烟与患肺病有关系吸烟与患肺病有关系”这句句话的意思是指的意思是指( ()

56、)A.A.在在100100个吸烟的人中个吸烟的人中, ,必有必有9999个人患肺病个人患肺病B.B.有有0.010.01的可能性的可能性认为推理出推理出现错误C.C.若某人吸烟若某人吸烟, ,则他有他有0.990.99的可能性患有肺病的可能性患有肺病D.D.若某人患肺病若某人患肺病, ,则0.990.99的原因是因的原因是因为吸烟吸烟【解析】【解析】选选B.B.若若K K2 2的观测值为的观测值为6.635,6.635,我们有我们有99%99%的把握认为吸烟的把握认为吸烟与患肺病有关系与患肺病有关系, ,这一句话的意思是有这一句话的意思是有99%99%的把握认为这个推理的把握认为这个推理是正确的是正确的, ,有有1%1%的可能性认为推理出现错误的可能性认为推理出现错误. .

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题 > 高中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号