高中数学人教A版选修2-3学案:3.2 独立性检验的基本思想及其初步应用 Word版含解析

上传人:tang****xu4 文档编号:126181835 上传时间:2020-03-23 格式:DOC 页数:14 大小:1.05MB
返回 下载 相关 举报
高中数学人教A版选修2-3学案:3.2 独立性检验的基本思想及其初步应用 Word版含解析_第1页
第1页 / 共14页
高中数学人教A版选修2-3学案:3.2 独立性检验的基本思想及其初步应用 Word版含解析_第2页
第2页 / 共14页
高中数学人教A版选修2-3学案:3.2 独立性检验的基本思想及其初步应用 Word版含解析_第3页
第3页 / 共14页
高中数学人教A版选修2-3学案:3.2 独立性检验的基本思想及其初步应用 Word版含解析_第4页
第4页 / 共14页
高中数学人教A版选修2-3学案:3.2 独立性检验的基本思想及其初步应用 Word版含解析_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《高中数学人教A版选修2-3学案:3.2 独立性检验的基本思想及其初步应用 Word版含解析》由会员分享,可在线阅读,更多相关《高中数学人教A版选修2-3学案:3.2 独立性检验的基本思想及其初步应用 Word版含解析(14页珍藏版)》请在金锄头文库上搜索。

1、32独立性检验的基本思想及其初步应用1.了解分类变量的意义2.了解22列联表的意义3.了解随机变量K2的意义4通过对典型案例分析,了解独立性检验的基本思想和方法,1分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的频数表称为列联表22列联表一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(也称为22列联表)为下表y1y2总计x1ababx2cdcd总计acbdabcd(1)列联表是两个或两个以上分类变量的汇总统计表,现阶段我们仅限于研究两个分类变量的列联表,并且每个分类变

2、量只取两个值,这样的列联表称为22列联表(2)列联表有助于直观地观测数据之间的关系2等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征(2)观察等高条形图发现和相差很大,就判断两个分类变量之间有关系3独立性检验(1)定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验(2)K2,其中nabcd为样本容量(3)独立性检验的具体做法根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.利用公式计算随机变量K2的观测值k.如果kk0,就推断“X与Y有关系”,这种推断犯错误的概

3、率不超过,否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”独立性检验的基本思想与反证法的思想的相似之处反证法独立性检验要证明结论A要确认“两个分类变量有关系”在A不成立的前提下进行推理假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下计算K2判断正误(正确的打“”,错误的打“”)(1)列联表中的数据是两个分类变量的频数()(2)对事件A与B的独立性检验无关,即两个事件互不影响()(3)K2的大小是判断事件A与B是否相关的统计量()答案:(1)(2)(3)某校为了检验高中数学新课程改革的成果,在两个班进行

4、教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如22列联表所示(单位:人),则其中m_,n_80分及80分以上80分以下总计试验班321850对照班24m50总计5644n答案:26100若两个分类变量X和Y的22列联表为:y1y2x1515x24010则X与Y之间有关系的可信度为_解析:K2的观测值k18.810.828.故有99.9%的把握认为X与Y有关系答案:99.9%探究点1等高条形图的应用为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列

5、联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?【解】等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系(1)判断两个分类变量是否有关系的两种常用方法利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大(2)利用等高条形图判断两个分类变量是否相关的步骤研究人员选取170名青年男女大学生,对他们进行

6、一种心理测验发现60名女生对该心理测验中的最后一个题目的反应是:作肯定的有18名,否定的有42名.110名男生在相同的题目上作肯定的有22名,否定的有88名试判断性别与态度之间是否有关系解:根据题目所给数据建立如下列联表:肯定否定总计女生184260男生2288110总计40130170相应的等高条形图如图所示比较来看,女生中肯定的人数比要高于男生中肯定的人数比,因此可以在某种程度上认为性别与态度之间有关探究点2独立性检验某新闻媒体为了了解观众对央视开门大吉节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:女男总计喜爱402060不喜爱203050总计60501

7、10试根据样本估计总体的思想,估计约有多大的把握认为“喜爱该节目与否和性别有关”,并说明理由参考附表:P(K2k)0.0500.0100.001k3.8416.63510.828(参考公式:K2,其中nabcd)【解】假设喜爱开门大吉节目与否和性别无关K2的观测值k7.86.635,P(K26.635)0.01,所以有99%以上的把握认为“喜爱开门大吉节目与否和性别有关”解决独立性检验问题的基本步骤(1)根据已知的数据作出列联表(2)作出相应的等高条形图,可以利用图形做出相应判断(3)求K2的观测值(4)判断可能性:与临界值比较,得出事件有关的可能性大小为了研究学生选报文、理科是否与对外语的兴

8、趣有关,某同学调查了361名高一在校生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人试分析学生选报文、理科与对外语的兴趣是否有关?解:问题是判断学生选报文、理科是否与对外语的兴趣有关列出22列联表如下:理文总计有兴趣13873211无兴趣9852150总计236125361由公式得K2的观测值k1.871104.因为1.8711042.706,故可以认为学生选报文、理科与对外语的兴趣无关探究点3独立性检验的综合应用(2017高考全国卷节选)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱

9、水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量50kg旧养殖法新养殖法附:P(K2k)0.0500.0100.001k3.8416.63510.828K2.【解】(1)记B表示事件“旧养殖法的箱产量低于50kg”,C表示事件“新养殖法的箱产量不低于50kg”由题意知P(A)P(BC)P(B)P(C)旧养殖法的箱产量低于50kg的频率为(0.0120.0140.

10、0240.0340.040)50.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50kg的频率为(0.0680.0460.0100.008)50.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.620.660.4092.(2)根据箱产量的频率分布直方图得列联表箱产量6.635,故有99%的把握认为箱产量与养殖方法有关两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例,也可以估计满足条件Xx2的个体中具有Yy1的个体所占的比例.两个比例的值相差越大,X与Y有关系成立的可能性就越大(2)观测值法:通过

11、22列联表,先计算K2的观测值k,然后借助k的含义判断“两个分类变量有关系”这一结论成立的可信程度某市教育局邀请教育专家深入该市多所中小学,开展听课、访谈及随堂检测等活动,他们把收集到的180节课分为三类课堂教学模式,教师主讲的为A模式,少数学生参与的为B模式,多数学生参与的为C模式,A,B,C三类课的节数比例为321.(1)为便于研究分析,教育专家将A模式称为传统课堂模式,B,C统称为新课堂模式,根据随堂检测结果,把课堂教学效率分为高效和非高效,根据检测结果统计得到如下22列联表(单位:节)高效非高效总计新课堂模式603090传统课堂模式405090总计10080180请根据统计数据回答:能

12、否在犯错误的概率不超过0.01的前提下认为课堂教学效率与教学模式有关?并说明理由(2)教育专家采用分层抽样的方法从收集到的180节课中选出12节课作为样本进行研究,并从样本中的B模式和C模式课堂中随机抽取2节课,求至少有一节课为C模式课堂的概率参考临界值有:P(K2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828参考公式:K2,其中nabcd.解:(1)由列联表中的统计数据计算随机变量K2的观测值k96.635,由临界值表P(K26.635)0.010,所以在犯错误的概率不超过0.01的前提下可以认为课堂效率与教学

13、模式有关(2)样本中的B模式课堂和C模式课堂分别是4节和2节从中任取两节有C15种取法,其中至少有一节课为C模式课堂取法有CC9种,所以至少有一节课为C模式课堂的概率为.1对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()Ak越大,“X与Y有关系”的可信程度越小Bk越小,“X与Y有关系”的可信程度越小Ck越接近于0,“X与Y没有关系”的可信程度越小Dk越大,“X与Y没有关系”的可信程度越大解析:选B.k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大;k越小,“X与Y有关系”的可信程度越小2下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A性别与喜欢理科无关B女生中喜欢理科的比为80%C男生比女生喜欢理科的可能性大些D男生不喜欢理科的比为60%解析:选C.由图知女生中喜欢理科的比为20%,男生不喜欢理科的比为40%,故B、D不正确由图知,男生比女生喜欢理科的可能性大些3高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”下表是一次针对高三文科学生的调查所得的数据总成绩好总成绩不好总计

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号