新教材2021-2022学年人教A版选择性必修第三册 - 分类变量与列联表 独立性检验 学案.docx

上传人:新** 文档编号:499450679 上传时间:2023-11-16 格式:DOCX 页数:11 大小:74.07KB
返回 下载 相关 举报
新教材2021-2022学年人教A版选择性必修第三册 - 分类变量与列联表 独立性检验 学案.docx_第1页
第1页 / 共11页
新教材2021-2022学年人教A版选择性必修第三册 - 分类变量与列联表 独立性检验 学案.docx_第2页
第2页 / 共11页
新教材2021-2022学年人教A版选择性必修第三册 - 分类变量与列联表 独立性检验 学案.docx_第3页
第3页 / 共11页
新教材2021-2022学年人教A版选择性必修第三册 - 分类变量与列联表 独立性检验 学案.docx_第4页
第4页 / 共11页
新教材2021-2022学年人教A版选择性必修第三册 - 分类变量与列联表 独立性检验 学案.docx_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《新教材2021-2022学年人教A版选择性必修第三册 - 分类变量与列联表 独立性检验 学案.docx》由会员分享,可在线阅读,更多相关《新教材2021-2022学年人教A版选择性必修第三册 - 分类变量与列联表 独立性检验 学案.docx(11页珍藏版)》请在金锄头文库上搜索。

1、8.3列联表与独立性检验8.3.1分类变量与列联表8.3.2独立性检验新课程标准解读核心素养1.通过实例,理解2X2列联表的统计意义数学建模2.通过实例,了解2X2列联表独立性检验及其应用数据分析虹情境导入吸烟已成为全球范围内严重危害健康、危害人类生存环境、降低人们的生活水平、缩短人类寿命的紧迫问题.为此,联合国将每年5月31日定为全球戒烟日.问题你知道是如何判定吸烟有害健康的吗?迢新知初探知识点一分类变量与列联表1. 分类变量用以区别不同的现象或性质的一种特殊的随机变量,称为分类变量.分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等.

2、本节我们主要讨论取值于0,1的分类变量的关联性问题.2. 2X2列联表在实践中,由于保存原始数据的成本太高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将下表这种形式的数据统计表称为2X2列联表.XY合计Y=r=ox=oaba+bx=cdc+d合计a+cb+d3. 等高堆积条形图将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高堆积条形图.等高堆积条形图可以展示列联表数据的频率特征,能够直观地反映出两个分类变量间是否相互影响.。做一做1. (多选)给出下列实际问题,其中用独立性检验可以解决的问题有()A. 两种药物治疗同一种病是否

3、有区别B. 吸烟者得肺病的概率C. 吸烟是否与性别有关系D. 网吧与青少年的犯罪是否有关系解析:选ACD独立性检验是判断两个分类变量是否有关系的方法,而B是概率问题,故选A、C、D.2. 下面是一个2X2列联表:XY合计r=oY=x=oa2173x=22527合计b46则表中mb处的值分别为()A. 94,96B.52,50D.54,52=52,b=54.C.52,54解析:选C。+21=73,由,。+2=,3. (2021-长沙月考)观察如图的等高条形图,其中最有把握认为两个分类变量x,y之间有关系的是(AA1ri%cx2rir?D解析:选解析:选D在等高条形图中,XI,x2所占比例相差越大

4、,分类变量x,y有关系的把握越大.知识点二独立性检验1. 分类变量X和K独立如果X=0与件0独立;X=0与V=l独立;%=!与V=0独立;X=l与仃=1独立.我们就称分类变量X与丫独立.2. 独立性检验(1)小概率值a的临界值:对于-任何小概率值s可以找到相应的正实数乩,使得下面的关系成立:P(/m&)=a.我们称&为。的临界值,这个临界值可作为判断z2大小的标准.概率值a越小,临界值为越大;(2#的计算公式:f+硕*斜3. 小概率值的检验规则当时,推断不成立,即认为X和V不独立,该推断犯错误的概率不超过a;当时,没有充分证据推断Ho不成立,可以认为X和丫独立.利用的取值推断分类变量X和V是否

5、独立的方法称为/独立性检验,读作“卡方独立性检验”,简称独立性检验.4. 尸独立性检验中几个常用的小概率值和相应的临界值.0.10.050.01().0050.001Xa2.7063.8416.6357.87910.828i点一点独立性检验的基本思想与反证法的思想的相似之处0想一想反证法独立性检验要证明结论人要确认“两个分类变量有关系在A不成立的前提下进行推理假设该结论不成立,即假设结论“两个分类变量没有关系成立,在该假设下计算尸如何对独立性检验的基本思想进行理解?提示:独立性检验的基本思想是经过选取统计量按照计算公式/2=(卬)(:*%溯+,/)当】较大时,说明两变量人,有关联(不独立*越大

6、,A关联性就越强,当,小于一个临界值时,A与3两变量基本相互独立,即没有关联性.因此用z2作为判断变量人与B是否具有关联性的统计量.。做一做1. 对于独立性检验,下列说法正确的是()A. 独立性检验的统计假设是各事件之间相互独立B. 结果可以为负值C. 独立性检验显示“患慢性气管炎和吸烟习惯有关”,这就是指“有吸烟习惯的人必定会患慢性气管炎”D. 2X2列联表中的4个数据可以是任意正数解析:选A由独立性检验的检验步骤可知A正确:V2X2列联表中的数据均为正整数,故结果不可能为员值,故排除B;.独立性检验显示“患慢性气管炎和吸烟习惯有关”,是指有一定的把握说他们相关,或者说有一定的出错率,故排除

7、C;V2X2列联表中的4个数据是对于某组特定数据的统计数据,故四个数据间有一定的关系,故排除D.2. 利用独立性检验来考虑两个分类变量X和丫是否有关系时,通过查阅临界值表来确定推断“X和丫有关系”的可信度,如果/6.635,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过()A. 0.1B.0.01C.0.001C.0.001D.0.979解析:选B因为P侦26.635)=0.01,故在犯错误的概率不超过0.01的前提下,认为“X和V有关系.劾缘Mi国骸骨典物精析列联表和等高堆积条形图的应用列联表和等高堆积条形图的应用例1(链接教科书笫126页例1)某学校对高三学生作了一项调查,发现:在

8、平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张.性格外向的学生594人中有213人在考前心情紧张,作出等高堆积条形图,利用图形判断考前心情紧张与性格类别是否有关系.|解作列联表如下:单位:人考前心情性格合计内向外向紧张332213545不紧张94381475合计4265941020相应的等高堆积条形图如图所示:0考前心者前心情紧张情不紧张09876543211000000000图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.进行独立性检验

9、的前提是根据题中数据获得2X2列联表,常用等高堆积条形图展示列联表数据的频率特征,即将南与嚣或品与光)的值相比,由此能直观地反映出两个分类变量间是否相互影响,但是此方法较粗劣.跟踪训练为了研究子女吸烟与父母吸烟的关系,调查了-千多名青少年及其家长,数据如下:单位:人利用等高堆积条形图判断父母吸烟对了女吸烟是否有影响?子女父母合计吸烟不吸烟吸烟23783320不吸烟6785221200合计9156051520解:等高堆积条形图如下:子女吸烟子女不吸烟子女吸烟子女不吸烟密父母吸烟I父母不吸烟由图形观察可以看出子女吸烟者中父母吸烟的比例要比子女不吸烟者中父母吸烟的比例高,因此可以在某种程度上认为“子

10、女吸烟与父母吸烟有关系”.独立性检验例2(2020-全国卷III)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到I、表(单位:天):fJ锻炼人次空气质量等f0,200(200,400(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为123,4的概率;(2) 求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3) 若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,

11、完成下面的2X2列联表,并根据列联表,判断是否有95%的把握认为天中到该公园锻炼的人次与该市当天的空气质量有关?人次W400人次400空气质量好空气质量不好附:卬)(籍a0.0500.0100.001Xa3.8416.63510.828解(I)由所给数据,该市一天的空气质量等级为123,4的概率的估计值如表:空气质量等级1234概率的估计值0.430.270.210.09(2)天中到该公园锻炼的平均人次的估计值为&X(1OOX2O+3OOX35+5OOX45)=35O.(3)根据所给数据,可得2X2列联表:人次W400人次400空气质量好3337空气质量不好228根据列联表得R5.820.R5

12、.820.100X(33X822X37)255X45X70X30由于5.8203.841=血050,根据小概率值。=0.05的独立性检验,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.解决独立性检验问题的基本步骤(1) 根据已知的数据作出列联表;(2) 作出相应的等高堆积条形图,可以利用图形做出相应判断;(3) 求的观测值;(4) 判断可能性:与临界值比较,得出事件有关的可能性大小.跟踪训练(202()新高等全国卷I)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO?浓度(单位:ng/m3),得下表:PM2.5

13、0,501(50,150(150,4750,3532184(35,756812(75,115J3710(1) 估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;根据所给数据,完成下面的2X2列联表:SO2PM2.50,150(150,4750,75(75,115(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?n(adbcy,%(a+/)(c+d)(a+c)(/?+1/)a0.0500.0100.001Xa3.8416.63510.828解:(1)根据抽查数据,该市1()0天空气中的PM2.5浓度不超过75,且

14、SO?浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO?浓64度不超过150的概率的估计值为面=0.64.(2)根据抽查数据,可得2X2列联表:PM2.50,150(150,4750,756416(75,1151010(3)根据(2)的列联表得,100X(64X1016X10)2/=87484z80X20X74X26由于7.4846.635=心仞0,根据小概率值=0.010的独立性检验,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.随堂检测I.下面的等高堆积条形图可以说明的问题是()1.9.8.7.6.43z.1oO.O.O.O.O.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号