新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件

上传人:副** 文档编号:358432355 上传时间:2023-08-23 格式:PPTX 页数:17 大小:1.64MB
返回 下载 相关 举报
新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件_第1页
第1页 / 共17页
新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件_第2页
第2页 / 共17页
新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件_第3页
第3页 / 共17页
新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件_第4页
第4页 / 共17页
新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件》由会员分享,可在线阅读,更多相关《新人教A版高中数学选择性必修三《8.3.1分类变量与列联表》课件(17页珍藏版)》请在金锄头文库上搜索。

1、8.3.1 8.3.1 8.3.1 8.3.1 分类变量与列联表分类变量与列联表分类变量与列联表分类变量与列联表1.通过实例,通过实例,制作、制作、理解理解22列联表的统计意义列联表的统计意义.2.理解判断两个分类变量是否有关系的常用方法理解判断两个分类变量是否有关系的常用方法.课标要求素养要求通过学习通过学习22列联表,提升数学抽象、列联表,提升数学抽象、数据建模数据建模及数据分析素养及数据分析素养.重难点制作理解列联表、理解利用抽样数据频率得出结论的可靠性制作理解列联表、理解利用抽样数据频率得出结论的可靠性问题导学 前面两节所讨论的变量,如人的身高、树的胸径、树的高度、短跑100m世界纪录

2、和创纪录的时间等,都是数值变量,数值变量的取值为实数.其大小和运算都有实际含义.在现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或相互影响的问题.例如,就读不同学校是否对学生的成绩有影响,不同班级学生用于体育锻炼的时间是否有差别,吸烟是否会增加患肺癌的风险,等等,本节将要学习的独立性检验方法为我们提供了解决这类问题的方案。在讨论上述问题时,为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示,例如,学生所在的班级可以用1,2,3等表示,男性、女性可以用1,0表示,等等.在很多时候,这些数值只作为

3、编号使用,并没有通常的大小和运算意义,本节我们主要讨论取值于0,1的分类变量的关联性问题.问题探究问题1.为了有针对性地提高学生体育锻炼的积极性,某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响,为此对学生是否经常锻炼的情况进行了普查,全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼。你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?为了清楚起见,我们用表格整理数据性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601合计3208041124 在实践中,由于保存原始数

4、据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将下表这种形式的数据统计表称为22列联表(contingency table).22列联表给出了成对分类变量数据的交叉分类频数,以右表为例,它包含了X和Y的如下信息:最后一行的前两个数分别是事件Y=0和Y=1中样本点的个数;最后一列的前两个数分别是事件X=0和X=1中样本点的个数;中间的四个格中的数是表格的核心部分,给出了事件X=x,Y=y(x,y=0,1)中样本点的个数;右下角格中的数是样本空间中样本点的总数。概念解析性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)1284

5、73601合计32080411241.分类变量分类变量我我们们经经常常会会使使用用一一种种特特殊殊的的随随机机变变量量,以以区区别别不不同同的的现现象象或或性性质质,这这类类随随机机变变量称为量称为_,分类变量的取值可以用,分类变量的取值可以用_表示表示.分类变量分类变量实数实数2.22列联表及随机事件的概率列联表及随机事件的概率(1)22列联表:如果随机事件列联表:如果随机事件X与与Y的样本数据如下表格形式的样本数据如下表格形式XY合计Y0Y1X0ababX1cdcd合计acbdabcd在这个表格中,核心的数据是中间的在这个表格中,核心的数据是中间的4个格子,个格子,所以这样的表格通常称为所

6、以这样的表格通常称为22列联表列联表.例1.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀,试分析两校学生中数学成绩优秀率之间是否存在差异.学校数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计711788 表是关于分类变量X和Y的抽样数据的22列联表:最后一行的前两个数分别是事件(Y=0)和(Y=1)的频数;最后一列的前两个数分别是事件(X=0)和(X=1)的频数;中间的四个格中的数是事件(X=x,Y=y)(x,y=0,1)

7、的频数;典例解析我们可以用等高堆积条形图直观地展示上述计算结果,如图所示 左边的蓝色和红色条的高度分别是甲校学生中数学成绩不优秀和数学成绩优秀的频率;右边的蓝色和红色条的高度分别是乙校学生中数学成绩不优秀和数学成绩优秀的频率,通过比较发现,两个学校学生抽样数据中数学成绩优秀的频率存在差异,甲校的频率明显高于乙校的频率,依据频率稳定于概率的原理,我们可以推断P(Y=1|X=0)P(Y=1|X=1).也就是说,如果从甲校和乙校各随机选取一名学生,那么甲校学生数学成绩优秀的概率大于乙校学生数学成绩优秀的概率,因此,可以认为两校学生的数学成绩优秀率存在差异,甲校学生的数学成绩优秀率比乙校学生的高。学校

8、数学成绩合计不优秀(Y=0)优秀(Y=1)甲校(X=0)331043乙校(X=1)38745合计7117882.两个分类变量之间关联关系的定性分析的方法:等高堆积条形图可以展示列联表数据的频率特征,能够直观地反映出两个分类变量间是否相互影响.概念解析【例例子子】在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解解根据题目给出的数据作出如下的列联表:根据题目给出的数据作出如下的列联表:色盲不色盲合计男38442480女6514520合计449561 000根据列联表作出相应的等高堆积条形图:根据列联表作出相应的等高堆积条形图:从从等等高高堆堆

9、积积条条形形图图来来看看,在在男男人人中中患患色色盲盲的的比比例例要要比比在在女女人人中中患患色色盲盲的的比比例例大大得得多多,因因此此,我我们们认认为为患患色色盲盲与与性性别别是是有有关关系系的的.利用等高堆利用等高堆积条形条形图判断两个分判断两个分类变量是否相关的步量是否相关的步骤:思维升华问题:你认为以上例子中“两校学生的数学成绩优秀率存在差异”等结论是否有可能是错误的?有可能 “两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.有可能出现这种情况:在随机抽取的这个样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的.对于随机样本而言,

10、因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算.问题探究课堂小结1.牢牢记3个知个知识点点(1)分分类变量的概念;量的概念;(2)22列列联表;表;(3)等高堆等高堆积条形条形图.2.掌握掌握2个方法个方法(1)用用22列列联表分析两分表分析两分类变量量间关系的方法;关系的方法;(2)用等高堆用等高堆积条形条形图分析两分分析两分类变量量间关系的方法关系的方法.3.注意注意1个易个易错点点作作22列列联表表时,关,关键是是对涉及的涉及的变量分清量分清类别,计算算时要准确无要准确无误.4.要理解通过抽样数据得出的结论是有误差的,我们下一节将进一步学习如何评估结论的可靠性。课后练习:教材127、128,教学设计后的作业。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号