1.2 独立性检验的基本思想

上传人:飞*** 文档编号:24752264 上传时间:2017-12-07 格式:DOC 页数:9 大小:459.51KB
返回 下载 相关 举报
1.2 独立性检验的基本思想_第1页
第1页 / 共9页
1.2 独立性检验的基本思想_第2页
第2页 / 共9页
1.2 独立性检验的基本思想_第3页
第3页 / 共9页
1.2 独立性检验的基本思想_第4页
第4页 / 共9页
1.2 独立性检验的基本思想_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《1.2 独立性检验的基本思想》由会员分享,可在线阅读,更多相关《1.2 独立性检验的基本思想(9页珍藏版)》请在金锄头文库上搜索。

1、第 1 页 共 9 页1.2 独立性检验的基本思想1内容和内容解析(1)内容:独立性检验的基本思想及实施步骤, 基本思想是: 根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误的概率的上界 ,然后查临界值表,确定临界值 ;0k 利用公式(1),计算随机变量 的观测值 ;2K2k 如果 ,就推断“ 与 有关系”,这种推断犯错误的概率不超过 ;否则,就认20kXY 为在犯错误概率不超过 的条件下不能推断“ 与 有关系”,或者在样本数据中没XY有发现足够证据支持结论“ 与 有关系”.主要是给“判断分类变量 X 和 Y 有关系”建立上述规则,并且这个概率的上界必须在随机抽样之前就要确定,不能在

2、计算随机变量 的值之后,再去确定.2K(2)内容解析:统计学的思想方法如下:利用频率、等高条形图直观判断两个分类变量有关;理解结论(1) 的值越小,说明两个分类变量之间关系越弱;(2) 的值越|adbc |adbc大,说明两个分类变量之间关系越强;理解独立性检验的基本思想,主要是在假设 的前提0H下,如果出现一个与 相矛盾的小概率事件,因为小概率事件在一次试验中,极少发生,因此,0H我们更愿意相信 不成立,即“分类变量有关系”成立;独立性检验的基本思想的关键是理解临界值表的含义.以 为例,其含义是:概率的上界 为 ,在02.76k2(.706).1PK假设 的前提下, 发生的概率不超过 0.1

3、0,即“两个分类变量有关系”发生的概0H2K率超过 0.90.掌握随机变量 的观测值判断两个分类变量有关系的解题步骤,而随机变量2的构造过程则不要求学习.2K独立性检验的实施步骤是:(1)假设 :两个分类变量没有关系;(2)由列联表中数据,0H利用公式(1)计算 的观测值为 ;(3)查临界值表得概率的上界;(4)确定两个分类变2K2k量有关的可靠程度及其犯错误的概率.教学重点:理解独立性检验的基本思想及实施步骤2目标和目标解析(1)目标:1.学生经历分析频率差异的比较、画出等高条形图,掌握初步判断两个分类变量是否有关的统计方法;2.学生通过探究 的值及其对两个分类变量是有关的可靠程度的影响,体

4、会结论(1) |adbc第 2 页 共 9 页的值越小,说明分类变量 X 与 Y 之间关系越弱;(2) 的值越大,说明分类变|adbc |adbc量 X 与 Y 之间关系越强;3.师生共同讨论概率的上界 的变化,调整对应的临界值 ,弄清楚临界值 对两个分类变0k0k量是否有关的影响,理解独立性检验的基本思想及实施步骤4.比较反证法原理与独立性原理,明确两者之间的联系与区别.(2)目标解析:1.在引例中,学生经历如何判断数学成绩合格与性别有关的过程,理解列联表的概念、分类变量的概念,会画等高条形图;2.在实例中,学生通过探究得出 后,分析得到结论:(1) 的值越小,说明吸0adbc|adbc烟与

5、患肺癌之间关系越弱;(2) 的值越大,说明吸烟与患肺癌之间关系越强,分别计|算实例、引例、 的 的值,理解其对两个分类变量是否有关的影响,并求出各自|c的可靠程度,学生由不完全归纳法深化对该结论的认识,在记忆中留下深深的烙印;3.在假设 的前提下,针对概率的上界 的变化,调整对应的临界值 ,理解在假设 的前0H0k0H提下概率的上界的变动,对两个分类变量是否有关的影响,体会概率的上界的意义,理解在随机抽样之前一定要根据实际的问题,设定两个分类变量是否有关的概率的上界 ;4. 通过比较反证法原理与独立性检验原理了解两者之间的关系,即在假设 成立的前提下,0反证法中推出一个与 相矛盾的不可能事件,

6、而独立性检验的原理是出现一个与 相矛盾0H H的小概率事件.3教学问题诊断分析1本节课的内容独立性检验对学生来说是全新的内容,为什么有这么一个方法?为什么要学习这个方法?2独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率.所以首先要教会学生的是了解并初步理解这个规则,而后才是会用这个规则解决问题.3独立性检验难以理解的一个主要之处在于凭空出现一个 ,这个随机变量 K2是怎样2K构造出来的,为什么如此构造?教材在这一部分处理上,是先进行某一临界值的讲解,而后再给出临界值表,这对于学生

7、是比较难以理解的,为什么就给出这么一个临界值呢?有这个问题的存在,学生对接下来所谈到的内容会有所怀疑,不一定十分认同.为了突破这个难点,我采用“先入为主”的思想,把教材后面介绍的临界值表提前讲解,用概率知识解读临界值表的含义,引导学生先接受统计学上的知识,而后在应用过程中进一步理解,这样进行调整后,学生对独立性检验的思想的接受就更容易一些.教学难点:了解独立性检验的基本思想; 了解随机变量 K2的含义,K 2的观测值很大,就认为两个分类变量是有关系的.4教学支持条件分析第 3 页 共 9 页数 学 成 绩 合 格 率 与 性 别 关 系0.00.20.40.60.81.0男 生 女 生不 合

8、格合 格图 1为了高效课堂目标,考虑到学生的知识水平和理解能力,从学生的认知规律出发,让学生自主学习,运用探究式法,充分调动学生的积极性,让学生逐步领会独立性检验的基本思想,掌握独立性检验的方法.学生每人要准备一个计算器;由于表格较多,需制作 PPT 辅助教学.5教学过程设计复习:函数关系是一种确定关系,相关关系是一种不确定关系,可以用函数模型去拟合两个相关的关系,通过上一个单元的学习,我们知道用回归分析的方法去判断这种拟合效果的好坏.现实世界里,处理上述的变量之外,还没有新的变量呢?带着这样的问题 ,我们今天今天的课堂.(1)创设情境,提出问题引例:数学某次周测成绩情况如下:90 至 150

9、 分(含 90 分),共 20 人,其中男生 15 人,女生 5 人;0 至 89 分,共 30 人,其中男生 10 人,女生 20 人.问:这次考试数学成绩合格与性别有关吗?问题 1(1)列表整理数据;问题 1(2)男生的合格率是_;女生的合格率是_;班级的合格率_你认为数学成绩合格与性别_关系.(填:“有”或“没有” )问题 1(3)画出数学合格率的图形.预设答案如下:问题 1(1)不合格 合格 合计男生 10 15 25女生 20 5 25合计 30 20 50问题 1(2)0.6;0.4;0.2;有问题 1(3)条形图如图 1:学习概念分类变量,如果某种变量的不同“值”表示个体所属的不

10、同类别,像这样的变量称为“分类变量”;等高条形图,有关频率分布的图形.【设计意图】从学生熟悉的学习情境创设一个实际问题情境,这个问题非常容易回答,可以提高学生学习下面内容的热情;提前提出分类变量、列联表、等高条形图的概念,避免在实例的教学中,损耗学生的精力,发散他们的注意力,降低学习质量.实例:为研究吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了 9965 人,得到如下结果(单位:人):吸烟与肺癌列联表 1-7那么吸烟是否对患肺癌有影响?学生活动思考、交流、合作讨论.问题 2(1)在不吸烟者中患肺癌的比例是 ;在吸烟者中患肺癌的比例是不患肺癌 患肺癌 合计不吸烟 7775 42 7817吸烟

11、2099 49 2148合计 9874 91 9965第 4 页 共 9 页吸 烟 与 患 肺 癌 的 关 系0.00.10.20.30.40.50.60.70.80.91.0不 吸 烟 吸 烟不 患 肺 癌患 肺 癌图 2_;结论是吸烟者的患肺癌率是不吸烟者的_倍.问题 2(2)画出吸烟与患肺癌的等高条形图.你认为吸烟与患肺癌_关系.(填:“有”或“没有” )预设答案:问题 2(1). ; ;4;有关系.40.5%78492.81问题 2(2). 等高条形图如图 2,有.【设计意图】在复杂的问题中,学生受到引例的启发,再次应用频率差异较大、等高条形图去直接判断吸烟与患肺癌有关系,成功的体验,

12、将提高学生继续学习的兴趣.引导性语言:我们直观判断“吸烟与患肺癌有关”,那么这种判断的可靠程度怎么样呢?为了研究的一般性,在列联表 1-7 中用字母代替 数字,得到列联表如下: 不患肺癌 患肺癌 合计不吸烟 abab吸烟 cdcd合计 n其中, nabd1启发探究我们假设 :吸烟与患肺癌没有关系0H问题 3(1)在不吸烟者中患肺癌的比例是_ 在吸烟者中患肺癌的比例是_ 问题 3(2)我们假设 :吸烟与患肺癌没有关系,则应得到什么结论?0问题 3(3)由 可以初步得出什么结论?adbc预设答案:问题 3(1). ; ;问题 3(2).吸烟的患肺癌的比例约等于不吸烟患肺癌的比例. ,()(),0b

13、dcdabca问题 3(3)结论 越小,说明吸烟与患肺癌之间关系越弱,吸烟对患肺癌影响越小;|第 5 页 共 9 页 越大,说明吸烟与患肺癌之间关系越强,吸烟对患肺癌影响越大.|adbc问题 3(4)分别计算实例与引例中的 的值.|adbc预设答案:292817;3832【设计意图】要研究两个分类变量有关系是不容易解决的问题,本着“正难则反”的思想方法,借助反证法的思考模式,将问题转化为两个分类变量无关,利用事件独立的概率相关知识,用频率代替概率,利用列联表由学生自己动手推导出,在 成立的条件下有 ,进而0Hbcad引出随机变量 K2公式中的部分结构 .adbc( )在假设 的前提下,得出 的

14、观测值应该很小,而 的观测值应该很大,说明 不成立,0H2 2K0H即“两个分类变量有关”,为后面理解独立性检验的基本思想奠基;2新知解读引导性语言:为了使不同样本的数据有一个统一而又合理的评判标准,统计学家们经过研究后构造了一个随机变量 = 其中 为样本容量.2K2(),)(nadbcnabcd我们假设 :吸烟与患肺癌没有关系0H若假设 成立, 应该很小;若 很大,说明假设不成立,即两变量有关系.22同时统计学家们还得到了如下的临界值表:P(K2k 0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 0.455 0.708 1

15、.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828下面讨论临界值的使用方法.举例说明:(1) ,在假设 的前提下, 发生的20.45,(0.45).kPk0H20.45k概率不超过 0.50,即吸烟与患肺癌有关系发生的概率超过.50.(2) ,在假设 的前提下, 发生的概率不超过20.76,(.76).102.760.10,即吸烟与患肺癌有关系的概率超过 0.90.【设计意图】随机变量 含义的理解是本节课的难点之一,利用概率知识解读临界值表中数2K据的含义,有助于学生理解独立性检验的基本思想.接下来,我们就利用统计量 K2来判断探究中“吸烟与患肺癌有

16、关”的可靠程度.问题解决:解:(1)假设 H0:吸烟与患肺癌没有关系,由样本数据得到随机变量 的观测2K值 .22965(749)6.38281k(2)查临界值表得: .2(.)0Pk第 6 页 共 9 页因此,在假设 的前提下, 成立的概率的不超过为 0.10,即吸烟与患肺癌有关0H26.35k系的概率超过 0.90,所以我们有 99%的把握认为吸烟与患肺癌有关系,这种推断犯错误的概率为 1%.学生分组讨论:解决数学成绩合格与性别有关的问题.预设答案:解:(1)假设 :数学成绩合格与性别没有关系0(2)由样本数据得到随机变量 的观测值 .2K2250(105)8.30793k(3)查临界值表

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号