统计案例的教学教研用(独立性)

上传人:平*** 文档编号:14755153 上传时间:2017-11-02 格式:DOC 页数:7 大小:550.64KB
返回 下载 相关 举报
统计案例的教学教研用(独立性)_第1页
第1页 / 共7页
统计案例的教学教研用(独立性)_第2页
第2页 / 共7页
统计案例的教学教研用(独立性)_第3页
第3页 / 共7页
统计案例的教学教研用(独立性)_第4页
第4页 / 共7页
统计案例的教学教研用(独立性)_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《统计案例的教学教研用(独立性)》由会员分享,可在线阅读,更多相关《统计案例的教学教研用(独立性)(7页珍藏版)》请在金锄头文库上搜索。

1、统计案例的教学西城教育研修学院 闻岩一、课标要求学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。内容与要求1统计案例(约14课时)通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。(1)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用。(2)通过对典型案例(如“质量控制”“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用(参见例1)。-删掉了(3)通过对典型案例(

2、如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。-删掉了(4)通过对典型案例(如“人的体重与身高的关系”等)的探究,进一步了解回归的基本思想、方法及初步应用。说明与建议1统计案例的教学中,应鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,认识统计方法的特点(如统计推断可能犯错误,估计结果的随机性),体会统计方法应用的广泛性。应尽量给学生提供一定的实践活动机会,可结合数学建模的活动,选择1个案例,要求学生亲自实践。对于统计案例内容,只要求学生了解几种统计方法的基本思想及其初步应用,对于其理论基础不作要求,避免学生单纯记忆和机械套用公式进行计算。2教学中,应鼓励学生使用计算

3、器、计算机等现代技术手段来处理数据,有条件的学校还可运用一些常见的统计软件解决实际问题。例1 某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选5只羊做实验,结果这5只羊服用此药后均未患病。问此药是否有效。初看起来,会认为这药一定有效,因为服药的羊均未患病。但细想一下,会有问题,因为大部分羊不服药也不会患病,患病的羊只占0.4左右。这5只羊都未患病,未必是药的作用。分析这问题的一个自然想法是:若药无效,随机抽取5只羊都不患病的可能性大不大。若这件事发生的概率很小,几乎不会发生,那么现在我们这几只羊都未患病,应该是药的效果,即药有效。现假设药无效,5只羊都不

4、生病的概率是(1-0.4) 50.078.这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的。这里的分析思想有些像反证法,但并不相同。给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”。应该指出的是,当我们作出判断“药是有效的”时,是可能犯错误的。犯错误的概率是0.078。也就是说,我们有近92%的把握认为药是有效的。-没必要讲了这个例子了二、全国考纲的要求17统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题独立检验了解独立检验(只要求 2列联表)的基本思想、方法及简单应用回归分析了解回归分析的基本思想、方

5、法及简单应用三、关于独立性检验(一)数理统计中的处理关于两个分类变量的独立性分析.一般可得一个二维离散分布表.一般,若总体中的个体可按两个属性 与 分类, 有 个类 , 有 个类ABr12,rA Bc,从总体中抽取大小为 的样本,设其中有 个个体既属于类 又属于类 ,即 是频12,cB nijnijn数,将 个 排列为一个 行 列的二维列联表,简称 表。如图:rijnrcrcA1 j c和1ir 1jn 1n 1in ij ic1r rjn rcn1AiArA和 A jA A(也可以有多维的列联表)在 表中,若以 , 和 分别表示个体仅属于 与 和同时属于 与 的概率,则可得rcipAjij

6、iAjBiAjB一个二维离散分布表: AB1 j c行和1ir p 1jp 1p 1i ij ic1rp rjp rcp1AiArA列和 A jA A1此时统计量为 , 其中 为 ,221()rcijijijnpijpjiijijn上式服从自由度为 的 分布,(2)1()rcrc2对给定的显著性水平 ,检验的拒绝域为 .021()1Wrc-概率论与数理统计教程 茆诗松等)(二)B版教材的处理患慢性气管炎( )B不患慢性气管炎( )总计吸烟( )A1n12n1n不吸烟( ) 2 2总计 12给出统计假设 :吸烟与患肺癌没有关系, 即 .0H()()PAB事件的概率用相应的频率来估计,如 的估计为

7、 , 的估计为 , 的估计为()PAB1n1n()PB.1n于是 与 应该很接近, 与 应该很接近,.11nA12n2或者说 , , , 应该比较小,2()()A211()nA2()nA所以 应该比较小,211122nn上式可以化简为 .21221()上面的阅读(探索与研究)与大学教材的处理基本一致.之后,给出两个临界值 与 .3.8465(自由度为1的时候,显著性水平为0.05,0.01的两个卡方值)之后,给出对临界值的认识:当 时,有 的把握说事件 与 有关;23.849%AB当 时,有 的把握说事件 与 有关;65当 时,认为事件 与 是无关的.2.1(三)A版教材的处理关于列联表的研究

8、和计算分类变量:变量不同“值”表示个体所属的不同类别.列联表:列出两个分类变量的频数表。可以 表( 行 列的二维列联表) ,简单的为 列联rc2表。 (即两个或多个变量的频数表)可用二维条形图或三维柱形图直观的反映相关数据的总体状况.进一步分析,要用统计的相关知识了.例题:为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机的调查了9965人,得到如下结果(单位:人):利用Excel表可以进行很快的计算:不 患 肺 癌 患 肺 癌 总 计不 吸 烟 7775 42 7817吸 烟 2099 49 2148总 计 9874 91 9965公 式 分 子 854416992047885公 式 分 母 1

9、5087208917144卡 方 56.63187915不 患 肺 癌患 肺 癌不 吸 烟吸 烟209949777542010002000300040005000600070008000不 吸 烟吸 烟用字母表示:不患癌症 患癌症 总计不吸烟 abab吸烟 cdcd总计 先假设: :吸烟与患肺癌没有关系,0H应有 , , ,acbd()()acdb0adc因此, 越小,说明吸烟与患肺癌的关系越弱; 越大,说明吸烟与患肺癌的关系越 b强。构造随机变量 ,其中 为样本容量。22()(nadbcKnabcd于是,若 成立,即“吸烟与患肺癌没有关系” ,则 应该很小,0H2K上面例题中 的观测值 。2

10、56.32对 的观测值 的认识2Kk研究表明:成立的情况下, ,0H(6.35)0.1P即在 成立的情况下, 的观测值大于 的概率非常小,近似于 ,是一个小概率事件。2K6350.1(统计中常将概率小于 的事件成为小概率事件, )0.1、例题中的观测值远大于 ,所以有理由断定 不成立,即“吸烟与患肺癌有关系” 。6.350H2、这个判断会犯错误,犯错误的概率不会超过 。即我们是以 的把握认为“吸烟与患肺.19%癌有关系” 。3、上诉过程中,依据随机变量 的观测值 ,建立了一个判断 是否成立的规则:2Kk0如果 ,就判断 不成立,即两个分类变量有关系;否则,就判断 成立,即两个分类6.5k0H0

11、H变量没有关系。在该规则之下,把结论“ 成立”错判成“不成立”的概率不会超过 ,即0 (6.35).1Pk有 的把握认为 不成立。9%04、 是一个常用的判断规则的临界值。6.355、一般情况下,判断 的观测值 是大还是小,需要确定一个正数 ,当 时就认为 的2Kk0k02K观测值 大,此时相应于 的判断规则为:k0k如果 ,就认为“两个分类变量有关系” ;否则就认为“两个分类变量没有关系” 。0正数 为一个判断规则的临界值。在此规则下,把结论“两个分类变量没有关系”错判成“两个分类变量有关系”的概率为。20()PKk在实际应用中,我们把 解释为有 的把握认为“两个分类变量有关系”0k20(1

12、)1%PKk;把 解释为不能以 的把握认为“两个分类变量有关系” ,或者由样本观02(1)P测数值不能充分说明“两个分类变量有关系” 。6、上面这样利用随机变量 来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为2K两个分类变量的独立性检验。7、在实际应用中,在获取样本数据之前,通常通过查阅下表确定临界值:20()PKk0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.0010k0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828一般情况:一般的,假设有两个分类变量

13、和 ,它们的可能取值分别为 和 ,其样本频数XY12,x12,y列联表(称为 列联表)为:21y2y总计1xabab2cdcd总计 若要推断的论述为 : 与 有关系, 可以按如下步骤判断成立的可能性:1HXY1、通过三维柱形图和二维条形图,可以粗略的判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度。(1)在三维柱形图中,主对角线上两个柱形高度的成绩 与副对角线上高度的乘积 相差越大,adbc成立的可能性就越大。H(2)在二维条形图中,可以估计满足条件 的个体中具有 的个体所占的比例 ,1Xx1Yya也可以估计满足条件 的个体中具有 的个体所占的比例 。两个比例的值相差越

14、大,2XxYycd成立的可能性就越大。1H2、可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度。具体做法如下:(1)先根据实际问题需要的可信程度确定临界值 ;0k(2)根据观测数据计算由公式 给出的随机变量 的值 ;22()(nadbcK2Kk(3)如果 ,就以 的把握认为“ 与 有关系” ;否则就认为由样0k20(11%PkXY本数据没有充分的证据显示“ 与 有关系” 。XY五、教学建议统计学有两方面的主要工作,一方面是收集数据,另一方面是分析数据。那么,数据如何收集?对于收集到的数据怎样处理?如何分析数据中体现的规律,据现有的数据作出对未来的预测,对预测有一个判断.我们的教学中,必修中学习了数据的收集-抽样(随机抽样,简单随机抽样,系统抽样,分层抽样) ;数据的描述(直方图、条形图、茎叶图、平均数、中位数、方差) ;分析和预测(用样本的频率分布估计总体的分布、用样本的数字特征估计总体的数字特征,数值变量的回归分析(线性、非线性) ,分类变量的相关关系). 在统计中,回归分析和相关分析是应用很广的。独立性检验的基本教学要求(一)用 B 版的探索与研究的方法(或用 A 版的解释)给出 统计量。 21、会调查,列表,计算 统计量,依据两个临界值做出判断。22、正确认识 23.841(1) “我们有95%的把握说事件A与B有关” 。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号