统计学概念和方法-第9章

上传人:tia****nde 文档编号:69696919 上传时间:2019-01-14 格式:PPT 页数:23 大小:414.32KB
返回 下载 相关 举报
统计学概念和方法-第9章_第1页
第1页 / 共23页
统计学概念和方法-第9章_第2页
第2页 / 共23页
统计学概念和方法-第9章_第3页
第3页 / 共23页
统计学概念和方法-第9章_第4页
第4页 / 共23页
统计学概念和方法-第9章_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《统计学概念和方法-第9章》由会员分享,可在线阅读,更多相关《统计学概念和方法-第9章(23页珍藏版)》请在金锄头文库上搜索。

1、第九章 两个分类变量的x2分析,数学与信息科学学院 王 坤 TEL:13987460215 ,统计学概念和方法,主要内容,分类数据的检验 四格表及其独立性检验,1分类数据的检验,例 (Mendel的豌豆实验) 19世纪英国生物学家Mendel按颜色与形状把豌豆分为4类:黄而圆的,青而圆的,黄而有角度,青而有角的。遗传基因中,黄色是显性的,青色是隐性的;圆是显性的,有角是隐性的。Mendel指出这四类豌豆个数之比是9:3:3:1,即这四类豌豆的概率分别为9/16、3/16,3/16,1/16.他随机抽取了n=556颗豌豆,观察到这四类豌豆的个数分别为315、108、101、32。下面根据这些观察

2、数据,对Mendel的遗传学理论进行检验。,分类数据检验问题 根据某项指标,总体被分为r类:A1, ,Ar。 H0:类Ai所占的比例为pi=pi0(i=1, ,r) 设n个个体中属于Ai类的实际观察个数为ni,则npi0为理论频数。Mendel提出的问题实际上就是考虑实际频数与理论频数有无偏离。 1900年,Pearson提出用 作为衡量实际频数与理论频数的偏差的指标。,套用上页公式计算Mendel豌豆实验中的数据,计算如下: 算得x2=0.47. 这里r=4,自由度为r-1=3.查x2表,得p值=0.925431,给定a=0.1或者0.05,显然,pa,故不拒绝H0.我们认为观察数据符合遗传

3、学上四种豌豆符合9/16、3/16,3/16,1/16的比例。,也可在Excel中输入“=CHIDIST(0.47,3)”,得p=0.92543108,例 某学校有十门新的选修课,下面的数字分别记录了选修每门课程的学生数。取水平0.05,检验:学生对这些课程的选择没有倾向性,即选各门课的人数比例相同。 这里H0:p=0.1,n=800,r=10 套用公式 算得x2=5.125,对应的P值=0.8232783490.05,故接受H0,学生对这些课程的选择没有倾向性,各门课选课人数的频率为0.1.,2四格表及其独立性检验,设A,B为两个属性,那么四格表的形式为: 其中:n1+=n11+n12, n

4、2+=n21+n22 n+1=n11+n21, n+2=n12+n22 n=n11+n12+n21+n22,例 对肺癌患者和对照组的调查结果 :,四格表的独立性,考虑上例中吸烟与患肺癌有无关系,亦即A与B是否独立,若A、B二因素独立,则患肺癌与吸烟无关。 记p1=P(B|A),p2=P(B|没有A) 即p1=n11/n1+, p2=n21/n2+, 如果p1=p2,则属性A与属性B独立。,欲检验则属性A与属性B独立,只需检验: H0: p1=p2 检验统计量为: 对于上面的例子, 在excel中输入“=CHIDIST(9.664,1)”,得到p=0.001879,p0.05,故拒绝H0, p1

5、和p2不独立,亦即吸烟与患肺癌有关。,例在对人们休闲的一次调查中,共调查了124人,其中女性70人,男性54人。女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。 (1)22的列联表:,(2)三维柱形图:,二维条形图: 等高条形图:,(3)假设休闲方式与性别无关,计算 在excel中输入“=CHIDIST(6.20123,1)”,得到p= 0.012766 ,p0.025,故拒绝H0, p1和p2不独立,亦即有理由认为休闲方式与性别无关是不合理的,即我们有97.5%的把握认为休闲方式与性别有关。,Excel2

6、003中的部分统计函数,案例 :泰坦尼克号的真实故事,1912 年 4 月 10 日, “泰坦尼克号”从英国的南安普顿出发驶往美国纽约。富家少女罗丝与母亲及未婚夫卡尔一道上船,另一边,不羁的少年画家杰克靠在码头上的一场赌博赢到了船票。罗丝不愿嫁给卡尔,打算投海自尽,被杰克抱住。很快,罗丝与杰克相爱了。可没想到惨绝人寰的悲剧突然发生了,泰坦尼克号与冰山相撞。杰克把生存的机会让给了爱人罗丝,自己则在冰海中被冻死。这是美国电影泰坦尼克号里的凄美爱情故事。但是背后真实的情况又是怎样的呢?就让我们从泰坦尼克号的死亡记录来寻找一些答案吧。,号称“永不沉没”的“泰坦尼克号” ,重达 46328 吨,排水量

7、66000 吨,是当时世界上唯一超过四万吨吨位的客轮;其最高航行速度可达每小时 30 海里(约 55.6 公里) 。船身全长 260 米,最大宽度为 28 米;客轮上下共 11 层,拥有 762 个舱室、7 公里长的走廊和游步甲板。船上吃、喝、玩、乐设施应有尽有。船长和船员也经过严格的挑选,担任船长的是在银星轮船公司工作了 38 年的J.E.史密斯,是该公司最有经验的船长,而指挥“泰坦尼克号”首航横渡大西洋将为他的航海生涯画上圆满的句号。,1912 年 4 月 15 日,世界上最大的豪华巨轮“泰坦尼克号”与冰山相撞而沉没的悲剧成了世纪之痛。这个灾难充满了神秘与巧合,而对于其致命的原因,解释也多

8、种多样:有人认为是船长的疏忽,有人认为是设计者只考虑到了船体的正面冲击却忽视了高速侧撞的问题,有人认为是其过于自信而忽略了安全措施的准备等等。能载二千三百人的船,其救生艇却少得可怜,仅仅二十只,最多能载一千一百七十八人。面对死亡,人们又做出了怎样的选择?,文献记载数据:当时船上有 1316 名乘客和892 名船员共2208 人,事故发生后幸存 718 人,约2/3 的人在海难中丧生。 有关数据(单位:人)整理如下:,(一) 死亡与性别是否有关,检验假设 H 0 :死亡与性别之间不存在依赖关系。,P值 = x2=449.19=1.0824E-990.01,故应拒绝 H 0,可认为死亡与性别存在依赖关系。 我们发现,如果死亡与性别之间不存在依赖关系, 那么幸存下来的男性应该接近期望值 565,但实际上幸存下来的男性只有 374 人;女性的幸存期望值为 153,实际上幸存下来的女性远远大于这个数字,为 344 人。 由此,我们可以得出这样的结论:当时社会上可能存在着一种可贵人性,即遵守“男性绅士风度”和“优先救助妇女”的守则,因而逃生的结果是约 73.2%的女性都存活下来了,而男性的存活率只有 21.5%。,思考,1976年至1977年美国佛罗里达州29个区的凶杀案件中凶手的肤色和是否被判死刑的326个犯人的情况如下,问是否存在种族歧视与审判不公?,The end! 谢谢!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号