17 第十三章 分类数据的假设检验

上传人:飞*** 文档编号:5330995 上传时间:2017-08-07 格式:PPT 页数:35 大小:350.50KB
返回 下载 相关 举报
17 第十三章 分类数据的假设检验_第1页
第1页 / 共35页
17 第十三章 分类数据的假设检验_第2页
第2页 / 共35页
17 第十三章 分类数据的假设检验_第3页
第3页 / 共35页
17 第十三章 分类数据的假设检验_第4页
第4页 / 共35页
17 第十三章 分类数据的假设检验_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《17 第十三章 分类数据的假设检验》由会员分享,可在线阅读,更多相关《17 第十三章 分类数据的假设检验(35页珍藏版)》请在金锄头文库上搜索。

1、第十三章 分类资料的假设检验卡方(2)检验,卡方分布适合性检验独立性检验分布的假设检验,2,2 (chi-square)分布,定义设随机变量X1, X2, , Xn彼此独立且都服从标准正态分布 N(0, 1),则随机变量,服从自由度为n的2分布,记为,3,2 分布,性质2 分布随机变量的取值范围为(0,)若Y1 2 (n),Y2 2 (m),且相互独立,则Y1 Y2 2 (n m)2 分布为非对称分布,其分布曲线的形状由自由度决定,自由度越大,分布越趋于对称(见教材 p.70,图6.4)当 n , 2 (n) N(n, 2n),4,2 分布,与2 分布有关的表格,1. 附表3:2 分布上侧分位

2、数表,5,卡方检验,用于分类资料的概率分布的假设检验检验统计量,Oi :第 i 类别中的观察频数Ei :第 i 类别中的理论频数(基于原假设计算) : 对所有类别求和,6,卡方检验,注意事项卡方检验只是近似检验样本不能太小,每个类别中的理论频数不能小于5当卡方分布的自由度等于1时,最好对2统计量进行连续性校正(尤其是在样本较小的情况下),7,适合性检验,检验不同类别出现的比例是否符合某个理论比例例1:Mendel在其豌豆杂交试验中得到以下结果:,P1: 红花,P2: 白花,F1: 红花 ,F2: 红花 705 白花 224 (3.15 : 1),问F2中红花和白花植株出现的比例是否符合3:1的

3、理论比例。,8,适合性检验,H0: 观察的频率分布与理论频率分布相符 HA: 观察的频率分布与理论频率分布不符检验统计量,否定域:,=显著性水平,查附表4,9,适合性检验,例1 F2中红花和白花的理论频数分别为 696.75 (=929*3/4) 和 232.25 (=929-696.75),F2中红花和白花的频数分布符合3:1,或,10,独立性检验,检验分类资料的分布在两个或多个群体(处理)中是否相同 例2 为检验某种新措施对仔猪白痢的治疗效果是否优于传统措施,试验后得到以下数据,死亡 存活 合计 治愈率,新措施传统措施合计,132 18 150 88% 114 36 150 76% 246

4、 54 300 82/%,11,独立性检验,列联表(contingency table),检验在不同处理中不同类别的频率分布是否相同 不同类别的分布与处理无关(独立),12,独立性检验,卡方检验H0:不同类别的分布与处理无关 HA:不同类别的分布与处理有关检验统计量,13,独立性检验,例2 理论频数,14,独立性检验,新措施可显著提高仔猪白痢的治愈率,检验统计量,或,15,独立性检验,22列联表2统计量的简化计算,16,独立性检验,22列联表的Fisher精确检验可用于小样本(理论频数小于5)的情形,例3:用A和B两种药物各治疗9个病人,结果如下,痊愈 未愈 合计,A药B药合计,8 1 9 3

5、 6 9 11 7 18,问两种药物的疗效有无显著差别,17,独立性检验,检验步骤1)在保持边际和不变时,列出2*2列联表的所有可能排列,9 02 7,8 13 6,7 24 5,6 35 4,5 46 3,4 57 2,3 68 1,2 79 0,(1) (2) (3) (4),(5) (6) (7) (8),18,独立性检验,2)计算在原假设(两种药物的治愈率相同)成立的条件下每种排列出现的概率,19,独立性检验,20,独立性检验,3)检验统计量: X=用A药的未愈数=1,双侧检验(HA:两种药物的治愈率不等):,单侧检验(HA:A药的治愈率高于B药):, 两尾概率 0.05 两种药物的治

6、愈率差异显著, 右尾概率0.05 A药的治愈率显著高于B药,21,独立性检验,配对22列联表的检验 例4:用叩诊和X-照射对相同的病人进行肺结核诊断,结果如下,叩诊 阴性 阳性,阴性阳性,a b c d,问两种诊断方法有无差别,X-照射,22,独立性检验,只有 b 和 c 能提供两种方法有无差别的信息H0:两种方法无区别(Pb = Pc = 1/2)检验统计量:,或,23,对分布类型的检验,对总体是否服从某种分布进行检验检验统计量,c:用样本资料估计的总体参数的个数,24,分布的假设检验,二项分布的假设检验例:现有116窝窝产5头仔猪的资料如下,试利用该资料检验窝产雄性仔猪数是否服从二项分布。

7、,25,分布的假设检验,H0: X B(5, 0.5),26,分布的假设检验,检验统计量,接受原假设,窝产雄性仔猪数服从二项分布。,27,分布的假设检验,泊松分布的假设检验泊松分布(Poisson distribution)稀有事件发生次数的概率分布二项分布的一种特殊形式 例:在某个人群中某个稀有疾病的发病个体数, 一个显微镜视野内观察到的细菌数概率函数, = 总体均数 = 总体方差,X P(),28,分布的假设检验,例:现有在不同显微镜视野内观察到的酵母菌数资料如下,试利用该资料检验视野内的酵母菌数是否服从泊松分布。,H0: X P(1.8),29,分布的假设检验,4,4.14,30,分布的

8、假设检验,检验统计量,接受原假设,视野内的酵母菌数服从泊松分布,31,世界杯中的统计学,在2002年韩日世界杯的64场比赛中,各队每场进球数大部分是0,1,2个,个别队是5个以上进球,最多的是8个进球。强队大都能进球、赢球(如巴西队),弱队大都不能进球,总是输(如中国队)。下面是每场各队进球数(不包括点球):,每场各队进球数 场数 0 37 1 47 2 27 3 13 4 2 5 1 6 1,试检验每场各队进球数是否服从泊松分布。,32,分布的假设检验,正态分布的假设检验将样本资料分组并计算各组的观察频数计算样本平均数 和样本方差S2,作为总体均数和总体方差的估计值 H0:,计算在原假设成立

9、条件下随机变量在各组范围内取值的概率和各组的理论频数将理论频数小于5的组合并计算卡方检验统计量统计推断(卡方检验统计量的自由度为 k-2-1),33,卡方检验的分解,目的:进一步对有2个以上类别的分类资料的比例分布偏离理论分布的现象做出解释例:灰色长翅 灰色残翅 黑色长翅 黑色残翅 合计 175 42 38 25 280 经卡方检验,这个分布与9:3:3:1的理论比例有显著差异,9:3:3:1成立的充要条件:1)灰色:黑色 = 3:12)长翅:残翅 = 3:13)体色与翅型彼此独立(不连锁),34,卡方检验的分解,检验1:H0:灰色:黑色 = 3:1, HA:灰色:黑色 3:1,检验2:H0:长翅:残翅 = 3:1, HA:长翅:残翅 3:1,35,卡方检验的分解,检验3:H0:体色和翅型是独立的, HA:体色和翅型不独立,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号