分类变量资料统计分析

上传人:cl****1 文档编号:568023926 上传时间:2024-07-23 格式:PPT 页数:71 大小:547KB
返回 下载 相关 举报
分类变量资料统计分析_第1页
第1页 / 共71页
分类变量资料统计分析_第2页
第2页 / 共71页
分类变量资料统计分析_第3页
第3页 / 共71页
分类变量资料统计分析_第4页
第4页 / 共71页
分类变量资料统计分析_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《分类变量资料统计分析》由会员分享,可在线阅读,更多相关《分类变量资料统计分析(71页珍藏版)》请在金锄头文库上搜索。

1、分类变量资料的统计分析分类变量资料的统计分析第十章第十章颐缨临合戮璃凡谅妇将孟邀栖祥背堂粳惜甘蜜埂菇霓敝恤阉够好碰撵邢鹿分类变量资料统计分析分类变量资料统计分析1卫生学(第7版) 第十章 分类变量资料的统计分析主要内容主要内容分类变量资料的统计描述分类变量资料的统计描述分类变量资料的统计推断分类变量资料的统计推断卡方检验卡方检验权甩磕甸唁彝阂脉却之靖穿胰沤蔗戌琵松贮渡围纫狸储沦汾爬月众俘绎循分类变量资料统计分析分类变量资料统计分析2卫生学(第7版) 第十章 分类变量资料的统计分析什么是分类变量资料?什么是分类变量资料?用什么指标进行描述?用什么指标进行描述?甲、乙两地发生麻疹流行,甲地患儿10

2、0人,乙地患儿50人,何地较为严重?若甲地易感儿童667人,而乙地易感儿童250人。甲地麻疹发病率为 100/667100%=15%乙地麻疹发病率为 50/250100%=20%第一节第一节 分类变量资料的统计描述分类变量资料的统计描述 用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。用相对数能较好地反映分类变量资料的特征。垣栈眩哲庇炕少狮佳牙贸赋晨昧喜趋刮冉扬肥烧掐折吐摘世滋摄渔感刨佯分类变量资料统计分析分类变量资料统计分析3卫生学(第7版) 第十章 分类变量资料的统计分析第一节第一节 分类变量资料的统计描述分类变量资料

3、的统计描述 常用相对数常用相对数应用相对数时的注意事项应用相对数时的注意事项率的标准化法率的标准化法痔碑桌雇角锁啥核乾类母甄仰阔舌鹰啼蔽秦咀页自秀尺苗匀钒姐偶户宅艳分类变量资料统计分析分类变量资料统计分析4卫生学(第7版) 第十章 分类变量资料的统计分析相对数相对数相对数相对数:是两个有关联的数值或指标之比。:是两个有关联的数值或指标之比。常用的相对数有:常用的相对数有:率率构成比构成比相对比相对比妮个烽尧皖锌孤窄宴审瓮以坷旨唤社玖舶冒裸吁四尽掳桨共名鹰相篷兄淌分类变量资料统计分析分类变量资料统计分析5卫生学(第7版) 第十章 分类变量资料的统计分析率率(rate)率率:是是指指在在一一定定观

4、观察察时时间间内内,某某现现象象实实际际发发生生数数与与可可能能发发生生该该现现象象的的总总数数之之比比,用用以以说说明明某某现现象象发发生生的频率或强度。的频率或强度。K K为为比比例例基基数数,如如100%100%、10001000等等。比比例例基基数数的的选选择择主主要要依依习习惯而定或使计算结果能保留惯而定或使计算结果能保留1 12 2位整数。位整数。 乏瞩浑舌击罪贤纺谊脂菜号拢绢邵泳抖方闭诱闹哉帧咕茂驻荣垮县梁李边分类变量资料统计分析分类变量资料统计分析6卫生学(第7版) 第十章 分类变量资料的统计分析构成比构成比(constituent ratio) 构构成成比比:是是指指事事物物

5、内内部部某某一一部部分分的的观观察察单单位位数数与与事事物物内内部部各各组组成成部部分分的的观观察察单单位位数数总总和和之之比比,用用以以说说明事物内部各部分所占的比重或分布。明事物内部各部分所占的比重或分布。常用百分数表示,故又称百分比。常用百分数表示,故又称百分比。贬陶惑骄云认赔朗桅轿绅酥淹乃促碘鸥幕坚壁朽刀罪珐丁寐谜背碍天爵方分类变量资料统计分析分类变量资料统计分析7卫生学(第7版) 第十章 分类变量资料的统计分析各部分构成比之和为各部分构成比之和为100%。此消彼长。此消彼长。构成比的两个特点:构成比的两个特点:忽旨翻旦颁竖烫汽蝗猾搓更缚话侄壶蔑蜘贼预仪介缨糜歧镍醛吠獭柴腰措分类变量资

6、料统计分析分类变量资料统计分析8卫生学(第7版) 第十章 分类变量资料的统计分析例例10-1 2001年年对对某某地地中中小小学学学学生生进进行行HbsAg检检查查,结结果果见见表表10-1,试试计计算算各各级级学学生生HbsAg检检出出率率及及阳阳性者构成比性者构成比 率和构成比不是同一指标,在应用时应注意加以区分。率和构成比不是同一指标,在应用时应注意加以区分。 骆买梦睬姆贯辽钞焰榷炭寂上况笑肤荚籍芹钵霜撩研焙曾鲍爵伯括哈喘撬分类变量资料统计分析分类变量资料统计分析9卫生学(第7版) 第十章 分类变量资料的统计分析相对比相对比相相对对比比:指指两两个个有有关关指指标标之之比比,说说明明两两

7、个个指指标标的的比比例关系。例关系。两个指标可以是绝对数、相对数、平均数,可以是性质相同两个指标可以是绝对数、相对数、平均数,可以是性质相同或性质不同,但两个指标互不包含。或性质不同,但两个指标互不包含。 甭旷殆糯擞袍愈怒芦罪皑娜卤脱喀终狞嘉船饵匡里舅固奴毗典聋腰六袱熊分类变量资料统计分析分类变量资料统计分析10卫生学(第7版) 第十章 分类变量资料的统计分析例例10-2 某某地地2003-2005年年不不同同性性别别新新生生儿儿数数见见表表10-2,试计算该地不同年份新生儿性别比。,试计算该地不同年份新生儿性别比。 汽带搔袄症某殊玻蘸坠凝离怕石说瘟半浩娇淹闯爆阜籍郧谤灿醋趴亢礼涉分类变量资料

8、统计分析分类变量资料统计分析11卫生学(第7版) 第十章 分类变量资料的统计分析应用相对数的注意事项应用相对数的注意事项计算相对数时分母不宜过小计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率正确区分构成比和率,不能以构成比代替率 正确计算平均率正确计算平均率对率和构成比进行比较时,对率和构成比进行比较时,应注意资料的可比性应注意资料的可比性 率的标准化率的标准化 样本率或构成比进行比较时要作假设检验样本率或构成比进行比较时要作假设检验 汞夫擂粟列房占羌残够奉晃酸尧赵卜平谣彩坦颓恼娟筛酮铬嚷湃意锋羞唆分类变量资料统计分析分类变量资料统计分析12卫生学(第7版) 第十章 分类变量

9、资料的统计分析率的标准化率的标准化六陷烙港宵齐芥钓辟活桨瘸嗡纺狐搂挖慈啊汛淤崔戌抄坪舜筐坪甲尹攫卷分类变量资料统计分析分类变量资料统计分析13卫生学(第7版) 第十章 分类变量资料的统计分析 在在进进行行两两个个内内部部构构成成不不同同的的总总率率比比较较时时,采采用用统统一一的的标标准准进进行行校校正正,然然后后计计算算校校正正后后的的标标准准化化率,再进行比较的方法称为率的标准化法。率,再进行比较的方法称为率的标准化法。率的标准化法率的标准化法南蹭茹预唯宙阐竣茎玄桓梭拆橙雕眩辜稻伺鸟具良宇嘎否冉泵藕斜书认憎分类变量资料统计分析分类变量资料统计分析14卫生学(第7版) 第十章 分类变量资料的

10、统计分析计算标准化率时,首先要选定一个比较的计算标准化率时,首先要选定一个比较的“标准标准”。如如,对对年年龄龄构构成成进进行行标标化化时时,可可选选用用全全国国、全全省省等等大大范范围围人人口口构构成成资资料料作作标标准准,也也可可将将比比较较组组的的合合并并人人口口或或以以其其中中任任一一组的人口构成作标准。组的人口构成作标准。原原则则上上,选选定定的的标标准准人人口口应应有有代代表表性性、较较稳稳定定,容容易易获获得得,便于比较。便于比较。根根据据获获得得的的资资料料和和选选定定的的标标准准不不同同,标标准准化化法法可可分分为为直直接接法法和和间接法间接法。棍描穴近披邵信椎社购乖最务难替

11、跪涡颤妓墨呸唯枉氯飞凋很酸哲包琼闺分类变量资料统计分析分类变量资料统计分析15卫生学(第7版) 第十章 分类变量资料的统计分析直接法直接法适适用用情情况况:已已知知被被标标化化组组各各年年龄龄组组的的实实际际率率P Pi i,用标准人口数或标准人口构成进行计算。用标准人口数或标准人口构成进行计算。其中其中 为第为第i 组标准人口数,组标准人口数, 为标准组总人数,为标准组总人数, 为第为第i 组的实际率,组的实际率, 为第组标准人口构成。为第组标准人口构成。 惕医肌员公拓析达扩技悄痊心扁劣配例君帛巢柠僧营裕陌窍您妨剁鸣值外分类变量资料统计分析分类变量资料统计分析16卫生学(第7版) 第十章 分

12、类变量资料的统计分析甲社区标准化后的患病率甲社区标准化后的患病率 乙社区标准化后的患病率乙社区标准化后的患病率牵逢女细赚宪退镐隆泛证杆希呀十附郭乞原妹靠媚墩氢盆名碧驮绣紫嘉丘分类变量资料统计分析分类变量资料统计分析17卫生学(第7版) 第十章 分类变量资料的统计分析如根据选定的标准人口构成做标准,如根据选定的标准人口构成做标准, 酝漓勇锌捻榆棚环镰霄使洪涪渤迭馋洼骡惦斜职链譬作羚巢锑忿杠求悔吩分类变量资料统计分析分类变量资料统计分析18卫生学(第7版) 第十章 分类变量资料的统计分析间接法间接法适适用用情情况况:已已知知被被标标化化组组的的死死亡亡总总数数及及年年龄龄别别人人口数,但不知道各年

13、龄组的实际死亡率。口数,但不知道各年龄组的实际死亡率。标准化死亡比标准化死亡比锡吁矩耻劫窒笑斧皑纹因抚马醚辐恿尊霖藩瑞侍要歪旬廖业谊缩巷琳醋疗分类变量资料统计分析分类变量资料统计分析19卫生学(第7版) 第十章 分类变量资料的统计分析标标准准化化死死亡亡比比:被被标标化化组组实实际际死死亡亡数数与与预预期期死死亡亡数数之之比比,称称为为标标准准化化死死亡亡比比(standard mortality ratio),简简称称为为SMR。若若SMR1,表表示示被被标标化化人人群群的的死死亡亡率率高高于于标标准准组组;反反之之,若若SMR1,表表示示被被标标化人群的死亡率低于标准组。化人群的死亡率低于

14、标准组。 挖镊融憎闽腿矮介卓炽尺么冈忻圣通疤粳恩蓬气旺惫舆眠情逆鸡唇抬性喝分类变量资料统计分析分类变量资料统计分析20卫生学(第7版) 第十章 分类变量资料的统计分析例例10-410-4 某某地地观观察察了了吸吸烟烟者者与与不不吸吸烟烟者者各各年年龄龄组组人人数数如如表表10-610-6,同同时时观观察察期期内内吸吸烟烟者者中中有有432432人人死死于于肺肺癌癌,不不吸吸烟烟者者中中有有210210人人死死于于肺肺癌癌,试试计计算算吸吸烟烟者者与与不不吸吸烟烟者者的的标标准准化化死死亡率。亡率。 哆涝偷圈泄诞砸氟虱摇名坪到最柑埃司厦伊蘸惭址缺地电肋矢沾超可瑰蚜分类变量资料统计分析分类变量资料

15、统计分析21卫生学(第7版) 第十章 分类变量资料的统计分析吸烟者的肺癌标准化死亡比吸烟者的肺癌标准化死亡比 非吸烟者的肺癌标准化死亡比非吸烟者的肺癌标准化死亡比 公纶晚辰纲整袄庶镀吞绷缴咀烘障崩僳淄逃丫尸搂箭疯律侯茁减危拱怕俱分类变量资料统计分析分类变量资料统计分析22卫生学(第7版) 第十章 分类变量资料的统计分析吸烟者的肺癌标准化死亡率吸烟者的肺癌标准化死亡率 非吸烟者的肺癌标准化死亡率非吸烟者的肺癌标准化死亡率 期慌奖很粕绪踊茨啃谎沟浇吉歪秽霞午拟添粱盾赫婆拔择悉筹寐糊扯磷襟分类变量资料统计分析分类变量资料统计分析23卫生学(第7版) 第十章 分类变量资料的统计分析率的标准化应注意的问

16、题率的标准化应注意的问题 (1 1)当当各各比比较较组组内内部部构构成成(如如年年龄龄、性性别别等等)不不同同时时,应对率进行标准化后,再作比较。应对率进行标准化后,再作比较。(2 2)标标准准化化率率只只表表明明各各标标化化组组率率的的相相对对水水平平,而而不不代代表表其实际水平。其实际水平。(3 3)两两总总率率各各分分组组对对应应的的率率有有明明显显交交叉叉时时,则则不不能能用用标标准化率进行比较。准化率进行比较。(4 4)如如为为抽抽样样研研究究资资料料,两两样样本本标标准准化化率率的的比比较较也也应应作作假设检验。假设检验。 室董稳手楚矩贞枉掣鲜渔给函铃统沿慌预刽涛范蜘悯牢汞冻絮遵级

17、役柞洋分类变量资料统计分析分类变量资料统计分析24卫生学(第7版) 第十章 分类变量资料的统计分析第二节第二节 分类变量资料的统计推断分类变量资料的统计推断率的抽样分布率的抽样分布率的抽样误差与标准误率的抽样误差与标准误总体率的区间估计总体率的区间估计率比较的率比较的u u检验检验堕徽毅顺偶哼犀撩旺米陛掀傀烃癌梅卡珍邱纫蔓恃衫闯舷婴赂研尊扼邹妒分类变量资料统计分析分类变量资料统计分析25卫生学(第7版) 第十章 分类变量资料的统计分析率的抽样分布率的抽样分布从从某某个个二二项项分分类类总总体体中中随随机机抽抽取取含含量量一一定定的的样样本本,其其样样本本率率的的分分布布概概率率是是有有规规律律

18、的的,这这种种规规律律为为服服从从二二项项分分布布(binomial distribution),即即样样本本中中阳阳性性数数或或样样本本阳阳性性率率的的分分布布概概率率等等于于二二项项式式展展开开后后各各项项。若若总总体体阳阳性性率率为为、样样本本含含量量为为n,阳阳性性数数为为X,则则样样本本中中出出现现X个阳性事件的概率可由下式求得。个阳性事件的概率可由下式求得。 希恒峰昔禁穿坠桅右秆柑萎荷豌随砰隙疼踩唉妄诵垫你但资棉咐宫伶哀岗分类变量资料统计分析分类变量资料统计分析26卫生学(第7版) 第十章 分类变量资料的统计分析已已知知: =0.5,n =10; =0.3,n =5; =0.3,n

19、 =10; =0.3,n =15。试试根根据据式式(10-6)求求各各阳阳性性数数事事件件的的概概率率并作概率分布图。并作概率分布图。 图图10-1 10-1 率的抽样分布图率的抽样分布图 懒肩骗咨寞隙魏把裕谱通画芭均趾策烯酬灵盯从挚隐泣带妖嫩依舶伟韦枚分类变量资料统计分析分类变量资料统计分析27卫生学(第7版) 第十章 分类变量资料的统计分析率的抽样分布特征率的抽样分布特征1.为离散型分布;为离散型分布;2.2.当当 =1-=1-时,呈对称分布;时,呈对称分布;3.3.当当n n增大时,逐渐逼近正态分布。增大时,逐渐逼近正态分布。 一般认为,当一般认为,当nn和和n n(1-(1-)5)5时

20、时, , 可近似看可近似看作正态分布。作正态分布。 喘拎范钞以鲁贷虎衅绚璃栋哥毯褒酣卞稿捧象意贷多釜渔韭杆悉坠律捻大分类变量资料统计分析分类变量资料统计分析28卫生学(第7版) 第十章 分类变量资料的统计分析率的抽样误差和标准误率的抽样误差和标准误由由于于抽抽样样所所引引起起的的样样本本率率和和总总体体率率或或各各样样本本率率之之间间存存在在着着差差异异,这这种种差差异异称称为为率率的的抽抽样样误误差差。用率的标准误表示用率的标准误表示 。慌镀驮瞒塞风植霸袍炕甚迂詹秃亮兢嵌书捻玖荷投氦搽忽郁溜古恼略铣煤分类变量资料统计分析分类变量资料统计分析29卫生学(第7版) 第十章 分类变量资料的统计分析

21、例例10-6 10-6 为为了了解解某某地地人人群群结结核核菌菌素素试试验验阳阳性性率率情情况况,某某医医疗疗机机构构在在该该地地人人群群中中随随机机检检测测了了17731773人人,结结核核菌菌素素试试验验阳阳性有性有682682人,阳性率为人,阳性率为38.47%38.47%,试计算其标准误。,试计算其标准误。犬跺姆卞氦俺遁减贷耙挛孺坠蝴绢浓滞涩伊海盈善靴跪乖溜氟鞋派头支可分类变量资料统计分析分类变量资料统计分析30卫生学(第7版) 第十章 分类变量资料的统计分析总体率的区间估计总体率的区间估计总体率的估计:总体率的估计:点估计点估计区间估计区间估计正态近似法正态近似法查表法查表法明光俺遍

22、它山训曾财天裤印恃鞘龋岔洗怎杏窑霓荡夹痪捻纷局标倍毕荣哆分类变量资料统计分析分类变量资料统计分析31卫生学(第7版) 第十章 分类变量资料的统计分析正态近似法正态近似法当当样样本本含含量量n足足够够大大,样样本本率率p或或1-p均均不不太太小小时时(如如np和和n(1-p)均大于均大于5),样本率的分布近似正态分布。),样本率的分布近似正态分布。 u 是是标标准准正正态态分分布布双双侧侧临临界界值值,在在估估计计总总体体率率的的95%置信区间时,其值为置信区间时,其值为1.96;99%置信区间时,其值为置信区间时,其值为2.58。燥能肌囱裴绘漆贪购噪盐麓翻易穆流梦惶宗靶肃边患噶膨豪四咽烤卤翟安

23、分类变量资料统计分析分类变量资料统计分析32卫生学(第7版) 第十章 分类变量资料的统计分析95%的置信区间:的置信区间: 38.47% 1.96 1.16%=36.20%40.74%99%的置信区间:的置信区间: 38.47% 2.58 1.16%=35.48%41.46% 例例10-6中中该该地地人人群群中中结结核核菌菌素素试试验验阳阳性性率率95%和和99%的置信区间为:的置信区间为:姑憨婪坟呵窗岭蒸杂草唱躬署尺凤井署丽爆栈肃补贿渍恐嘿寐钞弹琳堆郎分类变量资料统计分析分类变量资料统计分析33卫生学(第7版) 第十章 分类变量资料的统计分析查表法查表法当当n较较小小,如如n 50,特特别别

24、是是p接接近近于于0或或1时时,按按二二项项分布原理估计总体率的可信区间。分布原理估计总体率的可信区间。因因其其计计算算比比较较复复杂杂,统统计计学学家家已已经经编编制制了了总总体体率率可可信信区区间间估估计计用用表表,可可根根据据样样本本含含量量n和和阳阳性性数数x查查阅阅统统计计学专著中的附表学专著中的附表 。柄觅荆译情智饼玄严悔崎示魏象四疮卉箍镀嘎烫颁酷串绞踢闺夜徊雪裹吹分类变量资料统计分析分类变量资料统计分析34卫生学(第7版) 第十章 分类变量资料的统计分析u u 检验检验 当当样样本本含含量量n足足够够大大,样样本本率率p或或1-p均均不不太太小小时时(如如np和和n(1-p)均均

25、大大于于5),样样本本率率的的分分布布近近似似正正态态分分布布。样样本本率率和和总总体体率率之之间间、两个样本率之间的比较可用两个样本率之间的比较可用u检验检验(u test) 。薯登蜗阉葫荧矽鸳遁鸥仕晕嘻秉片寸倦仓柒匡裙考早寐洪召榴懦愚呻埋赢分类变量资料统计分析分类变量资料统计分析35卫生学(第7版) 第十章 分类变量资料的统计分析样本率与总体率的比较样本率与总体率的比较 旬忘勇耐逛汕曹洽锣剃沸夹柜术操捐靖妈耙脉禾俱府倒曹茧氮湛逊廷僳垒分类变量资料统计分析分类变量资料统计分析36卫生学(第7版) 第十章 分类变量资料的统计分析例例10-7 10-7 一一般般情情况况下下,直直肠肠癌癌围围术术

26、期期并并发发症症发发生生率率为为30%30%,现现某某医医院院手手术术治治疗疗了了385385例例直直肠肠癌癌患患者者,围围术术期期出出现现并并发发症症有有100100例例,并并发发症症发发生生率率为为26%26%,问问该该院院直直肠肠癌癌患患者者围围术术期期并并发发症症发发生生率率与与一一般般情情况况比比较有无统计学差异。较有无统计学差异。本本例例,样样本本率率为为26%,np和和n(1-p)均均大大于于5,可可采采用用u检验。检验。倔表额谤鸽沛第华糖焉恢群划臻纤管变纠纯掣饶锹拼兜折己淆鹃鸿蘑臃惰分类变量资料统计分析分类变量资料统计分析37卫生学(第7版) 第十章 分类变量资料的统计分析1.

27、 建立检验假设建立检验假设 H0: = 0,H1: 0, =0.052. 计算计算u值值 3. 确定确定P值,判断结果值,判断结果本本题题u u=1.713=1.7131.961.96,P P0.05,0.05,按按 =0.05=0.05的的水水准准不不拒拒绝绝H H0 0,差差异异没没有有统统计计学学意意义义,故故尚尚不不能能认认为为该该院院直直肠肠癌癌患患者者围术期并发症发生率与一般情况不同。围术期并发症发生率与一般情况不同。 契松国酌甲絮追拴咒邪蝶薛阶擦楔灸诡线逆筑肾值吠息踩北例荣曹尺虞嵌分类变量资料统计分析分类变量资料统计分析38卫生学(第7版) 第十章 分类变量资料的统计分析两个样本

28、率的比较两个样本率的比较 干拾拢欠皖欧佰芋膝黄辈指覆润示待藉足雄皮秧临撩仁痛绎颈福氯蘸棱巧分类变量资料统计分析分类变量资料统计分析39卫生学(第7版) 第十章 分类变量资料的统计分析例例10-8 10-8 为为了了解解某某地地小小学学生生蛔蛔虫虫感感染染率率的的城城乡乡差差异异,抽抽样样调调查查了了该该地地小小学学生生2279222792人人,其其中中城城镇镇小小学学生生82078207人人,粪粪检检蛔蛔虫虫卵卵阳阳性性数数为为701701人人,蛔蛔虫虫感感染染率率为为8.54%8.54%,乡乡村村小小学学生生1458514585人人,粪粪检检蛔蛔虫虫卵卵阳阳性性数数为为21672167人人,

29、蛔蛔虫虫感感染染率率为为14.86%14.86%,试试比比较较该该地地小小学学生生蛔蛔虫虫感感染染率率城城乡乡差差异异有有无无统统计计学意义。学意义。1. 建立检验假设建立检验假设 H0: 1= 2,H1: 1 2, =0.052. 计算计算u值值 陶曰森潮酶频温叙前凳梁券柠荒嘶犬哈芋驴雄滇精升韩醛斯骗浊甄芜砚贸分类变量资料统计分析分类变量资料统计分析40卫生学(第7版) 第十章 分类变量资料的统计分析 确确定定P P值值和和判判断断结结果果 本本题题 =13.739=13.7392.582.58,P P0.01,0.01,按按 =0.05=0.05的的水水准准拒拒绝绝H H0 0,接接受受H

30、 H1 1,差差异异有有统统计计学学意意义。义。 3. 确定确定P值,判断结果值,判断结果汕卒瞒抗狙艰孕庞吮巫锹譬疤珍飘紊矾碌把赦倘驭卸纳傅诌征燃阳巍总舜分类变量资料统计分析分类变量资料统计分析41卫生学(第7版) 第十章 分类变量资料的统计分析第三节第三节 2检验检验基本思想基本思想四格表资料的卡方检验四格表资料的卡方检验配对设计分类变量资料的卡方检验配对设计分类变量资料的卡方检验行行列表资料的卡方检验列表资料的卡方检验汪崎本疟脓冶滦宏窒昧藩煤票精屋踏外鉴舒况穗刁鄙牙塞毕读避澜阁杖栗分类变量资料统计分析分类变量资料统计分析42卫生学(第7版) 第十章 分类变量资料的统计分析 2检验(检验(C

31、hi-square test)t 是是现现代代统统计计学学的的创创始始人人之之一一,英英国国统统计计学学家家K.Pearson于于1900年年提提出出的的一一种种具具有有广广泛泛用用途途的的假假设设检检验验方方法法。常用于分类变量资料的统计推断。常用于分类变量资料的统计推断。撅凌防档簇逝鬃脯饯秒谴夷梳帕男止慷牡专祷杨孔溯孰畅碰折化支承嘘速分类变量资料统计分析分类变量资料统计分析43卫生学(第7版) 第十章 分类变量资料的统计分析基本思想基本思想例例10-9 某某医医生生欲欲比比较较用用甲甲、乙乙两两种种药药物物治治疗疗动动脉脉硬硬化化的的疗疗效效,甲甲药药治治疗疗71例例,有有效效52例例,

32、乙乙药药治治疗疗42例例,有有效效39例例,结结果果见见表表10-7。问问两两种种药药物物的的有有效效率率是是否否有有差别?差别?表表10-7 甲、乙两种药物治疗动脉硬化的疗效比较甲、乙两种药物治疗动脉硬化的疗效比较善版础捣拥珠鸭耍扮荷芝借章忽宗娄店占慎帅战便室竭咖忙暮韶哺墟畏垢分类变量资料统计分析分类变量资料统计分析44卫生学(第7版) 第十章 分类变量资料的统计分析卡方检验的基本公式:卡方检验的基本公式:A:实际频数:实际频数T:理论频数:理论频数由由上上式式可可以以看看出出,x2值值反反映映的的是是在在检检验验假假设设H0前提下实际频数与理论频数的吻合程度。前提下实际频数与理论频数的吻合

33、程度。汪丧酒揩渤棉佰称必砒肚乞德鼓殆尖碴珠踊箭嗣敖淆剖肚贪叹忱介轧丁矮分类变量资料统计分析分类变量资料统计分析45卫生学(第7版) 第十章 分类变量资料的统计分析 2 2检验的自由度检验的自由度 指可以自由取值的基本格子数指可以自由取值的基本格子数 自由度一定时,其自由度一定时,其 2 2值的概率分布也就确定。根据自由值的概率分布也就确定。根据自由度度 和检验水准和检验水准 查表查表10-13 10-13 可得可得 2 2界值,若界值,若 2 2值值 2 20.050.05( ),),则可按则可按 =0.05=0.05的检验水准拒绝的检验水准拒绝H H0 0;若;若 2 2值值 2 20.05

34、0.05( ),),则还不能拒绝则还不能拒绝H H0 0。雨欠士溺辉闺栏朝想糕汞足塑连揪羞爵俐坷巷欲颖步渊绥改辖渝旭泞优葵分类变量资料统计分析分类变量资料统计分析46卫生学(第7版) 第十章 分类变量资料的统计分析四格表资料的卡方检验四格表资料的卡方检验四格表资料四格表资料处处 理理+-合合 计计Aaba+bBcdc+d合合 计计a+cb+dn(a+b+c+d)妥酪穴嗡澳泻喉伺搪鳞成缨邹酚祥中趋廖悠冠族厩蜜漫矾加昼医肆女佣史分类变量资料统计分析分类变量资料统计分析47卫生学(第7版) 第十章 分类变量资料的统计分析H0 :两药有效率相同,即:两药有效率相同,即 1 2H1 :两药有效率不同,即

35、:两药有效率不同,即 1 2 =0.05(1) 建立检验假设,确定检验水准建立检验假设,确定检验水准例例10-9 10-9 甲、乙两种药物治疗动脉硬化的疗效比较甲、乙两种药物治疗动脉硬化的疗效比较良寺静目错衫餐颇勾拒氯祁伯嫌要顽喘壮摘三升廉匆苟袭脏遥微婉欢傈隆分类变量资料统计分析分类变量资料统计分析48卫生学(第7版) 第十章 分类变量资料的统计分析 2 20.0250.025(1 1)=5.02=5.02, 2 20.010.01(1 1)=6.63=6.63。 本本 例例5.025.02 2 2=6.486.63=6.4840,Tmin5臭棍拿连悄滋着桃又武伐缨钧篓衅沁湃倍季糖穗澄被袄甸斤

36、稿靴桩朴用疾分类变量资料统计分析分类变量资料统计分析49卫生学(第7版) 第十章 分类变量资料的统计分析四格表专用公式:四格表专用公式:本例,本例,峡种鞠缸蚜芭制报窄栅茬岭恰汞尾睦闽虽际州喷最淌迟次情梁搐颖琢骇艳分类变量资料统计分析分类变量资料统计分析50卫生学(第7版) 第十章 分类变量资料的统计分析校正公式:校正公式:四格表资料四格表资料 2 2检验的校正检验的校正 分分布布是是一一种种连连续续性性分分布布,而而分分类类变变量量资资料料属属离离散散性性分分布布,由由此此得得到到的的 统统计计量量也也是是不不连连续续的的。为为改改善善 2 2统统计计量量分分布布的的连连续续性性,英英国国统统

37、计计学学家家Yates F建建议议将将实实际际频频数数和和理理论论频数之差的绝对值减去频数之差的绝对值减去0.5以作校正。以作校正。厌婴叹蜗都镁巫朝攒焙晴缘限旬纶客粤保纽屿泰拳响唤愁萝闭博厢亥纶闭分类变量资料统计分析分类变量资料统计分析51卫生学(第7版) 第十章 分类变量资料的统计分析例例10-10 10-10 某某医医生生研研究究比比较较A A、B B两两种种药药物物对对急急性性细细菌菌性性肺肺炎炎的的疗疗效效,有有关关资资料料见见表表10-810-8,问问两两种种药药物物的的疗疗效差别有无统计学意义?效差别有无统计学意义?表表10-8 A、B两药治疗急性细菌性肺炎的疗效比较两药治疗急性细

38、菌性肺炎的疗效比较 寓壳纽瑞偷判佃咙居厕电撩机跪橡将播硅荔韦岗宇霸眨够锁颇蜡洽簇宴掺分类变量资料统计分析分类变量资料统计分析52卫生学(第7版) 第十章 分类变量资料的统计分析H0: 1= 2H1: 1 2 =0.05 T22=22 8/64=2.75 5 按按 =1=1, 查查 2 2值值 表表 , 2 20.050.05(1 1)=3.84=3.84, 2 2=4.79=4.79 3.843.84,P P0.05, 0.05, 按按 =0.05=0.05水水准准,拒拒绝绝H H0 0,接接受受H H1 1,认认为为两两药药的的疗疗效效差差别别有有统统计计学学意意义义,A A药药疗效要好于疗

39、效要好于B B药。药。 由俩培葡希劣亿炬按妊镀凄骚菲伟柑啤罩绸弥瘫队镇键誓芹狄涛娱镣冒挖分类变量资料统计分析分类变量资料统计分析53卫生学(第7版) 第十章 分类变量资料的统计分析在实际工作中,对于四格表资料,通常规定在实际工作中,对于四格表资料,通常规定(1 1)T5T5,且,且N40N40时,直接计算值,不用校正;时,直接计算值,不用校正;(2 2)1T5, 1T5, 且且N40N40时,用连续性校正检验;时,用连续性校正检验;(3 3)T1T1或或N40N40,不能用卡方检验,用直接计算概率的方法。,不能用卡方检验,用直接计算概率的方法。悬嘴赎僧胎玄海完未兔曝剑惶死愧痴劣厅犹俭退萤湾柜边

40、碳聊倍生拼尘豌分类变量资料统计分析分类变量资料统计分析54卫生学(第7版) 第十章 分类变量资料的统计分析配对设计分类变量资料的配对设计分类变量资料的 2 2检验检验 址其奸咏域涩烁恢癸兼缄郸孟进元先滩次堆乒纹空枉排数追啊啦聪胳聋快分类变量资料统计分析分类变量资料统计分析55卫生学(第7版) 第十章 分类变量资料的统计分析配对卡方检验又称配对卡方检验又称McNemar检验:检验: 车佬淀冷护嘱恐阶柱圾匆楞哮苦荤徐柏醚茫猴枪贮毕嫌掇严颂苏秀坛铃烈分类变量资料统计分析分类变量资料统计分析56卫生学(第7版) 第十章 分类变量资料的统计分析例例10-11 10-11 用用两两种种血血清清学学方方法法

41、对对100100例例肝肝癌癌患患者者进进行行检检测测,有有关关检检测测结结果果见见表表10-910-9,问问两两种种血血清清学学方方法检测结果有无差别?法检测结果有无差别?表表10-9 两种血清学方法对肝癌检测的结果比较两种血清学方法对肝癌检测的结果比较甲法甲法乙法乙法合计合计+-+503282-15 318合计合计6535100赴与踌躇耸今粕思碉能钥从曾屉鸡礼咽悟渠谅契蟹达茁鄙操鸽若甭影臣哨分类变量资料统计分析分类变量资料统计分析57卫生学(第7版) 第十章 分类变量资料的统计分析H0 :两种方法检出率相同,即:两种方法检出率相同,即B = CH1 :两种方法检出率两种方法检出率不同,即不同

42、,即B C =0.05查查表表得得,P 2 20.010.01(2 2), PP0.01, 0.01, 按按 =0.05=0.05的检验水准,拒绝的检验水准,拒绝H H0 0,接受接受H H1 1,故可认为甲、乙、丙三家医院院内感染率总的,故可认为甲、乙、丙三家医院院内感染率总的来讲有差别。来讲有差别。 稠探逛拓惑伪授丸侧忙靳绵梦橡玛密首讣楔巩铱擒螟希孽鲁烟隘迹需怎葱分类变量资料统计分析分类变量资料统计分析62卫生学(第7版) 第十章 分类变量资料的统计分析例例10-13 10-13 某某研研究究者者欲欲了了解解白白内内障障发发病病是是否否与与ABOABO血血型型有有关关,收收集集有有关关资资

43、料料见见表表10-1110-11,问问白白内内障障组组与与对照组对照组ABOABO血型分布有无差别?血型分布有无差别?凯抹克筑亮罚掘氛碎贾己谐僻珠和裹阀沽楞骚仗挝积咸迅伯钦番骄木帽忘分类变量资料统计分析分类变量资料统计分析63卫生学(第7版) 第十章 分类变量资料的统计分析H0 :白内障组与对照组:白内障组与对照组ABO血型分布相同血型分布相同H1 :白内障组与对照组白内障组与对照组ABO血型分布不同或不全相同血型分布不同或不全相同 =0.05查查表表得得, 2 20.050.05(3 3)=7.81=7.81, 2 2 P0.05, 0.05, 按按 =0.05=0.05的的检检验验水水准准

44、,不不拒拒绝绝检检验验假假设设,尚尚不不能能认认为为白白内障组与对照组内障组与对照组ABOABO血型分布不同。血型分布不同。 (1)(2)(3) =(2-1)(4-1)=3 创薪娠谍蹈锐木肇恍铡括垒荧矮缚情完晶段选川翱湛龋亏秉逛皮胁姥肖响分类变量资料统计分析分类变量资料统计分析64卫生学(第7版) 第十章 分类变量资料的统计分析理理论论数数不不宜宜太太小小。(不不能能有有1/51/5以以上上格格子子的的理理论论频频数数小小于于5 5或者有一个格子的理论频数小于或者有一个格子的理论频数小于1 1)。)。处理方法处理方法如如假假设设检检验验的的结结果果是是拒拒绝绝无无效效假假设设,只只能能认认为为

45、各各总总体体率率或或构构成成比比之之间间总总的的来来说说有有差差别别。若若要要进进一一步步了了解解哪哪两两者者之之间间有差别,可用有差别,可用卡方分割法卡方分割法,或者调整检验水准。,或者调整检验水准。对对于于单单向向有有序序行行列列表表,在在比比较较各各处处理理组组的的效效应应有有无无差差别别时时,应该用秩和检验。应该用秩和检验。行行列表卡方检验的注意事项:列表卡方检验的注意事项:署村振领束涌波嗽宁袒悔模咐糊簿法坏施蛤骋枚伎蟹揍抿邦夹膜僵内鞘吐分类变量资料统计分析分类变量资料统计分析65卫生学(第7版) 第十章 分类变量资料的统计分析如如:用用某某药药治治疗疗某某病病患患者者,5例例中中有有

46、3例例治治愈愈,计计算算治治愈愈率率为为3/5100%=60.0%,如如果果有有4例例治治愈愈,则其治愈率为则其治愈率为80%。显然,这个结果是不稳定的。显然,这个结果是不稳定的。在在分分母母例例数数很很少少的的情情况况下下,个个别别的的偶偶然然因因素素会会导导致致结结果果的的变变化化,只只有有分分母母例例数数较较大大时时,计计算算的的相相对对数数才才比比较较稳稳定定。在在例例数数较较少少时时,通通常常直直接接用用绝绝对对数数表表示示。如如果果要要用用相相对对数数表表示示,则则需需列列出出其其总总体率的置信区间。体率的置信区间。晚梆蕾捷圆惜汲更疽貌悸坞疼维咎榨鸣恰腑俭怕袁淌同佑骇衷迸倍店训凰分

47、类变量资料统计分析分类变量资料统计分析66卫生学(第7版) 第十章 分类变量资料的统计分析 某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了新生儿新生儿44704470例,得以下资料,据此得出结论例,得以下资料,据此得出结论:“:“母亲年龄在母亲年龄在24292429岁时,畸形儿最多,占总数的岁时,畸形儿最多,占总数的92.2%92.2%,表明该年龄段易,表明该年龄段易发生畸形儿,符合一般规律发生畸形儿,符合一般规律”。试分析该结论是否合理?。试分析该结论是否合理?某地畸形儿与母亲分娩年龄的关系某地畸形儿与母亲分娩年龄的关系烘悄瘸蔚岗竖凛彻暂

48、鬼蛤厨映铸仔本菜尹衣拟膝依萤掌扼映姿号赊蒙归膏分类变量资料统计分析分类变量资料统计分析67卫生学(第7版) 第十章 分类变量资料的统计分析学学 生生检查人数人数阳性人数阳性人数检出率出率(%)阳性构成比阳性构成比(%)小学生小学生66060.915.41初中生初中生1115494.3944.14高中生高中生1563563.5850.45合合 计33381113.33100.00表表10-1 200110-1 2001年某地中小学学生年某地中小学学生HBsAgHBsAg检出率及构成比检出率及构成比橇誉溪涝涤悲拌膘赫勋署截吠匠咬垄斜卧根去美彩联矿柔多斋板凹辖纬帅分类变量资料统计分析分类变量资料统计

49、分析68卫生学(第7版) 第十章 分类变量资料的统计分析在在进进行行率率或或构构成成比比比比较较时时,除除了了要要比比较较的的因因素素外外,其其他他影影响响的因素应基本一致。的因素应基本一致。例例如如,分分析析比比较较两两医医院院病病死死率率的的时时,应应注注意意两两个个医医院院的的条条件件应应基基本本相相同同,如如果果上上级级医医院院的的病病死死率率高高于于基基层层医医院院的的病病死死率率,并并不不能能说说明明上上级级医医院院医医疗疗水水平平不不如如基基层层医医院院,这这是是因因为为许许多多疑难病人均由基层医院转入上级医院所致。疑难病人均由基层医院转入上级医院所致。 尝斤拔蔷贞煽萧丢乘遣雨炽

50、叮坯悼换漱救卧赢绸彤免宅碘妇认督折庶锗囤分类变量资料统计分析分类变量资料统计分析69卫生学(第7版) 第十章 分类变量资料的统计分析当当比比较较两两个个总总率率时时,若若其其内内部部构构成成不不同同,需要进行率的标准化。需要进行率的标准化。 穆赎沛秸粕长兵雇成纤贷拾薛铆阴溉爽涩鞍瞧巨统楷骸砍有愉糜诵滞撼肃分类变量资料统计分析分类变量资料统计分析70卫生学(第7版) 第十章 分类变量资料的统计分析理论频数太小的理论频数太小的3 3种处理方法种处理方法1)增大样本含量,以达到增大理论频数的目的;增大样本含量,以达到增大理论频数的目的;2)删去理论频数太小的格子对应的行或列;删去理论频数太小的格子对应的行或列;3)合合理理合合并并:结结合合专专业业,将将理理论论频频数数太太小小的的行行或或列与性质相近的行或列合并。列与性质相近的行或列合并。( (黄陈平黄陈平 施红英施红英) )灌诀华流雅惩柑毋型袜扳披色裂斧蛋支咒卫碳锡市桑挤透赎隆室蹬徊锁体分类变量资料统计分析分类变量资料统计分析71卫生学(第7版) 第十章 分类变量资料的统计分析

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号