第8讲第8章RC表资料分析课件知识分享

上传人:yuzo****123 文档编号:137406399 上传时间:2020-07-08 格式:PPT 页数:75 大小:1.31MB
返回 下载 相关 举报
第8讲第8章RC表资料分析课件知识分享_第1页
第1页 / 共75页
第8讲第8章RC表资料分析课件知识分享_第2页
第2页 / 共75页
第8讲第8章RC表资料分析课件知识分享_第3页
第3页 / 共75页
第8讲第8章RC表资料分析课件知识分享_第4页
第4页 / 共75页
第8讲第8章RC表资料分析课件知识分享_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《第8讲第8章RC表资料分析课件知识分享》由会员分享,可在线阅读,更多相关《第8讲第8章RC表资料分析课件知识分享(75页珍藏版)》请在金锄头文库上搜索。

1、第八章 RC表资料的分析,分类资料时常将分类频数排成R行C列的表格方式,称RC列联表(contingency table),简称RC表RC表资料常用2检验。本章我们从2统计量的分布讲起,介绍多种RC表资料的检验方法。,预备知识 2分布,定义 如果u1,u2,.,un是n个相互独立的标准正态变量,则称随机变量,服从自由度为df=n的2分布,2 = u12 +u22 +.+un2,2 分布曲线偏向左边,随自由度df的不同而不同,自由度越小越偏,自由度相当大时,2分布曲线接近正态分布曲线。,2(df) 表示水准的2界值,P(2 2(df) =。本书附表列出了按P(22(df)=编制的单侧2界值表。,

2、例如,直接查附表,得单侧2界值20.05 (5) =11.07,它表示自由度df=5时,2值大于11.07的概率为0.05,即 P (211.07) =0.05 .显然,P (211.07) =0.95 。,2分布的常用性质,2分布具有可加性 ; 常用作某些统计量分布的近似,例如,当处理组较多,各处理组样本含量较大时,Kruskal Wallis法的H分布可用2分布来近似。 医学中2检验是常用的检验方法之一。,基本思想是衡量实际频数和理论频数之间的偏离度。检验统计量的意义和算法可用基本公式来说明:,8.2,Arc表示RC表中第 r 行(r=1,2,R)第c列(c=1,2,C) 位置上的实际频数

3、,简称实际数A;Trc表示与Arc相应(同位置)的理论频数(频数期望值),简称理论数T。,一、 2 检验的基本思想,第一节 四格表的Pearson 2 检验,0.73400.9176=0.6735,假设两种药物的疗效相同,那么我们期望全部观察值中胃金丹的理论有效率是67.35%总的观察数是376,而胃金丹的期望有效数就是,0.6735 376=253.24,理论数是根据检验假设 H0 来确定的,H0 为比较的各组处理效果相同,均等于合计的处理效果,据此推出第 r 行第c 列位置上理论数的计算公式,对例8.1 H0:即两组疗效相同;H1:即两疗效不相同。=0.05。,二、 四格表的 2 检验,=

4、56.77,按自由度df=1查附表2,20. 05(1) =3.84,因220.05(1) ,P0.05,按=0.05水准拒绝H0,认为两药治愈率不同。,n40,每个格子都有T5,用一般卡方检验,【SPSS操作】以组别、疗效及例数为变量名,建立数据文件L8-1.sav,点dataWeight Cases, 对数据文件L8-1进行加权处理.即告诉软件,同一组中的例数是频数,如果不进行加权处理,软件不进行卡方检验,点Weight Cases By,把例数送Frequency,Analyze Descriptive Statistics Crosstable,,选组别到Rows框,疗效到Column

5、框., Statistics ,选 Chi-Square、Contingency coefficient, Continue 。OK。,n=37640,所有理论频数5,Pearson 2 =56.772,P=0.000,拒绝H0,认为两药治愈率不同,【例8.2】 某中医院将71例血栓闭塞性脉管炎期23级患者随机分成甲、乙两组,甲组用活血温经汤,乙组用通塞脉1号治疗,结果如表10-4。问两药的疗效有无差别?,解 H0:两组疗效相同;H1:两组疗效不同,n40,最小理论数T12 933/714.18,因有理论数1T5,用校正卡方,本例若不用校正2,则2=4.06,查2界值表,得P0.05,可见未校

6、正的P值偏低,将得出相反的结论,2四格表2检验的注意事项, 自由度为1的四格表,在总样本例数n40,有理论频数1T5时,用不校正的2值查2界值表,所得概率偏低,误差较大,必须校正, 用专有公式计算2值,要先计算最小理论数。自由度df1时,u20.05/220.05(1)(即1.962 3.84),u20.01/220.01(1)(即2.57582 6.63),故n较大时的两样本率比较,既可用u检验,又可用2检验, 分类资料在划分阳性、阴性时信息量损失太大,而且划分界限不同,得出的统计结论也可能不同。在资料的划分归类时,必须结合专业知识,具备充分的理由才能确定某一划分界限。,第二节 四格表确切概

7、率法,四格表确切概率法(exact probabilities for 22 table) 系费歇(Fisher)利用超几何分布于1934年提出。四格表资料:当总样本含量n40时; 用其它假设检验方法所得概率接近检验水准时; 四格表中有实际频数为0或有理论数T1时,都无法用2检验,常用四格表确切概率法作为四格表2检验应用上的补充。,四格表资料确切概率的计算公式为:,【例8.3】 研究红花改善周围血管闭塞性病变患者的皮肤微循环状况,以安慰剂作对照,将38个病例随机分到2组,结果如表,试分析该药的疗效,H0:某药无效,H1:某药有效。,样本含量n =37 40,宜采用四格表确切概率法。双侧确切概率

8、P=0.001,单侧确切概率P=0.001,故拒绝H0,认为该药能够改善周围血管闭塞性病变患者的皮肤微循环状况。,【SPSS操作】四格表数据合为一列输入为变量x的值,变量m、n以值1、2分别代表数据所在的行或列。选择DataWeight Cases命令,把x选入Frequency Variable框进行加权。,选择AnalyzeDescriptive Statistics Crosstable命令,选m进入Rowss框,n进入Columns 框,击Statistics按钮,指定Chi-squarer,击ContinueOK按钮,得到结果.,使用SPSS软件,以处理、疗效及例数为变量名,建立2行

9、2列如图10-6的数据文件,选择Analyze Descriptive Statistics Crosstable,选处理组进入Rowss框,安慰组进入Columns 框,击Statistics按钮,,指定Chi-squarer,击Continue,点OK按钮.,得到,由n3840,宜用Fishers Exact Test。双侧确切概率P0.003,单侧确切概率P0.001,故拒绝H0,认为该药能够改善周围血管闭塞性病变患者的皮肤微循环状况,第三节 RC表的统计分析,有双向无序RC表、单向有序RC表、双向有序属性不同的RC表、双向有序且属性相同的R C表。不同的RC表,所使用的统计检验方法见图

10、8-3.,一、双向无序RC表,双向无序RC表,满足2检验条件(表中没有小于5的理论频数,总例数很大)时,用2检验法,按下式计算Pearson卡方检验统计量2值.,【例8.4】 某医院将用三种治疗方法治疗199例消化性溃疡住院病人,资料如表10-10。为避免中医不同证型对疗效比较的影响,试分析三种疗法治疗的病人按中医分型构成比有无差别。,H0:三组的中医分型构成比相同;H1:三组的中医分型构成比不同。= 0.05 H0:三组的中医分型构成比相同;H1:三组的中医分型构成比不同。= 0.05,以自由度df(R1)(C1)(31)(41)6查2界值表,20.10(6) 10.64,P0.10。,如使

11、用SPSS统计软件:建立数据文件L8.4.sav以后,操作过程和界面都同例8.1。,按0.05水准不拒绝H0,可认为三组病人中医各型的构成比相同。,注意事项: 1 RC表2检验对理论数T要求不宜有20%以上格子的T5,不能有T1。理论数太小时的处理办法:最好增加样本例数以增大理论数。删去理论数太小的行和列。将太小理论数所在行或列的实际数与性质相近的邻行邻列合并,使重新计算的理论数增大。须知,后两法可能会损失信息,也会损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作为常规方法。不满足2检验条件的RC表资料,最好计算RC表的确切概率(Monte Carlo(确切概率:蒙特卡洛法)) 。

12、,2RC表的确切概率法计算概率的步骤: (1)确定一个统计量,例如2值,计算原表的2值记为02; (2)列出边际和固定的全部可能的RC表,对于每一个表计算该统计量(比如2值)及其P值。 (3)凡统计量(比如2值)大于原始表的统计量值(即202)的那些RC表的P值之和,即为确切概率P值。,用SPSS, 在数据编辑窗建立配伍格式数据文件以后, AnalyzeDsecriptive statisticCrosstabs, 选择“行变量”进入Rows, 选择“列变量”进入Columns。 Statistics , 选 Chi-squareContinue Exact:Monte Carlo:Conti

13、nue; OK。即输出确切概率P值。,2. 实验分组变量无序,指标变量有序时,宜用秩和或检验Ridit分析。但当实验分组变量有序,指标分组变量无序时,仍可用双向无序RC表分析方法,3. 多个样本率或构成比的2检验拒绝H0时,只能认为各总体率或构成比之间总的来说有差别,不能说明它们彼此间都有差别,可进一步用2分割法作多个样本率间的“两两比较”。,处理双向有序且属性不同的RC表资料时,常常希望弄清两有序变量之间是否存在线性相关关系或是否存在线性变化趋势,故需选用定性资料的相关分析或线性趋势检验。,例8.7 就表8-7资料,推断老年环的混浊度与眼底动脉硬化级别是否有关联?如有关联,关系的密切程度如何

14、?,3、双向有序且属性不同的RC表,表8-11 不同级别眼底动脉硬化患者老年环混浊程度分布,注:( )内为小于5的理论数。,关联性分析H0:老年环的混浊度与眼底动脉硬化级别无关;H1:老年环的混浊度与眼底动脉硬化级别有关。0.05。可用秩和检验或RIDIT分析, 差异性检验 H0:眼底动脉不同硬化级别的混浊度差异,H1:眼底动脉不同硬化级别的混浊度差异,, 线性趋势检验H0:老年环的混浊度与眼底动脉硬化级别无线性关系;H1:老年环的混浊度与眼底动脉硬化级别有线性关系。0.05。,使用SPSS统计软件:以混浊程度(标签老年环的混浊程度)、硬化级别(标签眼底动脉硬化级别)及例数为变量名,建立25行

15、3列的数据文件L8-5A.sav,,Analyze, Descriptive Statistics, Crosstable,选硬化级别到Rows框,混浊程度到Column框;,对例数加权, Statistics ,选Chi-square、Correlations、Gamma; Continue ; OK,小于5的格子有9个,超过20%,故合并b与,建立L8-5B.SAV.仿照上述重新分析如下:,可认为老年环混浊度与眼底动脉硬化级别有线性关系,从输出的对称性度量可知,Spearman等级相关系数=0.212,P=0.001,故拒绝H0,认为老年环混浊度与眼底动脉硬化级别有正相关关系.,4.双向有

16、序属性相同的列联表资料分析,同一批血样用两种方法都按k种分类进行检测的结果;同一医生对同一批病理切片标本的k种类别在两个不同时间评判等,都可归纳整理成形如表8-8的kk方表。,第四节 McNemar检验与Kappa检验,McNemar检验用来检验配对方表中关于对角线两侧的计数值是否对称,如果不对称,则表示两个评估结果不一致的部分在一个方向的改变较另一个大。其检验假设为:H0:xijxji,对于所有的ij,方表中关于对角线两侧的计数值对称,即两者吻合,dfk(k1)/2,一. McNemar检验,1.意义,2. 配对四格表资料的McNemar检验(优势性检验),可进行独立性检验(Pearson 2检验)、优势性检验(McNemar检验)、一致性检验(Kappa检验)。,配对四格表资料优势性检验的H0为行与列效果相同,则位于b、c两个位置上的样本数应近似相等,这样就可不考虑两法相同的例数(a与d),只比较两法结果相异的例数(b与c),若行属性优于列属性为b例,列属性优于行属性为c例,则

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号