SPSS:多种样本率的卡方检查及两两比较 来自:医咖会 x 用扫描二维码分享至好友和朋友圈 医咖会之前推送过“两个率的比较(卡方检查)及Fisher精确检查的SPSS教程”,小伙伴们都掌握了吗?如果不止两个分组,又该如何进行卡方检查以及之后的两两比较呢?来看具体教程吧! 1、问题与数据 某医生拟探讨药物以外的其她措施与否可减少患者的胆固醇浓度,如增强体育锻炼、减少体重及改善饮食习惯等 该医生招募了150位高胆固醇、生活习惯差的受试者,并将其随机提成3组其中一组予以降胆固醇药物,一组予以饮食干预,另一组予以运动干预通过6个月的实验后,该医生重新测量受试者的胆固醇浓度,分为高和正常两类 该医生收集了受试者接受的干预措施(intervention)和实验结束时胆固醇的风险限度(risk_level)等变量信息,并按照分类汇总整顿,部分数据如下: 注释:本研究将胆固醇浓度分为“高”和“正常”两类,只是为了分析的以便,并不代表临床诊断成果 2、对问题的分析 研究者想判断干预后多种分组状况的不同如本研究中通过降胆固醇药物、饮食和运动干预后,比较各组胆固醇浓度的变化状况针对这种状况,我们建议使用卡方检查(2×C),但需要先满足5项假设: 假设1:观测变量是二分类变量,如本研究中实验结束时胆固醇的风险限度变量是二分类变量。
假设2:存在多种分组(>2个),如本研究有3个不同的干预组 假设3:具有互相独立的观测值,如本研究中各位受试者的信息都是独立的,不会互相干扰 假设4:研究设计必须满足:(a) 样本具有代表性,如本研究在高胆固醇、生活习惯差的人群中随机抽取150位受试者;(b) 目的分组,可以是前瞻性的,也可以是回忆性的,如本研究中将受试者随机提成3组,分别予以降胆固醇药物、饮食和运动干预 假设5:样本量足够大,最小的样本量规定为分析中的任一预测频数不小于5 经分析,本研究数据符合假设1-4,那么应当如何检查假设5,并进行卡方检查(2×C)呢? 3、思维导图 4、SPSS操作 4.1 数据加权 在进行正式操作之前,我们需要先对数据加权,如下: (1) 在主页面点击Data→Weight Cases 弹出下图: (2) 点击Weight cases by,激活Frequency Variable窗口 (3) 将freq变量放入Frequency Variable栏 (4) 点击OK 4.2 检查假设5 数据加权之后,我们要判断研究数据与否满足样本量规定,如下: (1) 在主页面点击Analyze→Descriptive Statistics→Crosstabs 弹出下图: (2) 将变量intervention和risk_level分别放入Row(s)栏和Column(s)栏 (3) 点击Statistics,弹出下图: (4) 点击Chi-square (5) 点击Continue→Cells (6) 点击Counts栏中的Expected选项 (7) 点击Continue→OK 经上述操作,SPSS输出预期频数成果如下: 该表显示,本研究最小的预测频数是24.7,不小于5,满足假设5,具有足够的样本量。
Chi-Square Tests 表格也对该成果做出提示,如下标注部分: 即在本研究中,没有不不小于5的预测频数,可以直接进行卡方检查(2×C)那么,如果存在预测频数不不小于5的状况,我们应当怎么办呢?一般来说,如果预测频数不不小于5,就需要进行Fisher精确检查(2×C),我们将在背面推送的内容中向人们具体简介 4.3 卡方检查(2×C)的SPSS操作 (1) 弹出下图: (2) (3) (4) (5) 点击Percentage栏中的Column选项 (6) 4.4 组间比较 (1) 弹出下图: (2) 点击Cells,弹出下图: (3) 点击z-test栏中的Compare column proportions和Adjust p-values (Bonferroni method)选项 (4) 5、成果解释 5.1 记录描述 在进行卡方检查(2×C)的成果分析之前,我们需要先对研究数据有个基本的理解SPSS输出成果如下: 该表提示,本研究共有150位受试者,根据干预方式均分为3组在实验结束时,药物干预组的50位受试者中有16位胆固醇浓度高,饮食干预组的50位受试者中有28位胆固醇浓度高,而运动干预组的50位受试者中有30位胆固醇浓度高,如下标注部分: 由此可见,药物干预比饮食或运动干预的疗效更好。
同步,该表也提示,药物干预组的50位受试者中有34位胆固醇浓度下降,饮食干预组的50位受试者中有22位胆固醇浓度下降,而运动干预组的50位受试者中只有20位胆固醇浓度下降,如下标注部分: 但是,当各组样本量不同步,频数会误导人们对数据的理解因此,我们推荐使用频率来分析成果,如下标注部分: 该表提示,药物干预组的50位受试者中68%胆固醇浓度下降,饮食干预组的50位受试者中44%胆固醇浓度下降,而运动干预组的50位受试者中只有40%胆固醇浓度下降,提示药物干预比饮食和运动干预更有效但是这种直接的数据比较也许受到抽样误差的影响,可信性不强,我们还需要进行记录学检查 5.2 卡方检查(2×C)成果 本研究中任一预测频数均不小于5,因此根据Chi-Square Tests表格分析各组的差别SPSS输出检查成果如下: 卡方检查(2×C)成果显示 χ2=9.175,P = 0.010,阐明本研究中各组之间率的差值与0的差别具有记录学意义,提示药物干预与饮食、运动干预在减少受试者胆固醇浓度的作用上存在不同如果P>0.05,那么就阐明各组之间率的差值与0的差别没有记录学意义,即不觉得各组之间存在差别。
5.3 卡方检查(2×C)中的成对比较分析 如果卡方检查(2×C)的P<0.05,阐明至少有两组之间的差别存在记录学意义SPSS输出的risk_level * intervention Crosstabulation表格通过数字标记提示了两两比较的成果,如下标注部分: 人们也许会注意到,每组数据的标记相似(即上下两行的标记相似),那么我们只要懂得组间标记的作用即可 那么,risk_level * intervention Cross tabulation表格的标记是什么意思呢?第一种状况,各组间无差别,如下: 如上图,各组间标记一致,阐明各组之间无差别第二种状况,任意两组之间均存在差别,如下: 即每组标记字母均不相似,阐明任意两组之间的差别均存在记录学意义第三种状况,有些组之间存在差别,而另某些组之间的差别没有记录学意义,如下: 如果任两组之间标记字母相似,阐明这两组之间的差别没有记录学意义;如果两组标记字母不同,阐明这两组之间的差别存在记录学意义 根据这一原则,分析本研究成果如下: 该表阐明,在本研究中,药物干预的降胆固醇作用(“a”)与饮食干预的降胆固醇作用(“b”)的差别存在记录学意义(P<0.05),药物干预的降胆固醇作用(“a”)也与运动干预的降胆固醇作用(“b”)的差别存在记录学意义(P<0.05),而饮食干预(“b”)与运动干预(“b”)在降胆固醇的作用上没有差别。
6、撰写结论 6.1 若卡方检查(2×C)的P<0.05 本研究招募150位高胆固醇、生活习惯差的受试者,随机分组后分别予以药物、饮食和运动干预实验结束时,药物干预组有34位(68%)胆固醇浓度下降,饮食干预组有22位(44%)胆固醇浓度下降,而运动干预组有20位(40%)胆固醇浓度下降,三组差别具有记录学意义(P=0.010) 成对比较成果提示,药物干预的降胆固醇效果好于饮食或运动干预(P<0.05),而饮食与运动干预在减少胆固醇浓度上的作用无差别(P>0.05) 6.2 若卡方检查(2×C)的P≥0.05 本研究招募150位高胆固醇、生活习惯差的受试者,随机分组后分别予以药物、饮食和运动干预实验结束时,药物干预组有24位(48%)胆固醇浓度下降,饮食干预组有22位(44%)胆固醇浓度下降,而运动干预组有20位(40%)胆固醇浓度下降,三构成果的差别没有记录学意义(P=0.620)。