检验或卡方检验和校正卡方检验的计算 私立广厦学校 郭捷思在教育学量的研究中,各种各样的统计方法已经被广泛的应用,特别是由于统计软件(如:SPSS)的不断成熟,给教育研究者提供了多种量的研究方法但是,这并不是无论什么量的研究都要通过统计软件来实现,也不是所有量的研究一定要运用统计软件才能快捷,简便的实现本文将教给大家几种简便的方法来实现卡方检验检验(chi-square test)或称卡方检验方法可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析它的零假设是样本来自的总体分布与期望分布或某一理论分布无显著差异根据卡方检验基本思想的理论依据,对变量总体分布的检验就可以从对各个观察频数的分析入手为检验实际分布与理论分布(期望分布)之间是否存在显著差异,可采用卡方检验统计量典型的卡方统计量是pearson卡方,其基本公式为:式中k为子集个数,为观察频数, 为期望频数,服从k—1个自由度的卡方分布如果值较大,则说明观测频数分布与期望频数分布差距较大;反之,如果值较小,则说明观测频数分布与期望频数分布较接近。
我们将通过代入数据运算这条公式,计算出统计量的观测值,并依据卡方分布表计算观测值对应的概率p值下面,将通过几个实际例子来探究如何进行卡方检验一、四格表资料的卡方检验例1:某学校分别运用传统教学和多媒体教学在两个平行班的数学课上进行试验,目的为了检测两种教学方法对学生的成绩影响是否有差异本实验把学生的成绩划分为优秀人数(80分以上)和非优秀人数表1: 两种教学方法学生成绩优秀率的比较组别 优秀人数非优秀人数合计 优秀率(%) 传统教学班 20 30 50 40多媒体教学班35 16 51 68.6 合计 55 46 101 52.5 表内这四个数据(斜体)是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的;两种教学的优秀率分别为40%和68.6%,两者的差别可能是抽样误差所致,亦可能是两种教学效果确有所不同这里可通过卡方检验来区别其差异有无统计学意义, 检验步骤:1. 建立检验假设:H0:π1=π2 (表示样本来自的总体分布与期望分布无显著差异,即传统教学和多媒体教学对学生成绩的影响并没有存在差异) H1:π1≠π2(传统教学和多媒体教学对学生成绩的影响存在差异) α=0.05(显著性水平;该值将用于与求出的概率p值进行比较,如果的概率p值小于显著水平α,则应拒绝零假设;反之则不能拒绝零假设) 2.计算理论(期望)频数(TRC),计算公式为: TRC= 公式(20.13) 式中TRC是表示第R行C列格子的理论数,为理论数同行的合计数,为与理论数同列的合计数,n为总例数。
这里期望频数精确到0.0001是为了减小误差) 第1行1列: 50×55/101=27.2277 第1行2列: 50×46/101=22.7723 第2行1列: 51×55/101=27.7723 第2行2列: 51×46/101=23.2277 以推算结果,可与原四项实际数并列成表2:表2:某学校分别运用传统教学和多媒体教学在两个平行班的数学课的试验结果比较组别优秀人数非优秀人数合计传统教学班20(27.2277)30(22.7723)50多媒体教学班35(27.7723)16(23.2277)51合计5546101因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=27.2277),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下: 第1行1列:27.2277 第1行2列:50-27.2277=22.7723 第2行1列:55-27.2277= 27.7723 第2行2列:51-27.7723=23.2277 3.计算x2值按公式代入4.查值表求P值 在查表之前应知本题自由度。
按检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查界值表(附表1),找到0.01(1)=6.63,0.001(1)=10.83而本题=8.2787即0.001(1)>>0.01(1),所以0.001<P<0.01,按α=0.05水准,p <α,拒绝H0,差异有高度统计学意义,可以认为传统教学和多媒体教学对差生成绩的影响存在显著差异通过界值表可以看出,越大,p值就会越小,那么试验中的差异具有的统计学意义越大而从这个实例中,我们可以得到期望频数和实际频数相差越大,值就会越大另一方面,值的大小又跟子集个数的多少有关,格子数越多,也会越大也就是说随自由度的增大也增大二、用专用公式计算卡方值 对于四格表资料,还可用以下专用公式求值首先把四个表依次表上字母如图所示:表3: 两种教学方法学生学习成绩的比较组别 优秀人数非优秀人数合计 传统教学班 20(a) 30(b) 50(a+b) 多媒体教学班35(c) 16(d) 51(c+d) 合计 55(a+c) 46(b+d)101 然后套用专用公式: 式中a、b、c、d各表示四个表中四个实际数,n表示总例数。
结果可以得到:计算结果与前述用基本公式一致,这种方法的更为简便 三、四格表值的校正算法上面讲解的例子中的值是根据正态分布中的定义计算出来的但是当自由度为1时(即在四格表中),如果出现期望频数小于5而总例数又大于40,应用以下的校正公式: 如果用四格表专用公式,亦应用下式校正:例2,对某学校的学生是否在课外时间请家教进行调查,目的是为了检测课外是否对学生的成绩有影响,结果如表4表4: 学生是否在课外时间请家教的对成绩的影响的卡方校正计算 优秀的人数非优秀的人数合计有请家教32(30.4478)2(3.5522)34没请家教28(29.5522)5(3.4478)33合计60767从表4可见,T1.2和T2.2数值都<5,且总例数大于40,故宜用校正公式检验步骤如下:1.检验假设:H0:π1=π2(表示样本来自的总体分布与期望分布无显著差异,即有请家教和没请家教对学生成绩的影响并没有存在差异)H1:π1≠π2(即有请家教和没请家教对学生成绩的影响存在差异)α=0.052.计算理论数:(已完成列入四格表括弧中)3.计算x2值:应用公式运算如下:=+++=0.7067则该题的自由度v=(2-1)(2-1)=1,查界值表(附表1),找到0.05(1)=3.84,而本题=0.7067即<0.05(1),P>0.05,按α=0.05水准,接受H0,无统计学意义。
实验结果表明是否参加课外对学生的学习成绩影响并不存在差异四、行×列表的卡方检验(test for R×C table)前面所阐述的是适用于两个组的率或百分比差别的显著性检验,而对于两个组以上的卡方检验其检验步骤与上述相同,简单计算公式如下: 式中n为总例数;为各观察值;和为与各值相应的行和列合计的总数 例3:许多教育学专家提出母亲的教育背景跟学生的学习成绩有很大的关系,通过以下的实验来验证该理论在某个学校中是否成立首先把母亲教育水平分为本科及本科以上、专科、中学和小学及小学以下;学生分为优秀(80分以上)和非优秀表5:母亲的教育背景与孩子的学习成绩的优秀率的比较成绩 母亲教育背景合计 本科及本科以上 专科 中学 小学及小学以下 优秀 80 60 30 25 195 非优秀 30 35 60 80 205 合计 110 95 90 105 400 优秀率(%) 47.4 46.7 58.8 66.3 53.2 该表资料由2行4列组成,称2×4表,可用公式检验式中k为子集个数,为观察频数,为理论数同行的合计数,为与理论数同列的合计数,n为总例数1.检验假设H0:不同母亲的教育背景下学生学习成绩的优秀率相同 H1:不同母亲的教育背景下学生学习成绩的优秀率不同 α=0.052.计算值=400(++++ +++)=67.923.确定P值和分析本例v=(2-1)(4-3)=3,据此查附表1:0.001(3)=16.27,本题=67.92,>0.001(3),P<0.001,按α=0.05水准,拒绝H0,可以认为不同教育水平的母亲,孩子的优秀率存在差异。
五.行×列表检验注意事项1.一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数当理论数太小可采取下列方法处理:①增加样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数所在行或列与性质相近的邻行邻列中的实际数合并,使重新计算的理论数增大由于后两法可能会损失信息,损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法 2.如检验结果拒绝检验假设,只能认为各总体百分比或总体构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别 附表 1:v P V P 0.05 0.01 0.001 0.05 0.01 0.001 1 3.84 6.63 10.83 16 26.30 32.00 39.25 2 5.99 9.21 13.81 17 27.59 33.14 40.79 3 7.81 11.34 16.27 18 28.87 34.18 42.31 4 9.49 13.28 18.47 19 30.14 36.19 43.82 5 11.07 15.09 20.52 20 31.41 37.57 45.32 6 12.59 16.81 22.46 21 32.67 38.93 46.80 7 14.07 18.48 24.32 22 33.92 40.29 48.27 8 15.51 20.09 26.12 23 35.17 41.64 49.73 9 16.92 21.67 27.88 24 36.42 42.98 51.18 10 18.31 23.21 29.59 25 37.65 44.31 52.62 11 19.68 24.72 31.26 26 38.89 45.64 54.05 12 21.03 26.22 32.91 27 40.11 46.96 55.48 13 22.36 27.69 34.53 28 41.34 48.28 56.89 14 23.68 29.14 36.12 29 42.。