浅谈考试成绩的差异显著性分析.docx

资源描述

《浅谈考试成绩的差异显著性分析.docx》由会员分享，可在线阅读，更多相关《浅谈考试成绩的差异显著性分析.docx（14页珍藏版）》请在金锄头文库上搜索。

1、浅谈考试成绩的差异显著性分析浅谈考试成绩的差异显著性分析浅谈考试成绩的差异显著性分析【摘要】本文尝试运用数理统计学中的显著性检验的基本思想和常用的excel 软件简单介绍了考试成绩中班级之间、校际之间的平均分、优秀率、及格率的差异显著性检验，即 U 检验的计算方法与主要步骤；以及教改结题报告的成绩分析涉及各种检验方法T 检验、Z 检验的区别及计算方法、主要步骤。简单而言，本文是用统计学中的检验方法科学地分析什么情况下两个平均分、优秀率、及格率“差别不大” ，“差别明显” ， “差很多” ，希望能更加科学客观地分析两个均值间的差异，对有需要的老师有所帮助。【关键词】成绩差异；U 检验；T 检

2、验；excel 软件在每次考试成绩统计中，平均分、及格率、优秀率依然是一个班级教学的主要考核指标，但由于这样或那样的原因，可能会有些学生缺考。特别是近年我市实行了中职技校春季招生政策，某些学校分流人数也许过半。如何才能科学地公平地进行统计分析，也是许多从事成绩分析与管理的老师面临的难题。另外，在教改结题报告或阶段性小结中，总要会对教改效果进行分析，也就难免对对比班与实验班的考试成绩中平均分、及格率、优秀率等数据作显著性检验，来比较教改的效果是否明显或不明显。看了不少结题报告，其中涉及到的检验方法如 U 检验，Z 检验，T 检验等等，不一而足，让人摸不着头脑。即便是数学教师，由于在大学就读时的教

3、学内容侧重点有所不同，或许对数理统计方面知识掌握不强，也很难明白这些检验方法孰是孰非，孰优孰劣，更别说非专业其它科目的教师。在作成绩对比分析时，通常无从下手，或是委托统计能力强的老师帮忙，或是随意给些似是而非的数据，抑或罗列考试成绩，直接对比，不作任何检验，也就缺乏科学严谨性。有些学校以班和年级考试人数与注册人数比值作为相对系数对实考的分数进行了调整，其大致算法是：年级在册人数为 N，缺考 R 人，某班在册人数为 n，缺考 r 人，则相对系数为/，用此系数乘以该班实际考试成绩，即为相对成绩，然后再以各班的相对成绩进行对比。这或许是一种方法，但这种调整，会对实考的成绩进行了放大或缩小，个人认为没

4、有多少益处。事实上，一个班级本身或许也有人缺考，只不过没别班那么多，但平均分调整后可能偏离很多。例 1：一所学校九年级 4 个班，每个班注册人数均为50，在一次考试中，某班平均分 60，缺考 20 人，全级缺考100 人，按上述方法折算该班平均分。解： =60*/=72，这是不科学的，也没有什么意义。1、样本均值与总体均值差异显著性检验要检查班级之间成绩是否相差太大，目的并不是要排出名次，可以采用 U 检验。U 检验的条件是：已知样本均值、样本容量与总体均值、总体的标准差，可能采用 U 检验进行两均值异显著性检验。统计学认为，不论 x 变量是连续型还是离散型，也无论 x 服从何种分布，一般只要

5、样本容量 n20，就可认为平均值的分布是正态的，，则，服从标准正态分布，这就是进行 U 检验的理论依据。U 检验主要步骤如下：第一步，建立虚无假设，即先认为两者没有差异，用表示第二步，计算 u 统计量U 检验的统计量为，其中，= 是要检验班的平均分，excel 软件的公式为：=AVERAGE；= 是年级平均分，excel 软件的公式为：=AVERAGE；为标准误，年级标准差，计算公式是 = excel 软件的公式为：=STDEV；n 为该班人数，excel 软件的公式为：=COUNT。以上的数据均由学生考试成绩表统计得到。从 u 统计量式子中我们看到，在两个平均分的差值进行标准化过

6、程中，u 值要受到年级标准差该班人数 n 影响。一般而言，就一次考试中 n 相对稳定，经开方后值更小，影响不大；而 u 值与成反比，换句话说，年级中各人成绩离散程度越大，两个平均分差值的差异就越不显著。第三步，设定显著水平，查表或计算接受域检验前必须设定显著水平，这是一个小概率数值，经常会选择 =，此时置信度 1-=，也即检验的结果有 95%可靠性，有 5%的不可靠，这个误差可能是由于偶然性造成的。在许多研究领域，通常被认为是可接受错误的边界水平。如果有必要，也可选择 =，等，使检验结果准确。由于标准正态分布图像是关于纵轴两边对称的，对应的置信区间占据中间部分，而两侧共占，一侧则占，所

7、以在计算或查表时，应以 1-/2 作为参数进行。如显著性水平 =，则查表或计算的是/2=对应的置信区间，excel 软件的计算公式为：=NORMSINV，回车后得，一般取近似数。由于图像对称性，确定的置信区间为，以这个区间为接受域。若令 =，则接受域。第四步，观察统计量 u 值是否落在接受区域，由此对样本均值与总体均值作出显著性差异判断。如果 u 统计量在置信区间内，接受 H0，差异不显著，否则拒绝 H0，差异显著；如果 u 统计量不在置信区间内，则差异非常显著。例 2.甲班某次参加考试 36 人，平均分 66，年级平均分 60，标准差为 20 分，检验甲班平均分与年级平均分是否有显著性

8、差异。解：把相关数据代入，所以无显著性差异。有些人认为相差 5 分就差很多，看来也是不科学的。2、标准分的计算由于标准分是综合个体与总体分数排位等因素计算而来，因此标准分本身是经过差异分析得到的数值。值得一提的是，在计算高考或中考标准分中，excel 的 NORMSINV函数作用非常大，不用查标准正态分布表，而且数值十分精确。换算公式 T=100Z+500，其中 Z=NORMSINV， Pi 为某名次以下的人数占考生总数的百分比，相当于 1-/2。例如10000 人考试，则第 1 名的标准分为 T=100Z+500= 100*NORMSINV+500 872。3、班、级的及格率、优秀率的检

9、验在成绩分析时，及格率、优秀率也可以像平均分一那样进行显著性差异检验，那么这两项该如何进行呢？难点在于标准差怎么求。其实，从公式看：平均分、及格率、优秀率三个数据的分母均为考试人数，三者均为平均值。平均分是每个人的分数之和/考试人数，由于每个人都会有一个分数，直接相加可得。那么及格率呢？表面看是及格率=及格人数/考试人数，在计算时，其实将每个人分数稍作处理：将达到及格的分数改为 1，没达到的改为 0，excel 软件中可用公式=if 及填充柄下拉简单得到，Ai 为每个原始分数所在单元格，然后对转换后的数据求平均值与标准差了。然后把班、级的及格率代入 u 统计量式子中计算 u 值。优秀率也用相方

10、法处理即可。例 2.乙班某次考试成绩如下：87 64 71 81 75 72 87 46 54 61 50 42 65 50 7972 43 68 64 64 60 48 87 48 52 56 54 50 48 6292 70 82 53 82 73 75 72 68 70求此次考试的及格率及对应的标准差。解：按及格分数为 1，不及格分数为 0 转换后为：1 1 1 1 1 1 1 0 0 1 0 0 1 0 11 0 1 1 1 0 0 1 0 0 0 0 0 0 11 1 1 0 1 1 1 1 1 1可以求出这组数据的平均值即及格率为=26/40=65%，标准差为 S= =。年级的优秀

11、率与及对应的标准差也如法炮制，再进一步如平均分一样代入 u 统计量式子中计算就可以进行分析检验。需要指出的是，有些资料计算方法并非如此，这可能是转换后的结果只有 0、1 两个，不少人会认为这组数据服从两点分布或二项分布，所以按两点分布求方差 S2=p，在这里 p 可以是及格率或优秀率，像上例 S= =，出入比较大，很明显这并不是两点分布。我认为每个人及格记 1 分，不及格记 0 分，班级的“平均数”就是及格率或优秀率，这样理解更自然，按上例方法求标准差及进行检验可能更科学。4、U 检验运用条件在已知样本均值、样本容量及总体的均值及总体的标准差，在每次考试中，这几个数据还是比较容易得到的，u统计

12、量服从标准正态分布，即可以进行 U 检验。U 检验涉及的计算较为简单，把以上四个参数代入公式即得 u 统计量，然后与临界值比较，一般以或为临界值，不再另外查表或计算，就可以分析样本均值与总体均值是否具有显著性差异，所以 U 检验在诸多领域运用广泛。一般而言，教改成绩就是实验班与对比班两个班的成绩比较，能否仅凭这两个班的平均分、优秀率、及格率的差值，立即得出教学效果是否明显呢？统计学认为，这样得出的结论是不可靠的，因为一个班的平均分具有统计意义，存在抽样误差，此数据是在一定范围内波动的，故而我们需要进行显著性差异检验。由于一个班多则也就 50 多人，少则也有 20 多人；所以每个班都可以看成一个

13、样本，两个班就可看成从两个总体中抽取出来的双样本，一个总体是实施了教改的，一个是没有实施教改的。当然，这两个总体在这种情形下更多是虚拟的，它们具体的一些数据我们是无从知晓的，也就没有办法直接研究，只能通过研究样本，由样本的数据对总体进行估计，并进行差异显著性检验，才能作出判断。1、Z 检验与 T 检验的区别不少文章对 Z 检验还是 T 检验这两种方法作出了说明，两个总体均值的差异显著性检验中，在不知总体方差及均值情况下且统计量服从 t 分布，可以使用 Z 检验或 T 检验。如果样本容量 n 大于 30，用 Z 检验，如果样本容量 n 小于30，则用 t 检验，在这里样本容量 n 即为该班人数。

14、很明显，正如前文所说，一个班的人数一般都在 30 人之上，可以用 Z 检验。但假如一个班 30 人以下，另一班 30 人以上那怎么办？其实在计算机广泛应用计算的今天，不管样本容量 n 是多少，哪种检验都是可以使用的，且各种检验的基本原理是相同的。下面，不妨先了解这两种检验方法的统计量。首先，不论哪种检验都要用到以下数据：两个班的平均分：；两个班的考试人数：；两个班的成绩的方差，应用 excel 软件的公式为=var，数量上，方差=标准差的平方。t 检验或 z 检验的主要步骤：第一步，建立虚无假设，即先认为两者没有差异，用表示第二步：计算 Z 检验或 T 检验统计量z= ，t= 。式子中

15、，是两个班的平均分，，是两个班分数的方差，是两个班考试人数。从函数单调性而言，不论 z 或 t，与 u 值类似，当两班的方差增大时，其值减小，即两班均分所代表的两总体的均值的差值差异性也到受成绩离散程度影响。另外，从式子结构看，t 统计量要复杂很多，这在计算工具落后的过去，这个计算当然是很繁琐的。想当初，手中可能连计算器都没有，开个方都可能需要手算。据说数学家陈景润证明“1+2”时所用的草稿纸真的达到汗牛充栋地步，可堆满房子，如果换了今天，估计他的稿纸也许高不盈尺。所以我们可以认为，Z 检验其实只是 T 检验的粗略计算而已，二者其实都可使用，只是 t 值过程稍复杂，但应更精确。第三步

16、查表或计算临界值在不知总体方差情形下，两个平均值差服从 t 分布，查表或计算 t 临界值要有两个参数，显著水平，及自由度df。如果考查一个班，d ，如果进行两个班对比，自由度 d 。计算临界值，excel 软件中公式为：=TINV，若令 =，自由度从 30 至 120，临界值都约为 2，详见下表：自由度 df 30 40 50 60 70 80 90 100 110 120临界值 t0 而两个班的人数基本上也在这个幅度内，像 U 检验一样，根据原始数据算出的 t 值与临界值进行比较，为了简化运算，可以取近似数 2。同样，在差异显著情形下，非要区别出相差很多，以令 =，自由度 30 至 120 主要的临界值如下：自由度 df 30 40 50 60 70 80 90 100 110 120临界值 t0 第四步比较 t 值或 z 值与，作出统计推断与 u 检验类似，比较计算出来的 t 值或 z 值与临界值，如果|t| 在报告中，不妨将各次考试成绩计算出来的t 值用表格与图表形式展示出来，这样使数据条理更加清晰

展开阅读全文

浅谈考试成绩的差异显著性分析.docx

最新文档