生物统计学：非参数检验

资源描述

《生物统计学：非参数检验》由会员分享，可在线阅读，更多相关《生物统计学：非参数检验（65页珍藏版）》请在金锄头文库上搜索。

1、非参数检验,第一节符号检验第二节秩和检验第三节等级相关分析,非参数检验是一种与总体分布状况无关的检验方法，它主要是利用样本数据之间的大小比较及大小顺序，对样本及其所属总体作差别检验，而不对总体分布的参数如平均数、标准差等进行估计推断。优点计算简便、直观，易于掌握，检验速度较快缺点降低了检验的准确性，效率一般要低于参数检验方法,参数检验,样本被视为从分布族的某个参数族抽取出来的总体的代表，而未知的仅仅是总体分布具体的参数值,推断问题就转化为对分布族的若干个未知参数的估计问题，用样本对这些参数做出估计或者进行某种形式的假设检验，这类推断方法称为参数方法。,非参数检验（nonpara

2、metric tests）,又称为任意分布检验（distribution-free test），它不考虑研究对象总体分布具体形式，也不对总体参数进行统计推断；,仅仅依赖于数据观测值得相对大小（秩）等，而是通过检验样本所代表的总体分布形式是否一致来得出统计结论。,非参数统计的名字中“非参数”意味着其方法不涉及描述总体分布的有关参数；,它被称为“和分布无关”是因为其推断方法和总体分布无关；不应理解为与所有分布无关（例如有关秩的分布）无关。,非参数检验的优点,对总体假定较少，有广泛的适用性，结果稳定性较好。假定较少不需要对总体参数的假定与参数结果接近针对几乎所有类型的数据形态。容易计算在

3、计算机盛行之前就已经发展起来,非参数检验的弱点,可能会浪费一些信息特别当数据可以使用参数模型的时候大样本手算相对麻烦一些表不易得到,参数检验（parametric test）,已知总体分布类型，对未知参数进行统计推断,依赖于特定分布类型，比较的是参数,非参数检验（nonparametric test）,对总体的分布类型不作严格要求,不受分布类型的影响，比较的是总体分布位置,优点：方法简便、易学易用，易于推广使用、应用范围广；可用于参数检验难以处理的资料（如等级资料，或含数值“50mg”等）。,缺点：方法比较粗糙，对于符合参数检验条件者，采用非参数检验会损失部分信息，其检验效能低；样本

4、含量较大时，两者结论常相同。,第一节符号检验,一、配对资料的符号检验二、样本中位数与总体中位数比较的符号检验,一、配对资料的符号检验,1、建立假设无效假设HO：两处理差值d总体中位数=0 备择假设HA：两处理差值d总体中位数0 或d总体中位数0 （一尾检验）或d总体中位数0（一尾检验）,2、计算差值并赋予符号 d0者记为“+”，总个数记为n+ d0者记为“”,总个数记为n- d=0记为“0”, 总个数记为n0 n= n+ n- 检验的统计量为K 为n+、n-中的较小者,3、统计推断,由n查附表15得临界值K0.05(n)，K0.01(n)，作统计推断：如果KK0.05(n) ，P0.

5、05，则不能否定HO，两个试验处理差异不显著；如果K0.01(n) KK0.05(n) ，0.01P0.05，则否定HO，接受HA，两个试验处理差异显著；如果KK0.01(n)，P0.01，则否定HO，接受HA，两个试验处理差异极显著。,【例1】某研究测定了噪声刺激前后15头猪的心率，结果见表1。问噪声对猪的心率有无影响？,表1 猪噪声刺激前后的心率（次/分钟）,1、提出无效假设与备择假设 HO ：噪声刺激前后猪的心率差值d总体=0； HA ：噪声刺激前后猪的心率差值d总体中位数 0。 2、计算差值并赋予符号噪声刺激前后的差值符号列于表11-1第4行和第5行，从而得n+=2 ，n-=

6、13，n=2+13=15，K=min n+,n-= n+=2 。 3、统计推断当n=15时，查附表11 得临界值K0.05(15)=3 ， K0.01(15) = 2 ，因为 K = 2 = K0.01(15)，P0.01，表明噪声刺激对猪的心率影响极显著。,二、样本中位数与总体中位数比较的符号检验,1、建立假设 HO：样本所在的总体中位数=已知总体中位数； HA：样本所在的总体中位数已知总体中位数。（若将备择假设HA中的“”改为“”或“”，则进行一尾检验）,2、计算差值、确定符号及其个数统计样本观察值与已知总体中位数的差值的符号， n= n+ n- 检验的统计量K 为n+、

7、n-中的较小者。,3、统计推断（同配对资料的符号检验）注意：样本的配对数少于6对时，不能检验出差别，在7-12对时也不敏感，在20对以上则比较有用。,【例2】已知某品种成年公黄牛胸围平均数为140cm，今在某地随机抽取10头该品种成年公黄牛，测得一组胸围数字：128.1,144.4, 150.3,146.2,140.6,139.7,134.1,124.3,147.9,143.0（cm）。问该地成年公黄牛胸围与该品种胸围平均数是否有显著差异？,表2 成年公黄牛胸围测定值符号检验表,1、提出无效假设与备择假设 HO ：该地成年公黄牛胸围的平均数=140厘米, HA ：该地成年公黄牛胸围的平均

8、数140厘米。 2、计算差值、确定符号及其个数样本各观测值与总体平均数的差值及其符号列于表11-2，并由此得 n+=6 ，n-=4，n=6+4=10，K=min n+,n-= n-=4 。 3、统计推断由 n = 10 ，查附表11，得K0.05(10)=1，KK0.05(10) ，P0.05，不能否定HO ，表明样本平均数与总体平均数差异不显著，可以认为该地成年公黄牛胸围的平均数与该品种胸围总体平均数相同。,第二节秩和检验,秩和检验也叫做符号秩和检验（signed rank-sum test），或称Wilcoxon检验，其统计效率远较符号检验为高。秩和检验与符号检验法不同，要求差数

9、来自某些对称分布的总体，但并不要求每一差数来自相同的分布。方法：将观察值按由小到大的次序排列，编定秩次，求出秩和进行假设检验。,一、配对试验资料的符号秩和检验二、非配对试验资料的秩和检验三、多个样本比较的秩和检验四、多个样本两两比较的秩和检验,一、配对试验资料的符号秩和检验（Wilcoxon配对法）,1、建立假设 HO：差值d总体的中位数=0； HA：差值d总体的中位数0。 2、秩次和符号求配对数据的差值d；按d绝对值从小到大编秩次；根据原差值正负在各秩次前标上正负号,3、统计量T 分别计算正秩次及负秩次的和，以绝对值较小的秩和绝对值为检验的统计量T。 4、统计推断根据

10、n（正、负差值的总个数为n ）查附表14(1)符号秩和检验用T临界值表，得T0.05(n)，T0.01(n)。如果TT0.05(n) ，P0.05，则不能否定HO，表明两个试验处理差异不显著；如果T0.01(n) TT0.05(n) ，0.01P0.05，则否定HO，接受HA，表明两个试验处理差异显著；如果TT0.01(n)，P0.01，则否定HO，接受HA，表明两个试验处理差异极显著,【例3】某试验用大白鼠研究饲料维生素E缺乏与肝脏中维生素A含量的关系，先将大白鼠按性别、月龄、体重等配为10对，再把每对中的两只大白鼠随机分配到正常饲料组和维生素E缺乏饲料组，试验结束后测定大白鼠肝中维

11、生素A的含量如表4。试检验两组大白鼠肝中维生素A的含量是否有显著差异。,表3 不同饲料鼠肝维生素A含量资料（国际单位/克）,1、提出无效假设与备择假设 HO：差值d总体的中位数=0； HA：差值d总体的中位数0。 2、编秩次、定符号计算表11-3中配对数据差值di，将d =0的舍去，共有差值n=8 个。按绝对值从小到大排列秩次并标上相应的符号，差值绝对值为750的有两个，它们的秩次为3和4，所以其平均秩次为（3+4）/2=3.5，结果见表11-3。,3、确定统计量T 此例，正号有7个，其秩次为2，3.5，3.5，5，6，7，8，秩次和为：2+3.5+3.5+5+6+7=35；负号只有1个，其

12、秩次为1，秩次和等于1。负号秩次和较小，所以T=1。 4、统计推断由n=8查附表10(1)得， T0.05(8)=3，T0.01(n)=0，因为T0.01(8) TT0.05(8) ，0.01P0.05，否定HO，接受HA，表明两个试验处理差异显著。,二、非配对试验资料的秩和检验（Wilcoxon非配对法）,1、建立假设 HO：甲样本所在的总体的中位数=乙样本所在的总体的中位数； HA：甲样本所在的总体的中位数乙样本所在的总体的中位数。 2、求两个样本合并数据的秩次将两样本合并后的数据按从小到大的顺序排列，与每个数据对应的序号即为该数据的秩次，最小数值的秩次为“1”，最大数值的秩次为“n

13、1+n2”。,3、确定统计量T 将两个样本重新分开，计算各自的秩和。将较小的样本含量作为n1，其秩和作为检验的统计量T。若n1=n2，则任取一组的秩和为T。 4、统计推断由n1、(n2n1)查附表14(2)，得接受区域T0.05T0.05，T0.01-T0.01 。若T 在T0.05T0.05之内，P0.05，则不能否定HO，若T在T0.05T0.05之外但在T0.01T0.01之内，0.01P0.05，则否定HO，接受HA; 若T在T0.01T0.01之外，P0.01，则否定HO，接受HA，,【例4】研究两种不同能量水平饲料对5-6周龄肉仔鸡增重（克）的影响，资料如表11-4所示。问

14、两种不同能量水平的饲料对肉仔鸡增重的影响有无差异？,表4 两种不同能量水平饲料的肉仔鸡增重及秩和检验,1、提出无效假设与备择假设 HO：高能量饲料增重总体的中位数=低能量饲料增重总体的中位数； HA：高能量饲料增重总体的中位数低能量饲料增重总体的中位数。 2、编秩次将两组数据混合从小到大排列为秩次。在低能量组有两个“512”，不求平均秩次，其；在高、低两组有一对数据为“585”，需求它们的平均秩次：(8+9)/2=8.5。结果见表4。,3、确定统计量T 以较小样本的秩次和为统计量T，即T= 73.5。 4、统计推断由n1=6, n2-n1=9-6=3查附表10（2）得，为3165，为26

15、70。T=73.5在，即2670之外，P0.01, 否定HO，接受HA，表明饲料能量高低对肉仔鸡增重的影响差异极显著。,三、多个样本比较的秩和检验（Kruskal-Wallis法，H法）,1、提出无效假设与备择假设,HO：各个样本所分别代表的各总体分布位置相同； HA：各个样本所分别代表的各总体分布位置不完全相同。,2、编秩次、求秩和,将各个样本的所有观测值混合后，按照由小到大的顺序排成1，2，n个秩次。不同样本的相同观测值，取平均秩次；一个样本内的相同观测值，不求平均秩次。按样本把每个观测值的秩次一一相加，求出各样本的秩和。,3、求H值,式中，Ri为第i个样本的秩次之和； ni为第i个样本的

16、含量；n=ni,4、统计推断,根据n, ni查附表10（3），得临界值：H0.05，H0.01。若HH0.05，P0.05，不能否定HO，可以认为各样本代表的各总体分布位置相同；若H0.05HH0.01, 0.01P0.05，否定HO，接受HA，表明各样本所代表的各总体分布位置显著不同；若HH0.01, P0.01，表明各样本所代表的各总体分布位置极显著不同。,当样本数k3，ni5时，不能从附表10（3）中查得H值。这时H近似地呈自由度为k1的分布，可对H进行检验。当相同的秩次较多时，按（11-1）式计算的H值常常偏低，此时应按（11-2）式求校正的H值HC：式中，tj表示某个数重复的次数。,【例5】某试验研究三种不同制剂治疗钩虫的效果，用11只大白鼠做试验，分为三组。每只鼠先人工感染500条钩蚴，感染后第8天，三组分别给服用甲、乙、丙三种制剂，第1

展开阅读全文