研究生统计学讲义第8讲非参数检验与ridit分析

资源描述

《研究生统计学讲义第8讲非参数检验与ridit分析》由会员分享，可在线阅读，更多相关《研究生统计学讲义第8讲非参数检验与ridit分析（67页珍藏版）》请在金锄头文库上搜索。

1、第11章非参数检验、Ridit分析,第一节非参数统计的意义,前面介绍的统计分析方法，通常都要求样本来自的总体分布类型已知(如样本来自正态分布的总体)，在这种假设基础上，对总体参数(如总体均数)进行估计或检验，称为参数统计(parametric statistics)。若不知道样本来自的总体分布类型或已知总体分布与检验所要求的条件不符，此时可用非参数统计(nonparametric statistics)进行假设检验。非参数检验是一种与总体分布无关的统计检验方法，它不比较参数，而是比较分布的位置。常采用“符号”(sign)或“等级”(rank)来代替数据本身进行分析。例如，秩和检验(rank

2、 sum test)、中位数检验(median test)等。,非参数统计的优点是不受总体分布类型的限制，应用范围广，对数据的要求不象参数检验那样严格，不论定量变量和分类变量均可用非参数检验。非参数检验的不足之处是：对符合用参数统计的资料，用非参数检验(如两样本均数比较，符合检验条件时，用秩和检验)，一般犯第二类错误的概率比参数检验大，若要使相同，非参数检验要比参数检验需要更多的样本例数。故适合参数统计条件的资料，一般先选参数检验，若参数检验的应用条件得不到满足，才用非参数检验。,用SPSS11.5进行非参数检验，由主菜单Analysis下拉菜单中的Nonparametric tests菜单导

3、出，其中列出了8 种非参数分析方法：,1.Chi-square test（2检验）：用2检验作同一样本中两个或多个构成比的比较，操作过程如例8.14，检验变量的几个取值所占百分比和期望的比例有无统计学差异。注意：该检验和一般用的2 检验不一样，一般的2检验用Analyze 中 Descriptive Statistics下拉菜单的Crosstable完成，而不是这里。具体见P143E8.15。,2.Binomial Test（二项分布检验）：用于检验所给的变量是否符合二项分布，变量可以是两分类的，也可以是连续性变量，按给出的分界点检验。,3.Runs Test（游程检验）：用于检验某变量值的变

4、化是否随机，是否是围绕着某个数值（如均数、中位数、众数或自定义数值）随机波动。操作过程如P154例9.8、,4. 1-Sample K-S Test（即One-Sample Kolmogorov-Smirnov Test单个样本的柯尔莫哥诺夫-斯米尔诺夫检验）：用于分析变量是否符合某种分布，可检验Normal（正态分布）、Uniform（均匀分布）、Poisson（Poission分布）和Exponential（指数分布）。操作过程如例3.1(血糖）中所做的探索性分析。,5. 2 Independent-Samples Tests（两个独立样本检验）：完全随机设计的两样本均数比较的非参数检验，

5、操作过程如例11.3。 6. K Independent Samples（多个独立样本检验）：完全随机设计的多个样本均数比较的非参数检验，操作过程如例11.5,7、2 Related-Samples Tests（两相关样本检验）：配对设计两样本均数的非参数检验。操作过程如例11.1、例9.1。,8、 K Related Samples Test（多个相关样本检验）：配伍设计多个样本均数的非参数检验，操作如例11.7,第二节配对设计资料的秩和检验(Wilcoxon法),所谓秩(rank), 又称等级, 实际上就是按数值大小顺序作1, 2, 3, , 等级的一种编码. 秩和检验常用于有序分类变量

6、或不符合用参数检验的资料. 两个或多个有序分类变量(等级资料)的比较, 如临床疗效分为治愈, 显效，好转, 无效; 尿糖分为, , , , ;针麻效果分为，级等.,可以列成2k 表或RC表，用RC表的 2 检验比较差异，但2 检验能说明各等级构成或各对比率是否相同，但不能说明对比各组疗效的优劣或针麻效果好坏等。而秩和检验与Ridit分析则可以起作用。,配对设计资料的符号秩和检验（Wilcoxon法）不仅可用于配对比较，亦可用于样本中位数与总体中位数比较，基本思想是：若H0成立，则配对数值的差值应服从均数T : 标准差T :,T =n(n+1)/4，,的对称分布,将配对的差值按绝对值大小编秩并标

7、上原来差值的符号后,带正号、带负号的秩和在理论上是均匀的, 即使有些差别,也只是随机因素造成的差别,应在一定范围内。,如果正、负秩和相差悬殊，统计量 T 特别小或特别大，则 H0 为真的可能性很小，从T 界值表(附表12)也可看出，当 n 确定以后，T 界值的下限愈小，上限愈大时，P 值愈小。因而可按小概率原理，拒绝H0；反之，不能拒绝H0 。随着 n增大，T 分布逐渐逼近:,均数:T=n(n1)/4，,方差为:,的正态分布。可用 u 检验。,Wilcoxon法配对符号秩和检验对子数 n 必须大于5。因n5时，可以排出差值编秩的所有组成共有32种情况。当各配对的差值符号相同时，秩和绝对值较小者

8、为0，较大者为15的5个自然数之和15，即T0或T15；其它情况下0T15；可知n5时，T的取值范围是015，,而P(T0)P(T15)1/320.03125，双侧概率为0.0312520.06250，已大于0.05。所以当n5时，用符号秩和检验不能得出双侧概率P0.05，故 n 必须大于5。,1配对设计资料比较的符号秩和检验,例9.1,.,(1) H0：配对差值总体中位数Md0；,H1：配对差值总体中位数Md 0 .0.05.,差值 -20 36 -5 -2 2 0 -10 -48,rank -8 10 - 3 -1.5 1.5 -5 -11,由于n11(因为有0)，T+11.5、T-54.

9、5，则统计量T11.5. 查统计用表12，11.5在(10,56)内,双侧P0.05，以0.05水准不拒绝H0，差值总体中位数与0的差异有无统计意义，尚不能认为两法检测谷-丙转氨酶的结果不同。,a.在n25时，可查统计用表11，用T值与T界值进行比较若T值在上、下界范围内，则 P 值大于相应概率；若T值为上、下界值或范围外，则 P 值小于相应概率,在n 25时，可用连续的u检验作不连续T分布的近似，即:,在相同差值太多时（不包括差值为0），由于求得的u值偏小，要进行校正，即,ti为第i个相同秩次的个数,SPSS11.5，建立数据文件P147E1.sav , Analyze， Nonparame

10、tric Tests，2 Related Samples,解法2:软件计算,表中显示：按y-x的正秩输出，检验统计量Z=-1.913，双侧大约概率P=0.056，故以=0.05水准不拒绝H0，接受H1。,二、单样本资料的秩和检验样本中位数与总体中位数比较的目的是推断样本是否来自某已知中位数的总体。检验方法步骤和配对比较的符号秩和检验一样，唯一不同的是用每一个样本观测值与已知总体中位数相减来计算“差值”。,【例9.2】已知某地正常人尿氟含量的中位数为0.86mg/L，今在该地某厂随机抽取12名工人，测得尿氟含量（mg/L）为：0.84，0.86，0.88，0.94，0.97，1.01，1.05

11、，1.09，1.20，1.28，1.35，1.83。推断该厂工人的尿氟含量是否高于当地正常人。因据经验尿氟含量不满足正态性，本例小样本资料，虽经正态性检验不拒绝H0，还是按不满足正态性处理，采用Wilcoxon符号秩和检验。,H0：该厂工人的尿氟含量与当地正常人相同，中位数Md0.86；H1：该厂工人的尿氟含量高于当地正常人， Md0.86。0.05。分别求12个观测值与总体中位数0.86之差（标明正负号），有一个差值为0，不编秩，依差值的绝对值从小到大编秩11个，标上原差值的正负号，统计正、负秩和分别为1.5、64.5，取T1.5。用n11查配对秩和检验T界值表（附表11），T1.5在单侧

12、T0.005/2（12）561的范围外，P0.005，按0.05水准，拒绝H0，接受H1，可认为该厂工人的尿氟含量高于当地正常人。,第三节完全随机设计两样本比较的秩和检验,完全随机设计两样本比较秩和检验是用两样本观察值的秩来推断两样本分别代表的总体分布位置是否不同。本节介绍Wilcoxon两样本比较法。,1计量资料的两样本比较例9.3 为了考察中药葛根对心脏的影响，使用3g/100mL和5g/100mL葛根的剂量，测定大鼠用药后一分钟心肌收缩的抑制率(1用药后心肌的收缩量/用药前心肌的收缩量)100，试检验这两种葛根剂量对心肌收缩作用是否相同？,3g/100ml组 94.45 54.69

13、1.24 81.80 85.19 86.92 91.32,5g/100ml组 90.71 98.25 79.92 90.68 68.64 91.90,-1.24 54.69 68.64 79.92 81.80 85.19 86.92 90.68 1 2 3 4 5 6 7 8,90.71 91.32 91.90 94.45 98.25 9 10 11 12 13,n1=6 , T=3+4+8+9+11+13=48,成组资料比较时，H0:两总体分布相同在H0成立时，容量分别为n1、n2的两个样本来自同一总体定量资料编秩时, 同组相同数据取顺序秩次, 不同组相同数据取平均秩次. 分类资料编秩时,

14、同一等级取平均秩次. 规定n1n2 , 记Nn1n2 , 容量为n1样本的秩和T与平均秩和n1(N1)/2理论上应相差不大 . 当n1、n2增大时 , T 的分布逐渐逼近: =N1(N1)/2 =n1n2(N1)/12 的正态分布,这种方法，称为成组秩和检验（Wilcoxon法）在n1、n2较小时，可查统计用表12，用T值与T界值进行比较若T值在上、下界范围内，则P值大于相应概率；若T值为上、下界值或范围外，则P值小于相应概率,在n1、n2较大时，可用连续的u检验作不连续T分布的近似，即,Nn1n2,在两样本相同秩次的个数太多时，由于求得的u值偏小，要进行校正，即,Nn1n2，ti 为第 i

15、个相同秩个数,解法1: 这是定量资料但不要求正态分布，H0:两总体分布相同，H1:两总体分布不同.,3g组 1.24 54.69 81.8 85.19 86.92,5g组 68.64 79.92 90.68,3g组 91.32 94.45 n2=7,Rank 1 2 3 4 5 6 7 8,5g组 90.71 91.90 98.25 n1=6,Rank 9 10 11 12 13 T=48,查统计用表11成组T界值，单侧P0.05，只能以0.05水准接受H0，两总体分布相同，不能认为两种剂量的效果不同,解法2: 用SPSS11.5统计软件,H0：两总体分布相同；,H1：两总体分布不相同,0.05。,Test Statisticsb 表中给出了Mann-Whitney U统计量为15、Wilcoxon W统计量为43, 两法的检验统计量Z= -0.857, 双侧近似P值=0.391, 确切概率=0.445。故双侧检验接受H0两总体分布相同,不能认为葛根两种剂量的效果不

展开阅读全文

研究生 统计学讲义 第8讲 非参数检验与ridit分析

研究生统计学讲义第8讲非参数检验与ridit分析