资料的正态性检验汇总.doc

上传人:M****1 文档编号:561284158 上传时间:2023-08-03 格式:DOC 页数:10 大小:289.50KB
返回 下载 相关 举报
资料的正态性检验汇总.doc_第1页
第1页 / 共10页
资料的正态性检验汇总.doc_第2页
第2页 / 共10页
资料的正态性检验汇总.doc_第3页
第3页 / 共10页
资料的正态性检验汇总.doc_第4页
第4页 / 共10页
资料的正态性检验汇总.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《资料的正态性检验汇总.doc》由会员分享,可在线阅读,更多相关《资料的正态性检验汇总.doc(10页珍藏版)》请在金锄头文库上搜索。

1、资料的正态性检验汇总作者:huaxie 来源:【整理】 发布时间:2009-4-22 浏览: 567 访问者: 58.23.96.242摘要提示:本文汇总了通常在对资料进行正态性检验时遇到的问题,比如Kolmogorov-Smirnov检验(简称K-S检验),还是Shapiro-Wilk检验,SPSS里面用哪个过程,SAS程序等。SPSS和SAS常用正态检验方法如何在spss中进行正态分布检验 一、图示法1、P-P图以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。2、Q-Q图以样

2、本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。以上两种方法以Q-Q图为佳,效率较高。3、直方图判断方法:是否以钟形分布,同时可以选择输出正态性曲线。4、箱式图判断方法:观测离群值和中位数。5、茎叶图类似与直方图,但实质不同。二、计算法1、偏度系数(Skewness)和峰度系数(Kurtosis)计算公式:g1表示偏度,g2表示峰度,通过计算g1和g2及其标准误g1及g2然后作U检验。两种检验同时得出U0.05的结论时,才可以认为该组资料服从正态分布。由公式可见,部分文献中所说的“偏

3、度和峰度都接近0可以认为近似服从正态分布”并不严谨。2、非参数检验方法非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk (W 检验)。SAS中规定:当样本含量n 2000时,结果以Shapiro Wilk(W 检验)为准,当样本含量n 2000 时,结果以Kolmogorov Smirnov(D 检验)为准。SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,计算 Shapiro-Wilk 统计量。对于无权重或整数权重,在加权样本大小位于3 和 5000 之间时,计算该统计量。由此可见,部分SPSS教材里面关于

4、“Shapiro Wilk适用于样本量3-50之间的数据”的说法实在是理解片面,误人子弟。(2)单样本 Kolmogorov-Smirnov 检验可用于检验变量(例如income)是否为正态分布。对于此两种检验,如果P值大于0.05,表明资料服从正态分布。三、SPSS操作示例SPSS中有很多操作可以进行正态检验,在此只介绍最主要和最全面最方便的操作:1、工具栏-分析描述性统计探索性2、选择要分析的变量,选入因变量框内,然后点选图表,设置输出茎叶图和直方图,选择输出正态性检验图表,注意显示(Display)要选择双项(Both)。3、Output结果(1)Descriptives:描述中有峰度系

5、数和偏度系数,根据上述判断标准,数据不符合正态分布。Sk=0,Ku=0时,分布呈正态,Sk0时,分布呈正偏态,Sk0曲线比较陡峭,Ku 0 时, 分布呈正偏态,S k 0 时, 分布呈负偏态。适用条件:样本含量应大于2002、用夏皮罗-威尔克(Shapiro-Wilk)法检验数据正态性即W检验,1965 年提出,适用于样本含量n 50 时的正态性检验;。3、用达戈斯提诺(DAgostino)法检验数据正态性即D检验,1971提出,正态性D检验该方法效率高,是比较精确的正态检验法。4、Shapiro-Francia 法即W检验,于1972 年提出,适用于50 n 5000 结果以Kolmogor

6、ov - Smirnov 为准。而SAS 规定:当样本含量n 2000 时,结果以Shapiro - Wilk (W 检验) 为准,当样本含量n 2000 时,结果以Kolmogorov - Smirnov (D 检验) 为准问:对照组和病例组都是20例,拟对某指标进行正态性检验,是用Kolmogorov-Smirnov检验(简称K-S检验),还是Shapiro-Wilk检验?已用K-S检验不能认为该指标不是正态分布,但是Shapiro-Wilk检验表明其为非正态分布,我该相信哪个检验结果?答:Kolmogorov-Smirnov检验:检验频数分布的正态性检验,适合大样本。Shapiro-Wi

7、lk检验:小样本数据的正态性检验。矩法正态性检验: 不限样本。问:用SPSS中analysze/discriptive statistics/explore法和用analyze/nonparametric tests/1-sample K-S法评价正态性,结果不完全相同,为什么?答:以第二个为准,第一种方法是参数检验,而第二种是非参数检验,第一种是在知道总体分布的情况下做的,第二种是在不知道总体分布的情况进行的检验,而且大多数的检验,我们都是不知道总体分布到底是什么才做的K-S检验。因此在做分析的时候一般用第二种,标准的检验单样本分布的方法。不过一般推荐用上面的,并且和SAS的结果比较吻合。同

8、时样本量小的时候选S-W的结果,至于结果的不同,应该是不同的方法算出的值不同,这很正常,因为这几个方法的数学表达式就不一样,中间对数据的处理也不一样,会有信息损失等原因的,在正态检验中,尤其是接近水准时,往往容易出现问题,所以要根据资料的性质判断用什么方法进行检验更合适。不是把所有的方法都做一遍。对于到底P取多少才有意义,说法有好多种,常用的是0.1 吧,SPSS自带的是0.2的界值。其实还是得结合QQ,PP图之类的来观察会好些。小样本最好不要看Kolmogorov-Smirnov的结果,常常会有问题,Shapiro-Wilk 的结果会好些。补充:如果根据国标,其偏态和峰态算法,其值为多少时符

9、合正态别有规定呢?K-S检验记得在资料上见过8=n=50时可以利用,小样本就不推荐,W检验在国标中不推荐,具体原因未知,不过,推荐了EPPS-PULLEY法(在SPSS,SAS软件中未见有这种检验,但有针对的软件对该法有独立开发)。问:那为什么用analysze/discriptive statistics/explore法的结果中,nonparametric tests 图下有一句话: test distribution is normal。这句话和P值不就矛盾了吗? 答:这个是对前面给出均数标准差时候的一个假定,因为如果不服从正态,给出这两个参数是没有实用价值的,或者说是错误的,所以它给了

10、一个假定。你看a,b标注在什么地方?问:大样本的非正态资料可看作近似正态分布的资料,那么其描述能不能用均数加减标准差来表示呢?一定要用中位数和四分位数间距来表示吗? 答:“大样本的非正态资料可看作近似正态分布的资料”这是基于中心极限定理,大样本均数服从正态分布,可用U检验进行两组均数的比较。并非大样本的非正态资料可看作近似正态分布的资料。大样本资料的描述可以用均数加减标准差。 数据的描述正态 XS 非正态 M(QR) (M代表中位数,QR=Q3-Q1,代表四分位数间距)非正态资料也有用 M(P25,P75)来进行描述的,能够更直观的看到数据的分布形状疑问:这儿有个值得考虑的问题,多大属于大样本

11、?如果样本是我们常说的“大样本”那么只能说明样本参数是符合正态分布。就样本资料来说,如果这个样本的资料偏态严重,那么就不适合采用均数加减标准差来对这个样本资料进行描述。问:SPSS中只有关于t检验的程序,请问U检验的程序在哪里呢? 答:U检验SAS程序(只有样本量、均数、标准差的情况)data utest;n1=116; x1=0.2189; s1=0.2351;n2=125; x2=0.2280; s2=0.2561;u=(x1-x2)/sqrt(s1*2/n1+s2*2/n2);p=(1-probnorm(abs(u)*2;proc print;var u p;run;SAS的正态性检验P

12、ROC UNIVARIATE DATA=data1 NORMALVAR x;RUN;注:以上问题即回答来自各大论坛,本工作室对其进行整理,和修正,以方便读者。如有不妥支出,请及时帮我们斧正,谢谢!如有与“GBT4882-2001数据的统计处理和解释-正态性检验”冲突的,请参照国标。下载地址http:/ 提取码:09042123310309MMH两种正态性检验方法差异比较SPSS 2010-06-26 13:20:34 阅读56 评论0 字号:大中小 SPSS里面有两处可以检验数据正态性,一个是: Analysis - Descriptive Statistics -Explore,这可能是常用的方法 另一处是:Analysis -Nonparametric tests - One sample K-S test, 两个地方虽然都用到了名称相同的Kolmogorov-Smirnov Test,但是经常会出现检验的结果不一致的情况。比如就用SPSS自带的数据Anxiety 2.sav,分别对trial1-trial4的检测值做正态性检验用EXPLORE得出的结果是:而用NPAR做出的结果是: 在探索里出现的Kolmogorov-Smirnov检验,它的右上角有一个a的注释号。下面的介绍表明它是经过Lill

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号