文档详情

判断数据正态分布

壹****1
实名认证
店铺
DOCX
10.86KB
约2页
文档ID:425679195
判断数据正态分布_第1页
1/2

正态性检验简介生成正态概率图并进行假设检验,以检查观测值是否服从正态分布对于正态性 检验,假设为H0:数据服从正态分布与H1:数据不服从正态分布图形中的垂直尺度类似于正态概率图中的垂直尺度,水平轴为线性尺度,此线 形成数据所来自总体的累积分布函数的估计值图中会显示总体参数的数字估计(均 值和标准差)、正态性检验值以及关联的 p值正态性检验的方法很多,但具体原理 是不相同的,有些是拟合优度检验,有些是偏峰度检验用 Minitab 作数据的正态性检验的方法:统计〉基本统计量〉正态性检验(stat>Basic Statistic>Normality test)最后都是看P值,P>0・05就基本可以认为数据正态有如下三种检验方法:(1 Anderson-Daling,缺省状态即为此检验法,AD法最灵敏AD检验是很准确的判断方法,表面上在直线附近,但很可能被拒绝2 Ryan-Joiner (它实际上与W检验很相似ISO将它定为标准检验方法,中国国标也采用此法)3 口 Kolmogorov-Smirnov 方法Anderson-Darling和Kolmogorov- Smirnov检定方法是基于经验分布函数,Ryan-Joiner (类似 Shapiro-Wilk)是基于相关与回归的,一般而言都选Anderson-Darling。

三种检验方法的详细解释如下:Anderson-Darling检验(a-d检验),是一种基于经验累积分布函数(ecdf)的算法,特 别适用于小样本(当然也适用于大样本),AD值越小,表明分布对数据拟合度越好,A-D检 验只适合特定的连续分布如: normal、 lognormal、 exponential、 Weibull、 logistic、 extreme-value type 1A-D检验是对K-S检验的一种修正,相比K-S检验它加重了对尾部数据的考量,K-S检验 具有分布无关性,它的临界值并不依赖被测的特定分布,而A-D检验使用特定分布去计算临 界值,这使得A-D检验具有更灵敏的优势选择此项将执行正态性的 Anderson-Darling 检验,此检验是将样本数据的经验累积分 布函数与假设数据呈正态分布时期望的分布进行比较如果实测差异足够大,该检验将否定 总体呈正态分布的原假设Ryan-Joiner检验(r-j检验,类似于Shapiro-Wilk检验),是一种基于相关性的算法R-J 检验可得到一个相关系数,它越接近1就越表明数据和正态分布拟合得越好A-D检验和R-J检验在正态性检验中具有相似的功效,而K-S检验的功效较弱。

对于大 样本的拟合度测试,通常使用卡方检验(卡方检验是一种基于概率密度函数的算法,不适合 于小样本)会更好,因为卡方检测不需要分布参数的知识,并且卡方检验适用于连续和离散 分布选择此项将执行 Ryan-Joiner 检验,此检验通过计算数据与数据的正态分值之间的相关 性来评估正态性如果相关系数接近 1,则总体就很有可能呈正态分布 Ryan-Joiner 统计 量可以评估这种相关性的强度;如果它未达到适当的临界值,您将否定总体呈正态分布的原 假设此检验类似于 Shapiro-Wilk 正态性检验Kolmogorov-Smirnov检验(k-s检验),也是一种基于经验累积分布函数(ecdf)的算法,K-S 检验最吸引人的特性是具有分布无关性,所以适用于任何连续分布,很适合小样本(当 然也适合大样本)但是由于K-S检验相对尾部而言,往往对分布中心更敏感,并且它的临 界值并不依赖被测的特定分布,相对A-D检验而言它的灵敏度较低,所以很多的分析更愿意 使用 A-D 拟合度检验选择此项将执行正态性的 Kolmogorov-Smirnov 检验,此检验是将样本数据的经验累积 分布函数与假设数据呈正态分布时期望的分布进行比较。

如果实测差异足够大,该检验将否 定总体呈正态分布的原假设三种方法结合使用:如果这些检验的 p 值低于你选择的 a 水平,你可以否定原假设,并断定总体呈非正态 分布有资料上说Anderson-darling、Ryan-Joiner、Kolmogorov-Smirnov三种检验中只要有一 种给出否定的结论,就应该判定该分布非正态实际上 AD 检验即使通不过,但是另外两种能通过的话,也可以当成正态分布的,因为 可以把它看成近似正态分布,这个与样本的多少有关AD检验更适合小样本数量的检验 因此,有的时候AD通不过正态,其它两种能通过,也能把数据看作近似正态分布的 样本容量(样本中个体的数目)仅为5~10 也可以进行正态性检验但是样本容量过少时,即 使是正态,也会受到置疑因为那要看抽样时5个样本的代表性如何用图形化汇总来验证 数据是否正态携带的信息比较多, P 值、峰度、偏度都会在图形化汇总中显示出来。

下载提示
相似文档
正为您匹配相似的精品文档