《Grubbs检验法》由会员分享,可在线阅读,更多相关《Grubbs检验法(26页珍藏版)》请在金锄头文库上搜索。
1、数据的统计处理和解释数据的统计处理和解释 正态样本离群值的判断和处理正态样本离群值的判断和处理1、 Grubbs检验法检验法2、 Dixon检验法检验法 数据的统计处理和解释数据的统计处理和解释数据的统计处理和解释(包括12个国标)正态样本离群值的判断和处理正态样本离群值的判断和处理已知标准差未知标准差Nair检测法离群值1GrubbsDixon偏度-峰度法Dixon1.主要内容出自GB/T 4883-2008 数据的统计处理和分析 正态样本离群值的判断和处理2.一部分文件引用自GB/T 4882-2001 数据的统计处理和解释 正态性检验 范围范围:适用于来自正态分布的样本适用于来自正态分布
2、的样本数据的统计处理和解释数据的统计处理和解释 说明:这两个方法及引用术语均来自国家标准说明:这两个方法及引用术语均来自国家标准 一:术语和定义一:术语和定义 离群值离群值 outlier 样本中的一个或几个观测值,他们离开其它观测值较远,暗示他们可能来自不同的总体样本中的一个或几个观测值,他们离开其它观测值较远,暗示他们可能来自不同的总体 检出水平检出水平 detection level 为检出离群值而指定的统计检验的为检出离群值而指定的统计检验的显著性水平显著性水平,用,用表示。表示。除非约定,除非约定,值应为值应为0.050.05 注1:用统计的方法检验测定值之间是否存在显著性差异,从而
3、判定结果或分析方法的可靠性,这一过程称为显著 性检验。 注2:在显著性检验中,将具有显著性差异的测定值在随机误差分布中出现的概率(小概率)称为显著性水平(水准)用表示,即这些测定值位于一定置信度所对应的随机误差界限之外。 注3:在置信区间内包含真值的概率称为置信度(置信水平)用P表示。注4:置信度和显著性水平的关系:P=1-数据的统计处理和解释数据的统计处理和解释统计离群值统计离群值 statistical outlier在剔除水平下统计检验为显著的离群值在剔除水平下统计检验为显著的离群值剔除水平剔除水平 deletion level为检出离群值是否高度离群而指定的统计检验的显著性水平,用为检
4、出离群值是否高度离群而指定的统计检验的显著性水平,用*表示,除表示,除非约定,非约定,*值应为值应为0.01歧离值歧离值 straggler在检出水平下显著,但在剔除水平下不显著的离群值在检出水平下显著,但在剔除水平下不显著的离群值数据的统计处理和解释数据的统计处理和解释二:符号和缩略语 n 样本量样本量 样本平均值样本平均值检验离群值所使用的显著水平,简称检出水平检验离群值所使用的显著水平,简称检出水平 * *检验统计离群值所使用的显著水平,简称剔除水平检验统计离群值所使用的显著水平,简称剔除水平( (* G1- (n)时,判定时,判定xixi为离群值,否则判未发现为离群值,否则判未发现xi
5、xi是离群值。是离群值。 b: b:下侧判断下侧判断 当当GnG1-(n)时,判定时,判定x x1 1为离群值,否则判未发现为离群值,否则判未发现x x1 1是离群值。是离群值。 c:c:双侧判断双侧判断 当当GnGn且且GnG1-/2(n) )时时, ,判定判定xi为离群值为离群值; 当当GnGn且且GnG1-/2(n)时时,判定判定x1为离群值为离群值; 否则判断未发现离群值。否则判断未发现离群值。数据的统计处理和解释数据的统计处理和解释质量质量数据的统计处理和解释数据的统计处理和解释4、统计离群值的判断(单侧)A、当检出、当检出Xi或或X1为离群值时,确定剔除水平为离群值时,确定剔除水平
6、*B、查附表、查附表1,G1-*(n)当当GnG1-*(n)时时上侧上侧判断判断Xi为统计离群值为统计离群值否则否则Xi为歧离值为歧离值判断判断X1为统计离群值为统计离群值否则否则X1为歧离值为歧离值数据的统计处理和解释数据的统计处理和解释当当GnG1-*(n)时时否则否则下侧下侧数据的统计处理和解释数据的统计处理和解释5、统计离群值的判断(双侧)A、当检出、当检出Xi或或X1为离群值时,确定剔除水平为离群值时,确定剔除水平*B、查附表、查附表1,G1-*/2(n)当当GnG1-/2*(n)时时双侧双侧1判断判断X1为统计离群值为统计离群值否则否则X1为歧离值为歧离值判断判断Xi为统计离群值为
7、统计离群值否则否则Xi为歧离值为歧离值数据的统计处理和解释数据的统计处理和解释当当GnG1-/2*(n)时时否则否则双侧双侧2数据的统计处理和解释数据的统计处理和解释使用Grubbs法检验的实例.临时文件soybean meal - November 2007.xls数据的统计处理和解释数据的统计处理和解释样本量(n)检验高端离群值检验低端离群值37 x(n)-x(n-1) x(n)-x(1) x(2)-x(1) x(n)- x(1)810 x(n)-x(n-1) x(n)-x(2) x(2)-x(1) x(n-1)-x(1)1113 x(n)-x(n-2) x(n)-x(2) x(3)-x(
8、1) x(n-1)-x(1)1430 x(n)-x(n-2) x(n)-x(3) x(3)-x(1) x(n-2)-x(1)Dixon检验法:检验法:Dn=r10=Dn=r10=Dn=r11=Dn=r21=Dn=r22=Dn=r11=Dn=r21=Dn=r22=数据的统计处理和解释数据的统计处理和解释Dixon检验法确认检出水平确认检出水平,在,在附表附表2 2中查出临界值中查出临界值D D1 1- -(n)(n)。当当Dn D1-(n)时,判定时,判定Xn为离群值为离群值当当Dn D1-(n)时,判定时,判定X1为离群值为离群值否则二者都判未发现离群值。否则二者都判未发现离群值。附表附表2
9、2相见相见GB/T4883-2008GB/T4883-2008 单侧单侧DixonDixon检验的临界值表,这检验的临界值表,这里将不再列举。里将不再列举。数据的统计处理和解释数据的统计处理和解释 Dixon检验法:统计离群值的判断(单侧)A、当检出、当检出Xn或或X1为离群值时,确定剔除水平为离群值时,确定剔除水平*B、查附表、查附表3,D1-*(n)Dixon检验法:统计离群值的判断(双侧)略当当DnD1-*(n)时时低端低端判断判断X1为统计离群值为统计离群值否则否则X1为歧离值为歧离值判断判断Xn为统计离群值为统计离群值否则否则Xn为歧离值为歧离值数据的统计处理和解释数据的统计处理和解
10、释当当DnD1-*(n)时时否则否则高端高端数据的统计处理和解释数据的统计处理和解释 附表附表1 Grubbs1 Grubbs检验的临界值表检验的临界值表n0.90 0.950.9750.990.99531.1481.1531.1551.1551.15541.4251.4631.4811.4921.49651.6021.6721.7151.7491.76461.7291.8221.8871.9441.97371.8281.9382.022.0972.13981.9092.0322.1262.2212.27491.9772.112.2152.3232.387102.0362.1762.292.4
11、12.482112.0882.2342.3552.4852.564122.1342.2852.4122.552.636132.1752.3312.4622.6072.699142.2132.3712.5072.6592.755152.2472.4092.5492.7052.806162.2792.4432.5852.7472.852172.3092.4752.622.7852.894182.3352.5042.6512.8212.932192.3612.5322.6812.8542.968202.3852.5572.7092.8843.001数据的统计处理和解释数据的统计处理和解释附表附表1
12、Grubbs1 Grubbs检验的临界值表检验的临界值表n0.90 0.950.9750.990.995212.4082.582.7332.9123.031222.4292.6032.7582.9393.06232.4482.6242.7812.9633.087242.4672.6442.8022.9873.112252.4862.6632.8223.0093.135262.5022.6812.8413.0293.157272.5192.6982.8593.0493.178282.5342.7142.8763.0683.199292.5492.732.8933.0853.218302.5632.7452.9083.1033.236因篇幅有限,将不再列举后面的表。详细信息见因篇幅有限,将不再列举后面的表。详细信息见GB/T4883-2008数据的统计处理和解释数据的统计处理和解释 Thank you!总体:研究对象的全体为总体。其具有:同质性、大量性、差异性。(有限和无限总体)样本:从总体中抽取部分个体所组成的集合称为样本。具有:代表性、客观性、随机性。