《二、单变量的统计描述》由会员分享,可在线阅读,更多相关《二、单变量的统计描述(12页珍藏版)》请在金锄头文库上搜索。
1、1,二、单变量的统计描述,统计分析内容回顾 统计描述:集中趋势、离散趋势统计推断:参数估计:总体参数估计(可信区间)假设检验资料类型计量资料-连续变量计数资料- 分类变量,2,一般统计描述-MEANS 过程,Proc means 操作选项统计量关键字列表; VAR ;/*指定分析的变量名列表,缺省为所 有数值变量*/ BY ; /*指定分组统计变量,要求排序*/ CLASS ;/*指定分组统计变量,不要求排序*/ FREQ ; /*表明该变量为分析变量的频数*/ OUTPUT 关键字= ; Run;,3,Proc means 操作选项data= 指定要分析的数据集名maxdec= 指定输出结果
2、的小数位数,默认为7位noprint 禁止统计结果在output窗输出alpha= 设定计算可信区间的水平,默认为0.05 注:在proc语句中的选项直接跟在proc名后,以空格分隔,中间不加“/” ,其他命令语句的选项需以“/” 分隔。,一般统计描述-MEANS 过程,4,统计指标选项:,一般统计描述-MEANS 过程,5,OUTPUT 关键字= 语句 将分析结果输出到SAS 数据集OUT= 数据集名 指定SAS数据集名称关键字= 指定要输出的统计量 可输出的有N,NMISS,MEAN,STD, MIN,MAX,RANGE, SUM, VAR,USS(平方和),CSS(离均差平方和),CV,
3、STDERR,T, PRT, SKEWNESS, KURTOSIS,LCLM,UCLM(同时指定输出为双侧;如只选一个,输出单侧可信区间)可以重新对统计量命名,也可用原名; 格式 n=n mean=mean prt=p,一般统计描述-MEANS 过程,6,程序3-1,data a;set child ;proc means maxdec=2;var x2-x6;run; Variable N Mean Std Dev Minimum Maximum - X2 7 73.86 70.48 30.00 178.00 X3 6 116.25 38.24 89.00 168.00 X4 7 23.79
4、 19.48 11.00 53.50 X5 7 59.29 14.74 47.00 82.00 X6 7 56.43 26.25 35.39 100.14 -,7,加入 class x1; 后:,X1 N Obs Variable N Mean Std Dev Minimum Maximum - f 3 X2 3 80.33 84.60 30.00 178.00 X3 3 115.00 41.57 91.00 163.00 X4 3 24.50 22.95 11.00 51.00 X5 3 58.00 18.19 47.00 79.00 X6 3 55.93 27.69 35.39 87.42
5、 m 4 X2 4 69.00 71.34 32.00 176.00 X3 3 117.50 43.85 89.00 168.00 X4 4 23.25 20.18 12.50 53.50 X5 4 60.25 14.52 52.00 82.00 X6 4 56.80 29.44 35.81 100.14 -,8,程序3-2,data a;input group x y z; cards; 1 545 40 50 1 490 46 39 1 515 45 44 1 505 45 47 1 492 46 32 2 485 45 25 2 499 49 17 2 480 45 20 2 566 4
6、9 36 2 539 49 27 ;,proc means maxdec=2 noprint; var x ; class group;output out=b n=n mean=mean sum =sum std=std lclm=lclm uclm=uclm; run;proc print ;run;,9,程序3-2,OBS GROUP _TYPE_ _FREQ_ N MEAN SUM STD LCLM UCLM1 . 0 10 10 511.6 5116 29.0524 490.817 532.3832 1 1 5 5 509.4 2547 22.3450 481.655 537.145
7、3 2 1 5 5 513.8 2569 37.2518 467.546 560.054,10,详细统计描述-UNIVARIATE 过程,Proc univariate 操作选项 ; VAR ; 指定分析的变量名列表, 缺省为所有数值变量 BY ; 指定分组统计变量,要求排序 FREQ ; 表明该变量为分析变量的频数Run;proc univariate 语句的操作选项 data= 指定要分析的数据集名 noprint 禁止统计结果在output窗输出 normal 进行正态性检验 plot 生成统计图,11,程序3-2,3 结果 Univariate ProcedureVariable=X
8、Moments N(样本含量) 12 Sum Wgts(总权重) 12 Mean(均数) 6.5 Sum(合计) 78 Std Dev(标准差) 2.54058 Variance(方差) 6.454545 Skewness(偏度) 0 Kurtosis(峰度) -1.39044 USS(平方和) 578 CSS(离均差平方和) 71 CV(变异系数) 39.08584 Std Mean(标准误) 0.733402 T:Mean=0(均数是否为0的检验)8.862804 Pr|T|(t值对应的p值) 0.0001 Num = 0(不等于0的样本数) 12 Num 0(大于0的样本数) 12 M(
9、Sign)(符号检验) 6 Pr=|M|(符号检验的p值)0.0005 Sgn Rank(符号秩和检验) 39 Pr=|S|(符号秩和检验的p值).0005 W:Normal(正态性检验W检验)0.932772 PrW(正态性检验的p值) 0.3843,12,程序3-2,3 结果 Quantiles(Def=5)(百分位数) 100% Max 10 99% 10 75% Q3 8.5 95% 10 50% Med 6.5 90% 10 25% Q1 4.5 10% 3 0% Min 3 5% 3 1% 3 Range 7 (极差) Q3-Q1 4 (四分位数间距) Mode 3 (众数) Extremes (极端值) Lowest Obs Highest Obs 3( 8) 8( 3) 3( 1) 8( 10) 4( 12) 9( 2) 5( 6) 10( 9) 5( 5) 10( 11),