统计分析系统sas--03

上传人:bin****86 文档编号:57530279 上传时间:2018-10-22 格式:PPT 页数:53 大小:1.27MB
返回 下载 相关 举报
统计分析系统sas--03_第1页
第1页 / 共53页
统计分析系统sas--03_第2页
第2页 / 共53页
统计分析系统sas--03_第3页
第3页 / 共53页
统计分析系统sas--03_第4页
第4页 / 共53页
统计分析系统sas--03_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《统计分析系统sas--03》由会员分享,可在线阅读,更多相关《统计分析系统sas--03(53页珍藏版)》请在金锄头文库上搜索。

1、第3讲数据步语句 SAS过程初步,计算中心 何宁,计算中心,数据步语句,选择语句 SELECT (选择表达式);WHEN(值列表) 语句;WHEN(值列表) 语句;OTHERWISE 语句; END;,计算中心,数据步语句,其中“选择表达式”是一个取数值、字符型值的变量或表达式,“值列表”为一项或者若干项,多项之间逗号分开,每项可以是一个与选择表达式相同取值类型的表达式。 “语句”可以是单个语句或复合语句。执行SELECT结构时,先计算出选择表达式和值列表中的所有值,然后把选择表达式值由前向后与值列表中的值相比,发现相等值则执行对应的语句,然后退出SELECT结构(不再查看后面的值列表). 如

2、果选择表达式的值不等于任何值列表中的值则执行OTHERWISE对应的语句,这种情况下没有OTHERWISE语句会出错。,计算中心,数据步语句,选择语句的另一种形式SELECT;WHEN(条件) 语句;WHEN(条件) 语句;OTHERWISE 语句;END; 这种SELECT语句没有选择表达式,而是在每一个 HEN语句指定一个条件(逻辑表达式) 执行第一个满足条件的WHEN后的语句 如果所有条件都不满足则执行OTHERWISE后的语句。,计算中心,数据步语句,SELECT;WHEN(age=12) put 少年;WHEN(age=5; Run;,计算中心,FREQ过程,Proc freq da

3、ta=数据集名 选项;tables 变量名列表/选项; Run; Tables语句中的选项:nocum不要累计的频数和百分数nopercent-不要百分数和累计的百分数 Proc freq语句中的选项:order=internal-按变量值排序freq-按频数降序排序data-按数据集中的值的次序排序formatted-按变量格式化的值排序,计算中心,MEANS过程,PROC MEANS DATA=;VAR ;BY ;CLASS ; RUN;,计算中心,可以计算的描述性统计量关键字及其含义见下表,计算中心,UNIVARIATE过程,PROC UNIVARIATE DATA = ;VAR ;BY

4、 | CLASS ;HISTOGRAM /;OUTPUT OUT = = ; RUN;,计算中心,UNIVARIATE过程,UNIVARIATE过程和MEANS过程的格式非常相似,相同的语句和选项其含义也相同,所不同的是某些统计量只能在UNIVARIATE过程中计算(如众数),而且UNIVARIATE过程中具有绘图功能。其中,HISTOGRAM语句用来指示SAS对其后所指定的变量绘制直方图,其后的选项用来指示SAS添加不同类型的拟合图形(如正态分布的分布密度曲线)。,计算中心,用分析家作频数统计,选择”解决方案/分析/分析家”进入分析家环境 点击”文件/按SAS名称打开”打开数据集 点击”统计

5、/描述性统计/频数统计”,在弹出的对话框中: AGE=Frequencies,Sex=Frequencies 点击OK,计算中心,FORMAT过程,PROC FORMAT; VALUE 格式变量名 分组形式; RUN; 其中:格式变量名由用户命名,在其他在其他过程中可以引用该格式名. 引用: PROC 过程名 DATA=数据集名; 过程语句; FORMAT 数据集中的变量名 格式名.; RUN;,计算中心,FORMAT过程,Proc format; Value wfmt low-13=“low“ 13-16=“13-16“ 16-high=“high“; Run; Proc print dat

6、a=temp.class; Format weight wfmt.; 若没有该语句,数据集中的Weight数据仍按原始显示 Run;,计算中心,SAS制作图形的过程,建立(或转换)数据文件 根据设计者的要求选用恰当的模型,生成图形 编辑、整理,得到满意的结果。 图形参数语句 Goptions 图形选项 设置图形输出的参数,如 goptions ftext=SWISS ctext=BLACK htext=1 cells; Symbole 图形选项 常对GPLOT过程输出的图形进行参数设置 Pattern 图形选项 常对CHART过程输出的图形进行参数设置,计算中心,使用GPLOT过程绘制散点图和

7、连线图,通常用散点图和连线图可以表示: 一个变量随另一个变量的变化;变量之间的关系;数据值的分布。 GPLOT过程的一般格式 PROC GPLOT DATA = ;PLOT * = /;SYMBOLn ; RUN;,计算中心,PLOT语句的选项,计算中心,SYMBOL语句用来控制表示点的符号和点间的连线。其中n是不同SYMBOL语句的序号,可以是1-99,缺省为1。选项见下表,计算中心,绘制函数y=sin(x)的曲线图,程序 DATA SIN; DO X=-2*3.14 TO 2*3.14 BY 0.2; Y1=SIN(X);Y2=COS(X); OUTPUT; END; SYMBOL1 I=

8、J V=PLUS; PROC GPLOT; PLOT Y1*X=1 Y2*X/OVERLAY; RUN;,计算中心,GCHART过程,GCHART过程用于绘制直方图、饼形图(扇形图)、三维直方图等表示变量分布的图形 语法格式 PROC GCHART DATA = ;图形关键字 / 绘制垂直条图; BY ; 指明分组变量; AXISn 定义坐标; Run;,计算中心,图形关键字,GCHART过程可以使用的图形关键字及其所绘制的图形类型见表,图形关键字后的变量名,用以指定进行图形描述时的分组变量,可以是数值型的(此时以各组的组中值为分组的标志),也可以是字符型的。,计算中心,选项列表,TYPE =

9、freq |cfreq |pct|cpct|sum|mean 统计图形变量的频数|累计频数| Discrete 把数字变量当成离散变量处理 GROUP=变量名,指定并排分组变量 SUBGROUP=变量名,按分组变量的值分段 Patternid=Midpoint,规定连续性图形变量按数字列表中的中心点数字次序进行排列 SUMVAR = 变量名(数值变量),指定要进行统计计算的变量,也就是“TYPE = 统计量关键字”选项中统计量的计算所依据的变量,计算中心,PATTERN语句,语句格式:pattern 选项; 常用选项: Color=颜色 设置花纹颜色 V=E|S|Ln|Rn|Xn 设置填充参数

10、依次可选:实心|空心|左斜线|右斜线|交叉线, 如: Goptions reset=all; Pattern v=x5 c=gray; Proc gchart data=aa.class; Vbar age/discrete; Run;,计算中心,画条形图(直方图),使用VBAR关键字可以画条形图 proc gchart data = aa.MYDATA;vbar Income; run; 结果如图所示,计算中心,PROC G3D options; PLOT y*x=z/options; 产生三维曲面图 Scatter y*x=z/options; 产生三维散点图 PLOT语句中的选择项(/options) CAXIS=color 坐标轴颜色 CBOTTOM=color 曲面底部区域颜色 CTOP=color 曲面顶部颜色 CTEXT=color 文本颜色,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号