一些常用的sas命令

上传人:小** 文档编号:56664585 上传时间:2018-10-14 格式:DOC 页数:14 大小:38.50KB
返回 下载 相关 举报
一些常用的sas命令_第1页
第1页 / 共14页
一些常用的sas命令_第2页
第2页 / 共14页
一些常用的sas命令_第3页
第3页 / 共14页
一些常用的sas命令_第4页
第4页 / 共14页
一些常用的sas命令_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《一些常用的sas命令》由会员分享,可在线阅读,更多相关《一些常用的sas命令(14页珍藏版)》请在金锄头文库上搜索。

1、常用 SAS 命令1. SAS 的子窗口主要有浏览器窗口(EXPLORER) 、结果窗口(RESULTS) 、程序编辑器窗口(program editor) 、日志窗口(log)、输出窗口(output);2.切换至日志窗口的命令是 log、热键是 F6;切换至输出窗口的命令是 output、热键是 F7;3.提交 SAS 程序的命令是 submit;4. SAS 系统是大型集成软件系统,具备完备的数据访问、管理、分析和呈现及应用开发功能;5. SAS 数据集是一类由 SAS 系统建立、维护和管理的数据文件;6.为了实现存储和管理面向对象的开发任务,SAS 建立目录册(catalog)类型的文

2、件,在这一类文件中可以存储整个应用系统,包括它的界面,源程序和各种对象间的连接;7. SAS 逻辑库是一个逻辑概念,一个逻辑库就是存放在同一文件夹或几个文件夹中的一组 SAS 文件;8.在 SAS 软件系统的信息组织中,总共只有两个层次:SAS 逻辑库是高一级的层次,低一级的层次就是 SAS 文件本身;9.在 SAS 系统中,为便于访问一个 SAS 文件,要为该 SAS 文件所在的位置指定一个 SAS 逻辑库,即赋予一个逻辑库名,在指定逻辑库名后,就可使用两级命名的方式引用 SAS 文件:逻辑库名.文件名;10.在每个 SAS 进程一开始,系统就自动地指定了一些逻辑库供用户使用,它们是 WOR

3、K、SASHELP 和 SASUSER;11.在每个 SAS 进程开始时系统缺省地创建名为 work 的 SAS 逻辑库,它是一个临时逻辑库,在引用 WORK 库中的 SAS 文件时,可省略逻辑库名;12.永久逻辑库是指它的内容在当前 SAS 进程结束时仍被保留的 SAS逻辑库,在 SAS 系统中除了库名为 WORK 以外的逻辑库都是永久库;13. Sashelp 包含所安装 SAS 系统各个产品有关的 SAS 文件,运行安装的 SAS 系统所需要的 SAS 文件缺省地存储在这个逻辑库中;14. Sasuser 包含为满足用户需要而特制的 SAS 文件,用户的一些设置也放在 Sasuser 逻

4、辑库中;Sasuser 也是存放为您个人使用而创建的文件的合适场合;15.库引擎是规定系统用什么格式向逻辑库读写文件的内部指令;16.由于 Sashelp、Sasuser 和 Work 是系统自动设定的,这些逻辑库名是不能删除的;17.一个 SAS 数据集是一个包含两个组成部分的文件:一个描述部分和一个数据部分。某些 SAS 数据集也另外包含一个索引文件;18. SAS 数据集的变量属性信息包括变量的:名称(name) 、类型(type) 、长度(length) 、输出格式(format) 、输入格式(informat)和变量标签(label) ;19.SAS 编程前必须明确以下三个方面:什么

5、是输入的或供操作的数据、要对输入的数据进行什么加工、期望的输出结果是什么;20.每个 SAS 程序是由许多完成单个动作的程序步和一些设定环境的语句构成的;21.数据步(data step):读入源数据文件和 SAS 数据集,修改、编辑或创建 SAS 数据集或文本文件;22.过程步(proc step):面向 SAS 数据集,完成某个特定的计算、分析和呈现的功能;23.每个语句是由一个关键词开始,并以分号结束,通常就用开始的关键词命名这个语句;24. DATA 语句和 PROC 语句分别标志数据步和过程步的开始,RUN 语句或另一个程序步的开始标志程序步的结束;25.指定逻辑库名的语句的一般形式

6、为:libname 逻辑库名 库的实际地址 ;26 在程序编辑器窗口提交语句: libname 逻辑库名 list;可以在log 窗口显示该逻辑库的连接;27.多个物理位置指定同一个逻辑库名的一般形式为:libname 逻辑库名(物理位置 1 物理位置 2) ;28. 指定逻辑文件名语句的一般形式为:filename 逻辑文件名 文件位置 ;29. 查看 SAS 逻辑库的属性和内容的一般写法为:proc datasets lib=逻辑库名;run;30. 查看 SAS 数据集的属性的一般写法为:proc contents data=数据集名;run;31. 输出数据集的数据部分的一般写法为:p

7、roc print data=数据集名;run;32. 转换文本数据文件的数据步的一般形式为:data 数据集名;infile 文件名;input 变量输入设定;run;33. input 语句的一般形式为:input 指针控制 变量名 输入格式;34. 指针控制n 表示从第 n 列开始读入,+n 表示将列控制指针增加 n 列后读入;35. 程序数据列 PDV 包含两个自动生成的(临时)变量:_N_、_ERROR_,它们可以在程序中使用,但不作为观测的一部分写入数据集;36. retain 语句的一般形式为:retain 变量名 变量名 ;37. 在数据步执行的每次循环中,retain 语句指

8、定的变量不再从新初始化,保留它以前存储的结果;38. 求和语句的一般形式是:变量名+表达式;在求和语句中加号前后的项有不同的作用,一个是累加的变量,另一个是相加的表达式,两者位置是不能互换的;39. 函数 LAG 和 DIF 调用的一般形式为:LAG(变量名);DIF(变量名) ;函数 LAG 的返回值是上一条记录中该变量的值,函数 DIF 的返回值是当前记录中变量值减去上一条记录中该变量的值;40. 实现将加工结果存为文本格式的数据步程序的一般形式为:Data_Null_;数据读入语句组;数据加工语句组;file 文件名;put 变量写入设定;run;41. 过程 import 的作用是实现

9、将 PC 格式数据文件、以固定字符为字段分隔符的文本文件转换为 SAS 数据集;42. DROP 和 KEEP 语句的作用是实现对生成数据集的变量进行删减;43. 在数据步的加工过程中,可使用 IF 语句选择要保留的观测,其一般形式为:IF 表达式;44. 临时变量 FIRST.*它在 BY 变量每个值的第一条记录时为 1,否则为 0;临时变量 LAST.*它在 BY 变量每个值的最后一条记录时为1,否则为 0;45. 过程 PRINT 的一般形式为:proc print data=数据集名 选项;id 变量 1 变量 2;var 变量 1 变量 2;sum 变量 1 变量 2;by 变量 1

10、 变量 2;pageby 变量 1 变量 2;run;46. 过程 FORMAT 可以设定用户自己的输出格式,对变量的不同值或不同范围的值以设定的不同的标签来显示,其一般形式为:PROC FORMAT;VALUE 格式名范围 1=标签 1范围 2=标签 2; run;47. 汇总信息最常用的就是各个变量取值的分布(取各个值的频数和百分数)和一些常用的描述统计量;48. SAS 中计算频数分布和描述统计量最常用的过程是 FREQ 和MEANS;49. FREQ 过程的一般形式为:proc freq data=数据集;tables 变量 1 变量 3;weight 变量名;format 变量 1

11、输出格式 变量 2 输出格式;run;50. mean 过程的一般形式为:proc mean data=数据集 ;var 变量 1 变量 2;class 变量 1 变量 2;freq 变量;weight 变量;output out=数据集统计量关键字=/autoname;run;51. 使用过程 TABULATE 制作一个报表,必须确定:什么是分类变量、什么是分析变量、计算什么统计量、用怎样的表格展示结果;52. 过程 tabulate 的基本形式为:proc tabulate data=数据集;class 变量 1 变量 2;var 变量 1 变量 2;table 行表达式,列表达式选项;r

12、un;53. keylabel 语句可对过程 tabulate 制作表格中的统计量名称进行更改,类似于变量标签的设定;54. 制作散点图使用的过程是 gplot,它的最简单的用法为:proc gplot data=数据集;plot 纵轴变量*横轴变量;run;55. 在过程 gplot 中,控制表示点的符号和点间连线的是 symbol 语句;56. 完成关于坐标轴的修饰是 AXIS 语句;57. 在一个过程步中制作多幅图形,可有以下几种做法:使用 BY 语句、在 PLOT 语句中提出多个纵横轴组合、在过程步中使用多个PLOT 语句;58. PLOT 语名可按第三个变量的不同值分别绘制连线并置于

13、同一幅图上,这一用法的一般形式为:PLOT 纵轴变量*横轴变量=第三变量选项;59. 过程 GCHART 制作汇总图的一般形式为:proc gchart data=数据集;图形名 分类变量选项;run;60. PLOT 过程中绘制柱状图、饼图的语句是 HBAR、VBAR、PIE,其选择分析变量和统计量的选项为:SUMVAR=变量名 TYPE=统计量;61. 使用过程 GCHART 制作柱状图时,对每个柱的花纹和颜色进行设定是通过 pattern 语句实现的;62. UNIVARITE 过程的功能比 FREQ 过程的功能更强,UNIVARITE过程除了能够统计频数、各种百分比之外,还可以统计均值

14、、标准偏差等描述性统计量以及图形显示;63. UNIVARITE 过程的一般形式:proc univariate data=数据集 freq plot;var 变量表;run;64定义宏变量的一般形式%let 变量名=值;65引用宏变量格式为&宏变量名;66在数据步中生成宏变量调用 symput()函数;67调用宏程序采用%宏名称;68使用%include 读入宏定义;69在程序中宏变量被引用的效果为用宏变量的值直接替代宏变量名,这一过程也称之为解读;70相关分析过程为 proc corr;71线性回归分析过程为 proc reg;72logistic 回归采用过程 proc logistic;73.方差分析采用过程 proc anova;74从外部导入数据的过程为 proc import;75从 SAS 导出数据的过程为 proc export。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号