《整理的SAS笔记》由会员分享,可在线阅读,更多相关《整理的SAS笔记(13页珍藏版)》请在金锄头文库上搜索。
1、精选优质文档-倾情为你奉上第一章 sas是什么1.SAS系统是一个模块化的集成软件系统; 数据处理和统计领域的国际标准软件; 世界领先的数据分析和信息系统;SAS系统广泛应用于金融、医疗、运输、通迅、政府、科研和教育等领域;SAS含义 Statistical Analysis System2.SAS系统的主要四大功能 数据访问 数据管理 数据分析 数据呈现3.SAS系统对50多种数据源提供了引擎 ,如: DB2 和 Oracle第二章 开始sas程序的讲解1.sas程序的介绍有两种程序步组成,数据步和过程步,每个步通常有若干个SAS语句组成; 数据步:以data语句开始,用于创建和处理SAS数
2、据集; 过程步:以proc语句开始,主要用户处理SAS数据集;2.SAS数据集 通常分为两个部分:描述部分(包含数据属性的信息)和 数据部分(包含数值); 数据集的列称为变量(Variable),行称为观测(Observation)。查看数据集的描述部分:proc contents data=sas_data_set;run; 查看数据集的数据部分:proc print data=sas_data_set;run;4.SAS变量的类型 *字符型变量 (Character Variable )(1-32767字节),均以字母、下划线开头;字符型变量的缺省数据用空格表示; *数值型变量 (Nume
3、rical Variable )默认为8个字节的长度,数值型变量的缺省数据用点(.)表示;5.变量的命名规范:132个字符长度,不区分大小写,以下划线或字母开头第三章 sas数据仓库1.每次SAS启动都自动生成三个库标记:WORK、SASUSER和SASHELP;2.库的分类 永久性库:sasuser、sashelp、自定义的库 临时性库:只有一个,名为WORK,可以省略库标记;每次启动SAS自动生成,结束SAS后库中的数据被自动删除;用libname指定库标记,如:libname temp“e:tempdata”;3.使用关键词_ALL_列出数据仓库中所有的sas文件,使用NODS opti
4、on来禁止对数据集的描述PROC CONTENTS DATA=libref._ALL_ NODS;RUN;注意:NODS选项只能和_ALL_一起联用第四章 数据列表报表1.print过程 语法格式:proc print data=SAS数据集 noobs;var 分析变量1 分析变量2 . 分析变量n;where 表达式;sum 求和变量;run; Noobs选项:在PRINT过程中可以用NOOBS选项去掉OBS列; VAR语句:控制变量的出现与否以及出现的顺序; WHERE语句:控制哪些观测将出现在报表中;它的表达式主要是操作数和操作符, SUM语句:计算变量的总合;2.观测的排序和分组(s
5、ort)和(by) 对数据进行分组并求每组小计,用PRINT过程的BY语句,但必须先对相应的变量进行排序; 如:proc sort data=temp.empdata out=temp.empdata2; By JobCode; Run; proc print data=temp.empdata; by JobCode; sum Salary; pageby JobCode; /*使产生的报表按组分页*/ run;第五章:输出1.标题和脚注: 在所有的SAS报告中都可以加标题(Title)和脚注(Footnote): 语法格式:TITLEn text; FOOTNOTEn text; 特点:n
6、 的取值范围是1-10; 标题出现在每页的顶部; 脚注出现在每页的底部; 如果没有定义标题,缺省的标题是:“The SAS System”; 如果没有脚注就不出现; 没有n的标题和脚注就是:TITLE1、FOOTNOTE1; 定义的标题和脚注一直有效,知道另一个语句被执行; 带n的标题或脚注被执行后,替代了原先具有同样号码的标题和脚注; 带n的标题或脚注被执行后,取消了更大号码的标题和脚注;2.LABEL语句:产生用户化和容易阅读的表头: 如:label 变量1=标签 变量2=标签; 属性:是最大长度为256个字符串; 注意:在PRINT过程中必须用PRINT语句中的LABEL或SPLIT=选
7、项才能被显示; 在过程步中定义只在该过程中有效; 在数据步中定义就被存在数据集的描述部分与数据集一直有效;3.format的使用分类:系统format和用户自定义format4.用户自定义format的使用 format变量的语法格式:format. 在VALUE语句中,格式可以赋予为:A单个数字:如: Proc format; Value gender 1=Female 2=Male Other=Miscoded; Run;B某数字范围:如: Proc format; Value boadfmt low-49=Below 50-99=Average 100-high=Above Averag
8、e; Run;C字符或字符串:如: Proc format; Value $grade A=GOOD B-D=PAID I,W=POOR PILOT=pilot Other=Miscoded; Run; format的使用步骤:第一步:用户创建formatPROC FORMAT; VALUE format-name range1=label range2=label . . . ;RUN;第二步:应用所创建的formatproc print data=ia.empdata; format $varialble-name format-name;run;5.使用ODS创建html报表(利用ODS
9、将SAS输出结果生成HTML格式文件)ODS-Output Delivery System语法格式:ODS HTML FILE=HTML-file-specification ;产生输出的sas代码 ODS HTML CLOSE;第六章 创建sas数据集1.列输入(column input)*此模式读入外部原始数据文件,适应文件为: 数据固定在某些列中; 数据只包含标准的数字和字符;*过程:a.开始一个数据步,并给数据步命名b.用infile指明原始数据的存放位置c.用input指明怎样读取原始数据*格式: data 库名.数据集名;infile 文件名(路径) ;input 变量名 起始列-
10、结束列; ($用在变量是字符型) run;2.格式输入(formatted input)*适合用格式输入的外部原始数据文件数据是固定列;但含有标准或者不标准字符以及数字的文件;*语法格式: data SAS数据集; Infile 外部原始文件; INPUT 指针控制 变量名 格式名;($表示字符型变量) Run;*指针的控制:n 移动指针到第几列(绝对位置)+n 把指针移动几个位置(相对位置)3.输入格式informatinformat-namew.说明:$ 如果是字符型,使用$informat-name是输入格式的格式名w 是变量总长度. 句点是必修的分隔符,不能缺少d 如果是数值型的话,
11、d指定了小数位的长度4.分配变量属性 变量的临时属性和永久属性: PROC步可赋予临时属性:其中的标签只在该步显示时有,并没存在数据集里; 如:proc print data=temp.dfwlax label; Label Dest=DestinationFirstClass=First Class Passengers; Run; DATA步可赋予永久属性:其中的标签被存在数据的描述部分,与数据集一起存在; 如:data temp.dfwlax; Infile c:coursetempdata.dat; Input 12 Dest $3. 15 FirstClass $3. ; Label Dest=Destination FirstClass=First Class Passengers; Run;-第七章 数据步程序设计1.读sas数据集以及创建变量 用DATA步产生SAS数据集的三种方法: