整理的SAS笔记

上传人:鲁** 文档编号:478076554 上传时间:2023-06-28 格式:DOCX 页数:13 大小:24.33KB
返回 下载 相关 举报
整理的SAS笔记_第1页
第1页 / 共13页
整理的SAS笔记_第2页
第2页 / 共13页
整理的SAS笔记_第3页
第3页 / 共13页
整理的SAS笔记_第4页
第4页 / 共13页
整理的SAS笔记_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《整理的SAS笔记》由会员分享,可在线阅读,更多相关《整理的SAS笔记(13页珍藏版)》请在金锄头文库上搜索。

1、精选优质文档-倾情为你奉上第一章 sas是什么1.SAS系统是一个模块化的集成软件系统; 数据处理和统计领域的国际标准软件; 世界领先的数据分析和信息系统;SAS系统广泛应用于金融、医疗、运输、通迅、政府、科研和教育等领域;SAS含义 Statistical Analysis System2.SAS系统的主要四大功能 数据访问 数据管理 数据分析 数据呈现3.SAS系统对50多种数据源提供了引擎 ,如: DB2 和 Oracle第二章 开始sas程序的讲解1.sas程序的介绍有两种程序步组成,数据步和过程步,每个步通常有若干个SAS语句组成; 数据步:以data语句开始,用于创建和处理SAS数

2、据集; 过程步:以proc语句开始,主要用户处理SAS数据集;2.SAS数据集 通常分为两个部分:描述部分(包含数据属性的信息)和 数据部分(包含数值); 数据集的列称为变量(Variable),行称为观测(Observation)。查看数据集的描述部分:proc contents data=sas_data_set;run; 查看数据集的数据部分:proc print data=sas_data_set;run;4.SAS变量的类型 *字符型变量 (Character Variable )(1-32767字节),均以字母、下划线开头;字符型变量的缺省数据用空格表示; *数值型变量 (Nume

3、rical Variable )默认为8个字节的长度,数值型变量的缺省数据用点(.)表示;5.变量的命名规范:132个字符长度,不区分大小写,以下划线或字母开头第三章 sas数据仓库1.每次SAS启动都自动生成三个库标记:WORK、SASUSER和SASHELP;2.库的分类 永久性库:sasuser、sashelp、自定义的库 临时性库:只有一个,名为WORK,可以省略库标记;每次启动SAS自动生成,结束SAS后库中的数据被自动删除;用libname指定库标记,如:libname temp“e:tempdata”;3.使用关键词_ALL_列出数据仓库中所有的sas文件,使用NODS opti

4、on来禁止对数据集的描述PROC CONTENTS DATA=libref._ALL_ NODS;RUN;注意:NODS选项只能和_ALL_一起联用第四章 数据列表报表1.print过程 语法格式:proc print data=SAS数据集 noobs;var 分析变量1 分析变量2 . 分析变量n;where 表达式;sum 求和变量;run; Noobs选项:在PRINT过程中可以用NOOBS选项去掉OBS列; VAR语句:控制变量的出现与否以及出现的顺序; WHERE语句:控制哪些观测将出现在报表中;它的表达式主要是操作数和操作符, SUM语句:计算变量的总合;2.观测的排序和分组(s

5、ort)和(by) 对数据进行分组并求每组小计,用PRINT过程的BY语句,但必须先对相应的变量进行排序; 如:proc sort data=temp.empdata out=temp.empdata2; By JobCode; Run; proc print data=temp.empdata; by JobCode; sum Salary; pageby JobCode; /*使产生的报表按组分页*/ run;第五章:输出1.标题和脚注: 在所有的SAS报告中都可以加标题(Title)和脚注(Footnote): 语法格式:TITLEn text; FOOTNOTEn text; 特点:n

6、 的取值范围是1-10; 标题出现在每页的顶部; 脚注出现在每页的底部; 如果没有定义标题,缺省的标题是:“The SAS System”; 如果没有脚注就不出现; 没有n的标题和脚注就是:TITLE1、FOOTNOTE1; 定义的标题和脚注一直有效,知道另一个语句被执行; 带n的标题或脚注被执行后,替代了原先具有同样号码的标题和脚注; 带n的标题或脚注被执行后,取消了更大号码的标题和脚注;2.LABEL语句:产生用户化和容易阅读的表头: 如:label 变量1=标签 变量2=标签; 属性:是最大长度为256个字符串; 注意:在PRINT过程中必须用PRINT语句中的LABEL或SPLIT=选

7、项才能被显示; 在过程步中定义只在该过程中有效; 在数据步中定义就被存在数据集的描述部分与数据集一直有效;3.format的使用分类:系统format和用户自定义format4.用户自定义format的使用 format变量的语法格式:format. 在VALUE语句中,格式可以赋予为:A单个数字:如: Proc format; Value gender 1=Female 2=Male Other=Miscoded; Run;B某数字范围:如: Proc format; Value boadfmt low-49=Below 50-99=Average 100-high=Above Averag

8、e; Run;C字符或字符串:如: Proc format; Value $grade A=GOOD B-D=PAID I,W=POOR PILOT=pilot Other=Miscoded; Run; format的使用步骤:第一步:用户创建formatPROC FORMAT; VALUE format-name range1=label range2=label . . . ;RUN;第二步:应用所创建的formatproc print data=ia.empdata; format $varialble-name format-name;run;5.使用ODS创建html报表(利用ODS

9、将SAS输出结果生成HTML格式文件)ODS-Output Delivery System语法格式:ODS HTML FILE=HTML-file-specification ;产生输出的sas代码 ODS HTML CLOSE;第六章 创建sas数据集1.列输入(column input)*此模式读入外部原始数据文件,适应文件为: 数据固定在某些列中; 数据只包含标准的数字和字符;*过程:a.开始一个数据步,并给数据步命名b.用infile指明原始数据的存放位置c.用input指明怎样读取原始数据*格式: data 库名.数据集名;infile 文件名(路径) ;input 变量名 起始列-

10、结束列; ($用在变量是字符型) run;2.格式输入(formatted input)*适合用格式输入的外部原始数据文件数据是固定列;但含有标准或者不标准字符以及数字的文件;*语法格式: data SAS数据集; Infile 外部原始文件; INPUT 指针控制 变量名 格式名;($表示字符型变量) Run;*指针的控制:n 移动指针到第几列(绝对位置)+n 把指针移动几个位置(相对位置)3.输入格式informatinformat-namew.说明:$ 如果是字符型,使用$informat-name是输入格式的格式名w 是变量总长度. 句点是必修的分隔符,不能缺少d 如果是数值型的话,

11、d指定了小数位的长度4.分配变量属性 变量的临时属性和永久属性: PROC步可赋予临时属性:其中的标签只在该步显示时有,并没存在数据集里; 如:proc print data=temp.dfwlax label; Label Dest=DestinationFirstClass=First Class Passengers; Run; DATA步可赋予永久属性:其中的标签被存在数据的描述部分,与数据集一起存在; 如:data temp.dfwlax; Infile c:coursetempdata.dat; Input 12 Dest $3. 15 FirstClass $3. ; Label Dest=Destination FirstClass=First Class Passengers; Run;-第七章 数据步程序设计1.读sas数据集以及创建变量 用DATA步产生SAS数据集的三种方法:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号