SAS_BASE基础

上传人:野鹰 文档编号:3163521 上传时间:2017-07-30 格式:PPT 页数:91 大小:1.10MB
返回 下载 相关 举报
SAS_BASE基础_第1页
第1页 / 共91页
SAS_BASE基础_第2页
第2页 / 共91页
SAS_BASE基础_第3页
第3页 / 共91页
SAS_BASE基础_第4页
第4页 / 共91页
SAS_BASE基础_第5页
第5页 / 共91页
点击查看更多>>
资源描述

《SAS_BASE基础》由会员分享,可在线阅读,更多相关《SAS_BASE基础(91页珍藏版)》请在金锄头文库上搜索。

1、上海*通信技术有限公司 Jim() 2012-11,SAS 基础知识,Statistical Analysis System,2,培训大纲,SAS简介基本术语SAS语法函数宏数据步过程步,3,SAS介绍,1、什么是SAS:SAS(Statistical Analysis System)是世界上最著名的统计分析系统之一,具有完备的数据访问、管理、分析和呈现功能,被誉为国际标准统计分析系统2、世界上公认的三大统计软件之一 SAS - Statistical Analysis System SPSS - Statistical Product and Service Solutions S-PLUS

2、,4,4,SAS的发展历程,1966年由美国北卡罗来纳州(NorthCarolina)州立大学开始研制 1976年成立美国SAS软件研究所,并开始对SAS系统进行维护、开发、销售和培训等工作 1985年推出了SAS/PC(6.02)版本 1989年推出SAS/PC(6.04)版本 1997年下半年推出适用于多种操作系统的6.12版本 2000年2月又正式推出SAS系统8版本 2002年推出全新的SAS9版本SAS公司于1989年在北京成立了办事处 1997年,SAS软件研究所正式宣布成立大中国区 1999年3月在国内设立独资公司赛仕软件(上海)有限公司。,5,SAS系统界面,6,显示管理系统

3、1、三个常用窗口:EDITOR 程序编辑窗口F5LOG日志窗口F6OUTPUT输出窗口F72、菜单:执行各种功能操作3、工具栏:方便执行常用功能操作,7,编写、运行、调试,编写SAS程序:在Program Edit 程序编辑窗口输入源程序根据题意编写程序例:有一批体检数据,包括受检者的姓名、性别、年龄、身高、体重信息。要求按性别分别计算身高、体重的描述性统计量:均值、标准差、最大值、最小值。,8,编写、运行、调试,9,DATA A;INPUT NAME $ SEX $ AGE HEIGHT WEIGHT;CARDS;ZHANGLINF47156.347.1ZHAOHUAM38172.461.5

4、WANGQANGM41169.264.5LIULI F52158.253.6SHIDONG F39160.148.0KONGYINGM29174.164.6LILING F37152.342.2GUANFENM32166.260.2MAQIANGM26180.374.3NEWHUA M31178.280.2TANGNEUF35169.260.8GENGJIE M24176.073.3SUNHONGF27158.349.9DONGLINF33162.451.6TONGLINGM34170.458.9;PROC SORT; BY SEX;PROC MEANS; BY SEX;VAR HEIGHT

5、WEIGHT;RUN;,10,程序说明数据步:将数据读入系统,建立数据集。以DATA语句开始INPUT语句描述数据变量 , 用$表示变量是字符型CARDS语句指示后面是数据每行为一个观测数据,数据间无分号数据最后以“;”开头的空行结束过程步:对数据集中数据进行分析、处理。以PROC语句开始,调用SAS标准过程每个语句都以“;”结束。整个程序最后要有RUN语句。,编写、运行、调试,11,SAS程序的书写格式:不分大小写单个名称中不能空格,不同名称间必须空格一行可写多条语句,用分号分隔一条语句可写多行数据行后不加分号,数据最后单独加一分号行程序用RUN;语句结束,编写、运行、调试,12,查看结果激

6、活OUTPUT窗口( F7 ) 注意:没有正确结果,可能是:程序语法错误: 查看日志窗口错误信息程序逻辑错误: 分析源程序没有调用能输出结果的过程查看运行过程及出错信息激活LOG窗口( F6 ) 黑色文字:源程序及运行情况蓝色文字:程序运行情况的说明信息红色文字:出错信息绿色文字:警告信息,编写、运行、调试,13,培训大纲,SAS简介基本术语SAS语法函数宏数据步过程步,14,数据集类型,a. 横截面数据集(cross-sectional data set): 即在同一时间截面上的统计数据。b.时间序列数据集(time series data set):是按时间顺序排列的统计数据。c.混合横截

7、面数据集(pooled cross section data set):有些数据既有横截面数据的特点又有时间序列的特点,但每一时点的样本不同,15,数据集类型,d.综列数据集(panel data set):由横截面数据集中每个样本的一个时间序列组成。(定点长期调查)差异:综列数据是调查经历一段时间的同样的横截面数据,而混合横截面数据调查的是不相同的横截面数据。两者的唯一区别在于是否个体发生改变。面板是个体一定不能够发生变化。其它专门数据类型: 1、离散数据(discrete data):通常在考察个人、家庭或企业的决策行为时,通过问卷调查获得,由此发展出“离散选择模型”。定量数据与定性数据2

8、、持续数据(survival data):用于考察变量从开始到结束或调查终止前所经过的时间长度,如失业持续时间、罢工持续时间,股市牛熊市持续时间,16,16,基本术语,名词术语1、数据集:数据的集合,由样本(行)和变量(列)组成SAS数据集样本(观测、记录)、变量(字段、域)、表(数据集)、 数据库变量属性(名称、类型、长度、输入格式、输出格式、标签)类型:数字型、字符串型输入格式:数据被SAS读取的格式输出格式:数据呈现给人们的格式,17,培训大纲,SAS简介基本术语SAS语法函数宏数据步过程步,18,SAS程序规范,1、SAS程序由语句组成,语句用分号结束。2、几个SAS语句可以写在同一行

9、上,但每句要使用分号3、一个语句也可以写成几行,只要语句中的单词不被断开就可以。在一个语句中各个单词之间至少要有一个空格。4、SAS程序中不区分大小写5、用/*注释的内容*/来对程序进行注释 *; 也用来表示注释。6、SAS中的变量的命名规范以字母或下划线开始,字母不区分大小写。后面的字符可以是数字,字母或下划线。不能在定义变量中使用系统保留的关键字名称,最长32个字符。,19,SAS语言和SAS程序,常量,数值常量 数值常量由数字0、小数点、正负号和等符号组成。 例如:12 23 1.689E-8(1.68910-8) 数值常量的缺省值用“ ”来表示。 数值变量 常用的输入或输出格式符号是:

10、w.d 或 w. w 表示变量的字符长度,d 表示变量中小数的位数 Height 4.2 age 2.,20,2字符常量 字符常量由1200个字符组成。在赋值语句中,字符常量要用定界符单引号或双引号括起来。字符常量的缺省值用空格表示。字符变量 常用的输入或输出格式符号是 $w. 例如 SEX $1.,3日期、时间和日期时间常量 该型常量必须用单引号括起,后续一个D(Date)、T(Time)或DT(DateTime)表示其类型。,8JAN1999D 表示日期值10:45T 表示时间值8JAN99:9:25:14DT 表示日期时间值,例:,21,日期变量 常用的输入或输出格式符号是YYMMDDw

11、. 或 DDMMYYw. 或 MMDDYYw. 或 DATEw. w 表示日期变量中字符的长度 yymmdd8. date8. mmddyy6.SAS的时间输出格式 注意,当输出时间变量时,输出格式用yymmdd8. 或 date8. 或不用输出格式,其输出的结果形式是完全不一样的。例如,19801202的输出结果分别是80-12-02,02DEC80 和7641。 对于日期变量,如果输出时不给出输出格式,那么输出结果是一个按日排列得到的常数。SAS系统规定1960年1月1日等于1,然后以此类推。例如,1959年1月1日等于-365,1979年1月1日等于常数6940。,22,数组(array

12、)语句,当需要用同一种方法处理很多变量时,可以用数组语句定义这组变量为某个数组中的元素。1.显示下标array语句:由一个数组名字,在数组中元素个数的说明,及元素列表组成。2.隐含下标array语句:由一个数组名字、一个下标变量和列表名组成。,23,显示下标array语句,形如:ARRAY array-name subscript 例 array simple3 red green yellow; array x5,3 score1-score15; array c3等价于array c3 c1-c3 array test3 t1 t2 t3 (90 80 70) 访问数组变量:test1=1

13、; 数组中的变量必须全是数值型或字符串型 SAS中数组存储的是变量,不是数据。数组只在数据步(DATA STEP)中有效。数组的标号从1开始。规定数组中每一维的上下界:array x1:5,1:3 score1-score15;*表示SAS系统通过数组中变量的个数来确定下标。可用dim(数组名)函数计算数组元素个数。_temporary_建立一个临时数组元素列表 array a(3) _temporary_ (11,22,33);,24,隐含下标array语句,形如:ARRAY array-name array-elements 如:array x x1-x5DO OVER语句对隐含下标数组元素执行DO组里的语句语句格式: DO OVER array-name; sas语句; END; 其中:选项array-name规定一个隐含下标数组。,25,算术符号:+加a + b-减a - b*乘a * b/除a / b*乘方a*3 (a 的3 次方)比较算符: = 或 EQ 等于 a = b= 或 NE 不等于 a = b 或 GT 大于 a b= 或 GE 大于等于 a = b 或 LT 小于 a b= 或 LE 小于等于 a = b in,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号