SAS培训班讲义Word版与版内容相同方便打印使用

上传人:s9****2 文档编号:456906396 上传时间:2023-02-07 格式:DOC 页数:33 大小:332KB
返回 下载 相关 举报
SAS培训班讲义Word版与版内容相同方便打印使用_第1页
第1页 / 共33页
SAS培训班讲义Word版与版内容相同方便打印使用_第2页
第2页 / 共33页
SAS培训班讲义Word版与版内容相同方便打印使用_第3页
第3页 / 共33页
SAS培训班讲义Word版与版内容相同方便打印使用_第4页
第4页 / 共33页
SAS培训班讲义Word版与版内容相同方便打印使用_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《SAS培训班讲义Word版与版内容相同方便打印使用》由会员分享,可在线阅读,更多相关《SAS培训班讲义Word版与版内容相同方便打印使用(33页珍藏版)》请在金锄头文库上搜索。

1、 Made by Daibingchuan and lihui 课程名称: 数据处理数据类型a. 横截面数据集(cross-sectional data set):即给定时点对个人、家庭、企业、国家或一系列其他单位采集的样本所构成的数据集(应该忽略细小的时间差别)名词术语1、数据集:数据的集合,由样本(行)和变量(列)组成b.时间序列数据集(time series data set):是由一个或几个变量在不同时间的观测值所构成的。c.混合横截面数据集(pooled cross section data set):有些数据既有横截面数据的特点又有时间序列的特点,但每一时点的样本不同。d.综列数据

2、集(panel data set):由横截面数据集中每个样本的一个时间序列组成。(定点长期调查)其他专门数据类型: 1、离散数据(discrete data):通常在考察个人、家庭或企业的决策行为时,通过问卷调查获得,由此发展出“离散选择模型”2、持续数据(survival data):用于考察变量从开始到结束或调查终止前所经过的时间长度,如失业持续时间、罢工持续时间、甚至怀孕间隔3、cohort(一代人) data - 为持续收集特定社会群体在一段时间内的变化的数据。如:调查七十年代出生的样本在10年间的汽车持有率数据或就业率数据等。SAS运行环境的界面菜单栏: 文件 编辑 工具解决方案:

3、各功能模块窗口帮助SAS资源管理器我的电脑逻辑库:类似我的电脑,不同的是,在sas系统里才存在的,关闭sas系统后,在本地机中不容易找到包括4个目录:work(临时文件夹)map, sasuser, sashelpSAS工作空间n可以通过“查看”调取:程序窗口(PROGRAM EDITOR)n运行记录窗口(LOG)n输出窗口(OUTPUT)SAS程序第一例nSAS/HelloWorld.sasnn注:以后程序文件省略后缀,直接简记为文件名称,如此例简记为HelloWorld,需要说明文件类型时才标明后缀。Ctrl+e 清空除特殊字符外,大小写不区分数据步Data a; 生成以a命名的数据集,这

4、里a是空的数据集File print; 将原本在日志窗口中输出的内容转移至输出窗口中输出Put hello world; 将put后的内容在日志窗口中呈现Run;Proc print; 将前面运行的结果在输出窗口显示Run;运行后,日志窗口中显示执行情况深蓝 固有关键词浅蓝 普通关键词Insight模块在逻辑库中新建一个文件夹“培训”,放入培训中需要的文件在“命令行”中输入“insight”,启动insight逻辑库及其所含的数据界面:菜单 文件 编辑:可以设置 分析:图形、分析 灰色不可操作的菜单左上角的小三角 移动查找新建观测(样本)新建变量抽取样本左边的小方框,作图时用于表示这样的样本填

5、充数据:选定需要填充的范围,鼠标右键,“填充值”对话框:值:1增加值:1表示从1开始,增量为1默认变量名和变量类型,类型可以改变抽取样本选定2个变量,右键“抽取”,对这两个样本进行更加详细的分析编辑-窗口-工具,出现调色板,标记色彩对事先选定的样本标记,方便对数据作直观的研究事先未选定样本,创建标记色彩的规则:每个样本的每一个变量,符合某种条件时将该样本标记为某种颜色。查看一个数据集的概况:右键、属性“标签”对数据集添加密码等打开“分析”中的分布、拟合、多元等的窗口后,原先灰色不可选的菜单菜可操作(TablesGraphsCurves等)“分析”菜单中也可作图分布:输出大多数常用的统计量拟合:

6、回归分析多元:方差分析不同的分析方法,TablesGraphsCurves菜单里显示的功能也是不同的SAS程序的书写格式n1、SAS程序由语句组成,语句用分号结束。n2、SAS语句可以从某一行的任意位置开始; n3、几个SAS语句可以写在同一行上,但每句要使用分号n4、一个语句也可以写成几行,只要语句中的单词不被断开就可以。在一个语句中各个单词之间至少要有一个空格。n5、SAS程序中一般不区分大小写(字符串中要区分大小写)n6、用/*注释的内容*/来对程序进行注释,绿色显示SAS程序的结构nSAS数据集样本(观测、记录)、变量(字段、域)、表(数据集)、 数据库(一个或多个表,有着某种特定的联

7、系,来实现某种功能)n许多SAS语句都是以关键词开始并用它识别语句的类型(如data、input、proc)n绝大部分的SAS语句都可分为两步:DATA步(打开、编辑、整理数据)和PROC步(分析、处理、显示数据)SAS的变量及格式变量属性(名称、类型、长度、输入格式、输出格式、标签)类型:数字型、字符串型输入格式:数据被SAS读取的格式输出格式:数据呈现给人们的格式SAS程序第二例nSAS/orange.sasdata oranges; input variety美元符,表示它前面的变量是字符型,否则就是数值型 $ flavor texture looks; total=flavor+tex

8、ture+looks用赋值的方式生成新的变量; label total=总数给变量加标签; cardsCards后面是数据本身;navel 9 8 6不需要每行结束后都分号temple 7 7 7valencia 8 9 9mandarin 5 7 8;proc sort操作的名称及对象数据集的名称 data=oranges; by descending对某个变量降序排列 total; run;proc print data=oranges; var输出的变量,没有该语句默认输出所有变量 _numeric_; /* var _character所有字符型变量,系统内置变量,有固定含义_;*/

9、title 对ORANGES数据集的品尝结果加标题;run;输入数据-形成数据集-排序-打印显示SAS文件及命名n1、SAS数据集文件(后缀为sas7bdat)n2、SAS程序文件(后缀为sas)n3、SAS日志文件(后缀为log)n4、SAS输出文件(后缀为list)n临时数据集(放在work中,关闭系统会自动删除)和永久数据集data sastrain.oranges;SAS文件的2级命名方式:目录.文件名work目录和其他目录使用Libname语句创建永久数据集,libname 自建目录名 目录地址;libname例libname zhao d:sas新建目录zhao,物理位置是d:sa

10、s;data zhao.aa永久数据集,二级命名方式; input a变量 ;cards; 1;run;建立SAS数据集的5种方法1.data己输入数据建立。Orange例利用cards手工输入数据2、data步利用set 语句建立。Set例data abc; set相当于复制命令 sasuser.business;run;proc print没有“data=”默认为打印最近的数据集,即abc;run可以在work目录中看到数据集abc,和sasuser中的数据集business是一致的;3、从外部调入。Infile例data abcd; infile D:SASdataxxxx.dat从外部

11、导入(不是sas的逻辑库)文件; input a b c;run;proc print;run;D:SASdataxxxx.dat用记事本打开,就是数据文本,没有变量名和样本序号4、利用“导入数据”功能建立。Id.xls例和其他格式文件的交互(1)有1个Excel文件,第一行为变量名。Sas系统在打开一个文件时对该文件独占,所以导入操作前将这个excel文件关闭“文件”-“导入数据”-对话框,默认“标准数据源”,选择合适的数据格式-“浏览”找到要导入的工作簿-选择该工作簿的工作表-“option”的参数选择-是否“变量名在第一行”-选择导入的excel数据保存在逻辑库的哪个位置:选择库并给数据

12、集命名-是否“存储刚才的导入过程”,不需要就直接finish(2)文本文件,无变量名的纯数据。选择“用分隔符分割的文本文件”“浏览”后作一些设置:分隔符的类型(空格键、Tab或一些特定字符)、变量名是否在第一行5、利用EFI(external file interface外部文件接口)功能导入。Column.dat例tests.dat例comma.dat例(1)用记事本打开column.dat后,是这样未经分割的日期数据:01MAR200502MAR200503MAR2005利用sas将日、月、年分开还是“文件”-“导入数据”-不再选择“标准数据源”,选择“用户定义的格式”即EFI-“浏览”-

13、保存-finish-新的界面,对数据作自由导入-“options”选项-设置外部数据的形式:每一个样本在一行或者每一条记录为多个sas数据行导入数据的风格:列表型(list)选择分隔符 自定义列(column)从第几列到第几列定义为一个变量变量生成方式:手工生成或自动生成变量默认类型:字符型或数值型从第几个记录开始缺失值是什么鼠标拖拽某几列,下面begin、end、length已经开始发生改变;命名“date”并add,于是新生成变量“date”,如法炮制产生变量“month”和“year”关闭菜单,提示是否保存,保存为新的数据集(2)tests.dat如下:2458 Murray, W 72 185 128 12 38 D 2462 Almers, C 68 171 133 10 5 I 2501 Bonaventure, T 78 177 139 11 13 I 2523 Johnson, R 69 162 114 9 42 S 2539 LaMance, K

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 营销创新

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号