《sas应用基础》ppt课件

上传人:tia****nde 文档编号:69567720 上传时间:2019-01-14 格式:PPT 页数:70 大小:1.18MB
返回 下载 相关 举报
《sas应用基础》ppt课件_第1页
第1页 / 共70页
《sas应用基础》ppt课件_第2页
第2页 / 共70页
《sas应用基础》ppt课件_第3页
第3页 / 共70页
《sas应用基础》ppt课件_第4页
第4页 / 共70页
《sas应用基础》ppt课件_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《《sas应用基础》ppt课件》由会员分享,可在线阅读,更多相关《《sas应用基础》ppt课件(70页珍藏版)》请在金锄头文库上搜索。

1、SAS软件应用基础之二,SAS的数据获取,2,数据获取 (将实际数据转录为SAS数据文件),SAS 可以从以各种形式存储的数据中获取有用的信息,建立专门格式的SAS数据文件。 数据来源可以是长度不定的记录、二进制文件、自由格式数据、甚至包括残缺数据的文件。 通过SAS 系统中各种工具以及相应方法,可方便地访问这些数据,并可转换为SAS数据文件。 SAS系统只能对由SAS建立的数据文件直接进行统计分析。,3,图形界面交互式录入数据,SAS系统有多种图形界面能交互式的将数据录入为SAS专用的数据文件。这里介绍其中几种: 利用VIEWTABLE新建数据集 利用SAS ASSIST 创建数据集 利用S

2、AS INSIGHT 创建数据集 利用SAS ANALYST 创建数据集 利用SAS LAB 创建数据集,4,利用VIEWTABLE录入数据,VIEWTABLE 是SAS 系统中一种通过可视的方式管理数据的工具。 用VIEWTABLE 建立SAS数据文件的方法: 一.在SAS 资源管理器窗口中,打开某数据库,然后在此窗栏内单击鼠标右键,在菜单中选New 按钮(或单击SAS主菜单上的File-New,也可在命令窗口条内键入SAS命令vt)。 二.在随后出现的窗口、对话框内据提示选择。,5,利用SAS ASSIST录入数据,SAS ASSIST是SAS系统的一个重要的模块.它的作用是使得用户不需要

3、编程就可以完成一些常用的数据管理、统计分析、输出图表。 单击Solution 菜单下的ASSIST 选项,启动SAS ASSIST。在系统弹出的窗口中,SAS ASSIST 进行一些初始设置;如果不希望在下次使用SAS ASSIST 的时候仍然出现这个窗口,可以将Show this window at startup 前面的叉号取消。不作修改,单击Continue 按钮,就自动弹出了SAS ASSIST 的工作区域。 可根据提示进行操作。,数据输入时先按Insert键,结束时可用end命令!,6,用Insight与Analyst录入数据,用SAS主菜单上的Solutions-Anayisis-

4、 Analyst选项可打开Analyst界面进行数据录入和分析。(也可用命令窗条内键入analyst实现) 用SAS主菜单上的Solutions-Anayisis- Interactive Data Analysis选项可打开Insight界面进行数据录入和分析。 (也可用命令窗条内键入insight实现),7,SAS 基本概念,SAS 数据集与SAS 数据库 变量与观测 常用统计量及记号,8,SAS 数据集 (SAS数据文件),SAS数据集通常是SAS 系统操作的对象,也是数据在SAS 系统中的存储形式。 SAS 数据集可以看成是由若干行和若干列组成的表格(矩阵,关系型数据结构),各列可以取

5、不同类型的值。 SAS 数据集是由SAS 系统建立的特有的数据存储格式,只能被SAS 系统调用。 SAS 数据集以.sas7bdat 为扩展名。 数据集的名字由英文字母、数字、下划线组成,第一个字母必须是字母或下划线,名字最多只能有8 个字符;另外在命名时不区分大小写。,9,常见SAS文件的后缀名,.sas7bdat SAS系统数据集文件的扩展名 .sas7bvew SAS系统数据集视图的扩展名 .sas7bcat SAS系统目录文件的扩展名 .sas7bndx SAS系统数据集索引的扩展名 .sas7bitm SAS系统项目储存文件的扩展名,10,观测与变量,数据集的每一行叫做一个观测(ob

6、servation)。 数据集的一列叫做一个变量(variable)。 SAS变量只有两种基本类型:数值型(N)和字符型($或C);逻辑、时间型数据都通过数值型来表示。如将日期折算成与1960.1.1的间隔天数值存放,0表示FALSE,非零数表示TURE。 SAS 数据集类似于关系数据库中的一个表,因此,观测=记录、变量=属性(列)。,11,日期、时间型数据的存贮,为了使日期、时间型数据能参与合理的运算(如计算两日期的间隔时间等),应该将其保存为数值型数据最为恰当。 采用正确的输入方式后,SAS系统在贮存数据时,会自动将日期数据折算成与1960.1.1的间隔天数;将时间型数据折算成与午夜0时0

7、分0秒的间隔秒数;将日期时间型数据折算成与1960年1月1日0时0分0秒的间隔秒数。,12,变量的属性说明,Name:输入变量的名称,最长不能超过32 个字符。这项内容只在新建表格的时才可以修改。 Label:变量的标签,最长不能超过256 个字符。在VIEWTABLE 中,它代替Name作为这一列的题目。 Length:用来规定变量的数据的长度,默认为8字节 。这项内容也只在新建表格时才可修改。 Format:修改数据的输出格式。例如我们希望显示1288.12 美元,那么可在这里将格式修改为$10.2 ,则在表格中这个数据将显示为$1288.12。 Informat:修改数据的输入格式。 T

8、ype:选择变量是数值型(Numeric)还是字符型(Character)的。,13,SAS数据库 (Windows的目录、文件夹),SAS 数据库的概念与通常所讲的数据库的概念有所不同,它也是SAS 系统中一个特有的概念。 在SAS 系统中使用的各种数据文件(包括dbf/db2等外部数据文件)可以分类组织起来,冠以不同的逻辑别名数据库名。也就是说,数据库其实是比数据集高一级的目录文件夹。 在Windows操作系统中,一个数据库通常对应为一个或多个文件夹中的若干数据文件。 目的:在各种操作系统下,SAS对数据文件操作的环境相对统一,都可通过数据库方便地访问数据文件。,14,SAS预定义的数据库

9、,WORK 数据库: 用来存放临时数据集。 SASUSER 数据库: 用来存放用户自己的数据集,保存在其中的数据集是永久的。 SASHELP 数据库: 用来存放SAS 系统帮助、例子文件,保存在其中的数据集也是永久的。,15,临时数据集与永久数据集,按照数据集的生命周期可以将其分为临时数据集和永久数据集。 临时数据集就是数据集被建立后只在SAS 进程没有关闭的情况下存在,一旦退出SAS 进程,那么这个数据集也就随之消失了。 存储在work库下的数据集都是临时数据集,其它库中的数据集都是永久数据集。 永久数据集当SAS 进程结束的时候仍然存在,下次启动SAS 的时候(包括重启计算机) ,仍然可以

10、使用它,除非用delete 命令强行将它删除。,16,SAS数据集的两水平名,SAS数据集用两水平命名(两级名)方式进行命名。 两水平名中前一部分是数据库名,后一部分是数据集名,中间用点号连接。 若数据库名省略,则表示库名为WORK。 例如:数据集test表示WORK库中的临时数据集test;SASUSER.test表示SASUSER库中的数据集test。 (Windows下的实际文件名为test .sas7bdat。) 在SAS中访问数据集必须使用这样的办法。,17,用户自建数据库,用LIBNAME 语句可以将SAS数据库(逻辑的)与一个实际的目录(文件夹)联系起来,形成用户自建的SAS数据

11、库。 LIBNAME语句的一般用法为: libname 数据库名 引擎 库位置; libname 数据库名 (库位置1 库位置2 ); 库位置通常是目录的全路径文件名表示;引擎为读写数据的格式说明,如v8,v6,xport等。,另外,也可用“创建新的数据集”工具图标,来实现SAS数据库的创建。,18,建立SAS数据库的例子,希望把F:My SAS FilesV8new 这个目录与一个名叫libtest 的数据库联系起来,并且将test 数据集放置在其中。可以在编辑窗口输入如下的程序: libname libtest f:my sas filesv8new; data libtest.test;

12、 input code price; cards; 600381 18 600262 16 600252 8 600009 10 600036 ; run;,19,常用统计量的表示,20,常用统计量的表示(续),21,分位数表,Max 是最大值, Min 是最小值。 Med 是中位数,反映数据的中心位置。 Q1 是四分之一分位数, Q3 是四分之三分位数。 Range 是最大值减最小值,Q3-Q1 为四分位间距,可以反映数据取值分散程度。 Mode 是众数,即出现次数最多的值。,22,图形界面批量式录入关系数据,SAS系统提供了将SAS 数据集与标准格式文件和用户自定义格式文件之间的互相转换功

13、能。SAS的导入向导可以帮助我们完成这项工作。SAS 系统可以转换的标准格式的数据文件包括: Microsoft Excel 97 or 2000 Lotus 1 spreadsheet Microsoft Excel 5 or 7 Lotus 3 spreadsheet Microsoft Excel 4 spreadsheet Lotus 4 spreadsheet Microsoft Access 2000 table Delimited File Microsoft Access 97 table (分隔的数据文件没有特定扩展名) DBase File Comma Separated

14、Values Tab delimited File (逗号分隔数据文件扩展名为csv) (制表符分隔数据文件扩展名为txt),23,标准格式的数据文件的转换,首先选择File 菜单中的Import data 按钮,就启动了导入向导。若文件是标准数据格式,则选择Standard data source,然后在下拉菜单选具体格式。,24,编程方式录入数据,采用SAS编程方式录入实际数据是一种灵活而有效的手段。尽管用图形界面进行各种操作已经成为Windows时代的一种主流模式,但在一些较复杂的、庞大的问题上,还是需要用编程模式才能方便的给予解决。 在SAS系统中,我们可以用其两类基本过程之一的数据步

15、过程来完成对批量数据的录入与管理。,25,Data Step,用于将原始数据文件转换成SAS数据集并可进行多种数据变换。 Data Step的一般形式:,data SAS-data-set; infile filename option; input 变量输入设定; 其他SAS语句; run;,data SAS-data-set; input变量输入设定; 其他SAS语句; cards; 原始数据 ; run;,26,源数据的基本输入模式,在SAS数据步中,对输入数据起核心作用的是input语句;根据数据源的格式,input语句可以采用四种基本输入模式: 按列输入(Column) 格式化输入(

16、Format) 自由列表输入(List) 命名输入模式(Name) 当然,对一些形式较复杂的源数据还可采用混合模式输入。,引例1,在回收调查问卷数据时,为了快速录入,常把数据如下组织在文本文件中:,27,110011160310150 110021165422180 110302270230130 。,其中每行是一张问卷的数据,1-2列是区号,1-5列是问卷号,6列是等级码, 7列是性别, 8-9列是年龄,10列是教育程度,11列是职业代码,12-15列是收入。应如何录进SAS?,DATA diaoch; /*存入diaoch数据集,文件名长度为18个字符。*/ INPUT id 1-5 area 1-2 level 6 sex 7 age 8-9 edc 10 ocu 11 sal 12-15; LIST; /*显示每行的数据,以便核对。可省之*/ CARDS; /*告诉SAS,数据行从下一行开始读之*/

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号