SAS统计分析软件入门课件

上传人:我*** 文档编号:142133017 上传时间:2020-08-17 格式:PPT 页数:39 大小:509KB
返回 下载 相关 举报
SAS统计分析软件入门课件_第1页
第1页 / 共39页
SAS统计分析软件入门课件_第2页
第2页 / 共39页
SAS统计分析软件入门课件_第3页
第3页 / 共39页
SAS统计分析软件入门课件_第4页
第4页 / 共39页
SAS统计分析软件入门课件_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《SAS统计分析软件入门课件》由会员分享,可在线阅读,更多相关《SAS统计分析软件入门课件(39页珍藏版)》请在金锄头文库上搜索。

1、SAS统计 分析软件 入门,内容安排 概述 SAS语言基础 数据步 过程步,SAS(Statistical Analysis System),中文名“赛仕”,译为“统计分析系统”,一、概述,国际上的公认的标准统计软件之一。 公司卓著的业绩使之被评为“全美国人最乐意为之工作的100家公司”之一 及最佳决策支持工具的供应商。 发展 1966年 美国北卡州立大学 A.J.Barr 1972年 推出SAS72供大学使用版 1976年 成立SAS研究所(SAS Institute Inc.),总部在美国北卡州凯瑞市 现已是全球最大的私人软件公司和全球排名第九位的独立软件商,系统组成: 三十几个模块,如B

2、ASE,GRAPH,ETS,FSP,AF,OR,IML,SHARE,QC,STAT,INSIGHT,ANALYST,ASSIST, CONNECT,CPE,LAB,EIS,WAREHOUSE,PC File Formats,GIS,SPECTRAVIEW, SHARE*NET, R/3,OnlineTutor: SAS Programming,MDDB Server,IT Service Vision Client, IntrNet Compute Services,Enterprise Reporter,MDDB Server common products,Enterprise Miner

3、,AppDev Studio,Integration Technologies等,界面:三个基本窗口 Editor 编辑窗:在此编写SAS程序 Log 记录窗:记录程序运行过程中所做的内容,如所运行的数据情况、所调用的过程步、程序运行时间等(红色-错误 绿色- 警告 兰色-正常 ) Output结果输出窗:统计分析的结果。 Result窗口,Explorer窗口 其他:keys窗、libname窗、 options窗、var窗、dir窗 (在command命令窗 或命令行command=输入相应的命令可激活这些窗口),SAS会话窗口,程序编辑窗口,运行记录窗口,结果输出窗口,命令窗口,Resu

4、lts窗口,在命令窗口输入“keys”后情况,命令行,命令窗(条),SAS9.01中文界面的几个窗口,使用ToolsOptions Preferences可修改的界面显示,或输出文件的格式等。 在命令窗输入 num并回车,可在编辑窗口中加入行号。 SAS文件的扩展名 *.sd2 SAS数据集(6.12版)(必须以字母开头,长度不超过8位); 8.0以上版为*.sas7bdat; *.sas SAS程序文件 *.log log窗口输出 *.lst SAS结果文件,SAS语句以一个关键词开始, 以分号(;)结束; data a; input x; cards; 323 54 45 65 ; pro

5、c print; run;,SAS程序的基本结构,数据步:创建数据,过程步:调用数据分析过程,或 Lines 或 Datalines,运行编辑窗内程序 点击图标 按功能键“F8” 在命令行(窗)键入“submit” 在Run下拉菜单中选“submit ” 所激活窗口(Editor、Log、Output)内容的保存 在命令行(窗)键入 file “路径文件名” 点击图标 在file下拉菜单中选“save ”或“save as” 只有编辑窗口(edit窗)才能打开文件,常用的快捷键 F4 recall命令,用于editor窗,将前面提交的程序调回,可多次使用 F5 切换到editor窗; F6 切

6、换到log窗; F7 切换到output窗 F8 submit命令 Ctrl-E 清除当前窗口的内容。 editor窗被清除的内容不能用F4调回,二、SAS语言基础,data a; input x; cards; 43 54 65 ; proc print; run;,以关键词开始SAS语句;对于8.0以上SAS软件,这些关键词显示为蓝色;如果显示为红色,则可能的关键词无效或拼写错误,dat a; input x; cards; 43 54 65 ; proc print; run;,1. 所有SAS语句必须以“;”结束,data a; input x; cards; 43 54 65 ; p

7、roc print; run;,初学者最容易犯的错误就是不写分号。此时SAS将两个语句误认成一个语句(statement)。 注意:(1)一个SAS语句可以写成两行或多行,如“data a;”可写成 data a; (2)多个SAS语句可以写成简单的一行。如:“proc print;run;”,2. 程序的结束,data a; input x; cards; 43 54 65 ; proc print; run;,3. 数据集名与变量名,data a; input x; cards; 43 54 65 ; proc print; run;,数据集名称,变量名称,数据集名与变量名取名时可以是字母

8、、下划线、数字,不能以数字开头,最多可以32个字符(SAS8.0以下软件的最大字符数为8个字符) 字母可以大写、小写或大小写混合,因此Weight、weight、WEIgHT被SAS视为相同的变量。,4. 变量的排列,data a; input x; cards; 43 54 65 ; proc print; run;,如果有多个变量,如Height、Weight、Age、Sex,Job则在SAS中排列为“input Height Weight Age Sex Job;” 如果将以上变量用代号x1、x2、x3、x4、x5表示,则语句可写为: “input x1 x2 x3 x4 x5;” 或简

9、写为: “input x1- x5;”,5. 输入数据的标识语句,data a; input x; cards; 43 54 65 ; proc print; run;,cards; 或 datalines; 或 lines; 语句之后表示数据的输入即将开始。数据的变量名、变量的格式等在input语句中定义。 数据输入结束,也必须采用分号结束。,三、数据步,data a; input x; cards; 43 54 65 ; proc print; run;,数据分析前,数据集必须被读入。 读入数据方法:1. 直接创建;2. Infile 和 input语句 创建; 3. 对1.、2.数据进行

10、简单编辑,创建新的变量等。,1. 直接创建数据集,data child; /*建立临时数据集child.sd2,自动放在saswork子目录下*/ input id x1 $ x2 x3 x4 x5 x6; /* 指明要输入的变量 , $为字符型变量*/ cards; /*标志数据区开始,数据之间以一个或几个空格分隔*/ 1 m 32 95.5 14.0 53.5 49.64 2 m 35 92.0 13.0 52.0 41.61 3 m 33 89.0 12.5 53.5 35.81 254 m 176 168.0 53.5 82.0 100.14 255 f 30 91.0 11.0 48

11、.0 35.39 256 f 33 91.0 11.5 47.0 44.98 521 f 178 163.0 51.0 79.0 87.42 ; /* 标志数据区结束,分号必须单独一行 */ run;,SAS中的常用变量类型 数值型:不需特殊定义 字符型: 定义方式 变量名 $ 日期型:多种形式如: 变量名 mmddyy6. 实际记录为距1960/01/01的天数 其它数据库中的逻辑型、备注型变量在SAS中均为字符型变量。日期型变量转进SAS后一般也变为字符型变量。,data a1; input id x1 $ x2 x3 x4; cards; 1 m 32 95.5 2 m 35 92.0

12、13.0 3 m 33 89.0 12.5 ; proc print; run; 结果: Obs id x1 x2 x3 x4 1 1 m 32 95.5 2.0 2 3 m 33 89.0 12.5,data a1; input id x1 $ x2 x3; cards; 1 m 32 95.5 2 m 35 92.0 13.0 3 m 33 89.0 12.5 ; proc print; run; 结果: Obs id x1 x2 x3 1 1 m 32 95.5 2 2 m 35 92.0 3 3 m 33 89.0,SAS数据集创建时存在的问题,data esr; input x ;

13、/*每读入一个记录后,数据指针保持原位不换行, 继续读下一条记录*/ cards; 3 9 8 6 5 5 7 3 10 8 10 4 ; proc means; run; 结果: N Mean Std Dev Minimum Maximum - 12 6.5000000 2.5405797 3.0000000 10.0000000 -,不分行符的使用,data child; input id x1 $ x2 x3 x4 x5 x6; cards; 1 m 32 95.5 14.0 53.5 49.64 2 m 35 . 13.0 52.0 41.61 3 m 33 89.0 12.5 53.

14、5 35.81 254 m 176 168.0 53.5 82.0 100.14 255 f 30 91.0 11.0 48.0 35.39 256 f 33 91.0 11.5 47.0 44.98 521 f 178 163.0 51.0 79.0 87.42 ; proc means; run;,缺失值的输入- 以“ . ”表示,缺失值不进入分析,Variable N Mean Std Dev Minimum Maximum - id 7 184.5714286 194.9639771 1.0000000 521.0000000 x2 7 73.8571429 70.4779601 30

15、.0000000 178.0000000 x3 6 116.2500000 38.2410120 89.0000000 168.0000000 x4 7 23.7857143 19.4825930 11.0000000 53.5000000 x5 7 59.2857143 14.7361719 47.0000000 82.0000000 x6 7 56.4271429 26.2540446 35.3900000 100.1400000 -,如已存在一纯文本文件c:child.txt,内容如下: 1 m 32 95.5 14.0 53.5 49.64 2 m 35 92.0 13.0 52.0 41.61 3

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号