《SAS系统概述》PPT课件.ppt

上传人:桔**** 文档编号:568904683 上传时间:2024-07-27 格式:PPT 页数:40 大小:691.50KB
返回 下载 相关 举报
《SAS系统概述》PPT课件.ppt_第1页
第1页 / 共40页
《SAS系统概述》PPT课件.ppt_第2页
第2页 / 共40页
《SAS系统概述》PPT课件.ppt_第3页
第3页 / 共40页
《SAS系统概述》PPT课件.ppt_第4页
第4页 / 共40页
《SAS系统概述》PPT课件.ppt_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《《SAS系统概述》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《SAS系统概述》PPT课件.ppt(40页珍藏版)》请在金锄头文库上搜索。

1、一、教材:SAS统计分析及应用统计分析及应用,黄燕,机械工业出版社,黄燕,机械工业出版社,2006年年,(,(ISBN 7-111-17566-2)二、参考书目:SAS8.X经济统计经济统计,樊欣、邵谦谦,北京希望电子出版社,樊欣、邵谦谦,北京希望电子出版社,2003,(,(ISBN 7-89498-096-X)SAS8.2统计应用教程统计应用教程,薛富波等,北京希望电子出版社,薛富波等,北京希望电子出版社,2004, (ISBN:7-80172-217-5)SASV8基础教程基础教程,汪嘉冈,中国统计出版社,汪嘉冈,中国统计出版社,2003,(,(ISBN 7-5037-3666-6)SAS

2、统计分析实用大全统计分析实用大全,阮桂海等,清华大学出版社,阮桂海等,清华大学出版社,2003,(,(ISBN 7-302-06416-4)上一页下一页统计、计算机与统计软件统计、计算机与统计软件 现现代代生生活活越越来来越越离离不不开开计计算算机机了了,最最早早使使用用计计算算机机的的统统计计当当然然更更离离不不开开计计算算机机了了。最最初初的的计计算算机机仅仅仅仅是是为为科科学学计计算算而而设设计计和和建建造造的的,统统计计是是大大型型计计算算机机的的最最早早用用户户,现现在在仍仍然然是是数数值值计计算算的的主主要要用用户户。计计算算机机的的使使用用,从从计计算算机机语语言言到到 “傻傻瓜

3、瓜式式”地地点点击击鼠鼠标标,输输出出结结果果也也从从数数字字输输出出到到各各种种可可以以想想象象得得到到的的形形式式。输输入入数数据据,点点鼠鼠标标做做一一些些选选项项,就就可可得得到到漂漂亮亮结结果果,但其中充满了危险的陷阱。但其中充满了危险的陷阱。上一页下一页 计计算算机机无无法法识识别别你你的的统统计计方方面面的的错错误误,错错误误的的方方法法、错错误误的的数数据据形形式式都都必必然然输输出出错错误误的的结结果果(虽虽然然看看上上去去可可能能很很漂漂亮亮),得得到到大大量量垃垃圾圾。另另外外,统统计计软软件件输输出出的的结结果果太太多多、很很难难都都理理解解。统统计计软软件件的的种种类

4、类很很多多。这里仅介绍最常见的几种。这里仅介绍最常见的几种。上一页下一页SAS:这是功能非常齐全的软件;尽管价格相当不:这是功能非常齐全的软件;尽管价格相当不菲,许多公司,特别是美国制药公司都在使用,这多菲,许多公司,特别是美国制药公司都在使用,这多半是因为其功能众多和某些美国政府机构一些人的偏半是因为其功能众多和某些美国政府机构一些人的偏爱。尽管现在已经尽量爱。尽管现在已经尽量“傻瓜化傻瓜化”,但仍然需要一定,但仍然需要一定的训练才可以进入。也可以对它编程;但对于基本统的训练才可以进入。也可以对它编程;但对于基本统计课程则不那么方便。计课程则不那么方便。SPSS:这是一个很受欢迎的统计软件;

5、它容易操:这是一个很受欢迎的统计软件;它容易操作,输出漂亮,功能齐全,价格合理。它也有自己的作,输出漂亮,功能齐全,价格合理。它也有自己的程序语言,但基本上已经程序语言,但基本上已经“傻瓜化傻瓜化”。它对于非专业。它对于非专业统计工作者是很好的选择。统计工作者是很好的选择。上一页下一页EXCEL:它严格说来并不是统计软件,但作为数:它严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。而且凡是有据表格软件,必然有一定统计计算功能。而且凡是有Microsoft Office的计算机,基本上都装有的计算机,基本上都装有Excel。但要注意,有时在装但要注意,有时在装Office时没

6、有装数据分析功能,时没有装数据分析功能,那就必须装了才行。当然,画图功能是已经具备的了。那就必须装了才行。当然,画图功能是已经具备的了。对于简单分析,对于简单分析,EXCEL还算方便,但随着问题的深还算方便,但随着问题的深入,入,Excel就不那么就不那么“傻瓜傻瓜”,需要使用宏命令来编,需要使用宏命令来编程;这时就没有相应的简单选项了。多数专门一些的程;这时就没有相应的简单选项了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。统计推断问题还需要其他专门的统计软件来处理。上一页下一页S-plus:这是统计学家喜爱的软件。不仅由于其功能齐全,:这是统计学家喜爱的软件。不仅由于其功能齐

7、全,而且由于其强大而又方便的编程功能,使得研究人员可以编制而且由于其强大而又方便的编程功能,使得研究人员可以编制他们的程序来实现其自己创造的理论和方法。它也在进行他们的程序来实现其自己创造的理论和方法。它也在进行“傻傻瓜化瓜化”以争取顾客。但仍然以编程方便为顾客所青睐。以争取顾客。但仍然以编程方便为顾客所青睐。R软件:这是一个免费的,由志愿者管理的软件。其编程语软件:这是一个免费的,由志愿者管理的软件。其编程语言与言与S-plus所基于的所基于的S语言一样,很方便。还有不断加入的从语言一样,很方便。还有不断加入的从事各个方向研究的统计学家编写的统计软件包。同时从网上可事各个方向研究的统计学家编

8、写的统计软件包。同时从网上可以不断更新和增加有关的软件和程序。这是发展最快的软件,以不断更新和增加有关的软件和程序。这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。受到世界上统计师生的欢迎。是用户量增加最快的统计软件。它的语言结构和它的语言结构和C+、Fortran、Matlab、Pascal、Basic等等很相似,容易举一反三。对于一般非统计工作者来说,主要问很相似,容易举一反三。对于一般非统计工作者来说,主要问题是它没有题是它没有“傻瓜化傻瓜化”。上一页下一页Minitab:这个软件是很方便的功能强大而又齐全:这个软件是很方便的功能强大而又齐全的软件,也已经的软件

9、,也已经“傻瓜化傻瓜化”,在我国用的不如,在我国用的不如SPSS与与SAS那么普遍。那么普遍。Statistica:也是功能强大而齐全的:也是功能强大而齐全的“傻瓜化傻瓜化”的的软件,在我国用的也不如软件,在我国用的也不如SPSS与与SAS那么普遍。那么普遍。Eviews:这是一个处理回归和时间序列等问题很:这是一个处理回归和时间序列等问题很方便的软件。方便的软件。GAUSS:这是一个很好用的统计软件,许多搞经:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在我国使济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。用的人不多。上一页下一页FORTRAN:这是应

10、用于各个领域的历史很长的非常优:这是应用于各个领域的历史很长的非常优秀的编程软件,功能强大,也有许多数学软件包和一些秀的编程软件,功能强大,也有许多数学软件包和一些统计软件包。由于可以编译成机器语言,计算速度比这统计软件包。由于可以编译成机器语言,计算速度比这里介绍的其他软件都快的多。但需要编程和编译。里介绍的其他软件都快的多。但需要编程和编译。MATLAB、这样是应用于各个领域的以编程为主的软、这样是应用于各个领域的以编程为主的软件,在工程上应用广泛。编程类似于件,在工程上应用广泛。编程类似于S和和R。但是统计函。但是统计函数不多。数不多。 当然,还有很多其他的软件,没有必要一一罗列。当然,

11、还有很多其他的软件,没有必要一一罗列。只要学会使用一种只要学会使用一种“傻瓜式傻瓜式”软件或编程软件,使用其软件或编程软件,使用其他类似的软件也不会困难;最多看看帮助和说明即可。他类似的软件也不会困难;最多看看帮助和说明即可。 学习软件的最好方式是需要时在使用中学。学习软件的最好方式是需要时在使用中学。上一页下一页谁需要学谁需要学SAS?期望到产业界的应用统计部门就业,特别是药期望到产业界的应用统计部门就业,特别是药品与食品产业;品与食品产业;竞争北美或者来自北美的外企、需要汇总数据竞争北美或者来自北美的外企、需要汇总数据图表的职位;图表的职位;大规模数据库上的统计工作、数据挖掘工作;大规模数

12、据库上的统计工作、数据挖掘工作;统计研究中高强度的模拟运算。统计研究中高强度的模拟运算。谁不需要谁不需要SAS?要处理的数据样本量小于要处理的数据样本量小于5万,变量个数小于万,变量个数小于300。(Excel, OpenOffice的的Calc)通过图形界面作常见的统计检验通过图形界面作常见的统计检验 (SPSS, Excel)研究统计算法的实现,希望自己可以修改程序研究统计算法的实现,希望自己可以修改程序中的代码中的代码(R/Splus)本课程讲授内容本课程讲授内容第一章第一章 SAS系统概述系统概述第二章第二章 SAS语言初步语言初步第三章第三章 SAS数据管理数据管理第四章第四章 SA

13、S过程初步过程初步第五章第五章 SAS基本统计分析基本统计分析第六章第六章 SAS多元统计分析多元统计分析第七章第七章 SAS ANANLYST 模块模块上一页下一页CHAPTER1 SAS系统概述系统概述一、一、SAS系统简介系统简介二、二、SAS系统的工作环境系统的工作环境三、三、SAS基本概念基本概念上一页下一页一、一、SAS系统简介系统简介 SAS (Statistical Analysis System )是是由美国北卡来罗纳的由美国北卡来罗纳的 SAS institute 公司开发的公司开发的一种统计软件,如今已广泛普及和应用于医学、一种统计软件,如今已广泛普及和应用于医学、社会学

14、、市场学、经济学和自然科学各个领域的社会学、市场学、经济学和自然科学各个领域的信息处理、定量研究和科研分析中。它不但具有信息处理、定量研究和科研分析中。它不但具有强大的统计分析功能,也具有一般数据库软件的强大的统计分析功能,也具有一般数据库软件的数据管理功能,在众多的统计软件中,它以运行数据管理功能,在众多的统计软件中,它以运行稳定、功能强大而著称。稳定、功能强大而著称。上一页下一页返回本节首页 近近20 年来年来SAS一直占据统计软件的高端市场,一直占据统计软件的高端市场,在财富在财富 500 强中强中 有有 90% 的公司使用的公司使用 SAS。而在财。而在财富富 500 强的前强的前 1

15、00 家企业中家企业中 更是有更是有 98%的公司使用的公司使用 SAS。SAS 软件正在国内迅速地普及发展,因此如软件正在国内迅速地普及发展,因此如何学会使用何学会使用 SAS 已经成为当务之急!已经成为当务之急! SAS和和SPSS是国际上最富知名度的统计软件。在国际学术界有条是国际上最富知名度的统计软件。在国际学术界有条不成文的规定:凡是用不成文的规定:凡是用SPSS和和SAS统计分析的结果,统计分析的结果,在国际学术交流中可以不必说明算法,由此可见其权在国际学术交流中可以不必说明算法,由此可见其权威性和信誉度。威性和信誉度。上一页下一页返回本节首页 SAS系统是集数据分析、生成报表于一

16、体的一种集成系统是集数据分析、生成报表于一体的一种集成软件系统。它由基本部分和外加模块组成,其中基本部分包含软件系统。它由基本部分和外加模块组成,其中基本部分包含的功能如下:的功能如下: 基本部分基本部分: BASE SAS 部分部分; 统计分析计算部分统计分析计算部分: SAS/STAT; 绘图部分绘图部分: SAS/GRAPH; 矩阵运算部分矩阵运算部分: SAS/IML; 运筹学和线性规划运筹学和线性规划: SAS/OR; 经济预测和时间序列分析经济预测和时间序列分析: SAS/ETS;上一页下一页返回本节首页二、二、SAS系统的工作环境系统的工作环境 SAS的启动的启动 SAS系统的工

17、作环境系统的工作环境 SAS的退出的退出上一页下一页返回本节首页 SAS的启动上一页下一页返回本节首页 SAS系统的工作环境系统的工作环境上一页下一页返回本节首页 SAS系统的工作环境系统的工作环境SAS系统工作窗口系统工作窗口SAS系统菜单系统菜单 SAS命令行和工具栏命令行和工具栏 上一页下一页返回本节首页 SAS系统工作窗口系统工作窗口 SAS系统界面有五个窗口:系统界面有五个窗口:Explorer资源管理器窗口,资源管理器窗口,EDITOR 程序编辑窗口,程序编辑窗口,LOG 运行记录窗口,运行记录窗口,OUTPUT 输输出记录窗口,出记录窗口,Results结果窗口。结果窗口。Exp

18、lorer资源管理器窗口资源管理器窗口 EDITOR 程序编辑窗口程序编辑窗口 LOG 运行记录窗口运行记录窗口OUTPUT输出窗口输出窗口 Results结果窗口结果窗口 上一页下一页返回本节首页Explorer资源管理器窗口资源管理器窗口功能:功能:主要用于管理主要用于管理 SAS 文件以及其他类型文件以及其他类型文件的快捷方式文件的快捷方式 。 在资源管理器窗口可以新建或打开已有在资源管理器窗口可以新建或打开已有的数据库、的数据库、SAS 文件,进行删除、移动、复文件,进行删除、移动、复制等等各种文件管理操作制等等各种文件管理操作 。上一页下一页返回本节首页 EDITOR 程序编辑窗口程

19、序编辑窗口 功能:功能:编辑窗口主要用于输入程序、编辑程序、提交编辑窗口主要用于输入程序、编辑程序、提交程序。程序。 EDITOR编辑窗口用于编辑编辑窗口用于编辑SAS源程序文件。编辑源程序文件。编辑窗口支持全窗口编辑功能,即光标可以在整个窗口内随窗口支持全窗口编辑功能,即光标可以在整个窗口内随意移动,支持意移动,支持Windows系统常规编辑操作,如复制、系统常规编辑操作,如复制、剪切、粘贴等功能操作。剪切、粘贴等功能操作。SASV8提供了智能编辑功能,提供了智能编辑功能,它可根据用户输入的它可根据用户输入的SAS关键字、语句选项、变量名、关键字、语句选项、变量名、数据、标记等不同内容显示不

20、同的颜色,当用户输入的数据、标记等不同内容显示不同的颜色,当用户输入的字串不正确时,对应颜色不对,警告使用者有错误发生。字串不正确时,对应颜色不对,警告使用者有错误发生。上一页下一页返回本节首页 LOG 运行记录窗口运行记录窗口 功能:功能: 日志窗口给出日志窗口给出SAS系统以及提交的系统以及提交的SAS程程序的运行信息序的运行信息 。 提供的程序的运行信息包括:完成的实际的操提供的程序的运行信息包括:完成的实际的操作、花费的时间、错误等。当程序出现错误时,作、花费的时间、错误等。当程序出现错误时,LOG记录窗口中以红色字符显示错误信息,以绿记录窗口中以红色字符显示错误信息,以绿色显示一些警

21、告信息。提示使用者修改程序中的错色显示一些警告信息。提示使用者修改程序中的错误。误。上一页下一页返回本节首页OUTPUT输出窗口输出窗口 功能:功能:浏览提交的浏览提交的 SAS 程序的输出结果程序的输出结果 。 OUTPUT输出窗口分页显示输出窗口分页显示SAS程序运行所产生的文本输程序运行所产生的文本输出结果(图形输出通过出结果(图形输出通过GRAPHICS窗口显示)。对于文本结果的窗口显示)。对于文本结果的输出,可以使用主界面的菜单输出,可以使用主界面的菜单File|Save As将结果文档保存在磁将结果文档保存在磁盘中,保存的文件扩展名为盘中,保存的文件扩展名为.lst,但实际上是一种

22、文本文件格式,但实际上是一种文本文件格式,可以使用文字处理软件,如可以使用文字处理软件,如Word或写字板、记事本等打开并进或写字板、记事本等打开并进行编辑修改。对于输出到行编辑修改。对于输出到GRAPHICS窗口的图形,可以使用菜单窗口的图形,可以使用菜单File|Export as Image将图形导出保存在磁盘中,图形文件格式将图形导出保存在磁盘中,图形文件格式可以在可以在“保存类型保存类型”下拉列表中选择。在默认情况下,输出窗口下拉列表中选择。在默认情况下,输出窗口是被隐藏在编辑窗口和日志窗口下方的,当系统产生输出结果的是被隐藏在编辑窗口和日志窗口下方的,当系统产生输出结果的时候,它就

23、被自动放在最上层。时候,它就被自动放在最上层。上一页下一页返回本节首页Results结果窗口结果窗口 功能:功能: 使用户可以方便地查找、管理运行的使用户可以方便地查找、管理运行的 SAS 程序的结果。可以对每个结果进行浏览、保程序的结果。可以对每个结果进行浏览、保存、打印等操作。存、打印等操作。 在默认情况下在默认情况下 结果窗口被放置在资源管理器结果窗口被放置在资源管理器窗口的后面,直到提交的程序产生结果的时候,它窗口的后面,直到提交的程序产生结果的时候,它才被放置在上面。才被放置在上面。上一页下一页返回本节首页SAS系统菜单系统菜单 File菜单菜单Edit菜单菜单View菜单菜单Too

24、ls菜单菜单Run菜单菜单Solutions菜单菜单Window菜单菜单Help菜单菜单上一页下一页返回本节首页SAS命令行和工具栏命令行和工具栏命令行:保持与早期版本兼容命令行:保持与早期版本兼容工具栏:快捷方式工具栏:快捷方式上一页下一页返回本节首页 SAS的退出的退出两种方法都可以退出两种方法都可以退出SAS工作环境工作环境 菜单操作:菜单操作:File|Exit;Windows窗口操作:点击窗口操作:点击“关闭窗口关闭窗口”按钮。按钮。上一页下一页返回本节首页三、三、SAS基本概念基本概念(一)(一)SAS数据集数据集(二)(二)SAS数据库数据库(三)(三)SAS 程序程序 上一页下

25、一页返回本节首页(一)(一)SAS数据集数据集SAS数据集:数据集:“表表” SAS 数据集是由数据集是由 SAS 系统建立的特有的数据系统建立的特有的数据存储格式,只能被存储格式,只能被 SAS 系统调用,系统调用,SAS 数据集以数据集以“.sas7bdat”为扩展名。为扩展名。临时数据集:存储在临时数据集:存储在work目录下,退出系统即消失。目录下,退出系统即消失。永久数据集:退出系统依然存在永久数据集:退出系统依然存在根据生命周期的不同,可以分为:根据生命周期的不同,可以分为:上一页下一页返回本节首页(二)(二)SAS数据库数据库SAS数据库:数据库:“windows目录目录”四个四

26、个SAS数据库:数据库:WORK:临时文件,默认保存的数据库临时文件,默认保存的数据库SASUSER :用户自己的数据集用户自己的数据集SASHELPER:SAS系统帮助、例子文件系统帮助、例子文件MAPS:地图文件:地图文件上一页下一页返回本节首页数据集的单水平名和两水平名数据集的单水平名和两水平名 临时数据集使用单水平名,例如临时数据集使用单水平名,例如 test,而,而永久数据集使用两水平名,例如永久数据集使用两水平名,例如Sasuser.test。在两水平名中前一部分是数据库的名称,后一在两水平名中前一部分是数据库的名称,后一部分是数据集的名称,中间用点号相连。部分是数据集的名称,中间

27、用点号相连。上一页下一页返回本节首页 data score; input name $ sex $ math chinese english; cards; Alice f 90 85 91 Tom m 95 87 84 Jenny f 93 90 83 Mike m 80 85 80 Fred m 84 85 89 Kate f 97 83 82 Alex m 92 90 91 Cook m 75 78 76 Bennie f 82 79 84 Hellen f 85 74 84 ; run;上一页下一页返回本节首页 例如:一个班级内例如:一个班级内 10名同学的名同学的 3 门功课的成绩读

28、入数据的过程如下:门功课的成绩读入数据的过程如下: data sasuser.score; input name $ sex $ math chinese english; cards; Alice f 90 85 91 Tom m 95 87 84 Jenny f 93 90 83 Mike m 80 85 80 Fred m 84 85 89 Kate f 97 83 82 Alex m 92 90 91 Cook m 75 78 76 Bennie f 82 79 84 Hellen f 85 74 84 ; run;或 除了除了SAS系统预定义的系统预定义的 SAS 数据库之外,用数据

29、库之外,用户还可以新建自己的数据库,方法是使用户还可以新建自己的数据库,方法是使用 LIBNAME 语句将数据库与一个目录联系起来。语句将数据库与一个目录联系起来。上一页下一页返回本节首页LIBNAME例:例:libname libtest d:SAS8 ; data libtest.test; input name $ sex $ math chinese english;cards;Alice f 90 85 91Tom m 95 87 84Jenny f 93 90 83;run;上一页下一页返回本节首页(三)(三)SAS 程序程序 SAS 程序就是用户运用程序就是用户运用 SAS 语言

30、编辑而成的在语言编辑而成的在 SAS 系统下可以运行的一段程序。系统下可以运行的一段程序。 通常一段通常一段 SAS 程序包括数据步程序包括数据步(SAS DATA STEP)和过程步和过程步(SAS PROCEDURE STEP)。数据。数据步以步以 DATA 开始,过程步以开始,过程步以 PROC 开始,数据步主开始,数据步主要用于生成数据集、计算数据、整理数据、过程步主要用于生成数据集、计算数据、整理数据、过程步主要用于对数据进行分析、生成报告。要用于对数据进行分析、生成报告。 例如:例如:上一页下一页返回本节首页编辑程序将一组学生的成绩信息读入一个名为编辑程序将一组学生的成绩信息读入一

31、个名为SCORE的数据集的数据集data score; input name $ sex $ math chinese english; cards; Alice f 90 85 91 Tom m 95 87 84 Jenny f 93 90 83 Mike m 80 85 80 Fred m 84 85 89 Kate f 97 83 82 Alex m 92 90 91 Cook m 75 78 76 Bennie f 82 79 84 Hellen f 85 74 84;proc means data=score; var math;run;上一页下一页返回本节首页1.将本章例题中的程序输入到将本章例题中的程序输入到EDITOR编辑窗口中,编辑窗口中,并观察比较运行结果。并观察比较运行结果。【思考与练习思考与练习】

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号