SAS软件与数学建模说课讲解

上传人:人*** 文档编号:569187377 上传时间:2024-07-28 格式:PPT 页数:130 大小:1.85MB
返回 下载 相关 举报
SAS软件与数学建模说课讲解_第1页
第1页 / 共130页
SAS软件与数学建模说课讲解_第2页
第2页 / 共130页
SAS软件与数学建模说课讲解_第3页
第3页 / 共130页
SAS软件与数学建模说课讲解_第4页
第4页 / 共130页
SAS软件与数学建模说课讲解_第5页
第5页 / 共130页
点击查看更多>>
资源描述

《SAS软件与数学建模说课讲解》由会员分享,可在线阅读,更多相关《SAS软件与数学建模说课讲解(130页珍藏版)》请在金锄头文库上搜索。

1、SAS软件与数学建模建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28统计统计生物物理化学经济保险心理教育管理建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28建建 模模 软软 件

2、件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28SAS与与Excel的通讯的通讯SAS中数据Excel建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28SAS系统基础1 1 概述概述概述概述1.1SAS1.1SAS显示管理系统显示管理系统1.2SAS1.2SAS数据库与数据集数据库与数据集2 SAS2 SAS编程基础编程基础编程基础编程基础2.12.1一个简单一个简单SASSAS程序程序2.2SAS2.2SAS变量变量2.3SAS2.3SAS表达式表达式

3、2.4SAS2.4SAS函数函数2.4.1SAS2.4.1SAS函数概述函数概述2.4.22.4.2常用常用SASSAS函数函数3 DATA3 DATA步步步步3.1DATA3.1DATA步流程步流程3.2INPUT3.2INPUT语句语句3.33.3数据集的整理数据集的整理3.43.4数据集的连接与合并数据集的连接与合并3.5SAS3.5SAS与外部数据的交换与外部数据的交换建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28StatisticalAnalysisSystem(缩写为SAS):是用于数据分析与决策支

4、持的大型集成式模块化软件系统在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28四大任务:数据访问数据访问访问任何形式和来源的数据访问任何形式和来源的数据数据管理数据管理将数据转变为可用形式将数据转变为可用形式数据呈现数据呈现以文字、图形和表格的形式展现数据信息以文字、图形和表格的形式展现数据信息数据分析数据分析获取有意义的信息获取有意义的信息建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282

5、024/7/281.SAS1.SAS显示管理系统显示管理系统 SASSAS系统的启动系统的启动 点击图标点击图标,启动,启动SASSAS系统系统命令窗口命令窗口菜单栏菜单栏工具栏工具栏LOGLOG窗窗程序编辑窗程序编辑窗状态栏状态栏结果窗结果窗资源管理器资源管理器结果输出窗结果输出窗演示演示建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/282.SAS2.SAS数据库与数据集数据库与数据集SASSAS数据库数据库: :主要用于存放数据集和目录主要用于存放数据集和目录. .SASSAS系统系统库库操作系统操作系统文件夹

6、文件夹建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/282.SAS2.SAS数据库与数据集数据库与数据集SASSAS数据库数据库: :主要用于存放数据集和目录主要用于存放数据集和目录. .临时库临时库(WORK):SAS(WORK):SAS系统的临时工作目录系统的临时工作目录, ,退出系统时退出系统时, ,其中的内容全部删除其中的内容全部删除永久库永久库: :与临时库相反与临时库相反.SAS.SAS提供提供SASUSER,SASHELPSASUSER,SASHELP建建 模模 软软 件件建建 模模 软软 件件sas

7、sas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/282.SAS2.SAS数据库与数据集数据库与数据集SASSAS数据库数据库: :主要用于存放数据集和目录主要用于存放数据集和目录. .创建用户永久库创建用户永久库vv 用操作系统中的资源管理器用操作系统中的资源管理器, ,建立一文件夹建立一文件夹程序方式程序方式:libname:libname库名库名文件夹所在路径文件夹所在路径 菜单方式菜单方式: :点击图标点击图标,然后按要求操作然后按要求操作. .vv在在SASSAS系统中建库系统中建库建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮

8、电大学重庆邮电大学2024/7/282024/7/282.SAS2.SAS数据库与数据集数据库与数据集SASSAS数据库数据库: :主要用于存放数据集和目录主要用于存放数据集和目录. .创建用户永久库创建用户永久库例:在例:在SASSAS中先用程序方式建立一名为中先用程序方式建立一名为COURSECOURSE的用户库;的用户库;再用菜单方式建立一名为再用菜单方式建立一名为COURSE1COURSE1的用户库。的用户库。操作操作建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/282.SAS2.SAS数据库与数据集数据库

9、与数据集SASSAS数据集数据集: :主要用于存放数据文件。它一般由主要用于存放数据文件。它一般由描述部分描述部分和和数据部分数据部分组成,也有一些数据集包含组成,也有一些数据集包含索引部分索引部分。数据部分数据部分是存放数据的地方,它组织成一张是存放数据的地方,它组织成一张二维表二维表,其列,其列表示变量,行表示观测。表示变量,行表示观测。描述部分说明了数据集的一般信息,如数据集的名字和成员描述部分说明了数据集的一般信息,如数据集的名字和成员类型;建立的日期和时间;观测数以及变量个数、属性等。类型;建立的日期和时间;观测数以及变量个数、属性等。建建 模模 软软 件件建建 模模 软软 件件sa

10、ssas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/282.SAS2.SAS数据库与数据集数据库与数据集SASSAS数据集数据集: :数据部分数据部分是存放数据的地方,它组织成一张是存放数据的地方,它组织成一张二维表二维表,其列,其列表示变量,行表示观测。表示变量,行表示观测。观测观测变量变量建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/282.SAS2.SAS数据库与数据集数据库与数据集SASSAS数据集的引用数据集的引用: :库名数据集名园点连接符园点连接符建建 模模 软软 件件建建

11、模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28Data bodyfat;Data bodyfat; inPUt sex $ fatpct ; inPUt sex $ fatpct ; fat=fatpct/100;fat=fatpct/100;cards;cards;M 13.3 F 22 M 19 F 26 M 20 F 16 M 8 F 12 M 18 F 21.7M 13.3 F 22 M 19 F 26 M 20 F 16 M 8 F 12 M 18 F 21.7M 22 F 23.2 M 20 F 21 M 31 F 28 M

12、21 F 30 M 12 F 23M 22 F 23.2 M 20 F 21 M 31 F 28 M 21 F 30 M 12 F 23M 16 M 12 M 24M 16 M 12 M 24RUNRUN;PROC means data=bodyfat;PROC means data=bodyfat;var fatpct;var fatpct;run;run;DATADATA步步程程序序步步1 1、一个简单、一个简单SASSAS程序程序建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28该程序的结构包括两部分:该程序

13、的结构包括两部分:以关键词以关键词DATADATA开始的开始的DATADATA步;主要创建步;主要创建数据集数据集, ,如此例中的如此例中的bodyfatbodyfat,同时也可以产,同时也可以产生一些描述性统计和报表输出;生一些描述性统计和报表输出;以关键词以关键词PROCPROC开头开头PROCPROC步。步。PROCPROC步则步则是系统预先写好的执行特殊任务的是系统预先写好的执行特殊任务的SASSAS子程子程序序, ,如此例中的如此例中的meansmeans过程过程,它主要是承担,它主要是承担数据的分析,同时也可产生相关的数据集。数据的分析,同时也可产生相关的数据集。 1 1、一个简单

14、、一个简单SASSAS程序程序建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28从该程序可以看出从该程序可以看出SASSAS程序的特点:程序的特点:vv SASSAS程序是由程序是由SASSAS关键词、关键词、SASSAS名字、特殊字符名字、特殊字符(如例子中的(如例子中的$ $号)和运算符组成的字符串,并以号)和运算符组成的字符串,并以分号(;)结尾的分号(;)结尾的SASSAS语句组成,它要求语句组成,它要求SASSAS系统系统执行一种操作或给执行一种操作或给SASSAS系统提供信息。系统提供信息。vv SAS

15、SAS程序不区分大小写,语句位置任意,一条语程序不区分大小写,语句位置任意,一条语句的书写既可起始于任何行、列,也可跨越多行,句的书写既可起始于任何行、列,也可跨越多行,同时也可以将多条语句写在一行。不过一个好的习同时也可以将多条语句写在一行。不过一个好的习惯是;惯是;DATADATA步和步和PROCPROC步顶格书写,在每个步骤内步顶格书写,在每个步骤内的语句以缩进的方式书写,这样阅读和理解起来方的语句以缩进的方式书写,这样阅读和理解起来方便。便。 1 1、一个简单、一个简单SASSAS程序程序操作操作建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电

16、大学2024/7/282024/7/28SASSAS变量的命名:第一个字符必须是字母或下划线变量的命名:第一个字符必须是字母或下划线(_);(_);后面可跟后面可跟1 1至至3232个字符(数字、字母或下划线)个字符(数字、字母或下划线)变量的属性:变量的属性:类型类型(type)(type):数值型、字符型:数值型、字符型( (定义时变量后带定义时变量后带$)$)长度长度(length)(length):存储该变量所用的字节数(缺省为存储该变量所用的字节数(缺省为8 8)输入格式输入格式(informat)/(informat)/输出格式输出格式(format)(format):标签标签(l

17、abel)(label):对变量的作用给予描述。:对变量的作用给予描述。2 2、SASSAS变量变量建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28输入输入/ /输出格式:输出格式:类型:类型:字符型:用于字符变量的现成格式字符型:用于字符变量的现成格式数值型:用于一般数值型变量的现成格式数值型:用于一般数值型变量的现成格式日期时间型:用于日期和时间的现成格式日期时间型:用于日期和时间的现成格式用户定义:用于用户自定义格式用户定义:用于用户自定义格式2 2、SASSAS变量变量建建 模模 软软 件件建建 模模 软

18、软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28输入输入/ /输出格式:输出格式:一般形式:一般形式:格式名格式名.2 2、SASSAS变量变量字字符符型型变变量量宽宽度度小小数数点点后后数数值值位位数数建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28输入输入/ /输出格式:输出格式:字符格式:字符格式:$w.$w.$CHARw.$CHARw.2 2、SASSAS变量变量其含义是读入或显示字符变量的前其含义是读入或显示字符变量的前w w个字节。其缺省值个字节。其缺省值

19、均为变量的长度。当变量的长度未定时,均为变量的长度。当变量的长度未定时,$CHARw.$CHARw.格式格式宽度的缺省值为宽度的缺省值为8 8;对;对$w.$w.作为输出格式时缺省宽度为作为输出格式时缺省宽度为1 1,作为输入格式时,必须提供作为输入格式时,必须提供w w的值。的值。二者作为输出格式时,均保留字符串前的空格;二者作为输出格式时,均保留字符串前的空格;但作为输入格式时,但作为输入格式时,$CHARw.$CHARw.保留字符串前的空格,而保留字符串前的空格,而$w.$w.则删除字符前的空格。则删除字符前的空格。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重

20、庆邮电大学重庆邮电大学2024/7/282024/7/28输入输入/ /输出格式:输出格式:数值输入格式:数值输入格式:w.dw.d数值输出格式:数值输出格式:BESTw.BESTw.2 2、SASSAS变量变量BESTw.BESTw.是缺省输出格式。是缺省输出格式。WW的缺省值为的缺省值为1212,最大可取,最大可取3232。含义为将数值在规定的宽度下用最为精确有效的方式显示。含义为将数值在规定的宽度下用最为精确有效的方式显示。若用定点方式表示可提供更多的有效数字就使用定点方式;若用定点方式表示可提供更多的有效数字就使用定点方式;否则自动使用浮点数。否则自动使用浮点数。如:如:数据集中数值数

21、据集中数值输出格式输出格式输出表示输出表示1257000best6.1.26E61257000best6.1.26E61257000best3.1E61257000best3.1E6建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28输入输入/ /输出格式:输出格式:数值输入格式:数值输入格式:COMMAw.dCOMMAw.d2 2、SASSAS变量变量如:如:原始数据原始数据输入格式输入格式记入数值记入数值$1,2345,6789comma12.21234567.89$1,2345,6789comma12.2123

22、4567.89$1234,5678.9comma12.212345678.9$1234,5678.9comma12.212345678.9($1,2345,6789)comma14.2-1234567.89($1,2345,6789)comma14.2-1234567.89建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28输入输入/ /输出格式:输出格式:数值输出格式:数值输出格式:COMMAw.d&DOLLARw.dCOMMAw.d&DOLLARw.d2 2、SASSAS变量变量如:如:原始数据原始数据输出格式输

23、出格式输出表示输出表示123456.7comma12.2123,456.70123456.7comma12.2123,456.70-123456.7comma12.2-123,456.70-123456.7comma12.2-123,456.70123456.7dollar12.2$123,456.70123456.7dollar12.2$123,456.70-123456.7dollar12.2-123,456.70-123456.7dollar12.2-123,456.70建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/28202

24、4/7/28输入输入/ /输出格式输出格式( (日期日期) ):日期、时间的处理:日期、时间的处理:将日期和时间值均作为将日期和时间值均作为数值变量数值变量存储存储以以19601960年年1 1月月1 1日日为为0 0点,其它日期值为该日期值与点,其它日期值为该日期值与19601960年年1 1月月1 1日相差的天数。日相差的天数。时间以时间以19601960年年1 1月月1 1日日0 0时时0 0分分0 0秒秒为起点(为起点(0 0点),点),其余时间为与其的差值。其余时间为与其的差值。2 2、SASSAS变量变量建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电

25、大学重庆邮电大学2024/7/282024/7/28输入输入/ /输出格式输出格式( (日期日期) ):I. I.输入格式输入格式: :YYMMDDwYYMMDDw.输出格式输出格式: :YYMMDDxwYYMMDDxw. .源数据日期源数据日期输入格式输入格式SASSAS日期值日期值输出格式输出格式输出表示输出表示99-10-15yymmdd8.14532yymmddd10.1999-10-1599-10-15yymmdd8.14532yymmddd10.1999-10-1599/10/15ddmmyy8.14532yymmdds10.1999/10/1599/10/15ddmmyy8.14

26、532yymmdds10.1999/10/15151099ddmmyy6.14532mmddyyp10.10.15.1999151099ddmmyy6.14532mmddyyp10.10.15.199910-15-99mmddyy8.14532ddmmyyn8.1510199910-15-99mmddyy8.14532ddmmyyn8.151019992 2、SASSAS变量变量其中输出格式中的其中输出格式中的x x的取值为的取值为: :x:BCDNPSx:BCDNPS含义含义空格空格:-:-无无././建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电

27、大学2024/7/282024/7/28输入输入/ /输出格式输出格式( (日期日期) ):II.II.输入输出格式输入输出格式: :DATEwDATEw. .源数据日期源数据日期输入格式输入格式SASSAS日期值日期值输出格式输出格式输出表示输出表示15OCT99date7.14532date9.15OCT199915OCT99date7.14532date9.15OCT19992 2、SASSAS变量变量建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28输入输入/ /输出格式输出格式( (时间时间) ):III

28、.III.输入格式输入格式: :TIMEwTIMEw. .和输出格式和输出格式: :TIMEw.dTIMEw.dIV.IV.hh:mm:ss.sshh:mm:ss.ss( (时时: :分分: :秒秒. .百分秒百分秒) )源数据日期源数据日期输入格式输入格式SASSAS日期值日期值输出格式输出格式输出表示输出表示13:40:35.37time11.49235.37time11.213:40:35.3713:40:35.37time11.49235.37time11.213:40:35.37134035.37time11.49235.37Time2.13134035.37time11.49235

29、.37Time2.1313/40/35.37time11.49235.37Time5.13:4013/40/35.37time11.49235.37Time5.13:4013-40-35.37time11.49235.37Time8.13:40:3513-40-35.37time11.49235.37Time8.13:40:3514035.37PMtime14.49235.37Timeampm13.21:40:35.37PM14035.37PMtime14.49235.37Timeampm13.21:40:35.37PM2 2、SASSAS变量变量建建 模模 软软 件件建建 模模 软软 件件s

30、assas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28输入输入/ /输出格式输出格式( (日期时间日期时间) ):IV.IV.输入格式输入格式: :DATETIMEwDATETIMEw. .V.V.ddmmmyyddmmmyy hh:mm:ss.sshh:mm:ss.ss 或或 VI.VI.ddmmmyyyyddmmmyyyy hh:mm:ss.sshh:mm:ss.ssVII.VII. VIII.VIII.输出格式输出格式: :DATETIMEw.dDATETIMEw.dIX.IX.ddmmmyy:hh:mm:ss.ssddmmmyy:hh:mm:ss.ss或或

31、X.X.ddmmmyyyy:hh:mm:ss.ssddmmmyyyy:hh:mm:ss.ss2 2、SASSAS变量变量建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28变量列表:变量列表:x1x2x3xnx1x2x3xn简写为简写为x1-xnx1-xnABCDABCD简写为简写为A-DA-DVXTDUPJPPVXTDUPJPP简写为简写为V-JPPV-JPP2 2、SASSAS变量变量建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28

32、表达式是由运算符和运算对象形成的指令集表达式是由运算符和运算对象形成的指令集3 3、SASSAS表达式表达式1.SAS1.SAS常数常数 数值常数数值常数:110-0.351.8E30.5E-10:110-0.351.8E30.5E-10 字符常数字符常数:Smith23John:Smith23JohnSmithSmith 日期日期, ,时间和日期时间常数时间和日期时间常数: :13JUL2001d13JUL2001d22:23t13JUL2001:22:23:25DT22:23t13JUL2001:22:23:25DT2.SAS2.SAS运算符运算符: : 算术运算符算术运算符:*(:*(乘

33、方乘方)*/+-)*/+- 比较运算符比较运算符:=(eq)=(ne)(gt)=(ge)(gt)=(ge)(取小取小)()(取大取大)|()|(连接连接) )建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28表达式是由运算符和运算对象形成的指令集表达式是由运算符和运算对象形成的指令集3 3、SASSAS表达式表达式3. 3.运算次序运算次序: :1)1) 括号内的表达式先算括号内的表达式先算2)2)优先级优先级( (见下面见下面) )3)3)相同优选级别的算符相同优选级别的算符, ,按顺序按顺序, ,先左后右先左后

34、右建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28表达式是由运算符和运算对象形成的指令集表达式是由运算符和运算对象形成的指令集3 3、SASSAS表达式表达式优先级优先级第一级第一级*乘方乘方+ +仅作前缀时仅作前缀时( (取正取正) )- -仅作前缀时仅作前缀时( (取负取负) ) 非非最小最小最大最大第二级第二级* *乘乘/ /除除第三级第三级+ +加加- -减减第四级第四级| |连接连接第五级第五级,=,=,第六级第六级&与与第七级第七级| |建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜

35、思东 重庆邮电大学重庆邮电大学2024/7/282024/7/281.SAS1.SAS函数的调用函数的调用: :functionname(argument,)-functionname(argument,)-括号不能少括号不能少自变量的表示形式有两种自变量的表示形式有两种: :如如x,y,zx,y,z的和的和sum(x,y,z)sum(x,y,z)或或sum(ofxyz)sum(ofx-z)sum(ofxyz)sum(ofx-z)A=sum(x,y,z)A=sum(x,y,z)B=min(sum(ofxyz),1000)B=min(sum(ofxyz),1000)4 4、SASSAS函数函数建

36、建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/282.SAS2.SAS函数的返回值函数的返回值: :返回值为返回值为: :数值型数值型字符型字符型 其返回值的类型一般可通过自变量的类型加以判其返回值的类型一般可通过自变量的类型加以判断断( (但有个别有例外但有个别有例外, ,如如PUTPUT函数函数, ,总是输出字符型总是输出字符型) )4 4、SASSAS函数函数3.SAS3.SAS函数的分类函数的分类: :SASSAS函数分为十七类:算术函数、数组函数、截取函数、数学函数、函数分为十七类:算术函数、数组函数、截取

37、函数、数学函数、三角和双曲函数、概率函数、分位数函数、非中心函数、样本统计函数、三角和双曲函数、概率函数、分位数函数、非中心函数、样本统计函数、随机数函数、财政金融函数、逐位逻辑操作函数、数字函数、字符函数、随机数函数、财政金融函数、逐位逻辑操作函数、数字函数、字符函数、日期和时间函数、洲和日期和时间函数、洲和ZipZip码换算函数和特殊函数。码换算函数和特殊函数。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数1. 1.概率函数概

38、率函数: :SASSAS系统提供了系统提供了1010个常见分布的概率函数,其定义为:个常见分布的概率函数,其定义为:在下面的函数均表示求这些分布函数的值。在下面的函数均表示求这些分布函数的值。其中其中DFDF表示自由度,表示自由度,NCNC表示非中心参数值,表示非中心参数值,NDFNDF表示分表示分子自由度,子自由度,DDFDDF表示分母自由度,其余参数为相关分布的表示分母自由度,其余参数为相关分布的参数项。参数项。 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的SASSAS函

39、数函数4 4、SASSAS函数函数1. 1.概率函数概率函数: :标准正态分布函数标准正态分布函数PROBNORMPROBNORM(X X) 计算计算PUX(PU0PROBGAM(X,a)a0贝塔分布函数贝塔分布函数PROBBETA(X,a,b)XPROBBETA(X,a,b)X(0,1),a,b0(0,1),a,b0F F分布函数分布函数PROBF(X,NDF,DDF,NC)PROBF(X,NDF,DDF,NC)t t分布函数分布函数PROBT(X,DF,NC)PROBT(X,DF,NC)二项分布的概率分布函数二项分布的概率分布函数PROBBNML(P,N,M)PROBBNML(P,N,M)

40、波松分布波松分布POISSON(,N)POISSON(,N)负二项分布负二项分布PROBNEGB(P,N,M)PROBNEGB(P,N,M)超几何分布超几何分布PROBHYPR(NN,K,N,X,OR)PROBHYPR(NN,K,N,X,OR)表示表示NNNN件产品件产品, ,其中有其中有K K件件不合格品不合格品, ,随机地从随机地从NNNN件中抽取件中抽取N N件件, ,这这N N件中不合格品的个数服从该分布件中不合格品的个数服从该分布. .该函数给出该函数给出N N件品中不合格品的个数件品中不合格品的个数=X=X的概率的概率. .参数参数OROR是不匀率是不匀率.K=0.K=0是是有效的

41、值有效的值( (即即NNNN件产品中没有不合格品件产品中没有不合格品), ),由此导出由此导出X=0,X=0,不管其它参数取什么不管其它参数取什么值值, ,该函数获得值该函数获得值1.1.如果省略如果省略OR,OR,就认为其值为就认为其值为1.1.如如:X=PROBHYPR(10,5,3,2,1.5):X=PROBHYPR(10,5,3,2,1.5)OR=1.5OR=1.5表示抽到不合格品的概率是抽到合格品概率的表示抽到不合格品的概率是抽到合格品概率的1.51.5倍倍. .建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/

42、7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数1. 1.概率函数概率函数: :举例举例: :DATADD;DATADD;p=PROBCHI(5.6,4);/*p=PROBCHI(5.6,4);/*求自由度为求自由度为4 4的的 2 2分布不超过分布不超过5.65.6的概率值的概率值p*/p*/T=1-2*(1-PROBT(2.4,8);/*T=1-2*(1-PROBT(2.4,8);/*求自由度为求自由度为8 8的的P|t|2.4P|t|2.4*/*/RUN;RUN;在在SASSAS系统中操作系统中操作建建 模模 软软 件件建建 模模 软软 件件sa

43、ssas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数2. 2.分位数函数分位数函数: : 2 2分布的分位数分布的分位数CINVCINV(p p,dfdf,ncnc)nc0nc0)BetaBeta分布的分位数分布的分位数BETAINV(p,a,b)BETAINV(p,a,b)F F分布的分位数分布的分位数FINV(p,ndf,ddf,nc)FINV(p,ndf,ddf,nc)T T分布的分位数分布的分位数TINV(p,df,nc)TINV(p,df,nc)正态分布的分位数正态分布的分

44、位数PROBIT(p)PROBIT(p)标准正态分布的分位数标准正态分布的分位数, ,其结果在其结果在-5-5和和5 5之间之间. .GammaGamma分布的分位数分布的分位数GAMINV(p,a)GAMINV(p,a)建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数2. 2.分位数函数分位数函数: :举例举例: :DATAA;DATAA;Q1=FINV(0.025,2,10);/*Q1=FINV(0.025,2,10);/*求自

45、由度为求自由度为(2,10)(2,10)的的F F分布的分布的2.5%2.5%分位数分位数Q1Q1*/*/Q2=FINV(0.975,2,10);/*Q2=FINV(0.975,2,10);/*求自由度为求自由度为(2,10)(2,10)的的F F分布的分布的97.5%97.5%分位数分位数Q2Q2*/*/Q3=FINV(0.95,2,10,3.2);/*Q3=FINV(0.95,2,10,3.2);/*非中心值为非中心值为3.23.2的的F F分布的分布的95%95%的分位数的分位数, ,其自由度为其自由度为(2,10)(2,10)*/*/RUN;RUN;演示演示建建 模模 软软 件件建建

46、模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数3. 3.随机数函数随机数函数: :均匀分布随机数均匀分布随机数UNIFORMUNIFORM(seedseed) 其乘子为其乘子为1680716807,模为,模为2 23131的乘同余发生器和一个的乘同余发生器和一个6464位数的搅乱表形成的组合发生器,位数的搅乱表形成的组合发生器,seedseed必须是常数,它或是必须是常数,它或是0 0或或5 5位,位,6 6位,位,7 7位的奇数。位的奇数。RANUNIRA

47、NUNI(seedseed) 其乘子为其乘子为397204094397204094,模为,模为2 23131-1-1的素数发生器,的素数发生器,seedseed必须是小于模必须是小于模2 23131-1-1任何常数。任何常数。标准正态分布随机数标准正态分布随机数NORMALNORMAL(seedseed) RANNORRANNOR(seedseed)一般正态分布一般正态分布N N(,2 2)可由如下变换得到:)可由如下变换得到: 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的S

48、ASSAS函数函数4 4、SASSAS函数函数3. 3.随机数函数随机数函数: :指数分布随机数指数分布随机数 RANEXP(seedRANEXP(seed) ) 产生产生=1=1的指数分布的随机数的指数分布的随机数.Y=Y=RANEXP(seed)/RANEXP(seed)/, ,则产生则产生一般指数分布一般指数分布随机数随机数若若Y=Y=-* *LOG(RANEXP(seedLOG(RANEXP(seed),),则则Y Y为具有位置参数为具有位置参数 和尺度参数为和尺度参数为 的的极值分布极值分布随机变量随机变量若若Y=Y=FLOOR(-FLOOR(-RANEXP(seed)/LOG(pR

49、ANEXP(seed)/LOG(p) ), ,则则Y Y为具有参数为具有参数p p的的几何分布几何分布变量变量建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数3. 3.随机数函数随机数函数: :伽马分布随机数伽马分布随机数 RANGAM(seed,RANGAM(seed,) ). .它用组合法产生参数为非整数它用组合法产生参数为非整数 的的GAMMAGAMMA随机数随机数. .非整数非整数 可表示为整数部分和小数部分的和可表示为整数

50、部分和小数部分的和:=:=+(-+(-).).用逆变换方法产生参数为用逆变换方法产生参数为整数整数的的GAMMAGAMMA随机数随机数X1,X1,用舍选法产生参数为小数用舍选法产生参数为小数( (-) )的的GAMMAGAMMA随机随机数数X2,X2,那么那么X1+X2X1+X2即为参数为即为参数为 的的GAMMAGAMMA随机数随机数设设X=X=RANGAM(seed,RANGAM(seed,), ),则则Y=X/Y=X/为形状参数为为形状参数为,尺度参数为尺度参数为 的的GAMMAGAMMA分分布随机数布随机数; ;若若2*2*为整数为整数, ,且且Y=2*X,Y=2*X,则则Y Y是具有

51、自由度为是具有自由度为2*2*的卡方分布随机数的卡方分布随机数; ;若若=n(=n(正整数正整数) )且且Y=X/,Y=X/,那么那么Y Y是是ErlangErlang( (厄兰厄兰) )分布随机数分布随机数. .它是它是n n个独立的均值个独立的均值为为 的指数分布变量的和的指数分布变量的和; ;若若Y1=RANGAM(seed,),Y2=Y1=RANGAM(seed,),Y2=RANGAM(seed,RANGAM(seed,), ),则则Y=Y1/(Y1+Y2)Y=Y1/(Y1+Y2)是参数为是参数为 和和 的贝塔分布随机数的贝塔分布随机数建建 模模 软软 件件建建 模模 软软 件件sas

52、sas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数3. 3.随机数函数随机数函数: :三角分布随机数三角分布随机数RANTRIRANTRI(seedseed,h h) 0h10h1其密度函数为其密度函数为:的三角分布随机数的三角分布随机数. .对一般区间对一般区间 a,ba,b 上的三角形分布随机数上的三角形分布随机数Y,Y,可由可由0,10,1区间上三角形分布的随机数的区间上三角形分布的随机数的线性变换得到线性变换得到. .即即:Y=(b-a)*:Y=(b-a)*RANTRI(se

53、ed,h)+aRANTRI(seed,h)+ah=(h=(c-a)/(b-ac-a)/(b-a) )c ca,ba,b 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数3. 3.随机数函数随机数函数: :柯西分布随机数柯西分布随机数RANCAU(seedRANCAU(seed)用舍选法产生用舍选法产生Y=Y=+* *RANCAU(seedRANCAU(seed), ),则则Y Y是位置参数为是位置参数为,尺度参数为尺度参数为 的一般

54、柯西分布随机数的一般柯西分布随机数二项分布随机数二项分布随机数RANBIN(seed,n,pRANBIN(seed,n,p) )波松分布随机数波松分布随机数RANPOI(seed,RANPOI(seed,) )离散分布随机数离散分布随机数 RANTBL(seed,p1,p2,RANTBL(seed,p1,p2,p pn n) )此函数产生一个由此函数产生一个由p1p1到到p pn n定义的概率定义的概率密度函数的变量密度函数的变量. .它返回数值它返回数值1,2,3,n,1,2,3,n,且具以下概率分布且具以下概率分布: :123n123np1p2p3p1p2p3pnpn建建 模模 软软 件件

55、建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数3. 3.随机数函数随机数函数: :vv关于种子数关于种子数(seed):(seed):当当SEED0SEED0时时, ,则取系统当前的日期时间值作为初始值则取系统当前的日期时间值作为初始值vv随机数函数每次执行时虽然当前的种子不断变化随机数函数每次执行时虽然当前的种子不断变化, ,但自变量但自变量SEEDSEED的值保持不变的值保持不变. .因此不可能控制初始化之后的随机数因此不可能控制初始化之后的随机数

56、. .若想控制随机数流若想控制随机数流, ,可使用可使用CALLCALL子程序子程序 CallCallranbin(seed,n,p,xranbin(seed,n,p,x) )CallCallrancau(seed,xrancau(seed,x) )CallCallranexp(seed,xranexp(seed,x) )CallCallrannor(seed,xrannor(seed,x) )CallCallranpoi(seed,xranpoi(seed,x) )Callrantbl(see,p1,p2,Callrantbl(see,p1,p2,pn,xpn,x) )CallCallran

57、tri(seed,h,xrantri(seed,h,x) )CallCallranuni(seed,xranuni(seed,x) )CallCallrangam(seed,a,xrangam(seed,a,x) )建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数4. 4.样本统计函数样本统计函数: : 均值均值 MEANMEAN(OFX1-XnOFX1-Xn) 或或 MEAN(X,Y,Z,)(MEAN(X,Y,Z,)(注注: :缺

58、失值不含在内缺失值不含在内) ) 最大值最大值 MAX(OFX1-Xn)MAX(OFX1-Xn)或或 MAX(X,Y,Z,)(MAX(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) ) 最小值最小值 MIN(OFX1-Xn)MIN(OFX1-Xn)或或 MIN(X,Y,Z,)(MIN(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) ) 非缺失值的个数非缺失值的个数 N(OFX1-Xn)N(OFX1-Xn)或或 N(X,Y,Z,)N(X,Y,Z,) 缺失数据的个数缺失数据的个数 NMISS(OFX1-Xn)NMISS(OFX1-Xn)或或 NMISS(X,Y,Z,)NMISS

59、(X,Y,Z,) 求和求和 SUM(OFX1-Xn)SUM(OFX1-Xn)或或 SUM(X,Y,Z,)(SUM(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) ) 方差方差 VAR(OFX1-Xn)VAR(OFX1-Xn)或或 VAR(X,Y,Z,)(VAR(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) ) 标准差标准差 STD(OFX1-Xn)STD(OFX1-Xn)或或 STD(X,Y,Z,)(STD(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) )建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7

60、/282024/7/284. 4.与统计有关的与统计有关的SASSAS函数函数4 4、SASSAS函数函数4. 4.样本统计函数样本统计函数: : 标准误差标准误差 STDERR(OFX1-Xn)STDERR(OFX1-Xn)或或 STDERR(X,Y,Z,)(STDERR(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) ) 变异系数变异系数 CV(OFX1-Xn)CV(OFX1-Xn)或或 CV(X,Y,Z,)(CV(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) ) 极差极差 RANGE(OFX1-Xn)RANGE(OFX1-Xn)或或 RANGE(X,Y,Z,)(RA

61、NGE(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) ) 偏差平方和偏差平方和( (校正平方和校正平方和)CSS(OFX1-Xn)CSS(OFX1-Xn)或或 CSS(X,Y,Z,)(CSS(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) ) 未校正的平方和未校正的平方和USS(OFX1-Xn)USS(OFX1-Xn)或或 USS(X,Y,Z,)(USS(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) ) 偏斜度偏斜度SKEWNESS(OFX1-Xn)SKEWNESS(OFX1-Xn)或或 SKEWNESS(X,Y,Z,)(SKEWNESS(X,Y,Z,)(注注

62、: :缺失值不含在内缺失值不含在内) ) 峰度峰度KURTOSIS(OFX1-Xn)KURTOSIS(OFX1-Xn)或或 KURTOSIS(X,Y,Z,)(KURTOSIS(X,Y,Z,)(注注: :缺失值不含在内缺失值不含在内) )建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28编译阶段和执行阶段编译阶段和执行阶段1 1、DATADATA步流程步流程编译阶段(编译阶段(CompilationPhase):CompilationPhase):语法检查。若出现严重错误,则停止执行。语法检查。若出现严重错误,则停止

63、执行。将程序转换为机器码,代执行阶段使用将程序转换为机器码,代执行阶段使用建立工作部件,输入缓冲器(建立工作部件,输入缓冲器(InputBufferInputBuffer)建立工作部件建立工作部件PDVPDV(ProgramDataVectorProgramDataVector)确定数据集中各个变量的三个必须的属性:确定数据集中各个变量的三个必须的属性:变量名,类型,长度变量名,类型,长度建立新建数据集的描述部分建立新建数据集的描述部分建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28编译阶段和执行阶段编译阶段和执

64、行阶段1 1、DATADATA步流程步流程编译阶段(编译阶段(CompilationPhase):CompilationPhase):vv语法检查的主要内容:语法检查的主要内容:漏掉或错拼的关键词漏掉或错拼的关键词无效的变量名无效的变量名遗漏或错误的符号遗漏或错误的符号无效的选择项无效的选择项建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28编译阶段和执行阶段编译阶段和执行阶段1 1、DATADATA步流程步流程编译阶段(编译阶段(CompilationPhase):CompilationPhase):vv在内存中

65、建立程序数据矢量在内存中建立程序数据矢量PDVPDV用于建立用于建立SASSAS系统的数据集,一次只处理一个观测系统的数据集,一次只处理一个观测两个自动变量两个自动变量_N_N_记录记录DATADATA步执行的次数步执行的次数_ERROR_ERROR_指示出错信息指示出错信息.0.0表示无错误表示无错误,1 ,1表示有错误表示有错误PDVPDV的一般格式的一般格式: :|_N_|_ERROR_|_N_|_ERROR_|建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28编译阶段和执行阶段编译阶段和执行阶段1 1、DA

66、TADATA步流程步流程编译阶段(编译阶段(CompilationPhase):CompilationPhase):vv建立数据集的描述部分建立数据集的描述部分数据集名数据集名观测数和变量个数观测数和变量个数变量名及其属性变量名及其属性建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28编译阶段和执行阶段编译阶段和执行阶段1 1、DATADATA步流程步流程执行阶段(执行阶段(ExecutionPhase):ExecutionPhase):创建数据集的数据部分创建数据集的数据部分 执行顺序执行顺序vv PDVPDV中

67、外部为题初始化为缺省值中外部为题初始化为缺省值vv输入每条记录至输入缓冲器输入每条记录至输入缓冲器, ,按按INPUTINPUT语句读至语句读至PDVPDVvv按数据步的其它语句处理后存入按数据步的其它语句处理后存入PDVPDVvv在数据步结束时缺省地将在数据步结束时缺省地将PDVPDV的内容作为一条观测的内容作为一条观测写入新的数据集写入新的数据集vv回到数据步的开始回到数据步的开始. .使使PDVPDV中外部变量初始化为缺省值中外部变量初始化为缺省值vv对源文件中每条记录都按上述步骤执行一次对源文件中每条记录都按上述步骤执行一次vv当对源文件最后一条记录执行结束后当对源文件最后一条记录执行

68、结束后, ,数据步执行完成数据步执行完成. .建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28编译阶段编译阶段1 1、DATADATA步流程步流程data bodyfat;data bodyfat;inPUt sex $ fatpct;inPUt sex $ fatpct;fat=fatpct/100;fat=fatpct/100;cards;cards;M 13.3M 13.3F 22 F 22 RUNRUN; 程序数据矢量程序数据矢量|_N_|_ERROR_|_N_|_ERROR_|SEXSEX| |FATP

69、CTFATPCT| |data bodyfat;data bodyfat;inPUt sex $ fatpct ;inPUt sex $ fatpct ;fat=fatpct/100;fat=fatpct/100;cards;cards;M 13.3M 13.3F 22F 22RUNRUN; 程序数据矢量程序数据矢量|_N_|_ERROR_|_N_|_ERROR_|SEXSEX| |FATPCTFATPCT| |FATFAT| |数据集名数据集名:bodyfat:bodyfat变量的个数变量的个数( (从从PDVPDV中可知中可知)观测个数观测个数( (执行执行到到RUNRUN时也已知时也已知

70、)变量名及属性变量名及属性( (从从PDVPDV中可知中可知) )建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28执行阶段执行阶段1 1、DATADATA步流程步流程data bodyfat;data bodyfat;inPUt sex $ fatpct ;inPUt sex $ fatpct ;fat=fatpct/100;fat=fatpct/100;cards;cards;M 13.3 M 13.3 F 22F 22RUNRUN; 程序数据矢量程序数据矢量|_N_|_ERROR_|_N_|_ERROR_|S

71、EXSEX| |FATPCTFATPCT|FAT|FAT|1|0|M|13.3|.|1|0|M|13.3|.|初始缺省值初始缺省值data bodyfat;data bodyfat;inPUt sex $ fatpct ;inPUt sex $ fatpct ;fat=fatpct/100;fat=fatpct/100;cards;cards;M 13.3M 13.3F 22F 22RUNRUN; 程序数据矢量程序数据矢量|_N_|_ERROR_|_N_|_ERROR_|SEXSEX| |FATPCTFATPCT|FAT|FAT|1|0|.|.|1|0|.|.|data bodyfat;dat

72、a bodyfat;inPUt sex $ fatpct ;inPUt sex $ fatpct ;fat=fatpct/100;fat=fatpct/100;cards;cards;M 13.3 M 13.3 F 22F 22RUNRUN; 程序数据矢量程序数据矢量|_N_|_ERROR_|_N_|_ERROR_|SEXSEX| |FATPCTFATPCT|FAT|FAT|1|0|M|13.3|0.133|1|0|M|13.3|0.133|将将 M13.30.133M13.30.133写入数据集写入数据集bodyfatbodyfat建建 模模 软软 件件建建 模模 软软 件件sassas鲜思

73、东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28一个观测被处理完后,这时一个观测被处理完后,这时SASSAS系统首先将程系统首先将程序数据矢量中的数据写入数据集中序数据矢量中的数据写入数据集中( (两个自动变量两个自动变量的值并不写入的值并不写入, ,此值可在其他编程是使用此值可在其他编程是使用) ),同时,同时SASSAS系统将控制又返回到系统将控制又返回到DATADATA步的开头,程序开步的开头,程序开始第二个观测的处理,此过程一直到没有观测要处始第二个观测的处理,此过程一直到没有观测要处理为止。理为止。 1 1、DATADATA步流程步流程建建 模模 软软 件件建建

74、 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28 常用的有三种方式常用的有三种方式: :自由格式、列方式、规定格式自由格式、列方式、规定格式2 2、INPUTINPUT语句语句自由格式:自由格式:输入格式输入格式inputinput变量名变量名1$1$变量名变量名2$|2$|;特点:特点:o o输入的数据之间至少要用一个空格隔开输入的数据之间至少要用一个空格隔开o oinputinput中定义的变量顺序应与数据区中数据值对应中定义的变量顺序应与数据区中数据值对应o o一行一条观测(无一行一条观测(无|选项时)选项时)建建 模模 软软 件件

75、建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28 常用的有三种方式常用的有三种方式: :自由格式、列方式、规定格式自由格式、列方式、规定格式2 2、INPUTINPUT语句语句自由格式:自由格式:例子例子dataA;dataA;inputinputsex $ fatpct;sex $ fatpct; cards; cards;M 13.3 M 13.3 F 22 F 22 M 19 M 19 F 26F 26run;run;数据集数据集A A中的数据中的数据SexfatpctSexfatpctM13.3M13.3F22F22M19M1

76、9F26F26建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28 常用的有三种方式常用的有三种方式: :自由格式、列方式、规定格式自由格式、列方式、规定格式2 2、INPUTINPUT语句语句自由格式:自由格式:和和的作用的作用dataA;dataA;inputxy;inputxy;cards;cards;11223344112233445566778855667788run;run;数据集数据集A A中的数据中的数据xyxy11112222333344445555666677887788dataB;dataB;i

77、nputx;inputx;inputy;inputy;cards;cards;11223344112233445566778855667788run;run;dataC;dataC;inputx;inputx;inputy;inputy;cards;cards;11223344112233445566778855667788run;run;数据集数据集B B中的数据中的数据xyxy1111222255665566数据集数据集B B中的数据中的数据xyxy11115555建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/

78、28 常用的有三种方式常用的有三种方式: :自由格式、列方式、规定格式自由格式、列方式、规定格式2 2、INPUTINPUT语句语句列方式:列方式:输入格式输入格式inputinput变量名变量名$起始列起始列- -终止列终止列;特点:特点:o o输入的数据按固定的格式排列输入的数据按固定的格式排列o o可将含空格的字符串赋值给字符型变量可将含空格的字符串赋值给字符型变量o o可只读取数据区中某些数据可只读取数据区中某些数据建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28 常用的有三种方式常用的有三种方式: :自

79、由格式、列方式、规定格式自由格式、列方式、规定格式2 2、INPUTINPUT语句语句列方式:列方式:已知数据为已知数据为1231231-5-0-5-0-5-01-5-0-5-0-5-0 张张军军01APR7501APR75男男807984807984 王卫红王卫红24OCT7824OCT78女女959689959689inputname$1-6dmy$7-13sex$14-15math16-17phy18-19eng20-21;inputname$1-6dmy$7-13sex$14-15math16-17phy18-19eng20-21;inputname$1-6sex$14-15dmy$7

80、-13phy18-19;inputname$1-6sex$14-15dmy$7-13phy18-19;建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28 常用的有三种方式常用的有三种方式: :自由格式、列方式、规定格式自由格式、列方式、规定格式2 2、INPUTINPUT语句语句规定格式:规定格式:输入格式输入格式inputinput位置控制指针位置控制指针 变量名变量名$读入格式读入格式;特点:特点:o o适用于字段固定格式的数据适用于字段固定格式的数据o o给出字段开始列数,通过输入格式给出读入长度给出字段开始

81、列数,通过输入格式给出读入长度o o可设定输入格式可设定输入格式建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28 常用的有三种方式常用的有三种方式: :自由格式、列方式、规定格式自由格式、列方式、规定格式2 2、INPUTINPUT语句语句规定格式:规定格式:位置控制指针位置控制指针nn表示将输入指针移动到第表示将输入指针移动到第n n列列, ,这是指针的绝对位置移动这是指针的绝对位置移动+n+n表示将输入指针向后移动表示将输入指针向后移动n n列列, ,这是指针的相对移动这是指针的相对移动读入格式(见前面所述)

82、读入格式(见前面所述)建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28 常用的有三种方式常用的有三种方式: :自由格式、列方式、规定格式自由格式、列方式、规定格式2 2、INPUTINPUT语句语句规定格式:规定格式:例例已知数据为已知数据为1231231-5-0-5-0-5-01-5-0-5-0-5-0 张张军军01APR7501APR75男男807984807984 王卫红王卫红24OCT7824OCT78女女959689959689input1name$6.dmydate7.sex$2.math2.phy2

83、.eng2.;input1name$6.dmydate7.sex$2.math2.phy2.eng2.;inputname$6.14sex$2.7dmydate7.+4phy2.;inputname$6.14sex$2.7dmydate7.+4phy2.;建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28为了对数据进行分析,有时还要对以有的数据集进为了对数据进行分析,有时还要对以有的数据集进行整理,如提取需要处理的变量或观测等,这样才行整理,如提取需要处理的变量或观测等,这样才能满足各种分析的要求能满足各种分析的要

84、求 3 3、数据集的整理、数据集的整理常用的操作有:常用的操作有:赋值赋值累加累加语句语句DROP,KEEP,IF,DOENDDROP,KEEP,IF,DOEND建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28赋值语句赋值语句 它是将某个它是将某个SASSAS表达式的值赋给变量,其表达式的值赋给变量,其格式为:格式为:变量变量= =表达式表达式。若变量已经存在,则表示。若变量已经存在,则表示对该变量的值进行修改,否则表示建立一个新变量对该变量的值进行修改,否则表示建立一个新变量 3 3、数据集的整理、数据集的整理

85、累加语句累加语句 格式为:格式为:累加变量累加变量+ +表达式表达式,它表示把表达式的结果,它表示把表达式的结果加到累计变量中。注意累加变量只能是数值型变量,且最好将加到累计变量中。注意累加变量只能是数值型变量,且最好将表达式用小括号括起来,即累加变量表达式用小括号括起来,即累加变量+ +(表达式)。在第一个(表达式)。在第一个观测被读取之前,其值被自动置观测被读取之前,其值被自动置0 0,若表达式为缺失值,则将,若表达式为缺失值,则将表达式当作表达式当作0 0处理处理 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7

86、/28DROPDROP和和KEEPKEEP语句语句 格式为:格式为: DROPDROP变量表变量表 表示将所列的变量不输出到所建立的数据集。表示将所列的变量不输出到所建立的数据集。 KEEPKEEP变量表变量表 表示将所列出的变量输出到所建立的数据集。表示将所列出的变量输出到所建立的数据集。 3 3、数据集的整理、数据集的整理这两种方法事实上可达到同样的效果,即选择数据集中的变量。这两种方法事实上可达到同样的效果,即选择数据集中的变量。这两种形式要看哪种方便就用哪个,若要保留的变量少,可直这两种形式要看哪种方便就用哪个,若要保留的变量少,可直接用接用KEEP=KEEP=语句,这样等式右边列出的

87、变量个数少,比较方便;语句,这样等式右边列出的变量个数少,比较方便;若不需要的变量少,用若不需要的变量少,用DROP=DROP=语句则较方便。语句则较方便。 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28例例3 3、数据集的整理、数据集的整理dataB;dataB;inputname$1-6dmydate7.sex$14-15math16-17phy18-19eng20-21;inputname$1-6dmydate7.sex$14-15math16-17phy18-19eng20-21;total=sum(m

88、ath,phy);total=sum(math,phy);teng+engteng+eng;dropdmysex;/*dropdmysex;/*此句亦可用此句亦可用KEEPNAMEMATHPHYENGTOTALTENGKEEPNAMEMATHPHYENGTOTALTENG;替代。;替代。*/*/cards;cards;张张 军军01MAR7501MAR75男男807984807984王卫红王卫红24JUL7824JUL78女女959689959689run;run;输出结果输出结果 OBSNAMEMATHPHYENGTOTALTENGOBSNAMEMATHPHYENGTOTALTENG11张张

89、 军军807984159848079841598422王卫红王卫红959689191173959689191173建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28条件语句条件语句 IFIF条件语句条件语句 格式为:格式为:IFIF条件表达式条件表达式THENSASTHENSAS语句语句; ;ELSEsasELSEsas语句语句; ; 其意义为如果条件表达式为真(其值非其意义为如果条件表达式为真(其值非0 0),则去执行),则去执行THENTHEN后面的后面的SASSAS语句。若条件表达式为假(其值为语句。若条件表

90、达式为假(其值为0 0),则),则去执行去执行ELSEELSE后面的后面的SASSAS语句(当语句(当ELSEELSE选项存在时)或下一选项存在时)或下一条条SASSAS语句(语句(ELSEELSE语句不存在时)。语句不存在时)。3 3、数据集的整理、数据集的整理建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28条件语句条件语句子集子集IFIF语句语句 格式为:格式为:IFIF条件表达式条件表达式; ; 它它表示当条件表达式为真时,表示当条件表达式为真时,SASSAS系统对正被处理的观测继系统对正被处理的观测继续执

91、行续执行IFIF语句后面的语句;若表达式为假,则返回执行下一语句后面的语句;若表达式为假,则返回执行下一个个DATADATA步步 3 3、数据集的整理、数据集的整理建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28循环语句循环语句简单简单DODO语句语句 格式格式: :DO;DO;多个多个sassas语句语句; ;END;END;这时的这时的DOENDDOEND象是一对括号象是一对括号, ,将多个将多个SASSAS语句封装起来语句封装起来, ,它它通常通常IFIF语句联合使用语句联合使用 3 3、数据集的整理、数据

92、集的整理建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28循环语句循环语句简单简单DODO语句语句 IFSEX=IFSEX=男男THENTHENDODO;MATH=MATH+2;MATH=MATH+2;PHY=PHY-4;PHY=PHY-4;TOTAL=SUM(MATH,PHY);TOTAL=SUM(MATH,PHY);ENDEND; ;3 3、数据集的整理、数据集的整理相当于相当于IFSEX=IFSEX=男男THENMATH=MATH+2;THENMATH=MATH+2;IFSEX=IFSEX=男男THENPHY

93、=PHY-4;THENPHY=PHY-4;IFSEX=IFSEX=男男THENTOTAL=SUM(MATH,PHY);THENTOTAL=SUM(MATH,PHY);建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28循环语句循环语句循环循环DODO语句语句 格式格式: : DODO 循环变量循环变量= =初值初值TOTO终值终值BYBY步长步长; ;若干若干SASSAS语句语句;( ;(循环体循环体) ) ENDEND; ;3 3、数据集的整理、数据集的整理 括号内的终值和步长均为可选项括号内的终值和步长均为可选项

94、, ,当无步长时当无步长时, ,其值为其值为1,1,当无终值时当无终值时, ,循环体中循环体中至少有一语句控制循环的结束至少有一语句控制循环的结束, ,否则就为一死循环否则就为一死循环. .其执行过程是其执行过程是, ,循环变量在循环变量在取得初值后取得初值后, ,结合步长方向结合步长方向, ,同终值进行比较同终值进行比较, ,若没有超过终值若没有超过终值, ,则执行一次循环则执行一次循环体体, ,循环变量增加一个步长循环变量增加一个步长, ,继续下一轮的执行继续下一轮的执行, ,直到循环变量超过终值为止直到循环变量超过终值为止. .要要注意在循环体内不要对循环变量进行操作注意在循环体内不要对

95、循环变量进行操作, ,以免出现死循环以免出现死循环, ,另外循环变量也会另外循环变量也会被写到所建的数据集被写到所建的数据集, ,若不需要若不需要, ,可用可用DROPDROP语句将其删除语句将其删除. .建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28循环语句循环语句循环循环DODO语句语句 格式格式: : DODO 循环变量循环变量= =值值1 1,值,值2 2,值,值3 3,;若干若干SASSAS语句语句;( ;(循环体循环体) ) ENDEND; ;3 3、数据集的整理、数据集的整理如如: :DoI=2t

96、o10by2;DoI=2to10by2;Doj=10to2by2;Doj=10to2by2;Dok=3.6to4.8by0.05;Dok=3.6to4.8by0.05;Don=1,5,15,30,60;Don=1,5,15,30,60;Domonth=JAN,FEB,MAR;Domonth=JAN,FEB,MAR;Doq=kton/10;Doq=kton/10;建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28循环语句循环语句循环循环DOWHILEDOWHILE语句语句 格式格式: : DODO WHILEWHIL

97、E 条件表达式;条件表达式;若干若干SASSAS语句语句;( ;(循环体循环体) ) ENDEND; ;3 3、数据集的整理、数据集的整理此循环语句执行的过程是:当条件表达式为真时此循环语句执行的过程是:当条件表达式为真时, ,执行循环体执行循环体, ,直到条件表达式为假为止直到条件表达式为假为止. .它是先判断条件它是先判断条件, ,再执行循环体再执行循环体 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28循环语句循环语句循环循环DOUNTILDOUNTIL语句语句 格式格式: : DODO UNTILUNTI

98、L 条件表达式;条件表达式;若干若干SASSAS语句语句;( ;(循环体循环体) ) ENDEND; ;3 3、数据集的整理、数据集的整理它首先执行循环体一次它首先执行循环体一次, ,之后再进行条件的判断之后再进行条件的判断, ,若条件为假若条件为假, ,则继续下一次循环则继续下一次循环, ,若条件为真若条件为真, ,则循环结束则循环结束 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28OUTPUTOUTPUT语句语句 3 3、数据集的整理、数据集的整理dataCMCF;dataCMCF;inputname$1-

99、6dmy7-13sex$14-15math16-17phy18-19eng20-21;inputname$1-6dmy7-13sex$14-15math16-17phy18-19eng20-21;ifsex=ifsex=男男thenthenoutputoutputCM;CM;ifsex=ifsex=女女thenthenoutputoutputCF;CF;dropdmysex;/*dropdmysex;/*此句亦可用此句亦可用KEEPNAMEMATHPHYENGTOTALTENGKEEPNAMEMATHPHYENGTOTALTENG;替代。;替代。*/*/cards;cards;张张 军军01M

100、AR7501MAR75男男807984807984王卫红王卫红24JUL7824JUL78女女959689959689run;run;一次产生两个数据集:一次产生两个数据集:数据集数据集CMCM中只含男性的观测中只含男性的观测, ,数据集数据集CFCF中则只含有性别为女的观测中则只含有性别为女的观测 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/283 3、数据集的整理、数据集的整理注释语句注释语句 一个好的编程习惯是对程序进行恰当的注释一个好的编程习惯是对程序进行恰当的注释, ,以防止以防止遗忘和增加可读性遗忘和

101、增加可读性. .给程序加注释的格式有两种给程序加注释的格式有两种: :* *注释内容注释内容; ;整句注释整句注释( (后面的后面的; ;号不能少号不能少) )/*/*注释内容注释内容*/*/(任意内容注释)(任意内容注释) 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284 4、数据集的连接与合并、数据集的连接与合并A AB BA AB BA AB BA AB B连接连接合并合并合并合并+ + +建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/2820

102、24/7/284 4、数据集的连接与合并、数据集的连接与合并连接连接数据集的连接数据集的连接 数据集的连接是将数据集纵向连接起来,其主要目的给数据集追加观测。数据集的连接是将数据集纵向连接起来,其主要目的给数据集追加观测。这一功能可由这一功能可由SETSET语句完成,语句完成,其格式如下:其格式如下:SETSET数据集数据集1 1(选项选项);常用的常用的选项选项有有: :KEEP=KEEP=变量表变量表 只打开由变量表中所列出的变量只打开由变量表中所列出的变量. .DROP=DROP=变量表变量表 变量表中所列出的变量将不被打开。变量表中所列出的变量将不被打开。FIRSTOBS=nFIRST

103、OBS=n1 1 从第从第n n1 1个观测开始以后的观测将被选入新建数据集个观测开始以后的观测将被选入新建数据集. .OBS=nOBS=n2 2新建数据集的观测到第新建数据集的观测到第n n2 2个观测为止个观测为止. .RENAME=(RENAME=(原变量名原变量名= =新变量名新变量名)将原变量名改为新变量名将原变量名改为新变量名. .建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284 4、数据集的连接与合并、数据集的连接与合并连接连接dataA;dataA;inputnoname$mathphyeng;

104、inputnoname$mathphyeng;cards;cards;9701wanglei9086799701wanglei9086799702wanghao9897909702wanghao9897909703gudexian8786949703gudexian8786949706zhuming9687869706zhuming968786run;run;dataB;dataB;inputnoname$mathphichemgeo;inputnoname$mathphichemgeo;Cards;Cards;9701wanglei908689769701wanglei90868976970

105、2wanghao989769729702wanghao989769729704zhuzhun887678689704zhuzhun887678689705chaoyin648576669705chaoyin64857666run;run;数据集数据集A A:nonamemathphyengnonamemathphyeng9701wanglei9086799701wanglei9086799702wanghao9897909702wanghao9897909703gudexian8786949703gudexian8786949706zhuming9687869706zhuming968786数

106、据集数据集B Bnonamemathphichemgeononamemathphichemgeo9701wanglei908689769701wanglei908689769702wanghao989769729702wanghao989769729704zhuzhun887678689704zhuzhun887678689705chaoyin648576669705chaoyin64857666建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284 4、数据集的连接与合并、数据集的连接与合并连接连接dataC;da

107、taC;setA(drop=eng)B(drop=chemgeorename=(phi=phy);setA(drop=eng)B(drop=chemgeorename=(phi=phy);run;run;OBSNONAMEMATHPHYOBSNONAMEMATHPHY19701wanglei908619701wanglei908629702wanghao989729702wanghao989739703gudexian878639703gudexian878649706zhuming968749706zhuming968759701wanglei908659701wanglei90866970

108、2wanghao989769702wanghao989779704zhuzhun887679704zhuzhun887689705chaoyin648589705chaoyin6485建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284 4、数据集的连接与合并、数据集的连接与合并连接连接若不用选项,直接使用,其结果如下:若不用选项,直接使用,其结果如下:dataC1;dataC1;setAB;setAB;run;run;OBSNONAMEMATHPHYENGPHICHEMGEOOBSNONAMEMATHPHYENG

109、PHICHEMGEO19701wanglei908679.19701wanglei908679.29702wanghao989790.29702wanghao989790.39703gudexian878694.39703gudexian878694.49706zhuming968786.49706zhuming968786.59701wanglei90.86897659701wanglei90.86897669702wanghao98.97697269702wanghao98.97697279704zhuzhun88.76786879704zhuzhun88.76786889705chaoy

110、in64.85766689705chaoyin64.857666建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284 4、数据集的连接与合并、数据集的连接与合并合并合并数据集的合并是将不同数据集中的观测合并成一个数据集的合并是将不同数据集中的观测合并成一个新的观测。可用新的观测。可用MERGEMERGE语句实现此目的语句实现此目的 一对一合并一对一合并 它是将多个数据集中第一条观测它是将多个数据集中第一条观测合并成新数据集的第一条观测,第二条观测合并合并成新数据集的第一条观测,第二条观测合并成新数据集的第二条观测,

111、等等,没有的用缺失值替代成新数据集的第二条观测,等等,没有的用缺失值替代 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284 4、数据集的连接与合并、数据集的连接与合并合并合并dataAA;dataAA;inputx1x2;inputx1x2;cards;cards;121278784545; ;dataBB;dataBB;inputx1y1y2;inputx1y1y2;cards;cards;112233112233445566445566run;run;dataaabb;dataaabb;mergemerge

112、AABB;AABB;run;run;数据集数据集AAAA:x1x2x1x2121278784545数据集数据集BBBB:x1y1y2x1y1y2112233112233445566445566mergemerge数据集数据集aabbaabbobsx1x2y1y2obsx1x2y1y211122233111222332448556624485566345.345.建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284 4、数据集的连接与合并、数据集的连接与合并合并合并匹配合并匹配合并 这种合并是按某一公共变量的值进行这

113、种合并是按某一公共变量的值进行横向连接,其做法是首先对公共变量进行排序,然横向连接,其做法是首先对公共变量进行排序,然后再进行合并。后再进行合并。 建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284 4、数据集的连接与合并、数据集的连接与合并合并合并匹配合并匹配合并dataA;dataA;inputnoname$mathphyeng;inputnoname$mathphyeng;cards;cards;9701wanglei9086799701wanglei9086799702wanghao9897909702w

114、anghao9897909703gudexian8786949703gudexian8786949706zhuming9687869706zhuming968786run;run;dataB;dataB;inputnoname$mathphichemgeo;inputnoname$mathphichemgeo;Cards;Cards;9701wanglei908689769701wanglei908689769702wanghao989769729702wanghao989769729704zhuzhun887678689704zhuzhun887678689705chaoyin6485766

115、69705chaoyin64857666run;run;procprocsortsortdata=a;data=a;bynobyno; ;run;run;procsortdata=b;procsortdata=b;bynobyno; ;run;run;dataC;dataC;mergemergeAB;AB;bynobyno; ;run;run;本章目录建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/284 4、数据集的连接与合并、数据集的连接与合并合并合并匹配合并匹配合并OBSNONAMEMATHPHYENGPHIC

116、HEMGEOOBSNONAMEMATHPHYENGPHICHEMGEO19701wanglei90867986897619701wanglei90867986897629702wanghao98979097697229702wanghao98979097697239703gudexian878694.39703gudexian878694.49704zhuzhun88.76786849704zhuzhun88.76786859705chaoyin64.85766659705chaoyin64.85766669706zhuming968786.69706zhuming968786. 建建 模模

117、软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/285 5、SASSAS与外部数据的交换与外部数据的交换设设e:examplee:example目录下有以下三个文件目录下有以下三个文件EX1.DBFEX1.DBF、EX2.XLSEX2.XLS、EX3.TXTEX3.TXT,则三者分别与则三者分别与SASSAS之间进行文件转换如下之间进行文件转换如下 编程方式编程方式dbfdbf文件转换成文件转换成SASSAS数据集数据集SASSAS数据集转换成数据集转换成dbfdbf文件文件filenamefilenameex1e:exampl

118、eex1.dbf;ex1e:exampleex1.dbf;procdbfdb3=ex1OUT=DBF2SAS;procdbfdb3=ex1OUT=DBF2SAS;run;run;filenameex11e:examplesas2dbf.dbf;filenameex11e:examplesas2dbf.dbf;procdbfdb3=ex11data=DBF2SAS;procdbfdb3=ex11data=DBF2SAS;run;run;建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/285 5、SASSAS与外部数据的

119、交换与外部数据的交换设设e:examplee:example目录下有以下三个文件目录下有以下三个文件EX1.DBFEX1.DBF、EX2.XLSEX2.XLS、EX3.TXTEX3.TXT,则三者分别与则三者分别与SASSAS之间进行文件转换如下之间进行文件转换如下 编程方式编程方式EXCELEXCEL文件转换为文件转换为SASSAS数据集数据集SASSAS数据集转换为数据集转换为EXCELEXCEL文件文件filenameex2e:exampleex2.xls;filenameex2e:exampleex2.xls;procdbfdb3=ex2OUT=XLS2SAS;procdbfdb3=e

120、x2OUT=XLS2SAS;run;run;filenameex22e:exampleSAS2XLS.xls;filenameex22e:exampleSAS2XLS.xls;procdbfdb3=ex22data=XLS2SAS;procdbfdb3=ex22data=XLS2SAS;run;run;建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/285 5、SASSAS与外部数据的交换与外部数据的交换设设e:examplee:example目录下有以下三个文件目录下有以下三个文件EX1.DBFEX1.DBF、EX

121、2.XLSEX2.XLS、EX3.TXTEX3.TXT,则三者分别与则三者分别与SASSAS之间进行文件转换如下之间进行文件转换如下 编程方式编程方式文本文件转换为文本文件转换为SASSAS数据集数据集SASSAS数据集转换为文本文件数据集转换为文本文件 设文本文件的内容如下:设文本文件的内容如下:9701wanglei90869701wanglei90869702wanghao98979702wanghao98979703gudexian87869703gudexian87869706zhuming96879706zhuming9687则:则: filenameex3e:exampleex3

122、.txt;filenameex3e:exampleex3.txt;datatxt2sas;datatxt2sas;infileinfileex3;ex3;inputnoname$mathphy;inputnoname$mathphy;run;run;DATA_null_;/*DATA_null_;/*表示不建数据集表示不建数据集,_null_,_null_为为SASSAS的关键词的关键词*/*/SETTXT2SAS;SETTXT2SAS;FILEFILEE:EXAMPLESAS2TXT.TXT;/*E:EXAMPLESAS2TXT.TXT;/*指出存放的文件位置指出存放的文件位置*/*/PUT

123、PUTNO4.NAME8.MATH2.PHY2.;NO4.NAME8.MATH2.PHY2.;/*/*存在文件中的变量及格式存在文件中的变量及格式*/*/RUN;RUN;建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/285 5、SASSAS与外部数据的交换与外部数据的交换设设e:examplee:example目录下有以下三个文件目录下有以下三个文件EX1.DBFEX1.DBF、EX2.XLSEX2.XLS、EX3.TXTEX3.TXT,则三者分别与则三者分别与SASSAS之间进行文件转换如下之间进行文件转换如下

124、菜单方式菜单方式外部数据文件转成外部数据文件转成SASSAS数据集数据集(将(将hald.xlshald.xls转成转成SASSAS数据集)数据集)建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28MEANS过程1 描述性统计及SAS相关过程MEANS过程的格式及语句说明1.格式PROCMEANS选择项;VAR变量表;BY变量表;CLASS变量表;FREQ变量表;WEIGHT变量;ID变量表;OUTPUTOUT=SAS数据集统计量关键词=变量名表必需的语句必需的语句可可选选择择语语句句建建 模模 软软 件件建建 模

125、模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28MEANS过程的格式及语句说明2.语句说明 选择项vDATA=SAS数据集名,指明进行分析的数据集名,其缺省值为最近建立的SAS数据集。vNOPRINT不打印任何描述性统计量。此选项多用在将描述性统计量输出到SAS数据集时。缺省时的规定输出描述统计量,即PRINT选项。vMAXDEC=n指定输出结果小数部分的最大位数,n的取值范围为08,缺省值为n=2vALPHA=值,指定显著性水平的值。vVARDEF=除数指定计算方差所用的除数。除数可以用以下关键字表示:1.DF用自由度(N-1)做除数,这是

126、缺省设置。2.N用观测数做除数。3.WEIGHT|WGT用权重和做除数。 4.WDF用权重和减1做除数。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28MEANS过程的格式及语句说明2.语句说明 选择项v统计量用关键词表示:N、mean、std、min、max、Nmiss、range、sum、var、uss、css、cv、stderr、t、prt、sumwgt、skewness、krutosis、clm、lclm、uclm等,其中前五个统计量为缺省时的值.要得到这些统计量,只需给出相关的关键词即可.这此关键词亦可

127、用于OUTPUT语句中。clm是计算置信上限和下限;lclm计算置信下限;uclm计算置信上限。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28MEANS过程的格式及语句说明2.语句说明 VAR变量表规定要进行计算的数值变量及顺序。该语句缺省时,除由BY、CLASS、FREQ和WEIGHT指定的变量外,其余的数值变量均进行计算。BY变量表根据BY后指定的变量表形成多个观测组,然后对每组分别计算相应的统计量,不过在使用该语句之前,应对BY后面指定的变量表进行过排序。CLASS变量表此语句的作用与BY语句类似,其不同

128、之处是它不要求事先对CLASS的变量表进行排序,且在输出时,按CLASS变量的不同取值,以单页输出。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28MEANS过程的格式及语句说明2.语句说明 FREQ变量指定其后的变量代表的是频数,此语句当数据集是频数表资料时才使用。用ID后面指定的变量表的值来标识输出的观测。ID变量表指定其后的变量代表权重。该变量的值应大于零,若某值小于零或缺失,则取该值为0。WEIGHT变量例如,设变量X,其一组观测值为,用WEIGHT语句规定权重变量为W,相应的值为,(),则加权均值和加权

129、方差为:,其中除数由任选项VARDEF=确定。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28MEANS过程的格式及语句说明2.语句说明 该语句将结果输出到某SAS数据集,其中OUT=SAS数据集指明将结果保存的数据集,若要创建永久数据集则要用两级命名。统计量关键词见选择项中的说明OUTPUTOUT=SAS数据集统计量关键词=变量名表规定统计量并命名的形式有以下三种:OUTPUTOUT=SAS数据集统计量关键词=变量名表关键词=;或关键词(变量表)=;表示输出的数据集中计算由关键词指定的统计量,其名字仍为原变量名

130、。前者要计算的变量和顺序由VAR语句指定,而后者则由关键词括号中的变量表指定。关键词=名字列表;表示输出的统计量的名字为等号右边的名字列表指定,计算的变量和顺序也是由VAR语句指定。关键词(变量表)=名字列表;这结合前面两者的优点,既可控制要计算的变量及顺序,也可按自已的要求给计算的统计量取名字。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28MEANS过程的格式及语句说明3.例子 对120个炉钢中的SI含量进行检验,得数据如下:0.860.780.830.840.770.840.810.840.810.810.

131、800.810.790.740.820.780.820.780.810.800.810.740.870.780.820.750.780.790.800.850.810.780.870.740.810.710.770.880.780.820.770.760.780.850.770.730.770.780.770.810.710.790.950.770.780.780.810.810.790.870.800.830.770.650.760.640.820.780.800.750.820.820.840.800.790.800.900.770.820.810.790.750.820.830.790.

132、900.860.800.760.850.780.810.830.770.750.780.820.820.780.840.730.850.830.840.810.820.810.850.830.840.890.820.810.850.860.840.820.780.820.78给出这组数据的描述统计量,样本均值,样本方差,标准差,标准误差,极差,变异系数,偏度系数,峰度系数等建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28MEANS过程的格式及语句说明3.例子 datastat;inputx;cards;0.860

133、.780.830.840.770.840.810.840.810.810.800.810.790.740.820.780.820.780.810.800.810.740.870.780.820.750.780.790.800.850.810.780.870.740.810.710.770.880.780.820.770.760.780.850.770.730.770.780.770.810.710.790.950.770.780.780.810.810.790.870.800.830.770.650.760.640.820.780.800.750.820.820.840.800.790.800

134、.900.770.820.810.790.750.820.830.790.900.860.800.760.850.780.810.830.770.750.780.820.820.780.840.730.850.830.840.810.820.810.850.830.840.890.820.810.850.860.840.820.780.820.78;procmeansdata=statmeanvarstdstderrrangecvskewnesskurtosis;varx;run;演示建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/2

135、82024/7/28univariate过程UNIVARIATE过程与MEANS过程一样,能计算各种描述统计量,但它的功能比MEANS过程还要强大,除了可完成MEANS过程的基本统计量的计算外,还能计算众数和分位数,生成频率表,以及进行正态性检验和绘制正态概率图、茎叶图和盒形图等方面的功能(关于这部分的功能下章再说明)。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28Univariate过程的格式及语句说明1.格式PROCUNIVARIATE选择项;VAR变量表;BY变量表;FREQ变量;WEIGHT变量;ID变

136、量表;OUTPUTOUT=输出数据集统计量关键词=变量名表必需的语句必需的语句可可选选语语句句univariate过程UNIVARIATE过程与MEANS过程一样,能计算各种描述统计量,但它的功能比MEANS过程还要强大,除了可完成MEANS过程的基本统计量的计算外,还能计算众数和分位数,生成频率表,以及进行正态性检验和绘制正态概率图、茎叶图和盒形图等方面的功能(关于这部分的功能以后再说明)。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28Univariate过程的格式及语句说明2.语句说明选择项常用的几个选项如

137、下:DATA=数据集给出要计算的目标数据集NOPRINT要求不在OUTPUT窗中输出.PLOT给出三种图形:茎叶图、盒式图、正态概率图。FREQ给出频数分布表,表中包括变量值、频数、百分数、累计百分数等项;NORMAL进行正态性检验,检验的原假设是:数据来自正态总体。VARDEF=DF|WGT|N|WDF规定计算方差的除数OUTPUT语句OUTPUT语句建立包括UNIVARIATE过程分析结果的输出数据集,其格式与MEANS过程的格式相同,但该语句必须与VAR语句联用。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/

138、28Univariate过程的格式及语句说明2.语句说明OUTPUT语句 下面列出其统计关键词(1)系统给出的统计关键词N、NOBS、NMISS、MEAN、STDERR、SUM、STD、VAR、CV、USS、CSS、MAX、MIN、RANGE、SKEWNESS、KURTOSIS、SUMWGT、MODE、T、PRT。百分位数关键字:Q3上四分位数(第75百分位数)Q1下四分位数(第25百分位数)QRANGEQ3-Q1四分位距MEDIAN中位数(第50百分位数)P1第1百分位数,P5第5百分位数,P10第10百分位数P90第90百分位数,P95第95百分位数,P99第99百分位数其它:SIGNRA

139、NK符号秩统计量;PROBS大于中心的符号统计量的绝对值的概率MSIGN符号统计量;PROBM大于符号秩统计量的绝对值的概率NORMAL正态检验统计量(W、ProbD)。PROBN检验数据来自正态分布假设的概率值。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28Univariate过程的格式及语句说明OUTPUT语句 下面列出其统计关键词(2)自定义分位数的选项PCTLPTS=百分位数值表如PCTLPTS=5566.7即要求计算第55、和第66.7百分位数。若不指定这2个百分位数的变量名,则系统会自动地给出其变量

140、名分别为55、和66_7。小数点用“_代替,若指定的百分位数有两位小数,给出的变量名截成一位PCTLNAME=后缀名列表给出要输出的百分位数变量名的后缀PCTLPRE=前缀名列表给出要输出的百分位数变量名的字头自定义的百分位数的名字由定义的变量前缀和后缀确定或缺省名连接起来形成。以上三项常联合起来使用,其效果见下例:PROCUNIVARIATE;VARXYZ;OUTPUTOUT=TESTOUTPCTLPTS=5566.7PCTLPRE=ABCPCTLNAME=P55P66_7;run;建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/2

141、82024/7/28Univariate过程的格式及语句说明2.语句说明OUTPUT语句下面列出其统计关键词(2)自定义分位数的选项此例中要求给出由VAR语句中规定的三个变量X,Y,Z的第55%和66.7%百分位数,则在输出数据集中产生的变量AP55AP66_7表示X的第55和66.7百分位数;变量BP55,BP66_7表示Y的第55和66.7百分位数;变量CP55CP66_7表示Z的第5566.7百分位数。3.例子例数据同上例,下面我们用UNIVARIATE过程给出另外的几个描述性统计量,中位数,众数,上四分位数,下四分位数,四分位距procunivariatedata=stat;varx;

142、run;建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28Univariate过程的格式及语句说明3.例子输出结果为:UnivariateProcedureVariable=XMoments(I)N120SumWgts 120Mean0.80275Sum96.33StdDev0.044777Variance0.002005Skewness -0.33182Kurtosis2.287141USS77.5675CSS0.238593CV5.57795StdMean 0.004088T:Mean=0 196.3885Pr

143、|T|0.0001Num=0 120Num0120M(Sign)60Pr=|M|0.0001SgnRank 3630Pr=|S|0.0001建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28Univariate过程的格式及语句说明输出结果为:Quantiles(Def=5)(II)100%Max0.9599%0.975%Q30.8395%0.8750%Med0.8190%0.8525%Q10.7810%0.750%Min0.645%0.7351%0.65极差0.31Q3-Q10.05众数0.78Extremes(I

144、II)LowestObsHighestObs0.64(66)0.88(38)0.65(64)0.89(111)0.71(51)0.9(77)0.71(36)0.9(86)0.73(101)0.95(53)建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28Univariate过程的格式及语句说明N:观测的个数SumWgts:观测的加权和Mean:均值Sum:观测值的总和StdDev:标准差Variance:方差Skewness:偏度Kurtosis:峰度USS:观测值平方和CSS:离均差平方和CV:变异系数StdMe

145、an:标准误差(即均值的标准差)T:Mean=0:均值为0的假设下的T值Pr|T|:大于T绝对值的概率Num=0:非零观测的个数Num0:观测值中大于零的个数M(Sign):中位数为0的假设下符号统计量M的值Pr=|M|:不小于M绝对值的概率SgnRank:中位数为0的假设下符号秩和统计量S的值Pr=|S|:不小于S绝对值的概率。*W:Normal:正态性检验统计量W的值PrF0.0001表明y与x1,x2,x3,x4之间的线性关系成立参数检验:(结果表明每个参数均不显著)VariableProb|T|INTERCEP0.891X12.083X20.705X30.135X4-0.203结论:可

146、能存在多重共线性建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回归识别多重共线性识别多重共线性识别多重共线性识别多重共线性procregdata=hald;modely=x1-x4/vif collin;run;VarianceVariableInflationINTERCEP0.00000000X138.49621149X2254.42316585X346.86838633X4282.51286479X4的方差膨胀因子达282.51286479,可认为这四个变量间存在严重的多重共线性关

147、系建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回归识别多重共线性识别多重共线性识别多重共线性识别多重共线性 Collinearity Diagnostics Condition Var Prop Var Prop Var Prop Var Prop Var PropNumber Eigenvalue Index INTERCEP X1 X2 X3 X41 4.11970 1.00000 0.0000 0.0004 0.0000 0.0002 0.00002 0.55389 2.7272

148、1 0.0000 0.0100 0.0000 0.0027 0.00013 0.28870 3.77753 0.0000 0.0006 0.0003 0.0016 0.00174 0.03764 10.46207 0.0001 0.0574 0.0028 0.0457 0.00095 0.0000661 249.57825 0.9999 0.9316 0.99690.9498 0.9973最大的条件指数为249.57825,介于100到1000之间,表明这些变量间存在中等程度的多重共线性关系。从方差比例来看,对应最大条件指数的那一行,其方差比例最小的是变量X1,其值为0.9316,比0.5大,

149、表明这四个变量就是一个共线性组。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回归多重共线性的处理多重共线性的处理多重共线性的处理多重共线性的处理选择变量法选择变量法逐步回归法逐步回归法procregdata=hald;modely=x1-x4/selection=stepwise;run;All variables left in the model are significant at the 0.1500 level.No other variable met the 0.1500

150、 significance level for entry into the model. Summary of Stepwise Procedure for Dependent Variable Y Variable Number Partial ModelStep Entered Removed In R*2 R*2 C(p) F ProbF 1 X4 1 0.6745 0.6745 138.7308 22.7985 0.0006 2 X1 2 0.2979 0.9725 5.4959 108.2239 0.0001 3 X2 3 0.0099 0.9823 3.0182 5.0259 0

151、.0517 4 X4 2 0.0037 0.9787 2.6782 1.8633 0.2054可以看出,逐步回归法第一步是选进变量X4,在第二、三两步选入变量X1和X2后,变量X4的作用变得不明显,故第四步将X4从模型中删除掉。故用此法所选的变量为X1和X2建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回归多重共线性的处理多重共线性的处理多重共线性的处理多重共线性的处理选择变量法选择变量法全子集法全子集法procregdata=hald;modely=x1-x4/selection=ad

152、jrsqcpbic;run;In AdjRsq C(p) BIC Variables in Model 1 0.6450 138.7 55.54 X4 1 0.6359 142.5 55.85 X2 1 0.4916 202.5 60.00 X1 1 0.2210 315.2 65.39 X3- 2 0.9744 2.678 29.24 X1 X2 2 0.9670 5.496 30.98 X1 X4 2 0.9223 22.37 37.89 X3 X4 2 0.8164 62.44 46.84 X2 X3 2 0.6161 138.2 55.51 X2 X4 2 0.4578 198.1 5

153、9.74 X1 X3- 3 0.9764 3.018 31.17 X1 X2 X4 3 0.9764 3.041 31.18 X1 X2 X3 3 0.9750 3.497 31.41 X1 X3 X4 3 0.9638 7.337 33.00 X2 X3 X4- 4 0.9736 5.000 34.41 X1 X2 X3 X4-Cp原则比较准确得到相应的回归方程为:y=52.577349+1.468306X1+0.66225X2建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回归2线性回

154、归2.6综合实例多重共线性的处理多重共线性的处理多重共线性的处理多重共线性的处理选择变量法选择变量法全子集法全子集法In AdjRsq C(p) BIC Variables in Model 1 0.6450 138.7 55.54 X4 1 0.6359 142.5 55.85 X2 1 0.4916 202.5 60.00 X1 1 0.2210 315.2 65.39 X3- 2 0.9744 2.678 29.24 X1 X2 2 0.9670 5.496 30.98 X1 X4 2 0.9223 22.37 37.89 X3 X4 2 0.8164 62.44 46.84 X2 X3

155、 2 0.6161 138.2 55.51 X2 X4 2 0.4578 198.1 59.74 X1 X3- 3 0.9764 3.018 31.17 X1 X2 X4 3 0.9764 3.041 31.18 X1 X2 X3 3 0.9750 3.497 31.41 X1 X3 X4 3 0.9638 7.337 33.00 X2 X3 X4- 4 0.9736 5.000 34.41 X1 X2 X3 X4-Cp原则比较准确得到相应的回归方程为:y=52.577349+1.468306X1+0.66225X2建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电

156、大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回归多重共线性的处理多重共线性的处理多重共线性的处理多重共线性的处理岭回归法岭回归法 procregdata=haldoutest=rghaldoutvifgraphicscorr;modely=x1-x4/ridge=0to1by0.123456;plot/ridgeplot;run;procprintdata=rghald;run;其中outest=rghald要求REG过程将结果保存在rghald数据集中,选项outvif要求输出方差膨胀因子,选项graphics要求在高分辨率方式下作图,corr则要求计算相关系

157、数。MODEL语句后面ridge=0to1by0.123456给出岭回归中的k值,共计有16个。plot语句后面加上参数ridgeplot,要求作出岭迹图。建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回归多重共线性的处理多重共线性的处理多重共线性的处理多重共线性的处理 岭回归法岭回归法 可取k=0.2的岭回归估计,得到如下岭回归模型:y=87.7519+0.9788X1+0.289X2-0.3268X3-0.324X4建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东

158、 重庆邮电大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回归多重共线性的处理多重共线性的处理多重共线性的处理多重共线性的处理主成分回归法主成分回归法 procregdata=ff.haldoutest=pchaldoutvif;modely=x1-x4/pcomit=1,2;run;procprintdata=pchald;run;选项pcomit=1,2表示分别求出在删除最后1个和2个主成分后所得到的回归方程建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回

159、归多重共线性的处理多重共线性的处理多重共线性的处理多重共线性的处理主成分回归法主成分回归法 数据集pchald中关于主成分回归的输出为OBS _MODEL_ _TYPE_ _DEPVAR_ _RIDGE_ _PCOMIT_ _RMSE_1 MODEL1 PARMS Y . . 2.446012 MODEL1 IPCVIF Y . 1 .3 MODEL1 IPC Y . 1 1 2.322064 MODEL1 IPCVIF Y . 2 .5 MODEL1 IPC Y . 2 2 3.08195OBS INTERCEP X1 X2 X3 X4 Y1 62.4054 1.55110 0.51017

160、0.10191 -0.14406 -12 . 2.71096 0.78071 2.48086 0.46813 -13 85.7433 1.31189 0.26942 -0.14277 -0.3800785.7433 1.31189 0.26942 -0.14277 -0.38007 -14 . 0.26570 0.25093 0.30167 0.26348 -15 88.9559 0.78884 0.36145 -0.59624 -0.3269088.9559 0.78884 0.36145 -0.59624 -0.32690 -1建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东

161、鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回归回归诊断回归诊断回归诊断回归诊断 利用前面所选的变量X1,X2进行回归建模,并进行残差分析和用COOKD值进行影响分析procregdata=haldgraphics;modely=x1-x2/r;plotstudent.*p.;run;选项r要求给出残差及COOKD值,plotstudent.*p.语句要求打印残差图,student和p后的点号(.)不可省略,分别表示调用程序输出中的学生化残差和预测值建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学20

162、24/7/282024/7/28回 归 分 析 多元线性回归回归诊断回归诊断回归诊断回归诊断 r值落在-2,2区间内,且无明显的规律,因此可认为这些观测符合高斯-马尔可夫条件建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28回 归 分 析 多元线性回归回归诊断回归诊断回归诊断回归诊断 Dep Var Predict Std Err Std Err Student Cooks Obs Y Value Predict Residual Residual Residual -2-1-0 1 2 D1 78.5000 80

163、.0740 1.206 -1.5740 2.082 -0.756 | *| | 0.0642 74.3000 73.2509 1.231 1.0491 2.067 0.507 | |* | 0.0303 104.3 105.8 0.830 -1.5147 2.259 -0.671 | *| | 0.0204 87.6000 89.2585 1.184 -1.6585 2.095 -0.792 | *| | 0.0675 95.9000 97.2925 0.696 -1.3925 2.304 -0.605 | *| | 0.0116 109.2 105.2 0.816 4.0475 2.264

164、1.788 | |* | 0.1397 102.7 104.0 1.447 -1.3021 1.922 -0.677 | *| | 0.0878 72.5000 74.5754 1.182 -2.0754 2.096 -0.990 | *| | 0.1049 93.1000 91.2755 1.019 1.8245 2.180 0.837 | |* | 0.05110 115.9 114.5 1.785 1.3625 1.614 0.844 | |* | 0.29011 83.8000 80.5357 1.032 3.2643 2.174 1.502 | |* | 0.17012 113.3 112.4 1.067 0.8628 2.157 0.400 | | | 0.01313 109.4 112.3 1.114 -2.8934 2.133 -1.356 | *| | 0.167一般认为COOKD值的临界值为4/n=0.3077知,所有D值均比此值小,所以每个观测对模型的影响是合理的。因此对这一模型可用于实际工作建建 模模 软软 件件建建 模模 软软 件件sassas鲜思东鲜思东 重庆邮电大学重庆邮电大学2024/7/282024/7/28Thank you!Thank you!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号