过程常用统计分析

上传人:夏** 文档编号:567916595 上传时间:2024-07-22 格式:PPT 页数:49 大小:2.81MB
返回 下载 相关 举报
过程常用统计分析_第1页
第1页 / 共49页
过程常用统计分析_第2页
第2页 / 共49页
过程常用统计分析_第3页
第3页 / 共49页
过程常用统计分析_第4页
第4页 / 共49页
过程常用统计分析_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《过程常用统计分析》由会员分享,可在线阅读,更多相关《过程常用统计分析(49页珍藏版)》请在金锄头文库上搜索。

1、3 SAS过程步过程步及简单统计分析及简单统计分析3.1 SAS过程步简介过程步简介SAS过程步的一般形式为:过程步的一般形式为:PROC 过程名过程名 DATA=输入数据集输入数据集 选项选项; 过程语句过程语句1 / 选项选项 ; 过程语句过程语句2 / 选项选项 ; RUN;Data选项选项用于指明所需处理的数据集名,在这里它是一个可选用于指明所需处理的数据集名,在这里它是一个可选项参数。项参数。常用过程步的名称及功能1VAR语句语句语法格式为:语法格式为:VAR 变量名变量名1 变量名变量名2 变量名变量名n;变量名列表可以使用省略的形式,如变量名列表可以使用省略的形式,如x1-x3

2、等。等。功能:用于指定分析变量。功能:用于指定分析变量。应用实例:应用实例: var math chinese;2MODEL语句语句语法格式为:语法格式为: MODEL 因变量因变量 = 自变量列表自变量列表 / 选项选项; 功能:统计建模过程中用来指定模型的形式。功能:统计建模过程中用来指定模型的形式。应用实例:应用实例:model y=x1 x2 x3 ;3BY语句语句语句格式:语句格式:BY 变量变量 功能:功能:在过程步中用来指定一个或几个分组变量,根据在过程步中用来指定一个或几个分组变量,根据这些分组变量值可以把观测记录分组,然后对每一组观测这些分组变量值可以把观测记录分组,然后对每

3、一组观测分别进行指定的分析。分别进行指定的分析。BY语句总是与语句总是与SORT过程一起使用,过程一起使用,以便定义数据排列次序。以便定义数据排列次序。 例如例如:假设我们已经把假设我们已经把class1数据集按性别排序,则下面数据集按性别排序,则下面PRINT 过程可以把男、女生分别列出:过程可以把男、女生分别列出: proc print data=class1 ; by sex; run;4OUTPUT语句语句语法格式为:语法格式为:OUTPUT OUT=输出数据集名输出数据集名 关键字关键字=变量名变量名 关键字关键字=变量名变量名 ;功能:将过程指定结果输出到一个新的功能:将过程指定结

4、果输出到一个新的SAS数据集,以便作数据集,以便作为下步处理的输入。不同过程中把输出结果存入数据集的为下步处理的输入。不同过程中把输出结果存入数据集的方法各有不同,方法各有不同,OUTPUT语句是使用频繁的语句之一。语句是使用频繁的语句之一。OUT=给出了存放结果数据集的名字,关键字用于定义输给出了存放结果数据集的名字,关键字用于定义输出变量名,用出变量名,用“关键字关键字=变量名变量名”的方式指定了系统自动的方式指定了系统自动输出变量与存储变量之间的对应关系。等号后面的变量名输出变量与存储变量之间的对应关系。等号后面的变量名指定了输出数据集中的存储变量名称。指定了输出数据集中的存储变量名称。

5、(程序示例)(程序示例)5FREQ语句语句语法格式为:语法格式为:FREQ 变量变量;功能:规定一个数值变量,表示数据集中观测出现的频数。功能:规定一个数值变量,表示数据集中观测出现的频数。6WEIGHT语句语句语法格式语法格式WEIGHT 变量;变量;功能:规定一个权重变量,反映该变量在总体中的相对重要功能:规定一个权重变量,反映该变量在总体中的相对重要性性7ID语句语句语法格式为:语法格式为:ID 变量表变量表;功能:用来规定一个变量,以便在输出或由该过程产生的功能:用来规定一个变量,以便在输出或由该过程产生的SAS数据集中,不再使用数据集中,不再使用Obs,而用这些变量来识别观测。,而用

6、这些变量来识别观测。8CLASS语句语句语法格式语法格式CLASS 变量表;变量表;功能:定义分类变量。功能:定义分类变量。9WHERE语句语句语法格式为:语法格式为:where 逻辑表达式逻辑表达式;功能:用来选择输入数据集的子集进行分析。功能:用来选择输入数据集的子集进行分析。示例:示例:Where math=90 chinese=60;10LABEL语句语句语法格式语法格式Label 变量变量=新标签新标签 ;功能:为变量指定一个标签。(示例)功能:为变量指定一个标签。(示例)11 FORMAT语句语句语法格式:语法格式:Format 变量名变量名 格式描述符格式描述符 ;示例:示例:F

7、ormat inday MMDDYY8. math 5.1;3.2 PRINT过程过程3.2.1 PRINT过程简介过程简介在在SAS Windows版以前,版以前,PRINT过程是最常用的过程是最常用的SAS过程之一。过程之一。PRINT过程步列出数据集的内容,过程步列出数据集的内容,以检查变量对应输入的数据值是否正确。现在我以检查变量对应输入的数据值是否正确。现在我们可能通过们可能通过Viewtable表打开生成的数据集查看数表打开生成的数据集查看数据。为了输出显示一个指定的数据集,在据。为了输出显示一个指定的数据集,在PROC PRINT语句中使用语句中使用DATA=指定数据集,语法结构

8、指定数据集,语法结构如下:如下:PROC PRINT ;proc print data=class1; var name chinese sex;run;3.2.3 全程语句全程语句 1. TITLE 标题语句标题语句SAS系统有一默认的输出标题,使输出的每页有一系统有一默认的输出标题,使输出的每页有一行标题,内容为行标题,内容为“The SAS System”。我们可以指定自己的标题来取代我们可以指定自己的标题来取代SAS缺省的标题。缺省的标题。指定标题指定标题TITLE语句格式为:语句格式为:TITLE 标题内容标题内容;例如,在前一例的程序前面加上一行例如,在前一例的程序前面加上一行 t

9、itle 2001级级1班成绩表班成绩表;则输出结果的标题以则输出结果的标题以“2001级级1班成绩表班成绩表”替代了替代了“The Sas System”。 3.2.3 全程语句全程语句 2. FOOTNOTE 脚注语句脚注语句全程语句全程语句FOOTNOTE用于为输出添加脚注,用于为输出添加脚注,语句格式为:语句格式为: FOOTNOTE 注脚内容字符串注脚内容字符串;例如:例如:FOOTNOTE 第三章例子第三章例子; 则其后的输出则其后的输出每页底端会有脚注每页底端会有脚注“第三章例子第三章例子”显示,显示,直到用另一个直到用另一个FOOTNOTE语句指定新的脚语句指定新的脚注,或用空

10、注,或用空FOOTNOTE语句取消脚注为止。语句取消脚注为止。使用方法同使用方法同TITLE语句。语句。3.2.3 全程语句全程语句 3. 输出格式选项输出格式选项OPTIONS语句语句OPTIONS语句可以规定系统运行的一些通用选择项,语句可以规定系统运行的一些通用选择项,比如输出是否每页有页号,是否有日期,输出的比如输出是否每页有页号,是否有日期,输出的行宽,输出每一页的高度(行数),等等。其使行宽,输出每一页的高度(行数),等等。其使用例如:用例如:options nonumber nodate linesize=78 pagesize=60;其中其中NONUMBER表示输出不显示页号(

11、改用表示输出不显示页号(改用NUMBER则规定显示页号),则规定显示页号),NODATE表示不表示不在每页显示运行日期和时间(改用在每页显示运行日期和时间(改用DATE则显示),则显示),LINESIZE=78规定输出每行最宽不超过规定输出每行最宽不超过78个字符,个字符,PAGESIZE=60 规定输出每页为规定输出每页为60行,不足时用行,不足时用空行补齐。空行补齐。3.3 简单描述统计分析简单描述统计分析3.3.1简单描述统计量的基本概念简单描述统计量的基本概念总体(总体(Population):一个统计问题所研究对):一个统计问题所研究对象的全体。象的全体。样体(样体(Sample):

12、从总体中抽取一定数量的):从总体中抽取一定数量的个体进行研究,这部分个体称做样本。个体进行研究,这部分个体称做样本。随机抽样随机抽样(Random Sample):从总体中随机抽:从总体中随机抽取样本,使每个个体都有同等的机会进入取样本,使每个个体都有同等的机会进入样本的抽样方法称为随机抽样。样本的抽样方法称为随机抽样。3.3.2 MEANS 过程过程 输出结果中统计量的命名方法:输出结果中统计量的命名方法:MEAN=X1-X3;MEAN=MEANX1 MEANX2 MEANX3;MEAN(X2)=MEANX2;说明:关键词后的变量名在输出文件中代说明:关键词后的变量名在输出文件中代表表VAR

13、变量的统计量值,所以他们与变变量的统计量值,所以他们与变量的顺序是一一对应的。量的顺序是一一对应的。MEANSMEANS过程应用过程应用Data new;Data new; * *建立数据集建立数据集 Input y;Input y; * *输入变量,变量名为输入变量,变量名为y yCards;Cards; * *数据块开始数据块开始数据块数据块; * *数据块结束数据块结束Proc means n mean std var cv;Proc means n mean std var cv; * *调用调用meansmeans过程并计算相应的统计数过程并计算相应的统计数Var y;Var y;

14、* *对变量对变量y y进行分析进行分析Run;Run; * *程序运行程序运行3.3.3 UNIVARIATE 过程过程1. UNIVARIATE过程简介过程简介 UNIVARIATE过程除了可以完成与过程除了可以完成与MEANS过程相过程相同的基本统计量外,还可以计算变量的极端值、同的基本统计量外,还可以计算变量的极端值、分位数,生成频率表,并支持对数据进行正态分位数,生成频率表,并支持对数据进行正态性检验。性检验。UNIVARIATE与与MEANS过程不同的功能包括:过程不同的功能包括:描述变量极端值的情况。描述变量极端值的情况。计算分位数,如中位数,计算分位数,如中位数,1/4和和3/

15、4分位数。分位数。生成若干个描述变量分布的图。生成若干个描述变量分布的图。生成频率表。生成频率表。对数据进行正态性检验。对数据进行正态性检验。UNIVARIATEUNIVARIATE过程过程UNIVARIATEUNIVARIATE过程常用的选项过程常用的选项Proc univariate语句的选项语句的选项NOPRINT 禁止统计报告在禁止统计报告在OUTPUT视窗中输出视窗中输出 PLOT 绘出茎叶图、箱式图和正态概率图绘出茎叶图、箱式图和正态概率图 FREQ 产生频数和累积频数分布表产生频数和累积频数分布表 NORMAL 对变量进行正态性检验对变量进行正态性检验 UNIVARIATE过程过

16、程SASSAS中用关键字来指定所需要的统计量,事实中用关键字来指定所需要的统计量,事实上结果输出中用的就是各种关键字,常用上结果输出中用的就是各种关键字,常用的关键字有:的关键字有: 基本统计量基本统计量 N MEAN STD(N MEAN STD(标准误标准误) CV SUM VAR() CV SUM VAR(方差方差) ) RANGE RANGE 百分位数描述百分位数描述 MIN P1 P5 P10 Q1 MEDIAN Q3 P90 P95 MIN P1 P5 P10 Q1 MEDIAN Q3 P90 P95 P99 MAX P99 MAX 与假设检验有关的统计量与假设检验有关的统计量 S

17、TDERR(STDERR(标准误标准误) T ) T 3.3.4 FREQ 过程过程 (频数过程)(频数过程)5. WEIGHT语句语句统计计算中我们统称假设每条观测记录对频统计计算中我们统称假设每条观测记录对频数计算的贡献为数计算的贡献为 1,使用,使用WEIGHT语句可语句可以定义每个观测值出现的频数为这个观测以定义每个观测值出现的频数为这个观测对应的权重(权重不能为负)。对应的权重(权重不能为负)。6. BY语句语句对由对由BY变量定义的几组观测分别进行分析。变量定义的几组观测分别进行分析。但要求先按但要求先按BY变量排序。变量排序。3.3.5 应用实例应用实例频数表的编制(习题)频数表

18、的编制(习题)FREQ过程步例 某地随机抽取正常成年男子120名,其红细胞数如下,试作该批样本的频数表。5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.844.91 5.14 5.25 4.89 4.79 4.90 5.09 4.04 5.14 5.46 4.66 4.204.21 3.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.214.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.054.92 4.87 4.

19、28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.974.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.224.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.534.83 4.11 3.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.514.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.774.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.693.4 菜单操作进行简单统计分析菜单操作进行简单统计分析3.4.1 利用利用SAS/INSIGHT进行简单分析进行简单分析我们仍以我们仍以GPA数据集为例进行窗口操作分析。数据集为例进行窗口操作分析。具体操作步骤如下:具体操作步骤如下:3.4.2 利用利用SAS/ASSIST进行简单分析进行简单分析Summary Statistics(与(与MEANS过过程相同)程相同)Frequency Tables (与(与FREQ过程过程相同)相同)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号