过程及常用统计分析说课材料

上传人:yuzo****123 文档编号:139660837 上传时间:2020-07-23 格式:PPT 页数:49 大小:2.56MB
返回 下载 相关 举报
过程及常用统计分析说课材料_第1页
第1页 / 共49页
过程及常用统计分析说课材料_第2页
第2页 / 共49页
过程及常用统计分析说课材料_第3页
第3页 / 共49页
过程及常用统计分析说课材料_第4页
第4页 / 共49页
过程及常用统计分析说课材料_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《过程及常用统计分析说课材料》由会员分享,可在线阅读,更多相关《过程及常用统计分析说课材料(49页珍藏版)》请在金锄头文库上搜索。

1、3 SAS过程步及简单统计分析,3.1 SAS过程步简介,SAS过程步的一般形式为: PROC 过程名 DATA=输入数据集 选项; 过程语句1 / 选项 ; 过程语句2 / 选项 ; RUN; Data选项 用于指明所需处理的数据集名,在这里它是一个可选项参数。,常用过程步的名称及功能,1VAR语句 语法格式为: VAR 变量名1 变量名2 变量名n; 变量名列表可以使用省略的形式,如x1-x3 等。 功能:用于指定分析变量。 应用实例: var math chinese; 2MODEL语句 语法格式为: MODEL 因变量 = 自变量列表 / 选项; 功能:统计建模过程中用来指定模型的形式

2、。 应用实例:model y=x1 x2 x3 ;,4OUTPUT语句 语法格式为: OUTPUT OUT=输出数据集名 关键字=变量名 关键字=变量名 ; 功能:将过程指定结果输出到一个新的SAS数据集,以便作为下步处理的输入。不同过程中把输出结果存入数据集的方法各有不同,OUTPUT语句是使用频繁的语句之一。OUT=给出了存放结果数据集的名字,关键字用于定义输出变量名,用“关键字=变量名”的方式指定了系统自动输出变量与存储变量之间的对应关系。等号后面的变量名指定了输出数据集中的存储变量名称。(程序示例),5FREQ语句 语法格式为: FREQ 变量; 功能:规定一个数值变量,表示数据集中观

3、测出现的频数。 6WEIGHT语句 语法格式 WEIGHT 变量; 功能:规定一个权重变量,反映该变量在总体中的相对重要性,7ID语句 语法格式为: ID 变量表; 功能:用来规定一个变量,以便在输出或由该过程产生的SAS数据集中,不再使用Obs,而用这些变量来识别观测。 8CLASS语句 语法格式 CLASS 变量表; 功能:定义分类变量。,9WHERE语句 语法格式为: where 逻辑表达式; 功能:用来选择输入数据集的子集进行分析。 示例: Where math=90 chinese=60; 10LABEL语句 语法格式 Label 变量=新标签 ; 功能:为变量指定一个标签。(示例)

4、,11 FORMAT语句 语法格式: Format 变量名 格式描述符 ; 示例: Format inday MMDDYY8. math 5.1;,3.2 PRINT过程,3.2.1 PRINT过程简介 在SAS Windows版以前,PRINT过程是最常用的SAS过程之一。PRINT过程步列出数据集的内容,以检查变量对应输入的数据值是否正确。现在我们可能通过Viewtable表打开生成的数据集查看数据。为了输出显示一个指定的数据集,在PROC PRINT语句中使用DATA=指定数据集,语法结构如下: PROC PRINT ;,proc print data=class1; var name

5、chinese sex; run;,3.2.3 全程语句,1. TITLE 标题语句 SAS系统有一默认的输出标题,使输出的每页有一行标题,内容为“The SAS System”。 我们可以指定自己的标题来取代SAS缺省的标题。指定标题TITLE语句格式为: TITLE 标题内容; 例如,在前一例的程序前面加上一行 title 2001级1班成绩表; 则输出结果的标题以“2001级1班成绩表”替代了“The Sas System”。,3.2.3 全程语句,2. FOOTNOTE 脚注语句 全程语句FOOTNOTE用于为输出添加脚注,语句格式为: FOOTNOTE 注脚内容字符串;例如:FOOT

6、NOTE 第三章例子; 则其后的输出每页底端会有脚注“第三章例子”显示,直到用另一个FOOTNOTE语句指定新的脚注,或用空FOOTNOTE语句取消脚注为止。使用方法同TITLE语句。,3.2.3 全程语句,3. 输出格式选项OPTIONS语句 OPTIONS语句可以规定系统运行的一些通用选择项,比如输出是否每页有页号,是否有日期,输出的行宽,输出每一页的高度(行数),等等。其使用例如: options nonumber nodate linesize=78 pagesize=60; 其中NONUMBER表示输出不显示页号(改用NUMBER则规定显示页号),NODATE表示不在每页显示运行日期

7、和时间(改用DATE则显示),LINESIZE=78规定输出每行最宽不超过78个字符,PAGESIZE=60 规定输出每页为60行,不足时用空行补齐。,3.3 简单描述统计分析,3.3.1简单描述统计量的基本概念 总体(Population):一个统计问题所研究对象的全体。 样体(Sample):从总体中抽取一定数量的个体进行研究,这部分个体称做样本。 随机抽样(Random Sample):从总体中随机抽取样本,使每个个体都有同等的机会进入样本的抽样方法称为随机抽样。,3.3.2 MEANS 过程,输出结果中统计量的命名方法: MEAN=X1-X3; MEAN=MEANX1 MEANX2 M

8、EANX3; MEAN(X2)=MEANX2; 说明:关键词后的变量名在输出文件中代表VAR变量的统计量值,所以他们与变量的顺序是一一对应的。,MEANS过程应用,Data new; *建立数据集 Input y; *输入变量,变量名为y Cards; *数据块开始 数据块 ; *数据块结束 Proc means n mean std var cv; *调用means过程并计算相应的统计数 Var y; *对变量y进行分析 Run; *程序运行,3.3.3 UNIVARIATE 过程,1. UNIVARIATE过程简介 UNIVARIATE过程除了可以完成与MEANS过程相同的基本统计量外,还

9、可以计算变量的极端值、分位数,生成频率表,并支持对数据进行正态性检验。 UNIVARIATE与MEANS过程不同的功能包括: 描述变量极端值的情况。 计算分位数,如中位数,1/4和3/4分位数。 生成若干个描述变量分布的图。 生成频率表。 对数据进行正态性检验。,UNIVARIATE过程,UNIVARIATE过程常用的选项,Proc univariate语句的选项 NOPRINT 禁止统计报告在OUTPUT视窗中输出 PLOT 绘出茎叶图、箱式图和正态概率图 FREQ 产生频数和累积频数分布表 NORMAL 对变量进行正态性检验,UNIVARIATE过程,SAS中用关键字来指定所需要的统计量,

10、事实上结果输出中用的就是各种关键字,常用的关键字有: 基本统计量 N MEAN STD(标准误) CV SUM VAR(方差) RANGE 百分位数描述 MIN P1 P5 P10 Q1 MEDIAN Q3 P90 P95 P99 MAX 与假设检验有关的统计量 STDERR(标准误) T,3.3.4 FREQ 过程 (频数过程),5. WEIGHT语句 统计计算中我们统称假设每条观测记录对频数计算的贡献为 1,使用WEIGHT语句可以定义每个观测值出现的频数为这个观测对应的权重(权重不能为负)。 6. BY语句 对由BY变量定义的几组观测分别进行分析。但要求先按BY变量排序。,3.3.5 应

11、用实例,频数表的编制(习题),FREQ过程步 例 某地随机抽取正常成年男子120名,其红细胞数如下,试作该批样本的频数表。 5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.84 4.91 5.14 5.25 4.89 4.79 4.90 5.09 4.04 5.14 5.46 4.66 4.20 4.21 3.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.21 4.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.0

12、5 4.92 4.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.97 4.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.22 4.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.53 4.83 4.11 3.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.51 4.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.77 4.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69,3.4 菜单操作进行简单统计分析,3.4.1 利用SAS/INSIGHT进行简单分析 我们仍以GPA数据集为例进行窗口操作分析。具体操作步骤如下:,3.4.2 利用SAS/ASSIST进行简单分析Summary Statistics(与MEANS过程相同),Frequency Tables (与FREQ过程相同),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号