as应用教程的课件

上传人:汽*** 文档编号:590927227 上传时间:2024-09-16 格式:PPT 页数:81 大小:789KB
返回 下载 相关 举报
as应用教程的课件_第1页
第1页 / 共81页
as应用教程的课件_第2页
第2页 / 共81页
as应用教程的课件_第3页
第3页 / 共81页
as应用教程的课件_第4页
第4页 / 共81页
as应用教程的课件_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《as应用教程的课件》由会员分享,可在线阅读,更多相关《as应用教程的课件(81页珍藏版)》请在金锄头文库上搜索。

1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第二章 SAS的描述统计功能n2.1 描述性统计的基本概念描述性统计的基本概念n2.2 在在SAS中计算统计量中计算统计量n2.3 统计图形统计图形as应用教程的PPT课件STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.1 2.1 描述性统计的基本概念描述性统计的基本概念n2.1.1 统计学的基本概念统计学的基本概念n2.1.2 表示数据位置的统计量表示数据位置的统计量n2.1.3 表示数据分散程度的统计量表示数据分散程度的统计量n2.1.4 表示数据分布形状的统计量表示数据分

2、布形状的统计量n2.1.5 其它统计量其它统计量as应用教程的PPT课件STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.1 统计学的基本概念统计学的基本概念1. 1. 总体与样本总体与样本 总总体体(population):总总体体是是指指所所研研究究对对象象的的全全体体组组成成的集合。的集合。 样样本本(sample):样样本本是是指指从从总总体体中中抽抽取取的的部部分分对对象象(个个体体)组组成成的的集集合合。样样本本中中包包含含个个体体的的个个数数称称为为样样本本容容量量。容容量量为为n的的样样本本常常用用n个个随随机机变变量量X1,X2,Xn表表

3、示示,其其观观测测值值(样样本本数数据据)则则表表示示为为x1,.,xn,为简单起见,有时不加区别。为简单起见,有时不加区别。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 参数与统计量参数与统计量 参参数数(parameter):参参数数是是用用来来描描述述总总体体特特征征的的概概括括性性值值。如如总总体体平平均均值值()、总总体体方方差差( 2)、总总体体比比例(例()等。)等。 统统计计量量(statistics):统统计计量量是是用用来来描描述述样样本本特特征征的的概概括括性性值值。如如样样本本均均值值( )、样样本本方方差差(s2)、样样本

4、本比例(比例(P)等。)等。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.2 表示数据位置的统计量表示数据位置的统计量 如如果果要要用用简简单单的的数数字字来来概概括括一一组组观观测测数数据据x1,.,xn,可可以以使使用用“位位置置统统计计量量”来来作作为为数数据据的的总总体体代代表表,常见的位置统计量有:均值、中位数、分位数、众数等。常见的位置统计量有:均值、中位数、分位数、众数等。1. 1. 均值(均值(MeanMean) 均均值值是是所所有有观观测测值值的的平平均均值值,是是描描述述数数据据取取值值中中心心位位置的一个度量:置的一个度量:STA

5、TSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 中位数(中位数(MedianMedian或或MedMed) 中中位位数数是是描描述述观观测测值值数数据据中中心心位位置置的的统统计计量量,大大体体上上比比中中位位数数大大(小小)的的数数据据为为观观测测值值的的一一半半。中中位位数数的的一一个个优优点点是是它它不不受受个个别别极极端端数数据据的的影影响响,具具有有稳稳健健性性。中中位位数数的的计计算算方方法法是是:首首先先将将数数据据从从小小到到大大排排序序为为:x(1),.,x(n),然后计算,然后计算STATSTATSTATSTATSASSAS软件与统计应

6、用教程软件与统计应用教程3. 3. 众数(众数(ModeMode) 观观测测值值中中出出现现最最多多的的数数称称为为众众数数。众众数数用用得得不不如如均均值值和和中中位位数数普普遍遍。在在属属性性变变量量分分析析中中,常常需需考考虑虑频频数数,因因此众数用得多些。此众数用得多些。4. 4. 百分位数(百分位数(PercentilePercentile) 分分位位数数也也是是描描述述数数据据分分布布和和位位置置的的统统计计量量。0.5分分位位数数就就是是中中位位数数,0.75分分位位数数和和0.25分分位位数数又又分分别别称称为为上上、下四分位数,并分别记为下四分位数,并分别记为Q3和和Q1。S

7、TATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.3 表示数据分散程度的统计量表示数据分散程度的统计量1. 1. 极差(极差(RangeRange)与半极差()与半极差(Interquartile rangeInterquartile range) 极差就是数据中的最大值和最小值之间的差:极差就是数据中的最大值和最小值之间的差:极差极差 = maxxi minxi 上上、下下四四分分位位数数之之差差Q3 Q1称称为为四四分分位位极极差差或或半半极极差,它描述了中间半数观测值的散布情况。差,它描述了中间半数观测值的散布情况。2. 2. 方差(方差(Varian

8、ceVariance或或VarVar) 方方差差是是由由各各观观测测值值到到均均值值距距离离的的平平方方和和除除以以观观测测量量减减1:STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 标准差(标准差(Standard deviationStandard deviation或或Std DevStd Dev) 方差的开方称为标准差:方差的开方称为标准差: 标准差的量纲与原变量一致。标准差的量纲与原变量一致。4. 4. 变异系数(变异系数(Coefficient of VariationCoefficient of Variation或或CVCV) 变变异

9、异系系数数是是将将标标准准差差表表示示为为均均值值的的百百分分数数,是是观观测测数数据据分分散散性性的的一一个个度度量量,它它在在比比较较用用不不同同单单位位测测量量的的数数据据的分散性时是有用的:的分散性时是有用的:STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.4 表示数据分布形状的统计量表示数据分布形状的统计量 偏度和峰度是描述数据分布形状的指标。偏度和峰度是描述数据分布形状的指标。1. 1. 偏度(偏度(skewnessskewness) 偏度是刻画数据对称性的指标。偏度的计算公式为:偏度是刻画数据对称性的指标。偏度的计算公式为: 在在SAS中:

10、中: 关于均值对称的数据其偏度为关于均值对称的数据其偏度为0; 左侧更为分散的数据,其偏度为负,称为左偏;左侧更为分散的数据,其偏度为负,称为左偏; 右侧更为分散的数据,其偏度为正,称为右偏。右侧更为分散的数据,其偏度为正,称为右偏。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 峰度(峰度(kurtosiskurtosis) 峰峰度度描描述述数数据据向向分分布布尾尾端端散散布布的的趋趋势势。峰峰度度的的计计算算公公式为:式为: 利利用用峰峰度度研研究究数数据据分分布布的的形形状状是是以以正正态态分分布布为为标标准准(假假定定正正态态分分布布的的方方

11、差差与与所所研研究究分分布布的的方方差差相相等等)比比较较两端极端数据的分布情况,若两端极端数据的分布情况,若 近似于标准正态分布,则峰度接近于零;近似于标准正态分布,则峰度接近于零; 尾部较正态分布更分散,则峰度为正,称为轻尾;尾部较正态分布更分散,则峰度为正,称为轻尾; 尾部较正态分布更集中,则峰度为负,称为厚尾。尾部较正态分布更集中,则峰度为负,称为厚尾。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.5 其它统计量其它统计量1. 1. 均均值值的的标标准准误误(Std Std Error Error MeanMean或或Std Std MeanM

12、ean或或Std Std errorerror)2. 2. 校正平方和(校正平方和(Corrected sum of squaresCorrected sum of squares)STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 未校正平方和(未校正平方和(Uncorrected sum of squaresUncorrected sum of squares)4. 4. k k阶原点矩阶原点矩其中其中A1即为均值即为均值 。5. 5. k k阶中心矩阶中心矩STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.2 2

13、.2 在在SASSAS中计算统计量中计算统计量n2.2.1 用用INSIGHT计算统计量计算统计量n2.2.2 用用“分析家分析家”计算统计量计算统计量n2.2.3 编程实现描述性统计编程实现描述性统计as应用教程的PPT课件STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.1 用用INSIGHT计算统计量计算统计量 INSIGHT可以非常方便地计算各种统计量。可以非常方便地计算各种统计量。1. 1. 实例数据实例数据【例例2-1】表表2-1为为两两个个不不同同地地区区居居民民家家庭庭收收入入和和支支出出情情况况的的抽抽样样调调查查(单单位位:元元),试试

14、分分别别统统计计收收入入和和支支出出情情况。况。将将表表2-1中中数数据据通通过过Excel导导入入到到SAS数数据据集集Mylib.sryzc中中,4个个变变量量名名分分别别为为:ID、R_ID、Income和和Outgo,相相应应的的标标签签名名为为家家庭庭编编号号、地地区区编编号号、家家庭庭总总收收入入和和家家庭总支出。庭总支出。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程家庭编号地区编号家庭总收入家庭总支出家庭编号地区编号家庭总收入家庭总支出1217941550162220020602217161365171273022363134102730181

15、24961455421765153019117601040522184190020128202366622050205021222501966722460218422131702400811976117023212001250912850249624217761350101427527602521980179411220101275261245525501212236181027210801380131330528202821986120014124001976291336923051522250197030215301316STATSTATSTATSTATSASSAS软件与统计应用教程软件与

16、统计应用教程2. 2. 在在INSIGHTINSIGHT中打开数据集中打开数据集 在在 菜菜 单单 中中 选选 择择 “Solution( 解解 决决 方方 案案 )”“Analysis( 分分 析析 ) ”“Interactive Data Analysis(交交互互式式数数据据分分析析)”,打打开开“SAS/INSIGHT Open”对对话话框框,在在对对话话框框中中选选择择数数据据集集:Mylib.sryzc,单单击击“Open(打打开开)”按按钮钮,即即可可在在INSIGHT中中打打开开数据窗口,如图所示。数据窗口,如图所示。STATSTATSTATSTATSASSAS软件与统计应用教

17、程软件与统计应用教程3. 3. 计算统计量计算统计量 选选择择菜菜单单“Analyze(分分析析)”“Distribution (Y)(分分布布)”,打打开开“Distribution (Y)”对对话话框框。在在数数据据集集sryzc的的变变量量列列表表中中,选选择择Income为为分分析析变变量量,选择选择R_Id,为分组变量。,为分组变量。 单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中包包含描述性统计量选项。含描述性统计量选项。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 选选择择选选项项矩矩统统计计量量和和分分位位数

18、数,取取消消默默认认的的选选项项:“Box Plot/Mosaic Plot”和和“Histogram/Bar Chart”,单单击击“OK”按按钮钮,即即可可得得到到变变量量Income按按“R_Id”分分组组的的各各种种矩矩统统计计量量(Moments)和和分分位位数数(Quantiles),如图所示。如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.2 用用“分析家分析家”计算统计量计算统计量1. 1. 启动启动“分析家分析家” 选选 择择 主主 菜菜 单单 “Solutions( 解解 决决 方方 案案 )”“Analysis(分分析析)

19、”“Analyst(分分析析家家)”,打开,打开“分析家分析家”窗口。窗口。 选选择择主主菜菜单单“File(文文件件)”“Open By SAS Name”,打打开开“Select A Member”对对话话框框,选选择择数数据据集集Mylib.sryzc。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 通通过过Summary Summary StatisticsStatistics菜菜单单计计算算描描述述性性统统计量计量 选选择择主主菜菜单单“Statistics(统统计计)”“Descriptive( 描描 述述 性性 统统 计计 ) ”“Su

20、mmary Statistics(汇汇总总统统计计量量)”,打打开开“Summary Statistics”对对 话话 框框 , 选选 择择 变变 量量 列列 表表 中中 的的 Income, 单单 击击“Analysis”按钮,选定分析变量,如图所示。按钮,选定分析变量,如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程单单击击“Statistics”按按钮钮,打打开开“Summary Statistics:Statistics”对对话话框框。对对话话框框中中列列出出可可以以计计算算的的所所有有统统计计量(如右图所示)。量(如右图所示)。描述性统计量如

21、下图所示。描述性统计量如下图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 通过通过DistributionsDistributions菜单计算描述性统计量菜单计算描述性统计量 选选择择主主菜菜单单“Statistics(统统计计)”“Descriptive(描描述述性性统统计计)”“Distributions(分分布布)”,打打开开“Distributions”对对话话框框,选选择择变变量量列列表表中中的的Income,单击,单击“Analysis”按钮,选定分析变量。按钮,选定分析变量。 单单击击“OK”按按钮钮,即即可可得得到到关关于于变

22、变量量Income的的矩矩统统计量和基本统计测度计量和基本统计测度STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.3 编程实现描述性统计编程实现描述性统计 SAS提提供供有有多多个个不不同同的的过过程程来来实实现现统统计计量量的的计计算算,它它们们在在功功能能范范围围上上有有许许多多的的重重复复,下下面面介介绍绍用用FREQ、MEANS和和UNIVARIATE这这三三个个过过程程来来计计算算简简单单的的描描述述统计量。统计量。 FREQ过过程程常常用用来来计计算算分分类类变变量量取取值值的的频频数数,而而MEANS和和UNIVARIATE过过程程则则对对

23、数数值值型型变变量量计计算算均均值值、标准差等统计量。标准差等统计量。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1. FREQ1. FREQ过程过程 FREQ过过程程包包括括多多个个控控制制频频数数输输出出与与检检验验的的语语句句和和选选项,格式如下:项,格式如下:PROC FREQ DATA = ; TABLES ; FORMAT . . ;RUN; 其其中中PROC FREQ语语句句调调用用FREQ过过程程,标标志志FREQ过程的开始;过程的开始; TABLES语语句句用用于于创创建建有有关关变变量量所所构构成成的的各各种种表表格格并并进行相应的假设检

24、验和计算,可以多次使用。进行相应的假设检验和计算,可以多次使用。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 例例如如,统统计计数数据据集集Mylib.sryzc中中变变量量R_Id和和Income频数的代码如下:频数的代码如下:proc freq data = mylib.sryzc; tables R_Id Income;RUN; 显示结果如图所示。显示结果如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. MEANS2. MEANS过程过程(1) 语法格式语法格式 MEANS过程的一般格式过程的一般格式:PR

25、OC MEANS DATA=; VAR ; BY ; CLASS ;RUN;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 PROC MEANS语语句句后后的的选选项项主主要要用用来来指指定定所所要要计计算算的的统统计计量量,默默认认情情况况下下,MEANS过过程程会会给给出出频频数数、均均数数、标标准准差差、最最大大值值和和最最小小值值等等,其其余余统统计计量量的的计计算算均均需要在选项中指定。需要在选项中指定。 VAR语语句句引引导导所所要要进进行行分分析析的的所所有有变变量量的的列列表表,SAS将将对对VAR语语句句所所引引导导的的所所有有变变量量分分别

26、别进进行行描描述述性性统统计计分分析。析。 BY语语句句与与CLASS语语句句所所指指定定的的分分类类变变量量用用来来进进行行分分组统计,但输出格式不同。组统计,但输出格式不同。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 如如对对数数据据集集Mylib.sryzc中中的的Income变变量量计计算算简简单单统统计量,只要用如下计量,只要用如下MEANS过程:过程:proc means data = mylib.sryzc; var Income;run; 结果如图结果如图2-15所示。所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件

27、与统计应用教程(2) 使用统计量关键字列表使用统计量关键字列表 在在PROC MEANS语句中使用统计量关键字列表:语句中使用统计量关键字列表:proc means data = mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min; var Income;run; 结果如图结果如图2-16所示。所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 可以计算的描述性统计量关键字及其含义见下表。可以计算的描述性统计量关键字及其含义见下表。关键字所代表的含义关键字所代表的含义n有效数据记录数range极差nmi

28、ss缺失数据记录数skewness偏度mean均值kurtosis峰度std标准差t分布位置假设检验之t统计量stderr标准误probt上述t统计量对应的概率值var方差q1第一四分位数median中位数q3第三四分位数mode众数qrange四分位数间距cv变异系数p1第一百分位数max最大值p5第五百分位数min最小值p10第十百分位数sum总计p90第九十百分位数sumwgt加权值总计p95第九十五百分位数css校正平方和p99第九十九百分位数uss未校正平方和STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3) 使用使用CLASS语句和语句和BY语句

29、语句 使使用用CLASS语语句句和和BY语语句句可可以以分分组组计计算算分分析析变变量量的的描描述述统统计计量量值值,由由CLASS语语句句和和BY语语句句指指定定的的变变量量在在分分析析中中起起分分组组(类类)的的作作用用,被被称称为为分分类类变变量量。两两个个语语句的区别是:句的区别是: 使使用用BY语语句句时时要要求求数数据据集集须须按按BY变变量量排排序序,使使用用CLASS语句无此要求。语句无此要求。 使使用用BY语语句句时时输输出出按按BY变变量量的的每每个个值值分分别别提提供供一一个个表表,使使用用CLASS语语句句则则将将所所有有结结果果排排列列在在一一个个表表之之中。中。ST

30、ATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 使使用用BY语语句句之之前前先先排排序序,如如下下代代码码可可以以在在上上例例中中按按变量变量R_Id分组统计:分组统计:proc sort data = mylib.sryzc; by R_Id;run;proc means data = mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min; var Income; by R_Id;run;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 使使用用CLASS语语句句分分组组较较为

31、为简简单单,如如下下代代码码也也可可以以在在上例中按变量上例中按变量R_Id分组统计:分组统计:proc means data = mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min; var Income; class R_Id;RUN;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. UNIVARIATE3. UNIVARIATE过程过程 UNIVARIATE过程的一般格式为:过程的一般格式为:PROC UNIVARIATE DATA = ; VAR ; BY | CLASS ; HISTOGRAM

32、 /; OUTPUT OUT = = ;RUN;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 UNIVARIATE过过程程和和MEANS过过程程的的格格式式非非常常相相似似,相相同同的的语语句句和和选选项项其其含含义义也也相相同同,所所不不同同的的是是某某些些统统计计量量只只能能在在UNIVARIATE过过程程中中计计算算(如如众众数数),而而且且UNIVARIATE过程中具有绘图功能。过程中具有绘图功能。 其其中中,HISTOGRAM语语句句用用来来指指示示SAS对对其其后后所所指指定定的的变变量量绘绘制制直直方方图图,其其后后的的选选项项用用来来指指示示

33、SAS添添加加不不同类型的拟合图形(如正态分布的分布密度曲线)。同类型的拟合图形(如正态分布的分布密度曲线)。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 输出包括五个部分。输出包括五个部分。 第一部分是矩统计量,各统计量已在第一部分是矩统计量,各统计量已在2.1.1中作了介绍。中作了介绍。 第第二二部部分分为为基基本本的的位位置置和和分分散散程程度度统统计计量量,位位置置统统计计量量包包括括均均值值、中中位位数数、众众数数,分分散散程程度度统统计计量量包包括括标标准准差、方差、极差、四分位间距差、方差、极差、四分位间距 第第三三部部分分为为关关于于均均值值

34、等等于于零零的的三三种种检检验验的的结结果果,包包括括t检验、符号检验和符号秩检验。检验、符号检验和符号秩检验。 第四部分为各个重要的分位数。第四部分为各个重要的分位数。 第五部分是观测数据的五个最低值和五个最高值。第五部分是观测数据的五个最低值和五个最高值。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.3 2.3 统计图形统计图形n2.3.1 定量变量的图形表示定量变量的图形表示n2.3.2 分类变量的图形表示分类变量的图形表示as应用教程的PPT课件STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.3.1 定量变量的

35、图形表示定量变量的图形表示1. 1. 直方图直方图 对对于于数数值值型型变变量量,常常用用直直方方图图(histogram)来来展展示示变变量量取取值值的的分分布布。将将变变量量取取值值的的范范围围分分成成若若干干区区间间,在在等等间间隔隔区区间间的的情情况况,每每个个区区间间的的长长度度称称为为组组距距。考考察察数数据据落落入入每每一一区区间间的的频频数数与与频频率率,在在每每个个区区间间上上画画一一个个矩矩形形,它它的的宽宽度度是是组组距距,它它的的高高度度可可以以是是频频数数、频频率率或或密密度度(频频率率组组距距),在在高高度度是是密密度度的的情情况况,每每一一矩矩形形的的面面积积恰恰

36、是是数数据据落落入入区区间间的的频频率率,这这种种直直方方图图可可以以估估计计总总体的概率密度。体的概率密度。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程图2-22 密度直方图与频数直方图SAS软软件件会会根根据据样样本本容容量量在在样样本本取取值值范范围围内内自自动动地地确确定定一个分组方式,另外也提供了设定分组的方法。一个分组方式,另外也提供了设定分组的方法。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 盒形图盒形图 盒盒形形图图(boxplot,又又称称箱箱图图、箱箱线线图图、盒盒子子图图)是是用用更更为

37、为简简洁洁的的方方法法表表现现数数据据在在数数轴轴上上的的分分布布及及其其特特点点的的图形。图形。 图图2-23的的左左边边是是根根据据居居民民家家庭庭的的收收入入情情况况所所绘绘的的盒盒形形图;右边是分地区情况所绘的盒形图。图;右边是分地区情况所绘的盒形图。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 散点图散点图 通通常常得得到到的的数数据据可可能能有有两两个个变变量量,比比如如家家庭庭的的收收入入和和支支出出情情况况的的数数据据,这这里里家家庭庭总总收收入入是是一一个个变变量量,而而家家庭庭总总支支出出是是第第二二个个变变量量。希希望望通通

38、过过图图形形了了解解收收入入和和支支出出的的关关系系,这这时时可可以以用用一一个个变变量量为为横横坐坐标标(如如家家庭庭总总收收入入),另另一一个个为为纵纵坐坐标标(这这里里是是家家庭庭总总支支出出)来来作作图图(图图2-24)。这种图称为散点图)。这种图称为散点图(Scatter Plot)。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4. 4. 线图线图 线线图图(Line Plot)用用来来表表示示变变量量间间的的取取值值变变化化情情况况,有有单式和复式两种(图单式和复式两种(图2-25)。)。 在在复复式式线线图图中中可可用用不不同同颜颜色色的的实

39、实线线来来标标志志区区别别,如如图图2-25右所示。右所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.3.2 分类变量的图形表示分类变量的图形表示 分分类类变变量量也也可可以以通通过过图图形形直直观观地地描描绘绘出出它它们们各各类类的的数数量和所占比例,常用的有条形图、饼图和马赛克图。量和所占比例,常用的有条形图、饼图和马赛克图。1. 1. 条形图条形图 条条形形图图(Bar Chart)给给出出分分类类变变量量取取每每个个值值的的频频数数,如图如图2-26所示为变量所示为变量R_ID取值的条形图。取值的条形图。STATSTATSTATSTATSAS

40、SAS软件与统计应用教程软件与统计应用教程2. 2. 饼图饼图 通通常常,饼饼图图(Pie Chart)可可以以对对分分类类变变量量描描述述其其频频数数取取值值的的比比例例,对对于于数数值值变变量量,则则像像直直方方图图那那样样应应先先计计算算各区间取值的频数,再按比例画出。各区间取值的频数,再按比例画出。 图图2-27中中给给出出的的是是家家庭庭支支出出分分组组频频数数的的饼饼图图。要要注注意意的是,如果有太多的分组,那么饼图就不那么好看了。的是,如果有太多的分组,那么饼图就不那么好看了。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 马赛克图马赛

41、克图 马马赛赛克克图图(Mosaic Plot)一一般般不不对对单单个个变变量量作作,而而是是对对两两个个分分类类变变量量来来作作。这这种种图图的的好好处处是是直直观观显显示示了了两两个个变变量每种取值组合的观测个数和比例,如图量每种取值组合的观测个数和比例,如图2-28所示。所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.4 2.4 用用SASSAS绘制统计图形绘制统计图形n2.4.1 用用INSIGHT绘制统计图形绘制统计图形n2.4.2 用用“分析家分析家”绘制统计图形绘制统计图形n2.4.3 编程绘制统计图编程绘制统计图n2.4.4 图形的调

42、整与输出图形的调整与输出as应用教程的PPT课件STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.1 用用INSIGHT绘制统计图形绘制统计图形 INSIGHT模模块块可可以以画画出出多多种种统统计计图图形形,而而且且图图形形清清晰、美观。晰、美观。1. 1. 绘制直方图绘制直方图 选选择择菜菜单单“Analyze(分分析析)”“Histogram/Bar Chart (Y)( 直直 方方 图图 /条条 形形 图图 ) ”, 打打 开开“Histogram/Bar Chart (Y)”对对话话框框。在在数数据据集集的的变变量量列表中,选择变量,然后单击列表

43、中,选择变量,然后单击“Y”按钮。按钮。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中选选择择“Labels(标标签签)”选选项项,如如图图所所示示,以以便便输输出出的的图图形显示中文标签名。单击形显示中文标签名。单击“OK”按钮返回对话框。按钮返回对话框。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单击单击“OK”按钮,即可得到直方图如图按钮,即可得到直方图如图2-30左所示。左所示。 单单击击图图形形框框左左下下角角处处的的三三角角形形,在

44、在打打开开的的菜菜单单中中选选择择“Values(值值)”,即即可可在在图图中中显显示示频频数数值值,如如图图2-30右所示。右所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 绘制条形图绘制条形图 INSIGHT模模块块对对分分类类变变量量绘绘制制条条形形图图。首首先先单单击击R_Id变变量量名名上上边边的的变变量量作作用用按按钮钮,在在弹弹出出的的菜菜单单中中选选择择“Nominal(列名型)(列名型)”,如图左所示。,如图左所示。 选选择择菜菜单单“Analyze”“Histogram/Bar Chart (Y)”,打打开开“Histog

45、ram/Bar Chart (Y)”对对话话框框。在在数数据据集集的的变变量量列列表表中中选选择择变变量量,然然后后单单击击“Y”按按钮钮,如如图图右右所示。所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中选选择择“Labels(标标签签)”选选项项,单单击击“OK”按按钮钮返返回回对对话话框。框。 单单击击“OK”按按钮钮,即即可可得得到到条条形形图图如如图图2-34左左所所示示。如如果果选选择择Income_freq(见见2.2.2节节)作作为为分分析析变变量量,则则可以

46、得到图可以得到图2-34右所示的条形图。右所示的条形图。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 绘制盒形图绘制盒形图 选选择择菜菜单单“Analyze”“Box Plot/Mosaic Plot (Y)”,可可以以对对区区间间型型变变量量作作盒盒形形图图,对对分分类类型型变变量量作作马马赛赛克克图图。打打开开“Box Plot/Mosaic Plot (Y)”对对话话框框。在在数数据据表表sryzc的的变变量量列列表表中中,选选择择income变变量量,然然后后单单击击“Y”按钮,按钮,income变量被选定,如图左所示。变量被选定,如图左

47、所示。 单单 击击 “Output”按按 钮钮 , 在在 打打 开开 的的 对对 话话 框框 中中 选选 择择“Labels”选项,取消选项,取消“Y Axis Vertical”如图右所示。如图右所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单击单击“OK”按钮,即可得到盒形图如图按钮,即可得到盒形图如图2-36左所示。左所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程在在“Box Plot/Mosaic Plot (Y)”对对话话框框中中选选定定多多个个分分析析变变量量,可可以以将将多多个个盒盒形形图图画画

48、在在一一个个坐坐标标系系下下,这这样样便便于于比比较变量的取值情况,如图所示。较变量的取值情况,如图所示。 图图形形分分析析:从从图图中中可可以以看看到到支支出出数数据据在在均均值值两两边边的的分分布布近近似似对对称称,说说明明低低于于和和高高于于平平均均支支出出的的家家庭庭几几乎乎各各占占一一半半;收收入入数数据据的的二二分分之之一一分分位位数数在在均均值值的的左左边边,说说明明大大部部分分人人的的收收入入低低于于平平均均收收入入。另另外外,10号号家家庭庭的的收收入入是一个极端值,它不具有代表性。是一个极端值,它不具有代表性。 STATSTATSTATSTATSASSAS软件与统计应用教程

49、软件与统计应用教程4. 4. 绘制马赛克图绘制马赛克图 选选择择“Analyze(分分析析)”“Box Plot/Mosaic Plot (Y)(盒盒形形图图/马马赛赛克克图图)”命命令令,可可以以对对分分类类变变量量作作马马赛赛克克图图。下下面面以以2.2.2中中修修改改过过的的数数据据集集sryzc为为例例,作作出出R_Id变量和变量和Income_freq变量的马赛克图。变量的马赛克图。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4. 4. 绘制马赛克图绘制马赛克图首先将首先将R_Id变量改为变量改为“列名型列名型”(参见图(参见图2-33左)。左)。

50、 选选择择菜菜单单“Analyze(分分析析)”“Box Plot/Mosaic Plot (Y)( 盒盒 形形 图图 /马马 赛赛 克克 图图 ) ”, 打打 开开 “Box Plot/Mosaic Plot (Y)”对对话话框框。在在数数据据集集sryzc的的变变量量列列表表中中,选选择择R_Id变变量量,然然后后单单击击“Y”按按钮钮,R_Id变变量量被选定,单击被选定,单击“OK”按钮,得到结果如图按钮,得到结果如图2-38所示。所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5. 5. 绘制散点图绘制散点图 选选择择菜菜单单“Analyze”“S

51、catter Plot (Y X)”,打打开开“Scatter Plot (Y X)”对对话话框框。在在变变量量列列表表中中,选选择择Income,单单击击“Y”按按钮钮,Income变变量量被被选选定定为为Y轴轴变变量量,选选择择Outgo,单单击击“X”按按钮钮,Outgo变变量量被被选选定定为为X轴变量,如图左所示。轴变量,如图左所示。 单单击击“OK”按按钮钮,即即可可得得到到散散点点图图如如图图右右所所示示。可可以以看出收入与支出有一定的线性相关关系。看出收入与支出有一定的线性相关关系。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 在在数数据据集

52、集窗窗口口选选中中所所有有1号号地地区区的的观观测测号号,图图2-40是是在在散散点点图图中中区区分分两两个个地地区区的的情情况况,细细点点为为2号号地地区区,粗粗点点为为1号号地地区区。从从该该图图可可以以看看出出1号号地地区区比比2号号地地区区在在收收入和支出水平上都要高出许多。入和支出水平上都要高出许多。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程6. 6. 绘制线图绘制线图 选选择择菜菜单单“Analyze(分分析析)”“Line Plot (Y X)(分分布布)”,打打开开“Line Plot (Y X)”对对话话框框。在在数数据据集集sryzc的

53、的变变量量列列表表中中,选选择择ID变变量量,单单击击“X”按按钮钮,ID变变量量被被选选定定为为X轴轴,然然后后选选择择Income变变量量,单单击击“Y”按按钮钮,如如图图左左所所示示。单单击击“OK”按按钮钮,即即可可得得到到线线图图如如图右所示。图右所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 若若在在“Line Plot (Y X)”对对话话框框中中,将将ID变变量量选选定定为为X轴轴,选选择择Income变变量量和和Outgo变变量量,单单击击“Y”按按钮钮。单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中选

54、选择择“Labels(标标签签)”选选项项,如如图图左左所所示示,以以便便输输出出的的图图形形显显示示中中文文标标签签名名。两两次次单单击击“OK”按按钮钮,得得到到关关于于Income变量和变量和Outgo变量的复式线图(图右)。变量的复式线图(图右)。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.2 用用“分析家分析家”绘制统计图形绘制统计图形1. 1. 绘制饼图绘制饼图 在在“分析家分析家”中打开数据集中打开数据集mylib.sryzc。 选选择择主主菜菜单单“Graphs”“Pie Chart”,打打开开“Pie Chart”对对话话框框,选

55、选择择变变量量列列表表中中的的Income,单单击击“Chart”按按钮钮,选选定定分分析析变变量量,如如图图左左所所示示。所所得得饼饼图如图右所示。图如图右所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 绘制条形图绘制条形图 选选择择主主菜菜单单“Graphs”“Bar Chart”“Horizontal”,打打开开“Horizontal Bar Chart”对对话话框框,选选择择变变量量列列表表中中的的INCOME,单单击击“Chart”按按钮钮,选选定定分分析析变变量量,选选择择R_ID变变量量,单单击击“Stack By”按按钮钮,再

56、再选选中中3-D选选项项,如如图图左左所所示示。单单击击“OK”按钮,得到水平条形图,如图右所示。按钮,得到水平条形图,如图右所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.3 编程绘制统计图编程绘制统计图 SAS可可以以把把存存贮贮在在SAS数数据据集集中中的的数数据据以以图图形形的的方方式式形形象象直直观观地地显显示示出出来来。在在SAS/GRAPH模模块块的的支支持持下下,SAS可可以以作作散散点点图图、曲曲线线图图、直直方方图图、扇扇形形图图、三三维维曲曲面图、等高线图、地图,等等。面图、等高线图、地图,等等。STATSTATSTATST

57、ATSASSAS软件与统计应用教程软件与统计应用教程1. GCHART1. GCHART过程过程(1) 语法格式语法格式 GCHART过过程程用用于于绘绘制制直直方方图图、饼饼形形图图(扇扇形形图图)、三维直方图等表示变量分布的图形。其语法格式为:三维直方图等表示变量分布的图形。其语法格式为:PROC GCHART DATA = ; /RUN;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 GCHART过过程程可可以以使使用用的的图图形形关关键键字字及及其其所所绘绘制制的的图形类型见表图形类型见表2-5。 图图形形关关键键字字后后的的变变量量名名用用以以指指定

58、定进进行行图图形形描描述述时时的的分分组组变变量量,可可以以是是数数值值型型的的(此此时时以以各各组组的的组组中中值值为为分分组组的标志),也可以是字符型的。的标志),也可以是字符型的。图形关键字绘制的图形类型图形关键字绘制的图形类型block方块图pie饼形图hbar水平的条形图pie3d三维饼形图hbar3d水平的三维条形图donut环形图vbar竖立的条形图star星形图vbar3d竖立的三维条形图STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程选项比较重要的有:选项比较重要的有: TYPE = 统统 计计 量量 关关 键键 字字 , 表表 示示 以以 图

59、图 形形 对对 变变 量量(SUMVAR所所指指定定的的变变量量)的的哪哪一一种种统统计计量量进进行行描描述述,比比如如频频数数(FREQ)、均均数数(MEAN)、总总计计(SUM)、频数百分比(频数百分比(PCTN)等;)等; SUBGROUP = 变变量量名名(分分组组变变量量),指指定定要要进进行行分分组(各组段内再分组)的变量;组(各组段内再分组)的变量; SUMVAR = 变变量量名名(数数值值变变量量),指指定定要要进进行行统统计计计计算算的的变变量量,也也就就是是“TYPE = 统统计计量量关关键键字字”选选项项中中统统计量的计算所依据的变量。计量的计算所依据的变量。STATST

60、ATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2) 画条形图(直方图)画条形图(直方图) 使使用用VBAR关关键键字字可可以以画画条条形形图图。例例如如,画画出出数数据据集集Mylib.sryzc中中Income变量的条形图的代码如下:变量的条形图的代码如下:proc gchart data = mylib.sryzc; vbar Income;run; 结果如图所示。结果如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 其其中中绘绘图图用用的的变变量量用用VBAR语语句句给给出出,如如果果把把VBAR改改成成HBAR则则条条形

61、形方方向向变变为为横横向向。用用GCHART绘绘制制的的条条形形图图和和在在INSIGHT中中绘绘制制的的直直方方图图有有所所不不同同,它它在在横横轴轴标标的的是是区区间间的的中中点点值值,而而在在INSIGHT中中横横轴轴标标的的是区间的端点值。是区间的端点值。 可可以以指指定定分分组组的的变变量量,例例如如在在每每个个区区段段内内再再分分段段,可可以用如下代码:以用如下代码:proc gchart data = mylib.sryzc; vbar Income / subgroup = R_Id;run; 结果如图所示。结果如图所示。STATSTATSTATSTATSASSAS软件与统计应

62、用教程软件与统计应用教程 (3) 画三维条形图画三维条形图 使使用用BLOCK关关键键字字可可以以画画三三维维条条形形图图。例例如如,画画出出数数据据集集mylib.sryzc中中Income变变量量的的三三维维条条形形图图的的代代码码如如下:下:proc gchart data = mylib.sryzc; block Income/ group = R_Id;run; 结果如图所示。结果如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(4) 画饼形图画饼形图 使使用用PIE关关键键字字可可以以画画饼饼形形图图,PIE3D关关键键字字可可以以画画三三

63、维维饼饼形形图图。例例如如,画画出出数数据据集集mylib.sryzc中中Income变变量的三维饼形图的代码如下:量的三维饼形图的代码如下:proc gchart data = mylib.sryzc; PIE3D Income;run; 结果如图所示。结果如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 使用使用GPLOTGPLOT过程绘制散点图和连线图过程绘制散点图和连线图 通常用散点图和连线图可以表示:通常用散点图和连线图可以表示: 一个变量随另一个变量的变化;一个变量随另一个变量的变化; 变量之间的关系;变量之间的关系; 数据值的分

64、布。数据值的分布。(1) GPLOT过程的一般格式过程的一般格式PROC GPLOT DATA = ; PLOT * = /; SYMBOLn ;RUN;常用的选项见表常用的选项见表2-6。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表2-6 PLOT语句的选项选项意义说明FRAM | NOFRAM在图形四周加入或不加入边框缺省为加入CFRAM = 颜色边框内的颜色缺省为白色AUTOHREF(AUTOVEREF)在水平(垂直)轴的每个主刻度处加入水平(垂直)参考线NOAXIS取消坐标轴及相关的图形元素CAXIS = 颜色设定轴的颜色CTEXT = 颜色设定与

65、轴相关字符的颜色HAXIS = 值列举设定水平轴主刻度的值VAXIS = 值列举设定垂直轴主刻度的值STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 SYMBOL语语句句用用来来控控制制表表示示点点的的符符号号和和点点间间的的连连线线。其其中中n是是不不同同SYMBOL语语句句的的序序号号,可可以以是是1-99,缺缺省省为为1。选项见表。选项见表2-7。表2-7 SYMBOL语句的选项选项意义取值V = 符号表示点使用的符号plus, x, star, square, diamond, triangle, hash, y, z, paw, point, dot,

66、 circleC = 颜色表示点的符号及连线的颜色black, red, green, blue, cyan, magenta, gray, pink, orange, brown, yellowCV =颜色专指点的符号的颜色H = n指名符号的大小单位有:cell, cm, pct, pt, inPOINTLABEL在点的附近表明Y轴变量的值i = 连线方式指明连线的方式none, join, spline, needleCI = 颜色专指连线的颜色L = nn为线型的序号0 空白线,1 - 实线,2 虚线 W = nn表示线的宽度STATSTATSTATSTATSASSAS软件与统计应用教

67、程软件与统计应用教程(2) 散点图 绘制家庭总收入对家庭总支出的散点图,代码如下:绘制家庭总收入对家庭总支出的散点图,代码如下:proc gplot data = mylib.sryzc; plot Income*outgo;run; 结结果果显显示示了了一一个个GRAPHICS窗窗口口,绘绘出出了了以以Income为纵轴、以为纵轴、以Outgo为横轴的散点图(见图)。为横轴的散点图(见图)。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 可可以以在在图图中中按按第第三三个个变变量量分分组组画画出出散散点点图图(如如图图2-48右),代码如下:右),代码如下:

68、proc gplot data = mylib.sryzc; plot Income*outgo = r_id; symbol1 color=black v = star; symbol2 color=blue v = dot;run;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3) 连线图连线图 为为了了绘绘制制连连线线,只只要要在在SYMBOL语语句句中中指指定定i = join。例例如如绘绘制制家家庭庭总总收收入入对对家家庭庭编编号号的的连连线线图图(图图2-49左左),代码如下:代码如下:proc gplot data = mylib.sryzc;

69、 plot Income*id; symbol i=join v=star;run;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 也也可可以以分分地地区区绘绘制制家家庭庭总总收收入入对对家家庭庭编编号号的的连连线线图图(图(图2-49右),代码如下:右),代码如下:proc gplot data = mylib.sryzc; plot Income*id=r_id; symbol1 color=black i=join v = star; symbol2 color=blue i=join v = dot;run;STATSTATSTATSTATSASSAS

70、软件与统计应用教程软件与统计应用教程2.4.4 图形的调整与输出图形的调整与输出 在在图图形形中中也也可可以以用用TITLE语语句句和和FOOTNOTE语语句句给给图形加标题和脚注。图形加标题和脚注。 还还可可以以在在图图形形的的标标题题、标标签签中中使使用用TrueType字字型型的的汉字,例如:汉字,例如:goptions ftext=宋体 htitle=4 cells htext=3 cells;proc gplot data=sasuser.class; title 试验SAS图形的汉字功能; symbol i=none v=square; plot weight*height; la

71、bel weight=体重 height=身高;run; 输输出出结结果果见见图图。其其中中GOPTIONS中中的的FTEXT选选项项指指定图形中文本的字体。定图形中文本的字体。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 为为了了把把GRAPH绘绘制制的的图图形形保保存存为为兼兼容容的的图图形形文文件件,只只要要在在显显示示某某一一页页图图形形输输出出时时,选选“File-Export”菜菜单单,在在出出现现的的输输入入文文件件名名的的窗窗口口选选择择适适当当的的文文件件类类型型,如如BMP、WMF、JPEG、PS,等等。,等等。 要要打打印印GRAPH生生成成的的图图形形,只只要要选选“File-Print”。这这样样用用Windows的的打打印印驱驱动动程程序序与与SAS/GRAPH的的图图形形驱驱动动配配合合来来打打印印。另另外外,SAS/GRAPH模模块块还还提提供供了了许许多多种种打打印印机机的的独独立立的的驱驱动动程程序序,可可以以不不依依赖赖于于Windows的打印驱动,具体请参考有关资料或帮助。的打印驱动,具体请参考有关资料或帮助。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程sadfsfsf

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号