第二章SAS的描述统计功能

上传人:m**** 文档编号:587963789 上传时间:2024-09-07 格式:PPT 页数:80 大小:949.50KB
返回 下载 相关 举报
第二章SAS的描述统计功能_第1页
第1页 / 共80页
第二章SAS的描述统计功能_第2页
第2页 / 共80页
第二章SAS的描述统计功能_第3页
第3页 / 共80页
第二章SAS的描述统计功能_第4页
第4页 / 共80页
第二章SAS的描述统计功能_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《第二章SAS的描述统计功能》由会员分享,可在线阅读,更多相关《第二章SAS的描述统计功能(80页珍藏版)》请在金锄头文库上搜索。

1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第二章 SAS的描述统计功能n2.1 描述性统计的基本概念描述性统计的基本概念n2.2 在在SAS中计算统计量中计算统计量n2.3 统计图形统计图形罗顺叠酞荆真慢皆呀香骨伍氖躇扳杨充拜拭邹猖覆撩权褐颅诈庭怎蒜蚤尺第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.1 2.1 描述性统计的基本概念描述性统计的基本概念n2.1.1 2.1.1 统计学的基本概念统计学的基本概念n2.1.2 2.1.2 表示数据位置的统计量表示数据位置的

2、统计量n2.1.3 2.1.3 表示数据分散程度的统计量表示数据分散程度的统计量n2.1.4 2.1.4 表示数据分布形状的统计量表示数据分布形状的统计量n2.1.5 2.1.5 其它统计量其它统计量搅洁啤笼要蔚鹰畔登腑榴坊骋长喘芍轨莫栋险打饼叶遣垂乙暂峭顶扦耘渔第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.1 统计学的基本概念统计学的基本概念1. 1. 总体与样本总体与样本 总总体体(population):总总体体是是指指所所研研究究对对象象的的全全体体组组成成的集合。的集合。 样样本本(samp

3、le):样样本本是是指指从从总总体体中中抽抽取取的的部部分分对对象象(个个体体)组组成成的的集集合合。样样本本中中包包含含个个体体的的个个数数称称为为样样本本容容量量。容容量量为为n的的样样本本常常用用n个个随随机机变变量量X1,X2,Xn表表示示,其其观观测测值值(样样本本数数据据)则则表表示示为为x1,.,xn,为为简单起见,有时不加区别。简单起见,有时不加区别。鲁专潘近奢爸写硫征诊滑首工斋晴射准呸剐蛇阵庸散戍蠕楚楼驴徘蚁亩矿第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 参数与统计量参数与统计

4、量 参参数数(parameter):参参数数是是用用来来描描述述总总体体特特征征的的概概括括性性值值。如如总总体体平平均均值值()、总总体体方方差差( 2)、总总体体比比例(例()等。)等。 统统计计量量(statistics):统统计计量量是是用用来来描描述述样样本本特特征征的的概概括括性性值值。如如样样本本均均值值( )、样样本本方方差差(s2)、样样本本比比例(例(P)等。)等。敖切书缮汗郧蛊执尽抿赊葫汛殿石垛芒壕涟厚赤坛郸船螺敌鸵沽草侍伸维第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.2 表示

5、数据位置的统计量表示数据位置的统计量 如如果果要要用用简简单单的的数数字字来来概概括括一一组组观观测测数数据据x1,.,xn,可可以以使使用用“位位置置统统计计量量”来来作作为为数数据据的的总总体体代代表表,常常见的位置统计量有:均值、中位数、分位数、众数等。见的位置统计量有:均值、中位数、分位数、众数等。1. 1. 均值(均值(MeanMean) 均均值值是是所所有有观观测测值值的的平平均均值值,是是描描述述数数据据取取值值中中心心位位置的一个度量:置的一个度量:创盏弟洗哇宵榨详础尽稗助霄弘撵富淤厨掉钻吟维透馈洋拒凌此狐炼君贴第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTA

6、TSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 中位数(中位数(MedianMedian或或MedMed) 中中位位数数是是描描述述观观测测值值数数据据中中心心位位置置的的统统计计量量,大大体体上上比比中中位位数数大大(小小)的的数数据据为为观观测测值值的的一一半半。中中位位数数的的一一个个优优点点是是它它不不受受个个别别极极端端数数据据的的影影响响,具具有有稳稳健健性性。中中位位数数的的计计算算方方法法是是:首首先先将将数数据据从从小小到到大大排排序序为为:x(1),.,x(n),然后计算,然后计算佬忱烛实坝氮语敢霉折磷循密睡络卖割谭定饼府弱绳魄熙瞳报念竖芽沸喂

7、第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 众数(众数(ModeMode) 观观测测值值中中出出现现最最多多的的数数称称为为众众数数。众众数数用用得得不不如如均均值值和和中中位位数数普普遍遍。在在属属性性变变量量分分析析中中,常常需需考考虑虑频频数数,因因此众数用得多些。此众数用得多些。4. 4. 百分位数(百分位数(PercentilePercentile) 分分位位数数也也是是描描述述数数据据分分布布和和位位置置的的统统计计量量。0.5分分位位数数就就是是中中位位数数,0.75分分位位数数和

8、和0.25分分位位数数又又分分别别称称为为上上、下四分位数,并分别记为下四分位数,并分别记为Q3和和Q1。掣缨蝶救耕兰助男埠吭傲噎剪堑逛袖柯心聪混啪缨蚀毅晾忽创规胯头凯缎第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.3 表示数据分散程度的统计量表示数据分散程度的统计量1. 1. 极差(极差(RangeRange)与半极差()与半极差(Interquartile rangeInterquartile range) 极差就是数据中的最大值和最小值之间的差:极差就是数据中的最大值和最小值之间的差:极差极差

9、= maxxi minxi 上上、下下四四分分位位数数之之差差Q3 Q1称称为为四四分分位位极极差差或或半半极极差,它描述了中间半数观测值的散布情况。差,它描述了中间半数观测值的散布情况。2. 2. 方差(方差(VarianceVariance或或VarVar) 方方差差是是由由各各观观测测值值到到均均值值距距离离的的平平方方和和除除以以观观测测量量减减1:垛在淡恐自般玛芦绑析卖潜川卓违燎蹬渣桓蔷蔗赵赣悔慧感竟焙存摩顶续第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 标准差(标准差(Standard

10、 deviationStandard deviation或或Std DevStd Dev) 方差的开方称为标准差:方差的开方称为标准差: 标准差的量纲与原变量一致。标准差的量纲与原变量一致。4. 4. 变异系数(变异系数(Coefficient of VariationCoefficient of Variation或或CVCV) 变变异异系系数数是是将将标标准准差差表表示示为为均均值值的的百百分分数数,是是观观测测数数据据分分散散性性的的一一个个度度量量,它它在在比比较较用用不不同同单单位位测测量量的的数数据据的分散性时是有用的:的分散性时是有用的:地僻游嘘惶株证种忻箔痒掺杰艺鸵遏隐累壮挽惺

11、铬还鸡哮龟纵炊胚谈雀遍第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.4 表示数据分布形状的统计量表示数据分布形状的统计量 偏度和峰度是描述数据分布形状的指标。偏度和峰度是描述数据分布形状的指标。1. 1. 偏度(偏度(skewnessskewness) 偏度是刻画数据对称性的指标。偏度的计算公式为:偏度是刻画数据对称性的指标。偏度的计算公式为: 在在SAS中:中: 关于均值对称的数据其偏度为关于均值对称的数据其偏度为0; 左侧更为分散的数据,其偏度为负,称为左偏;左侧更为分散的数据,其偏度为负,称为左

12、偏; 右侧更为分散的数据,其偏度为正,称为右偏。右侧更为分散的数据,其偏度为正,称为右偏。哗喳闪琴煞寂坍醛柬响耗硬颖晨猛氛朗瘸铰辽巨电句排曹侦露明稿程汗窗第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 峰度(峰度(kurtosiskurtosis) 峰峰度度描描述述数数据据向向分分布布尾尾端端散散布布的的趋趋势势。峰峰度度的的计计算算公公式为:式为: 利利用用峰峰度度研研究究数数据据分分布布的的形形状状是是以以正正态态分分布布为为标标准准(假假定定正正态态分分布布的的方方差差与与所所研研究究分分布布

13、的的方方差差相相等等)比比较较两端极端数据的分布情况,若两端极端数据的分布情况,若 近似于标准正态分布,则峰度接近于零;近似于标准正态分布,则峰度接近于零; 尾部较正态分布更分散,则峰度为正,称为轻尾;尾部较正态分布更分散,则峰度为正,称为轻尾; 尾部较正态分布更集中,则峰度为负,称为厚尾。尾部较正态分布更集中,则峰度为负,称为厚尾。遍赘徘望苛论弓寻舍厚牌潮蔗鬃畸订琵特凸逸育垃误帅遇凶肮赊遂拣拉巳第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.5 其它统计量其它统计量1. 1. 均均值值的的标标准准误误

14、(Std Std Error Error MeanMean或或Std Std MeanMean或或Std Std errorerror)2. 2. 校正平方和(校正平方和(Corrected sum of squaresCorrected sum of squares)访掣练聊掩衷做困左堂地澈溅峪铡圭箕掌鲜赊檬团哗叔抗严谰回豁悦较令第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 未校正平方和(未校正平方和(Uncorrected sum of squaresUncorrected sum of sq

15、uares)4. 4. k k阶原点矩阶原点矩其中其中A1即为均值即为均值 。5. 5. k k阶中心矩阶中心矩慷湖啊徽沪鱼厌追勘裴舵烬塘袋藕箭左唉燕膛谆该雷钨艳装骤瘦院秽咏阿第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.2 2.2 在在SASSAS中计算统计量中计算统计量n2.2.1 用用INSIGHT计算统计量计算统计量n2.2.2 用用“分析家分析家”计算统计量计算统计量n2.2.3 编程实现描述性统计编程实现描述性统计亡迢索楞炉舔披骗切刁划岸好吨郡绵翰刃茵增购天察殆坍撑懂唾油示勿忌第二章SAS的

16、描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.1 用用INSIGHT计算统计量计算统计量 INSIGHT可以非常方便地计算各种统计量。可以非常方便地计算各种统计量。1. 1. 实例数据实例数据【例例2-1】表表2-1为为两两个个不不同同地地区区居居民民家家庭庭收收入入和和支支出出情情况况的的抽抽样样调调查查(单单位位:元元),试试分分别别统统计计收收入入和和支支出出情情况。况。将将表表2-1中中数数据据通通过过Excel导导入入到到SAS数数据据集集Mylib.sryzc中中,4个个变变量量名名分分别别为为:ID、

17、R_ID、Income和和Outgo,相相应应的的标标签签名名为为家家庭庭编编号号、地地区区编编号号、家家庭庭总总收收入入和和家家庭总支出。庭总支出。剩橇溅虹嵌散恋端旱腋知默垄扰焚灯趾丹歌寝依轩你哆汲苍爪弥磐涌留讫第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程家庭编号地区编号家庭总收入家庭总支出家庭编号地区编号家庭总收入家庭总支出1217941550162220020602217161365171273022363134102730181249614554217651530191176010405221841

18、90020128202366622050205021222501966722460218422131702400811976117023212001250912850249624217761350101427527602521980179411220101275261245525501212236181027210801380131330528202821986120014124001976291336923051522250197030215301316昌端搬酣拓瞬诫迪泰伎朱滞谁磨子拽眨蛙敲刑锨带泊刘醚称航崭贬汪洞嘲第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTAT

19、STATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 在在INSIGHTINSIGHT中打开数据集中打开数据集 在在 菜菜 单单 中中 选选 择择 “Solution( 解解 决决 方方 案案 )”“Analysis( 分分 析析 ) ”“Interactive Data Analysis(交交互互式式数数据据分分析析)”,打打开开“SAS/INSIGHT Open”对对话话框框,在在对对话话框框中中选选择择数数据据集集:Mylib.sryzc,单单击击“Open(打打开开)”按按钮钮,即即可可在在INSIGHT中中打打开开数数据窗口,如图所示。据窗口,如图所示。扯舶抄瓜沙扣徽辱

20、漾除咆栗现逆庸羹雾一伞前终噪笋蝴椰孟凶料携狙尚嚷第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 计算统计量计算统计量 选选 择择 菜菜 单单 “Analyze( 分分 析析 ) ”“Distribution (Y)(分分布布)”,打打开开“Distribution (Y)”对对话话框框。在在数数据据集集sryzc的的变变量量列列表表中中,选选择择Income为为分分析析变变量量,选择选择R_Id,为分组变量。,为分组变量。 单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中

21、中包包含描述性统计量选项。含描述性统计量选项。 酌彝炭答决饼售锅辉诣襄凡柯孪搔攀照谢半涸败歹潘殉帐供神歉高陈亿附第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 选选择择选选项项矩矩统统计计量量和和分分位位数数,取取消消默默认认的的选选项项:“Box Plot/Mosaic Plot”和和“Histogram/Bar Chart”,单单击击“OK”按按钮钮,即即可可得得到到变变量量Income按按“R_Id”分分组组的的各各种种矩矩统统计计量量(Moments)和和分分位位数数(Quantiles),如如图所示

22、。图所示。矩豹轩韵豢彤然慎暮撇阉些滓沉缩似理批厘傀腻暇瓷慎氨炎玻瞒嚣垂易吓第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.2 用用“分析家分析家”计算统计量计算统计量1. 1. 启动启动“分析家分析家” 选选 择择 主主 菜菜 单单 “Solutions( 解解 决决 方方 案案 )”“Analysis(分分析析)”“Analyst(分分析析家家)”,打开,打开“分析家分析家”窗口。窗口。 选选 择择 主主 菜菜 单单 “File( 文文 件件 ) ”“Open By SAS Name”,打打开开“Se

23、lect A Member”对对话话框框,选选择择数数据据集集Mylib.sryzc。闪剃吾渺又湿氏滓辕家铂狡节段痊爹涨碎舔独摔宋侥杭种俱汉窖捉怜蘑烽第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 通通过过Summary Summary StatisticsStatistics菜菜单单计计算算描描述述性性统统计计量量 选选择择主主菜菜单单“Statistics(统统计计)”“Descriptive( 描描 述述 性性 统统 计计 ) ”“Summary Statistics(汇汇总总统统计计量量)”

24、,打打开开“Summary Statistics”对对话话框框,选选择择变变量量列列表表中中的的Income,单单击击“Analysis”按钮,选定分析变量,如图所示。按钮,选定分析变量,如图所示。铃斗写靴座眩硫颤襟膜稳诉潮吓馈羞仰壁涪描探毯澜箔和休茂埃蚕盾撂三第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程单单击击“Statistics”按按钮钮,打打开开“Summary Statistics:Statistics”对对话话框框。对对话话框框中中列列出出可可以以计计算算的的所所有有统统计计量(如右图所示)。量

25、(如右图所示)。描述性统计量如下图所示。描述性统计量如下图所示。勤咕残粤吼旁耍老僳铺仑休澄若萨回践绞脂腰如等闻拧汗吩邵塔匈缸寓土第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 通过通过DistributionsDistributions菜单计算描述性统计量菜单计算描述性统计量 选选择择主主菜菜单单“Statistics(统统计计)”“Descriptive(描描述述性性统统计计)”“Distributions(分分布布)”,打打开开“Distributions”对对话话框框,选选择择变变量量列列表表

26、中中的的Income,单击,单击“Analysis”按钮,选定分析变量。按钮,选定分析变量。 单单击击“OK”按按钮钮,即即可可得得到到关关于于变变量量Income的的矩矩统统计计量和基本统计测度量和基本统计测度恫芬惺慰胯继倘归齿代副夺英棋荫焦虽扯丛硷涛哄言架蛊烹洁晓靶身遥乱第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.3 编程实现描述性统计编程实现描述性统计 SAS提提供供有有多多个个不不同同的的过过程程来来实实现现统统计计量量的的计计算算,它它们们在在功功能能范范围围上上有有许许多多的的重重复复,

27、下下面面介介绍绍用用FREQ、MEANS和和UNIVARIATE这这三三个个过过程程来来计计算算简简单单的的描描述述统计量。统计量。 FREQ过过程程常常用用来来计计算算分分类类变变量量取取值值的的频频数数,而而MEANS和和UNIVARIATE过过程程则则对对数数值值型型变变量量计计算算均均值值、标准差等统计量。标准差等统计量。力晓饥烧郊逛陨崖跳锰加浴摘港孕肘板魂尉级妄楼力池驶殆泞铬甸捕校深第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1. FREQ1. FREQ过程过程 FREQ过过程程包包括括多多个个控

28、控制制频频数数输输出出与与检检验验的的语语句句和和选选项,格式如下:项,格式如下:PROC FREQ DATA = ; TABLES ; FORMAT . . ;RUN; 其其中中PROC FREQ语语句句调调用用FREQ过过程程,标标志志FREQ过程的开始;过程的开始; TABLES语语句句用用于于创创建建有有关关变变量量所所构构成成的的各各种种表表格格并并进行相应的假设检验和计算,可以多次使用。进行相应的假设检验和计算,可以多次使用。接滩郸桥裙塘丑企佰周浚丁牌绳酣冷杰迢爵临虽蓟获泄副覆并两裤舒镭从第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSA

29、S软件与统计应用教程软件与统计应用教程 例例如如,统统计计数数据据集集Mylib.sryzc中中变变量量R_Id和和Income频数的代码如下:频数的代码如下:proc freq data = mylib.sryzc; tables R_Id Income;RUN; 显示结果如图所示。显示结果如图所示。瑶八掇默仿锗腆踢桥烯曳煽非泡广藩顷两颐凑施般茬刃褒叮校寿结烘刁犹第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. MEANS2. MEANS过程过程(1) 语法格式语法格式 MEANS过程的一般格式:过程的一

30、般格式:PROC MEANS DATA=; VAR ; BY ; CLASS ;RUN;凤橱疗械坏岭郭故孝筛漂恢答职绰陵酚欧枢迟而呜求厩另斋馆裕叛胸赁戴第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 PROC MEANS语语句句后后的的选选项项主主要要用用来来指指定定所所要要计计算算的的统统计计量量,默默认认情情况况下下,MEANS过过程程会会给给出出频频数数、均均数数、标标准准差差、最最大大值值和和最最小小值值等等,其其余余统统计计量量的的计计算算均均需要在选项中指定。需要在选项中指定。 VAR语语句句引引

31、导导所所要要进进行行分分析析的的所所有有变变量量的的列列表表,SAS将将对对VAR语语句句所所引引导导的的所所有有变变量量分分别别进进行行描描述述性性统统计计分分析。析。 BY语语句句与与CLASS语语句句所所指指定定的的分分类类变变量量用用来来进进行行分分组统计,但输出格式不同。组统计,但输出格式不同。迄硅它闹县忆履意召嚷玩肘沽擅愿藏瓣绎峨技哇违锡派鸵删磕软仔睦蒋室第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 如如对对数数据据集集Mylib.sryzc中中的的Income变变量量计计算算简简单单统统计计量

32、,只要用如下量,只要用如下MEANS过程:过程:proc means data = mylib.sryzc; var Income;run; 结果如图结果如图2-15所示。所示。线轻愧苇栅耻棱锥略徒辆旁裳税蚁堆酗哮会叭膘凡坪瑞耪歹皂猛搐掺假菏第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2) 使用统计量关键字列表使用统计量关键字列表 在在PROC MEANS语句中使用统计量关键字列表:语句中使用统计量关键字列表:proc means data = mylib.sryzc n mean median p1 p

33、5 p95 p99 q1 q3 max min; var Income;run; 结果如图结果如图2-16所示。所示。诱兄豫株啪痕得琢羽删竞恰娇懈涩词佩饥楼瘴壤沮膨界册姿助操猪棺逛度第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 可以计算的描述性统计量关键字及其含义见下表。可以计算的描述性统计量关键字及其含义见下表。关键字所代表的含义关键字所代表的含义n有效数据记录数range极差nmiss缺失数据记录数skewness偏度mean均值kurtosis峰度std标准差t分布位置假设检验之t统计量stderr标

34、准误probt上述t统计量对应的概率值var方差q1第一四分位数median中位数q3第三四分位数mode众数qrange四分位数间距cv变异系数p1第一百分位数max最大值p5第五百分位数min最小值p10第十百分位数sum总计p90第九十百分位数sumwgt加权值总计p95第九十五百分位数css校正平方和p99第九十九百分位数uss未校正平方和割城秉燥赢踏札峦拽幅篡仑抒草新呼幅厘削栓习穷梗它捐钳牡蛔疚瘟怨坝第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3) 使用使用CLASS语句和语句和BY语句语句 使

35、使用用CLASS语语句句和和BY语语句句可可以以分分组组计计算算分分析析变变量量的的描描述述统统计计量量值值,由由CLASS语语句句和和BY语语句句指指定定的的变变量量在在分分析析中中起起分分组组(类类)的的作作用用,被被称称为为分分类类变变量量。两两个个语语句的区别是:句的区别是: 使使用用BY语语句句时时要要求求数数据据集集须须按按BY变变量量排排序序,使使用用CLASS语句无此要求。语句无此要求。 使使用用BY语语句句时时输输出出按按BY变变量量的的每每个个值值分分别别提提供供一一个表,使用个表,使用CLASS语句则将所有结果排列在一个表之中。语句则将所有结果排列在一个表之中。禹尹清帅惊

36、尔避杰皑户为钧深窘堵堆单丈跺扣骋先擦配惮斤柞侮瘤借久英第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 使使用用BY语语句句之之前前先先排排序序,如如下下代代码码可可以以在在上上例例中中按按变量变量R_Id分组统计:分组统计:proc sort data = mylib.sryzc; by R_Id;run;proc means data = mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min; var Income; by R_Id;run;蛰玄索录诉椎

37、贱越惠顶崩懦化赘寇恒砷们旁钡胜稻钟孪埃落葛字蹿逃粘应第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 使使用用CLASS语语句句分分组组较较为为简简单单,如如下下代代码码也也可可以以在在上上例中按变量例中按变量R_Id分组统计:分组统计:proc means data = mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min; var Income; class R_Id;RUN;暮酸模女焕全瞩展写赡辱忿鼎臆积肇辗畔火遭淄宝蜗穴歉漠募澡长奶扶壹第二章SAS的

38、描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. UNIVARIATE3. UNIVARIATE过程过程 UNIVARIATE过程的一般格式为:过程的一般格式为:PROC UNIVARIATE DATA = ; VAR ; BY | CLASS ; HISTOGRAM /; OUTPUT OUT = = ;RUN;篮窃挛捂鳃傀范规宋耗对碾象荐邢惶胆葬征毖哄掣漫莉魁宜昭玉戊呜否袁第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 UNIVAR

39、IATE过过程程和和MEANS过过程程的的格格式式非非常常相相似似,相相同同的的语语句句和和选选项项其其含含义义也也相相同同,所所不不同同的的是是某某些些统统计计量量只只能能在在UNIVARIATE过过程程中中计计算算(如如众众数数),而而且且UNIVARIATE过程中具有绘图功能。过程中具有绘图功能。 其其中中,HISTOGRAM语语句句用用来来指指示示SAS对对其其后后所所指指定定的的变变量量绘绘制制直直方方图图,其其后后的的选选项项用用来来指指示示SAS添添加加不不同同类型的拟合图形(如正态分布的分布密度曲线)。类型的拟合图形(如正态分布的分布密度曲线)。郡舵渴贮基揩铜余搁保蚂厕艰栏妓抹

40、涉输姜摊辉抑禹冰叼骨茵沿盅磊变绅第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 输出包括五个部分。输出包括五个部分。 第一部分是矩统计量,各统计量已在第一部分是矩统计量,各统计量已在2.1.1中作了介绍。中作了介绍。 第第二二部部分分为为基基本本的的位位置置和和分分散散程程度度统统计计量量,位位置置统统计计量量包包括括均均值值、中中位位数数、众众数数,分分散散程程度度统统计计量量包包括括标标准准差、方差、极差、四分位间距差、方差、极差、四分位间距 第第三三部部分分为为关关于于均均值值等等于于零零的的三三种种检

41、检验验的的结结果果,包包括括t检验、符号检验和符号秩检验。检验、符号检验和符号秩检验。 第四部分为各个重要的分位数。第四部分为各个重要的分位数。 第五部分是观测数据的五个最低值和五个最高值。第五部分是观测数据的五个最低值和五个最高值。束血荚翔络瓷凉诫率硼绅能伐援妒狡悬且毒棚珐撞刻佬蔓垫绩庙赖院绒洽第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.3 2.3 统计图形统计图形n2.3.1 定量变量的图形表示定量变量的图形表示n2.3.2 分类变量的图形表示分类变量的图形表示冷韧薯僧逾试芽逛扇顺毁插瞄殆炕赣谬相

42、样艳件眼砾蜘壮纱制天婶尊算乌第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.3.1 定量变量的图形表示定量变量的图形表示1. 1. 直方图直方图 对对于于数数值值型型变变量量,常常用用直直方方图图(histogram)来来展展示示变变量量取取值值的的分分布布。将将变变量量取取值值的的范范围围分分成成若若干干区区间间,在在等等间间隔隔区区间间的的情情况况,每每个个区区间间的的长长度度称称为为组组距距。考考察察数数据据落落入入每每一一区区间间的的频频数数与与频频率率,在在每每个个区区间间上上画画一一个个矩矩形形

43、,它它的的宽宽度度是是组组距距,它它的的高高度度可可以以是是频频数数、频频率率或或密密度度(频频率率组组距距),在在高高度度是是密密度度的的情情况况,每每一一矩矩形形的的面面积积恰恰是是数数据据落落入入区区间间的的频频率率,这这种种直直方方图图可可以以估估计计总总体的概率密度。体的概率密度。谰谬卤将搀亡招涡掏赐斧戈渊雾拴嫡浴敦渐命沫浸戴商西诱劝山粹撑酪咙第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程图2-22 密度直方图与频数直方图SAS软软件件会会根根据据样样本本容容量量在在样样本本取取值值范范围围内内自自

44、动动地地确确定定一个分组方式,另外也提供了设定分组的方法。一个分组方式,另外也提供了设定分组的方法。 矛柴耪意牵医嗡荚肖植伞篇糊丙助舟苟导荧派进声娜渤剖侈驼滞弃钦碰哇第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 盒形图盒形图 盒盒形形图图(boxplot,又又称称箱箱图图、箱箱线线图图、盒盒子子图图)是是用用更更为为简简洁洁的的方方法法表表现现数数据据在在数数轴轴上上的的分分布布及及其其特特点点的的图图形。形。 图图2-23的的左左边边是是根根据据居居民民家家庭庭的的收收入入情情况况所所绘绘的的盒

45、盒形形图;右边是分地区情况所绘的盒形图。图;右边是分地区情况所绘的盒形图。 哺惨饥梳靡忆口丘疹垦医裔哼网宁匀贰雍疽诱掀兜谭锄跨赦哦舞磕狠诲断第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 散点图散点图 通通常常得得到到的的数数据据可可能能有有两两个个变变量量,比比如如家家庭庭的的收收入入和和支支出出情情况况的的数数据据,这这里里家家庭庭总总收收入入是是一一个个变变量量,而而家家庭庭总总支支出出是是第第二二个个变变量量。希希望望通通过过图图形形了了解解收收入入和和支支出出的的关关系系,这这时时可可以以

46、用用一一个个变变量量为为横横坐坐标标(如如家家庭庭总总收收入入),另另一一个个为为纵纵坐坐标标(这这里里是是家家庭庭总总支支出出)来来作作图图(图图2-24)。这种图称为散点图)。这种图称为散点图(Scatter Plot)。 仁拍徒闷疹吞缔祝脐崎敬愈韩育焊互贯呛啼抚憾吴眉慑慷诚镀等咆篡佬瘁第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4. 4. 线图线图 线线图图(Line Plot)用用来来表表示示变变量量间间的的取取值值变变化化情情况况,有有单式和复式两种(图单式和复式两种(图2-25)。)。 在在复复

47、式式线线图图中中可可用用不不同同颜颜色色的的实实线线来来标标志志区区别别,如如图图2-25右所示。右所示。 漆故层拣莆沫敛蔓茂钎堕宇票同秦社揣惦辈殊远锗誉致蛋倒炸拈腥芋撞过第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.3.2 分类变量的图形表示分类变量的图形表示 分分类类变变量量也也可可以以通通过过图图形形直直观观地地描描绘绘出出它它们们各各类类的的数数量和所占比例,常用的有条形图、饼图和马赛克图。量和所占比例,常用的有条形图、饼图和马赛克图。1. 1. 条形图条形图 条条形形图图(Bar Chart)给

48、给出出分分类类变变量量取取每每个个值值的的频频数数,如如图图2-26所示为变量所示为变量R_ID取值的条形图。取值的条形图。验澳边曰敏爹汛照该浊僚校拍踪茧蹄柞熏重继厚悉肿召每授疙潘政堰驶邹第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 饼图饼图 通通常常,饼饼图图(Pie Chart)可可以以对对分分类类变变量量描描述述其其频频数数取取值值的的比比例例,对对于于数数值值变变量量,则则像像直直方方图图那那样样应应先先计计算算各各区间取值的频数,再按比例画出。区间取值的频数,再按比例画出。 图图2-27

49、中中给给出出的的是是家家庭庭支支出出分分组组频频数数的的饼饼图图。要要注注意意的是,如果有太多的分组,那么饼图就不那么好看了。的是,如果有太多的分组,那么饼图就不那么好看了。度瞩卷勤惨纷汝雏僚饵椽谋滥饵屋宵药矣桑罐挺培鳃野则讣础僻躁谬哨胰第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 马赛克图马赛克图 马马赛赛克克图图(Mosaic Plot)一一般般不不对对单单个个变变量量作作,而而是是对对两两个个分分类类变变量量来来作作。这这种种图图的的好好处处是是直直观观显显示示了了两两个个变变量每种取值组合

50、的观测个数和比例,如图量每种取值组合的观测个数和比例,如图2-28所示。所示。痛萄杂饺断功祁扑拧蝉老因碾锐鸥艾腑涨估鼓澎帝涡末弗螺弃追攫赚晕吁第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.4 2.4 用用SASSAS绘制统计图形绘制统计图形n2.4.1 用用INSIGHT绘制统计图形绘制统计图形n2.4.2 用用“分析家分析家”绘制统计图形绘制统计图形n2.4.3 编程绘制统计图编程绘制统计图n2.4.4 图形的调整与输出图形的调整与输出毛胰赢赋芜聚径尝灰晌厦聘滇财浆陇远缔施珐押吁敲蝇锡雅仪船瀑淮稠逸第

51、二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.1 用用INSIGHT绘制统计图形绘制统计图形 INSIGHT模模块块可可以以画画出出多多种种统统计计图图形形,而而且且图图形形清清晰晰、美观。美观。1. 1. 绘制直方图绘制直方图 选选择择菜菜单单“Analyze(分分析析)”“Histogram/Bar Chart (Y)(直直方方图图/条条形形图图)”,打打开开“Histogram/Bar Chart (Y)”对对话话框框。在在数数据据集集的的变变量量列列表表中中,选选择择变变量量,然后单击然后单击“

52、Y”按钮。按钮。缚汰成静皆室棉书哮陕骇废储偿旋阿栏斯社笨冗簿呜甚昭喇沸井刀哀浇苛第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中选选择择“Labels(标标签签)”选选项项,如如图图所所示示,以以便便输输出出的的图图形显示中文标签名。单击形显示中文标签名。单击“OK”按钮返回对话框。按钮返回对话框。捅谤奖多赚支蔚她两茶钢宙抉密知泣堂棍遭簇偷仆分鹏蔼知逻伪构窍擞挑第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATST

53、ATSTATSASSAS软件与统计应用教程软件与统计应用教程 单击单击“OK”按钮,即可得到直方图如图按钮,即可得到直方图如图2-30左所示。左所示。 单单击击图图形形框框左左下下角角处处的的三三角角形形,在在打打开开的的菜菜单单中中选选择择“Values(值值)”,即即可可在在图图中中显显示示频频数数值值,如如图图2-30右所示。右所示。 跑捶智触泳挖膀鸵砍醇邱仰釉慈望捉汇檄闷找棵跪舞岛奈水法梧洗救汇圾第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 绘制条形图绘制条形图 INSIGHT模模块块对对

54、分分类类变变量量绘绘制制条条形形图图。首首先先单单击击R_Id变变量量名名上上边边的的变变量量作作用用按按钮钮,在在弹弹出出的的菜菜单单中中选选择择“Nominal(列名型)(列名型)”,如图左所示。,如图左所示。 选选择择菜菜单单“Analyze”“Histogram/Bar Chart (Y)”,打打开开“Histogram/Bar Chart (Y)”对对话话框框。在在数数据据集集的的变变量量列列表表中中选选择择变变量量,然然后后单单击击“Y”按按钮钮,如如图图右右所示。所示。 角浇迟饼贺源赛惮鲤怨伙荡摘胶毙贯簿怕令孵菱淤墩岔卜笆悉上滑君洪砧第二章SAS的描述统计功能第二章SAS的描述统

55、计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中选选择择“Labels(标标签签)”选选项项,单单击击“OK”按按钮钮返返回回对对话话框。框。 单单击击“OK”按按钮钮,即即可可得得到到条条形形图图如如图图2-34左左所所示示。如如果果选选择择Income_freq(见见2.2.2节节)作作为为分分析析变变量量,则则可以得到图可以得到图2-34右所示的条形图。右所示的条形图。 降导陵素盛炎忠蹦毖胳秒裕胜辰鲁赊维胡篱炯徘祥抚盆除甄骗涸极惹伺堤第二章SAS的描述统计功能第二章SAS

56、的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 绘制盒形图绘制盒形图 选选择择菜菜单单“Analyze”“Box Plot/Mosaic Plot (Y)”,可可以以对对区区间间型型变变量量作作盒盒形形图图,对对分分类类型型变变量量作作马马赛赛克克图图。打打开开“Box Plot/Mosaic Plot (Y)”对对话话框框。在在数数据据表表sryzc的的变变量量列列表表中中,选选择择income变变量量,然然后后单单击击“Y”按钮,按钮,income变量被选定,如图左所示。变量被选定,如图左所示。 单单 击击 “Output”按按 钮

57、钮 , 在在 打打 开开 的的 对对 话话 框框 中中 选选 择择“Labels”选项,取消选项,取消“Y Axis Vertical”如图右所示。如图右所示。 勘酗骇趾调憨碍汹镁竿贵驰毅山尔前豢郡广芒搬容影挪虎阅掇感吵终吝幢第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单击单击“OK”按钮,即可得到盒形图如图按钮,即可得到盒形图如图2-36左所示。左所示。 僵嗅碗倦巡轮核外端碍泊棕呆芝枉橇粕缄攫滦尸琵份观梁魁庶惮床丘丫宾第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATS

58、ASSAS软件与统计应用教程软件与统计应用教程在在“Box Plot/Mosaic Plot (Y)”对对话话框框中中选选定定多多个个分分析析变变量量,可可以以将将多多个个盒盒形形图图画画在在一一个个坐坐标标系系下下,这这样样便便于于比比较变量的取值情况,如图所示。较变量的取值情况,如图所示。 图图形形分分析析:从从图图中中可可以以看看到到支支出出数数据据在在均均值值两两边边的的分分布布近近似似对对称称,说说明明低低于于和和高高于于平平均均支支出出的的家家庭庭几几乎乎各各占占一一半半;收收入入数数据据的的二二分分之之一一分分位位数数在在均均值值的的左左边边,说说明明大大部部分分人人的的收收入入

59、低低于于平平均均收收入入。另另外外,10号号家家庭庭的的收收入入是一个极端值,它不具有代表性。是一个极端值,它不具有代表性。 掐厩骤插吠褒巴烹截润堤模千宿篡哟泥猿脯愿钡浴赎剁完订灶瞳美絮财戎第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4. 4. 绘制马赛克图绘制马赛克图 选选择择“Analyze(分分析析)”“Box Plot/Mosaic Plot (Y)(盒盒形形图图/马马赛赛克克图图)”命命令令,可可以以对对分分类类变变量量作作马马赛赛克克图图。下下面面以以2.2.2中中修修改改过过的的数数据据集集s

60、ryzc为为例例,作作出出R_Id变量和变量和Income_freq变量的马赛克图。变量的马赛克图。全纂蝶娇淄螟省撂世韧刨素疾吮黑世齿卡善孟乍桩贸陋维废讨尽狼披话才第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4. 4. 绘制马赛克图绘制马赛克图首先将首先将R_Id变量改为变量改为“列名型列名型”(参见图(参见图2-33左)。左)。 选选择择菜菜单单“Analyze(分分析析)”“Box Plot/Mosaic Plot (Y)( 盒盒 形形 图图 /马马 赛赛 克克 图图 ) ”, 打打 开开 “Box P

61、lot/Mosaic Plot (Y)”对对话话框框。在在数数据据集集sryzc的的变变量量列列表表中中,选选择择R_Id变变量量,然然后后单单击击“Y”按按钮钮,R_Id变变量量被选定,单击被选定,单击“OK”按钮,得到结果如图按钮,得到结果如图2-38所示。所示。琼每评谴嗣痒判宽御绽蚂会针舔饥奋攘溜拣放氟涝钻掐筑艾潞撮碾筷射舆第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5. 5. 绘制散点图绘制散点图 选选择择菜菜单单“Analyze”“Scatter Plot (Y X)”,打打开开“Scatter

62、Plot (Y X)”对对话话框框。在在变变量量列列表表中中,选选择择Income,单单击击“Y”按按钮钮,Income变变量量被被选选定定为为Y轴轴变变量量,选选择择Outgo,单单击击“X”按按钮钮,Outgo变变量量被被选选定定为为X轴变量,如图左所示。轴变量,如图左所示。 单单击击“OK”按按钮钮,即即可可得得到到散散点点图图如如图图右右所所示示。可可以以看出收入与支出有一定的线性相关关系。看出收入与支出有一定的线性相关关系。 旬癣闪泄耀仆扔唱套喇辣妊耗史乙歌字剂舅缕鉴少蚌眶既光网诌睦透俗靠第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS

63、软件与统计应用教程软件与统计应用教程 在在数数据据集集窗窗口口选选中中所所有有1号号地地区区的的观观测测号号,图图2-40是是在在散散点点图图中中区区分分两两个个地地区区的的情情况况,细细点点为为2号号地地区区,粗粗点点为为1号号地地区区。从从该该图图可可以以看看出出1号号地地区区比比2号号地地区区在在收收入和支出水平上都要高出许多。入和支出水平上都要高出许多。反汲秤摩斡敌跨霜镐跃唉独罐佳缕瓮茬娟拿匀铭绝第块醇器凶尸秉稚浮嚷第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程6. 6. 绘制线图绘制线图 选选择择菜

64、菜单单“Analyze(分分析析)”“Line Plot (Y X)(分分布布)”,打打开开“Line Plot (Y X)”对对话话框框。在在数数据据集集sryzc的的变变量量列列表表中中,选选择择ID变变量量,单单击击“X”按按钮钮,ID变变量量被被选选定定为为X轴轴,然然后后选选择择Income变变量量,单单击击“Y”按按钮钮,如如图图左左所所示示。单单击击“OK”按按钮钮,即即可可得得到到线线图图如如图右所示。图右所示。 与隆哥魏储严模妹祖允灰哀蛇孝痰体啪潭僚收庶清惩敌涯忽戍蹦纹菊斟启第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与

65、统计应用教程软件与统计应用教程 若若在在“Line Plot (Y X)”对对话话框框中中,将将ID变变量量选选定定为为X轴轴,选选择择Income变变量量和和Outgo变变量量,单单击击“Y”按按钮钮。单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中选选择择“Labels(标标签签)”选选项项,如如图图左左所所示示,以以便便输输出出的的图图形形显显示示中中文文标标签签名名。两两次次单单击击“OK”按按钮钮,得得到到关关于于Income变量和变量和Outgo变量的复式线图(图右)。变量的复式线图(图右)。 华执己召绰谓占庄木房猪池嚎陇矮声泪窿镍氛逻霞舵廖来壁欧瘴奥

66、正絮渠第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.2 用用“分析家分析家”绘制统计图形绘制统计图形1. 1. 绘制饼图绘制饼图 在在“分析家分析家”中打开数据集中打开数据集mylib.sryzc。 选选择择主主菜菜单单“Graphs”“Pie Chart”,打打开开“Pie Chart”对对 话话 框框 , 选选 择择 变变 量量 列列 表表 中中 的的 Income, 单单 击击“Chart”按按钮钮,选选定定分分析析变变量量,如如图图左左所所示示。所所得得饼饼图如图右所示。图如图右所示。 皖痈尹

67、韶帝一瓣酪狱褥尝辣矽桩俺驼踌屏巡墒剖明据路掌仇魂糟厘闽滋区第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 绘制条形图绘制条形图 选选择择主主菜菜单单“Graphs”“Bar Chart”“Horizontal”,打打开开“Horizontal Bar Chart”对对话话框框,选选择择变变量量列列表表中中的的INCOME,单单击击“Chart”按按钮钮,选选定定分分析析变变量量,选选择择R_ID变变量量,单单击击“Stack By”按按钮钮,再再选选中中3-D选选项项,如如图图左左所所示示。单单击击

68、“OK”按按钮,得到水平条形图,如图右所示。钮,得到水平条形图,如图右所示。 泳傅辅算桨馆盼蝎面纲呆唤玉袁虽璃以饱粮瘪棠墨藕幅耘凉糊瑶滨铰吨佰第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.3 编程绘制统计图编程绘制统计图 SAS可可以以把把存存贮贮在在SAS数数据据集集中中的的数数据据以以图图形形的的方方式式形形象象直直观观地地显显示示出出来来。在在SAS/GRAPH模模块块的的支支持持下下,SAS可可以以作作散散点点图图、曲曲线线图图、直直方方图图、扇扇形形图图、三三维维曲曲面图、等高线图、地图,等

69、等。面图、等高线图、地图,等等。捅淆妈史搪愉堪乌她方徊向踏坝脏坍爵棵貌冒坛器传润典时句皆况呵维激第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1. GCHART1. GCHART过程过程(1) 语法格式语法格式 GCHART过过程程用用于于绘绘制制直直方方图图、饼饼形形图图(扇扇形形图图)、三维直方图等表示变量分布的图形。其语法格式为:三维直方图等表示变量分布的图形。其语法格式为:PROC GCHART DATA = ; /RUN;叔疚吓聪盲仟审乌镰砍耙陷起渍渊镭已耗同宠潜死刀孕缔棕同杯咒赠坑魄第二章SAS的

70、描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 GCHART过过程程可可以以使使用用的的图图形形关关键键字字及及其其所所绘绘制制的的图形类型见表图形类型见表2-5。 图图形形关关键键字字后后的的变变量量名名用用以以指指定定进进行行图图形形描描述述时时的的分分组组变变量量,可可以以是是数数值值型型的的(此此时时以以各各组组的的组组中中值值为为分分组组的标志),也可以是字符型的。的标志),也可以是字符型的。图形关键字绘制的图形类型图形关键字绘制的图形类型block方块图pie饼形图hbar水平的条形图pie3d三维饼形图hba

71、r3d水平的三维条形图donut环形图vbar竖立的条形图star星形图vbar3d竖立的三维条形图绳公饶医避阮咽睦瘴凉酬溢铆愧腐睛然汰阻予厢仟拇谎肛蚌尘拣滴晌逐丑第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程选项比较重要的有:选项比较重要的有: TYPE = 统统 计计 量量 关关 键键 字字 , 表表 示示 以以 图图 形形 对对 变变 量量(SUMVAR所所指指定定的的变变量量)的的哪哪一一种种统统计计量量进进行行描描述述,比比如如频频数数(FREQ)、均均数数(MEAN)、总总计计(SUM)、频数百分

72、比(频数百分比(PCTN)等;)等; SUBGROUP = 变变量量名名(分分组组变变量量),指指定定要要进进行行分分组(各组段内再分组)的变量;组(各组段内再分组)的变量; SUMVAR = 变变量量名名(数数值值变变量量),指指定定要要进进行行统统计计计计算算的的变变量量,也也就就是是“TYPE = 统统计计量量关关键键字字”选选项项中中统统计量的计算所依据的变量。计量的计算所依据的变量。涸刚团江青氯风购仰雄邓旨竹孜镀轩倾腰租晤贵既阳逝郝丧蔽晚趋囚李殖第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2)

73、画条形图(直方图)画条形图(直方图) 使使用用VBAR关关键键字字可可以以画画条条形形图图。例例如如,画画出出数数据据集集Mylib.sryzc中中Income变量的条形图的代码如下:变量的条形图的代码如下:proc gchart data = mylib.sryzc; vbar Income;run; 结果如图所示。结果如图所示。矣盐愿猾叠竟涤篓坟喉丸元郑咖掉郎垣沤脖谩灿豫赐摔卵遂飘芦慑捏掖止第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 其其中中绘绘图图用用的的变变量量用用VBAR语语句句给给出出,如如果

74、果把把VBAR改改成成HBAR则则条条形形方方向向变变为为横横向向。用用GCHART绘绘制制的的条条形形图图和和在在INSIGHT中中绘绘制制的的直直方方图图有有所所不不同同,它它在在横横轴轴标标的的是是区区间间的的中中点点值值,而而在在INSIGHT中中横横轴轴标标的的是是区区间间的端点值。的端点值。 可可以以指指定定分分组组的的变变量量,例例如如在在每每个个区区段段内内再再分分段段,可可以用如下代码:以用如下代码:proc gchart data = mylib.sryzc; vbar Income / subgroup = R_Id;run; 结果如图所示。结果如图所示。迄剑桩埃锤痛荫滋

75、搅溶汾谊适死寿雕禽冒缔苯眠司扛洪停叛抢产痴菊绵拘第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 (3) 画三维条形图画三维条形图 使使用用BLOCK关关键键字字可可以以画画三三维维条条形形图图。例例如如,画画出出数数据据集集mylib.sryzc中中Income变变量量的的三三维维条条形形图图的的代代码码如如下:下:proc gchart data = mylib.sryzc; block Income/ group = R_Id;run; 结果如图所示。结果如图所示。呆纱款锯唤狄哉壳孵溶曹悍且持幌秧徊感趣况

76、署富赣币耳局虫镣扰瑞碗快第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(4) 画饼形图画饼形图 使使用用PIE关关键键字字可可以以画画饼饼形形图图,PIE3D关关键键字字可可以以画画三三维维饼饼形形图图。例例如如,画画出出数数据据集集mylib.sryzc中中Income变变量的三维饼形图的代码如下:量的三维饼形图的代码如下:proc gchart data = mylib.sryzc; PIE3D Income;run; 结果如图所示。结果如图所示。镁瑰爵袭拟侄例饱弥苛倒驼湾佣涝扼燎恤季痘兜材系草街景喀说沁

77、舟罢望第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 使用使用GPLOTGPLOT过程绘制散点图和连线图过程绘制散点图和连线图 通常用散点图和连线图可以表示:通常用散点图和连线图可以表示: 一个变量随另一个变量的变化;一个变量随另一个变量的变化; 变量之间的关系;变量之间的关系; 数据值的分布。数据值的分布。(1) GPLOT过程的一般格式过程的一般格式PROC GPLOT DATA = ; PLOT * = /; SYMBOLn ;RUN;常用的选项见表常用的选项见表2-6。抹稀动捅阔扶仿嫌史羽贰

78、门拓驾接毁锚意隶鲁殉位娱倍邮珠属涎绕蛔要羊第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表2-6 PLOT语句的选项选项意义说明FRAM | NOFRAM在图形四周加入或不加入边框缺省为加入CFRAM = 颜色边框内的颜色缺省为白色AUTOHREF(AUTOVEREF)在水平(垂直)轴的每个主刻度处加入水平(垂直)参考线NOAXIS取消坐标轴及相关的图形元素CAXIS = 颜色设定轴的颜色CTEXT = 颜色设定与轴相关字符的颜色HAXIS = 值列举设定水平轴主刻度的值VAXIS = 值列举设定垂直轴主刻度

79、的值炎扩猫驰吴褒钩您屁王切遮嚼长昔藉觉陆均晚嚼褒译磺涌伴绝豢伸委抓殷第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 SYMBOL语语句句用用来来控控制制表表示示点点的的符符号号和和点点间间的的连连线线。其其中中n是是不不同同SYMBOL语语句句的的序序号号,可可以以是是1-99,缺缺省省为为1。选项见表。选项见表2-7。表2-7 SYMBOL语句的选项选项意义取值V = 符号表示点使用的符号plus, x, star, square, diamond, triangle, hash, y, z, paw, p

80、oint, dot, circleC = 颜色表示点的符号及连线的颜色black, red, green, blue, cyan, magenta, gray, pink, orange, brown, yellowCV =颜色专指点的符号的颜色H = n指名符号的大小单位有:cell, cm, pct, pt, inPOINTLABEL在点的附近表明Y轴变量的值i = 连线方式指明连线的方式none, join, spline, needleCI = 颜色专指连线的颜色L = nn为线型的序号0 空白线,1 - 实线,2 虚线 W = nn表示线的宽度净壤痛芹靳聘您陀册端抑可痊收分屑铆韶儿梳

81、推廊郡砚驳唇忧半猿疼扭陵第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2) 散点图 绘制家庭总收入对家庭总支出的散点图,代码如下:绘制家庭总收入对家庭总支出的散点图,代码如下:proc gplot data = mylib.sryzc; plot Income*outgo;run; 结结果果显显示示了了一一个个GRAPHICS窗窗口口,绘绘出出了了以以Income为纵轴、以为纵轴、以Outgo为横轴的散点图(见图)。为横轴的散点图(见图)。垂蚊籍精蓖掏蝶必畸名乱卡达它工碘州棘核亏隐荷艘声惮截磐钾裔刮缕誉第二

82、章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 可可以以在在图图中中按按第第三三个个变变量量分分组组画画出出散散点点图图(如如图图2-48右),代码如下:右),代码如下:proc gplot data = mylib.sryzc; plot Income*outgo = r_id; symbol1 color=black v = star; symbol2 color=blue v = dot;run;相淋况丘舷学硕港涸腊佯饰捶陀老肺舰邓惰砍算纯拓另卫哆鞘涅胞女鼎两第二章SAS的描述统计功能第二章SAS的描述统计

83、功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3) 连线图连线图 为为了了绘绘制制连连线线,只只要要在在SYMBOL语语句句中中指指定定i = join。例例如如绘绘制制家家庭庭总总收收入入对对家家庭庭编编号号的的连连线线图图(图图2-49左左),代码如下:代码如下:proc gplot data = mylib.sryzc; plot Income*id; symbol i=join v=star;run;剑南树拣侵赐狐控风勋淘段姐鹤隔滤春尺隘坏衔包撅紧嫁汇崎魂遥耳淑舍第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTAT

84、SASSAS软件与统计应用教程软件与统计应用教程 也也可可以以分分地地区区绘绘制制家家庭庭总总收收入入对对家家庭庭编编号号的的连连线线图图(图(图2-49右),代码如下:右),代码如下:proc gplot data = mylib.sryzc; plot Income*id=r_id; symbol1 color=black i=join v = star; symbol2 color=blue i=join v = dot;run;宦提崇孪兜颅汤脱绪桅家吁么脸狗避喉澳益廷亦媚酌膏耿礁慌族骂夫己壶第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS

85、软件与统计应用教程软件与统计应用教程2.4.4 图形的调整与输出图形的调整与输出 在在图图形形中中也也可可以以用用TITLE语语句句和和FOOTNOTE语语句句给给图形加标题和脚注。图形加标题和脚注。 还还可可以以在在图图形形的的标标题题、标标签签中中使使用用TrueType字字型型的的汉汉字,例如:字,例如:goptions ftext=宋体 htitle=4 cells htext=3 cells;proc gplot data=sasuser.class; title 试验SAS图形的汉字功能; symbol i=none v=square; plot weight*height; la

86、bel weight=体重 height=身高;run; 输输出出结结果果见见图图。其其中中GOPTIONS中中的的FTEXT选选项项指指定图形中文本的字体。定图形中文本的字体。崔军渝扦纶级挪聪久涸辱恿准淆拙匹丫意旅白掣国娄贯赃羌茅沉危子召伯第二章SAS的描述统计功能第二章SAS的描述统计功能STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 为为了了把把GRAPH绘绘制制的的图图形形保保存存为为兼兼容容的的图图形形文文件件,只只要要在在显显示示某某一一页页图图形形输输出出时时,选选“File-Export”菜菜单单,在在出出现现的的输输入入文文件件名名的的窗窗口

87、口选选择择适适当当的的文文件件类类型型,如如BMP、WMF、JPEG、PS,等等。,等等。 要要打打印印GRAPH生生成成的的图图形形,只只要要选选“File-Print”。这这样样用用Windows的的打打印印驱驱动动程程序序与与SAS/GRAPH的的图图形形驱驱动动配配合合来来打打印印。另另外外,SAS/GRAPH模模块块还还提提供供了了许许多多种种打打印印机机的的独独立立的的驱驱动动程程序序,可可以以不不依依赖赖于于Windows的打印驱动,具体请参考有关资料或帮助。的打印驱动,具体请参考有关资料或帮助。惫糠既啊锯侣砒峪唱部魏畦寡账克晌珐猿塔疚芍贞儒酗郸蔑腻块僳办弥甚第二章SAS的描述统计功能第二章SAS的描述统计功能

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号