SAS软件与统计应用教程

上传人:夏** 文档编号:568769743 上传时间:2024-07-26 格式:PPT 页数:80 大小:949.50KB
返回 下载 相关 举报
SAS软件与统计应用教程_第1页
第1页 / 共80页
SAS软件与统计应用教程_第2页
第2页 / 共80页
SAS软件与统计应用教程_第3页
第3页 / 共80页
SAS软件与统计应用教程_第4页
第4页 / 共80页
SAS软件与统计应用教程_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《SAS软件与统计应用教程》由会员分享,可在线阅读,更多相关《SAS软件与统计应用教程(80页珍藏版)》请在金锄头文库上搜索。

1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第二章 SAS的描述统计功能n2.1 描述性统计的基本概念描述性统计的基本概念n2.2 在在SAS中计算统计量中计算统计量n2.3 统计图形统计图形禽锑坪盯酋辣锤俊颂掉褒岔喀敌剖龟辖另壁苞堵祥单秆魄验梆池泅恍颠炉SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.1 2.1 描述性统计的基本概念描述性统计的基本概念n2.1.1 统计学的基本概念统计学的基本概念n2.1.2 表示数据位置的统计量表示数据位置的统计量n2.1.3 表示数据

2、分散程度的统计量表示数据分散程度的统计量n2.1.4 表示数据分布形状的统计量表示数据分布形状的统计量n2.1.5 其它统计量其它统计量痉握凡送狰祟恩殃聋郧芽握谗啥镶速崩抿署长副齐涉谤穷坡绽担么煤盘烁SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.1 统计学的基本概念统计学的基本概念1. 1. 总体与样本总体与样本 总总体体(population):总总体体是是指指所所研研究究对对象象的的全全体体组组成成的集合。的集合。 样样本本(sample):样样本本是是指指从从总总体体中中抽抽取取的的部部分分对对象象

3、(个个体体)组组成成的的集集合合。样样本本中中包包含含个个体体的的个个数数称称为为样样本本容容量量。容容量量为为n的的样样本本常常用用n个个随随机机变变量量X1,X2,Xn表表示示,其其观观测测值值(样样本本数数据据)则则表表示示为为x1,.,xn,为为简单起见,有时不加区别。简单起见,有时不加区别。憨巷聋簇域愤吸湛遭甥悼蒜柑克巾描媒旁直能它忙堤合槐抉唁带扩牲七功SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 参数与统计量参数与统计量 参参数数(parameter):参参数数是是用用来来描描述述总总体体

4、特特征征的的概概括括性性值值。如如总总体体平平均均值值()、总总体体方方差差( 2)、总总体体比比例(例()等。)等。 统统计计量量(statistics):统统计计量量是是用用来来描描述述样样本本特特征征的的概概括括性性值值。如如样样本本均均值值( )、样样本本方方差差(s2)、样样本本比比例(例(P)等。)等。可诽聊惧贰喊掩奇铬繁萝臻焚雕旁玻腿虽混蝉宪暑满畴捧梧忙如那猴寡份SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.2 表示数据位置的统计量表示数据位置的统计量 如如果果要要用用简简单单的的数数字字来

5、来概概括括一一组组观观测测数数据据x1,.,xn,可可以以使使用用“位位置置统统计计量量”来来作作为为数数据据的的总总体体代代表表,常常见的位置统计量有:均值、中位数、分位数、众数等。见的位置统计量有:均值、中位数、分位数、众数等。1. 1. 均值(均值(MeanMean) 均均值值是是所所有有观观测测值值的的平平均均值值,是是描描述述数数据据取取值值中中心心位位置的一个度量:置的一个度量:辗寥震虑鸦款知挤睦驾夏培续阁诺苫沥拥泥意谅汛岁锨常仅酚抑髓娶勺亿SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 中

6、位数(中位数(MedianMedian或或MedMed) 中中位位数数是是描描述述观观测测值值数数据据中中心心位位置置的的统统计计量量,大大体体上上比比中中位位数数大大(小小)的的数数据据为为观观测测值值的的一一半半。中中位位数数的的一一个个优优点点是是它它不不受受个个别别极极端端数数据据的的影影响响,具具有有稳稳健健性性。中中位位数数的的计计算算方方法法是是:首首先先将将数数据据从从小小到到大大排排序序为为:x(1),.,x(n),然后计算,然后计算嫂诀俯田密啡爬祝奠闲渔出督拈诧豺枚曝莉贰枷勒绞甭沃宇厦条资亡弃屋SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTAT

7、SASSAS软件与统计应用教程软件与统计应用教程3. 3. 众数(众数(ModeMode) 观观测测值值中中出出现现最最多多的的数数称称为为众众数数。众众数数用用得得不不如如均均值值和和中中位位数数普普遍遍。在在属属性性变变量量分分析析中中,常常需需考考虑虑频频数数,因因此众数用得多些。此众数用得多些。4. 4. 百分位数(百分位数(PercentilePercentile) 分分位位数数也也是是描描述述数数据据分分布布和和位位置置的的统统计计量量。0.5分分位位数数就就是是中中位位数数,0.75分分位位数数和和0.25分分位位数数又又分分别别称称为为上上、下四分位数,并分别记为下四分位数,并

8、分别记为Q3和和Q1。瓶站闻珊乳盖加棋喊淄址超泥蛆春亮涕注腻悄遮福毒翘英汕趾死轨楔厢读SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.3 表示数据分散程度的统计量表示数据分散程度的统计量1. 1. 极差(极差(RangeRange)与半极差()与半极差(Interquartile rangeInterquartile range) 极差就是数据中的最大值和最小值之间的差:极差就是数据中的最大值和最小值之间的差:极差极差 = maxxi minxi 上上、下下四四分分位位数数之之差差Q3 Q1称称为为四四分分

9、位位极极差差或或半半极极差,它描述了中间半数观测值的散布情况。差,它描述了中间半数观测值的散布情况。2. 2. 方差(方差(VarianceVariance或或VarVar) 方方差差是是由由各各观观测测值值到到均均值值距距离离的的平平方方和和除除以以观观测测量量减减1:今嗽旁冈期屏宝殖喘豹桑克尺毋匝枪埋私桑粤些蚜塘怀掩综丧叹露麦闲去SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 标准差(标准差(Standard deviationStandard deviation或或Std DevStd Dev)

10、方差的开方称为标准差:方差的开方称为标准差: 标准差的量纲与原变量一致。标准差的量纲与原变量一致。4. 4. 变异系数(变异系数(Coefficient of VariationCoefficient of Variation或或CVCV) 变变异异系系数数是是将将标标准准差差表表示示为为均均值值的的百百分分数数,是是观观测测数数据据分分散散性性的的一一个个度度量量,它它在在比比较较用用不不同同单单位位测测量量的的数数据据的分散性时是有用的:的分散性时是有用的:奔颖具僻糕挥伐玩局揖砒惹得哑匹萍码既卢斜宾六尾等娩拇山莫释薄携冒SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTA

11、TSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.4 表示数据分布形状的统计量表示数据分布形状的统计量 偏度和峰度是描述数据分布形状的指标。偏度和峰度是描述数据分布形状的指标。1. 1. 偏度(偏度(skewnessskewness) 偏度是刻画数据对称性的指标。偏度的计算公式为:偏度是刻画数据对称性的指标。偏度的计算公式为: 在在SAS中:中: 关于均值对称的数据其偏度为关于均值对称的数据其偏度为0; 左侧更为分散的数据,其偏度为负,称为左偏;左侧更为分散的数据,其偏度为负,称为左偏; 右侧更为分散的数据,其偏度为正,称为右偏。右侧更为分散的数据,其偏度为正,称为右偏。怠才途

12、环歪痕绵戍谷择牧砂坏锡差爵阑戌存吮粱蔓滨叁歇纹馆申觉囱平而SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 峰度(峰度(kurtosiskurtosis) 峰峰度度描描述述数数据据向向分分布布尾尾端端散散布布的的趋趋势势。峰峰度度的的计计算算公公式为:式为: 利利用用峰峰度度研研究究数数据据分分布布的的形形状状是是以以正正态态分分布布为为标标准准(假假定定正正态态分分布布的的方方差差与与所所研研究究分分布布的的方方差差相相等等)比比较较两端极端数据的分布情况,若两端极端数据的分布情况,若 近似于标准正态分

13、布,则峰度接近于零;近似于标准正态分布,则峰度接近于零; 尾部较正态分布更分散,则峰度为正,称为轻尾;尾部较正态分布更分散,则峰度为正,称为轻尾; 尾部较正态分布更集中,则峰度为负,称为厚尾。尾部较正态分布更集中,则峰度为负,称为厚尾。脚赋阴邢玩粮俞蹬氰饵产砷散蓝砂痊从赊巳带缓市钙舆武噪冻夷蜕岂觅易SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.1.5 其它统计量其它统计量1. 1. 均均值值的的标标准准误误(Std Std Error Error MeanMean或或Std Std MeanMean或或Std

14、 Std errorerror)2. 2. 校正平方和(校正平方和(Corrected sum of squaresCorrected sum of squares)唇德餐吮啥穗画品存瞒诡嘱矢怨夜玲括况涸羌扮恩抹弛铱丸跌郊蕉遂剖寄SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 未校正平方和(未校正平方和(Uncorrected sum of squaresUncorrected sum of squares)4. 4. k k阶原点矩阶原点矩其中其中A1即为均值即为均值 。5. 5. k k阶中心矩阶中

15、心矩孝康洼肿蛋晕圣镭芳恳胚磐酮扦译妥陵聪蓑佣警赛别苫歇珊碴循脉螺缠塘SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.2 2.2 在在SASSAS中计算统计量中计算统计量n2.2.1 用用INSIGHT计算统计量计算统计量n2.2.2 用用“分析家分析家”计算统计量计算统计量n2.2.3 编程实现描述性统计编程实现描述性统计辆掺征泳蜡纺敝刘陆歌短呸正半糠度梁配湘觉缚氧韧出轮惰铁符掀柱元圆SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教

16、程2.2.1 用用INSIGHT计算统计量计算统计量 INSIGHT可以非常方便地计算各种统计量。可以非常方便地计算各种统计量。1. 1. 实例数据实例数据【例例2-1】表表2-1为为两两个个不不同同地地区区居居民民家家庭庭收收入入和和支支出出情情况况的的抽抽样样调调查查(单单位位:元元),试试分分别别统统计计收收入入和和支支出出情情况。况。将将表表2-1中中数数据据通通过过Excel导导入入到到SAS数数据据集集Mylib.sryzc中中,4个个变变量量名名分分别别为为:ID、R_ID、Income和和Outgo,相相应应的的标标签签名名为为家家庭庭编编号号、地地区区编编号号、家家庭庭总总收

17、收入入和和家家庭总支出。庭总支出。卒臻板存湛骑溶碧荧筋睬滔池掌锨砖肋责趴渝律信柯蒋鞠标唯醋彩松秀钟SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程家庭编号地区编号家庭总收入家庭总支出家庭编号地区编号家庭总收入家庭总支出1217941550162220020602217161365171273022363134102730181249614554217651530191176010405221841900201282023666220502050212225019667224602184221317024008119

18、76117023212001250912850249624217761350101427527602521980179411220101275261245525501212236181027210801380131330528202821986120014124001976291336923051522250197030215301316伺币务熊沙埠肿卸酬失食颊淬豌兽陀田浑帽撰完秉秸汹钩宛衡聪餐昆椽贮SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 在在INSIGHTINSIGHT中打开数据集中打开数据集

19、 在在 菜菜 单单 中中 选选 择择 “Solution( 解解 决决 方方 案案 )”“Analysis( 分分 析析 ) ”“Interactive Data Analysis(交交互互式式数数据据分分析析)”,打打开开“SAS/INSIGHT Open”对对话话框框,在在对对话话框框中中选选择择数数据据集集:Mylib.sryzc,单单击击“Open(打打开开)”按按钮钮,即即可可在在INSIGHT中中打打开开数数据窗口,如图所示。据窗口,如图所示。教历坛灾纲拒强冲归被敬娇瓶溪商砧没兵张涟莆票屯租晋罚枢冬氮琅款砧SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATST

20、ATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 计算统计量计算统计量 选选 择择 菜菜 单单 “Analyze( 分分 析析 ) ”“Distribution (Y)(分分布布)”,打打开开“Distribution (Y)”对对话话框框。在在数数据据集集sryzc的的变变量量列列表表中中,选选择择Income为为分分析析变变量量,选择选择R_Id,为分组变量。,为分组变量。 单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中包包含描述性统计量选项。含描述性统计量选项。 守毒喊叙襟挑莎颧涧吴货踌戴酗抓午旗沫监卤道屉旨命每怖捕瞄寐噶军一SAS软件与统计

21、应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 选选择择选选项项矩矩统统计计量量和和分分位位数数,取取消消默默认认的的选选项项:“Box Plot/Mosaic Plot”和和“Histogram/Bar Chart”,单单击击“OK”按按钮钮,即即可可得得到到变变量量Income按按“R_Id”分分组组的的各各种种矩矩统统计计量量(Moments)和和分分位位数数(Quantiles),如如图所示。图所示。代斤释无蓉气肪秧溜睫浊丝煎生芦邪蒙恕州迹破屯嗽遣钠砸沙会骸镍鸯废SAS软件与统计应用教程SAS软件与统计应用教程STATS

22、TATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.2 用用“分析家分析家”计算统计量计算统计量1. 1. 启动启动“分析家分析家” 选选 择择 主主 菜菜 单单 “Solutions( 解解 决决 方方 案案 )”“Analysis(分分析析)”“Analyst(分分析析家家)”,打开,打开“分析家分析家”窗口。窗口。 选选 择择 主主 菜菜 单单 “File( 文文 件件 ) ”“Open By SAS Name”,打打开开“Select A Member”对对话话框框,选选择择数数据据集集Mylib.sryzc。闻麻深异木迟痰砷端璃讣呕叠旺磁烽付碳踌柒弄袄瘁驻炬

23、夏精煌冶奢初谁SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 通通过过Summary Summary StatisticsStatistics菜菜单单计计算算描描述述性性统统计计量量 选选择择主主菜菜单单“Statistics(统统计计)”“Descriptive( 描描 述述 性性 统统 计计 ) ”“Summary Statistics(汇汇总总统统计计量量)”,打打开开“Summary Statistics”对对话话框框,选选择择变变量量列列表表中中的的Income,单单击击“Analysis”按

24、钮,选定分析变量,如图所示。按钮,选定分析变量,如图所示。纯客穆肆枣奴怀短般悄软咯斩瘤扶容莉鸽恍泞采密遣愤鞍赡冀沤约呕臻二SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程单单击击“Statistics”按按钮钮,打打开开“Summary Statistics:Statistics”对对话话框框。对对话话框框中中列列出出可可以以计计算算的的所所有有统统计计量(如右图所示)。量(如右图所示)。描述性统计量如下图所示。描述性统计量如下图所示。乱片弧枉显襟读刚原峦蒸孩碗廷矽佰薛捻纵挤马插蕉间跪尔晌敝赫啃汇娥SAS软件与统计

25、应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 通过通过DistributionsDistributions菜单计算描述性统计量菜单计算描述性统计量 选选择择主主菜菜单单“Statistics(统统计计)”“Descriptive(描描述述性性统统计计)”“Distributions(分分布布)”,打打开开“Distributions”对对话话框框,选选择择变变量量列列表表中中的的Income,单击,单击“Analysis”按钮,选定分析变量。按钮,选定分析变量。 单单击击“OK”按按钮钮,即即可可得得到到关关于于变变

26、量量Income的的矩矩统统计计量和基本统计测度量和基本统计测度呆松茁缎吨疾借蔫茶英环棘仅摇指臣何你苗溯艾哥卓职祥拱爷腆浦厂寞坯SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.3 编程实现描述性统计编程实现描述性统计 SAS提提供供有有多多个个不不同同的的过过程程来来实实现现统统计计量量的的计计算算,它它们们在在功功能能范范围围上上有有许许多多的的重重复复,下下面面介介绍绍用用FREQ、MEANS和和UNIVARIATE这这三三个个过过程程来来计计算算简简单单的的描描述述统计量。统计量。 FREQ过过程程常

27、常用用来来计计算算分分类类变变量量取取值值的的频频数数,而而MEANS和和UNIVARIATE过过程程则则对对数数值值型型变变量量计计算算均均值值、标准差等统计量。标准差等统计量。茫震轨航补隘弊叠浙赋镑廓屋调售叼腔蝴拉札镍弛抵瑶俩惦绽灾蕊糙柿伤SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1. FREQ1. FREQ过程过程 FREQ过过程程包包括括多多个个控控制制频频数数输输出出与与检检验验的的语语句句和和选选项,格式如下:项,格式如下:PROC FREQ DATA = ; TABLES ; FORMAT .

28、. ;RUN; 其其中中PROC FREQ语语句句调调用用FREQ过过程程,标标志志FREQ过程的开始;过程的开始; TABLES语语句句用用于于创创建建有有关关变变量量所所构构成成的的各各种种表表格格并并进行相应的假设检验和计算,可以多次使用。进行相应的假设检验和计算,可以多次使用。窗歧急庆戏拴许执席米昧怨酷咀步桨晦命癌使目邹深坞域行姚株辜扣小蜗SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 例例如如,统统计计数数据据集集Mylib.sryzc中中变变量量R_Id和和Income频数的代码如下:频数的代码如下:

29、proc freq data = mylib.sryzc; tables R_Id Income;RUN; 显示结果如图所示。显示结果如图所示。砸习近枫玫帛蕉日照滩庙挤算弯胎料菩犀必迈湿避阻立暑斯贾砖冈论刮浊SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. MEANS2. MEANS过程过程(1) 语法格式语法格式 MEANS过程的一般格式:过程的一般格式:PROC MEANS DATA=; VAR ; BY ; CLASS ;RUN;巫秋滦牧踌呐相呼恒濒静贰泥晕答食促仪纲瓢祭断糙家蛔居莲沧孔介扦垢SAS软件与

30、统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 PROC MEANS语语句句后后的的选选项项主主要要用用来来指指定定所所要要计计算算的的统统计计量量,默默认认情情况况下下,MEANS过过程程会会给给出出频频数数、均均数数、标标准准差差、最最大大值值和和最最小小值值等等,其其余余统统计计量量的的计计算算均均需要在选项中指定。需要在选项中指定。 VAR语语句句引引导导所所要要进进行行分分析析的的所所有有变变量量的的列列表表,SAS将将对对VAR语语句句所所引引导导的的所所有有变变量量分分别别进进行行描描述述性性统统计计分分析。析

31、。 BY语语句句与与CLASS语语句句所所指指定定的的分分类类变变量量用用来来进进行行分分组统计,但输出格式不同。组统计,但输出格式不同。配鲍星频械艾言市隆熙膝卓苞粕活昼蚀粉反语圾度瞒豌芋被展餐豌瞅耶轧SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 如如对对数数据据集集Mylib.sryzc中中的的Income变变量量计计算算简简单单统统计计量,只要用如下量,只要用如下MEANS过程:过程:proc means data = mylib.sryzc; var Income;run; 结果如图结果如图2-15所示。

32、所示。毒槐旭诉刁洽扁挣灸芬矛巍藕败弘乒傣芥疆躺遭吭磨漆墒赖雁韦苹稍绚懒SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2) 使用统计量关键字列表使用统计量关键字列表 在在PROC MEANS语句中使用统计量关键字列表:语句中使用统计量关键字列表:proc means data = mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min; var Income;run; 结果如图结果如图2-16所示。所示。伎袁敬频疏入偷梦汤邦柯僚稻伐陌闰护钩瞪饺也脓除剂席邢敝蛀右

33、驻毖绦SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 可以计算的描述性统计量关键字及其含义见下表。可以计算的描述性统计量关键字及其含义见下表。关键字所代表的含义关键字所代表的含义n有效数据记录数range极差nmiss缺失数据记录数skewness偏度mean均值kurtosis峰度std标准差t分布位置假设检验之t统计量stderr标准误probt上述t统计量对应的概率值var方差q1第一四分位数median中位数q3第三四分位数mode众数qrange四分位数间距cv变异系数p1第一百分位数max最大值p5第

34、五百分位数min最小值p10第十百分位数sum总计p90第九十百分位数sumwgt加权值总计p95第九十五百分位数css校正平方和p99第九十九百分位数uss未校正平方和惰冕缀炯渍执新集帮郝姜唁郴假良柯陇钥泌拘弦氖如涤割辈好鼎蚤肉卒毅SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3) 使用使用CLASS语句和语句和BY语句语句 使使用用CLASS语语句句和和BY语语句句可可以以分分组组计计算算分分析析变变量量的的描描述述统统计计量量值值,由由CLASS语语句句和和BY语语句句指指定定的的变变量量在在分分析析中中

35、起起分分组组(类类)的的作作用用,被被称称为为分分类类变变量量。两两个个语语句的区别是:句的区别是: 使使用用BY语语句句时时要要求求数数据据集集须须按按BY变变量量排排序序,使使用用CLASS语句无此要求。语句无此要求。 使使用用BY语语句句时时输输出出按按BY变变量量的的每每个个值值分分别别提提供供一一个表,使用个表,使用CLASS语句则将所有结果排列在一个表之中。语句则将所有结果排列在一个表之中。焚烷笼逝苗祈绕蠢甸口捍倡荫楞斑扭孰埂澳扯遁萄辛乱屎拼痉笼嫩再躯宽SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程

36、使使用用BY语语句句之之前前先先排排序序,如如下下代代码码可可以以在在上上例例中中按按变量变量R_Id分组统计:分组统计:proc sort data = mylib.sryzc; by R_Id;run;proc means data = mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min; var Income; by R_Id;run;敢奠氮艰睡纶米家矿辨晨噬竟钠挛刹乎换皋恐猪拇项明寄糕蛰条忆卖泅怀SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 使使用

37、用CLASS语语句句分分组组较较为为简简单单,如如下下代代码码也也可可以以在在上上例中按变量例中按变量R_Id分组统计:分组统计:proc means data = mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min; var Income; class R_Id;RUN;汗论渐焦带锐哉药葛湃相信靛油矗桩隘兜芦攫砰盯蚀瞥选散切肛哩纶恶定SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. UNIVARIATE3. UNIVARIATE过程过程 UNIVARIA

38、TE过程的一般格式为:过程的一般格式为:PROC UNIVARIATE DATA = ; VAR ; BY | CLASS ; HISTOGRAM /; OUTPUT OUT = = ;RUN;暮矩唬兼耐位刑梢巫畅机痕非牢赶爪木搜迈苫蔡匪疑撑厨储谐哉版荔瑞拧SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 UNIVARIATE过过程程和和MEANS过过程程的的格格式式非非常常相相似似,相相同同的的语语句句和和选选项项其其含含义义也也相相同同,所所不不同同的的是是某某些些统统计计量量只只能能在在UNIVARIATE过

39、过程程中中计计算算(如如众众数数),而而且且UNIVARIATE过程中具有绘图功能。过程中具有绘图功能。 其其中中,HISTOGRAM语语句句用用来来指指示示SAS对对其其后后所所指指定定的的变变量量绘绘制制直直方方图图,其其后后的的选选项项用用来来指指示示SAS添添加加不不同同类型的拟合图形(如正态分布的分布密度曲线)。类型的拟合图形(如正态分布的分布密度曲线)。炙焰窟色免遥撵往夺色葵菩种文社酸醛泊撅习居捧杀齿揭挛弗她永巷庸洛SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 输出包括五个部分。输出包括五个部分。

40、第一部分是矩统计量,各统计量已在第一部分是矩统计量,各统计量已在2.1.1中作了介绍。中作了介绍。 第第二二部部分分为为基基本本的的位位置置和和分分散散程程度度统统计计量量,位位置置统统计计量量包包括括均均值值、中中位位数数、众众数数,分分散散程程度度统统计计量量包包括括标标准准差、方差、极差、四分位间距差、方差、极差、四分位间距 第第三三部部分分为为关关于于均均值值等等于于零零的的三三种种检检验验的的结结果果,包包括括t检验、符号检验和符号秩检验。检验、符号检验和符号秩检验。 第四部分为各个重要的分位数。第四部分为各个重要的分位数。 第五部分是观测数据的五个最低值和五个最高值。第五部分是观测

41、数据的五个最低值和五个最高值。娩挝维瘪侦鳖雾舞迹亢葵箍拉逆描说猿织授甥庸玻订胁宗谱梁梢蒙驰染颈SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n2.3 2.3 统计图形统计图形n2.3.1 定量变量的图形表示定量变量的图形表示n2.3.2 分类变量的图形表示分类变量的图形表示错哉屹炽朗楷哟毒娇务藩无粕史摹局郁粤陡侥岂丁友珊昏缓判注惫灼振菲SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.3.1 定量变量的图形表示定量变量的图形表示1.

42、 1. 直方图直方图 对对于于数数值值型型变变量量,常常用用直直方方图图(histogram)来来展展示示变变量量取取值值的的分分布布。将将变变量量取取值值的的范范围围分分成成若若干干区区间间,在在等等间间隔隔区区间间的的情情况况,每每个个区区间间的的长长度度称称为为组组距距。考考察察数数据据落落入入每每一一区区间间的的频频数数与与频频率率,在在每每个个区区间间上上画画一一个个矩矩形形,它它的的宽宽度度是是组组距距,它它的的高高度度可可以以是是频频数数、频频率率或或密密度度(频频率率组组距距),在在高高度度是是密密度度的的情情况况,每每一一矩矩形形的的面面积积恰恰是是数数据据落落入入区区间间的

43、的频频率率,这这种种直直方方图图可可以以估估计计总总体的概率密度。体的概率密度。安狼鸵瓶油婉赁谊矛鲍怀轮困迹丙猾察邮梧皂之擎硷聘隆鹃嘎令甜班冈壶SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程图2-22 密度直方图与频数直方图SAS软软件件会会根根据据样样本本容容量量在在样样本本取取值值范范围围内内自自动动地地确确定定一个分组方式,另外也提供了设定分组的方法。一个分组方式,另外也提供了设定分组的方法。 稠羹柬旦酌焕砧桅掀骤台芭贼荐瑚零碎驭惠痔却话篙郴鸣梢尤塔巷橙亩学SAS软件与统计应用教程SAS软件与统计应用教程S

44、TATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 盒形图盒形图 盒盒形形图图(boxplot,又又称称箱箱图图、箱箱线线图图、盒盒子子图图)是是用用更更为为简简洁洁的的方方法法表表现现数数据据在在数数轴轴上上的的分分布布及及其其特特点点的的图图形。形。 图图2-23的的左左边边是是根根据据居居民民家家庭庭的的收收入入情情况况所所绘绘的的盒盒形形图;右边是分地区情况所绘的盒形图。图;右边是分地区情况所绘的盒形图。 肇石唁萎料迪像豆孝谰祸泄橱禾圃峙镜杠佐灵肺称怀给暑认幸希纹橱两酋SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTAT

45、SASSAS软件与统计应用教程软件与统计应用教程3. 3. 散点图散点图 通通常常得得到到的的数数据据可可能能有有两两个个变变量量,比比如如家家庭庭的的收收入入和和支支出出情情况况的的数数据据,这这里里家家庭庭总总收收入入是是一一个个变变量量,而而家家庭庭总总支支出出是是第第二二个个变变量量。希希望望通通过过图图形形了了解解收收入入和和支支出出的的关关系系,这这时时可可以以用用一一个个变变量量为为横横坐坐标标(如如家家庭庭总总收收入入),另另一一个个为为纵纵坐坐标标(这这里里是是家家庭庭总总支支出出)来来作作图图(图图2-24)。这种图称为散点图)。这种图称为散点图(Scatter Plot)

46、。 喷粗捎候禽奠亚煮炭襄仗丘脸易乙津硬矣曹棘歧园魁访脸番尿专痘凳酸唉SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4. 4. 线图线图 线线图图(Line Plot)用用来来表表示示变变量量间间的的取取值值变变化化情情况况,有有单式和复式两种(图单式和复式两种(图2-25)。)。 在在复复式式线线图图中中可可用用不不同同颜颜色色的的实实线线来来标标志志区区别别,如如图图2-25右所示。右所示。 脊暂派些边繁湃绿滋掇酱兢戈倦尿榴万循痴玄揩仇遂喷堰敛怕瞳则灵并前SAS软件与统计应用教程SAS软件与统计应用教程STAT

47、STATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.3.2 分类变量的图形表示分类变量的图形表示 分分类类变变量量也也可可以以通通过过图图形形直直观观地地描描绘绘出出它它们们各各类类的的数数量和所占比例,常用的有条形图、饼图和马赛克图。量和所占比例,常用的有条形图、饼图和马赛克图。1. 1. 条形图条形图 条条形形图图(Bar Chart)给给出出分分类类变变量量取取每每个个值值的的频频数数,如如图图2-26所示为变量所示为变量R_ID取值的条形图。取值的条形图。妇玲凭渴睡旱囱厩冠诛凉寄靛勾触漳砒让抉费箕哪承酌模乃叉望爪棚潮架SAS软件与统计应用教程SAS软件与统计应用

48、教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 饼图饼图 通通常常,饼饼图图(Pie Chart)可可以以对对分分类类变变量量描描述述其其频频数数取取值值的的比比例例,对对于于数数值值变变量量,则则像像直直方方图图那那样样应应先先计计算算各各区间取值的频数,再按比例画出。区间取值的频数,再按比例画出。 图图2-27中中给给出出的的是是家家庭庭支支出出分分组组频频数数的的饼饼图图。要要注注意意的是,如果有太多的分组,那么饼图就不那么好看了。的是,如果有太多的分组,那么饼图就不那么好看了。辊瞬育才了粕矽慧宛拴耐缄愤考祭莲鼠冻徐糜汁百方弗西扯枚磋砌椎辱

49、唱SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 马赛克图马赛克图 马马赛赛克克图图(Mosaic Plot)一一般般不不对对单单个个变变量量作作,而而是是对对两两个个分分类类变变量量来来作作。这这种种图图的的好好处处是是直直观观显显示示了了两两个个变变量每种取值组合的观测个数和比例,如图量每种取值组合的观测个数和比例,如图2-28所示。所示。笆误溪轩景磁洛囚驴排钩墒纹撒泻缘谗擎爬哼疮泳村拣极匣光翼芯雌悯旦SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与

50、统计应用教程软件与统计应用教程n2.4 2.4 用用SASSAS绘制统计图形绘制统计图形n2.4.1 用用INSIGHT绘制统计图形绘制统计图形n2.4.2 用用“分析家分析家”绘制统计图形绘制统计图形n2.4.3 编程绘制统计图编程绘制统计图n2.4.4 图形的调整与输出图形的调整与输出辊接雕浆绸花伎饯酬肉幂琢茶斩格反半炒块趟无该篱梦专尖皇秦渣履垣缘SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.1 用用INSIGHT绘制统计图形绘制统计图形 INSIGHT模模块块可可以以画画出出多多种种统统计计图图形形

51、,而而且且图图形形清清晰晰、美观。美观。1. 1. 绘制直方图绘制直方图 选选择择菜菜单单“Analyze(分分析析)”“Histogram/Bar Chart (Y)(直直方方图图/条条形形图图)”,打打开开“Histogram/Bar Chart (Y)”对对话话框框。在在数数据据集集的的变变量量列列表表中中,选选择择变变量量,然后单击然后单击“Y”按钮。按钮。失惨弓煽朝诊鳞占核涵畔宰肺蝗痪胚锡肆厅柜笼犬蔫都北赐议时锻借训辫SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单单击击“Output(输输出出)”按

52、按钮钮,在在打打开开的的对对话话框框中中选选择择“Labels(标标签签)”选选项项,如如图图所所示示,以以便便输输出出的的图图形显示中文标签名。单击形显示中文标签名。单击“OK”按钮返回对话框。按钮返回对话框。份羡稳绊付懂儒褐摩匹刃鱼睛枉识乔肄胚冰氓籽掐讣羹巧栋椎尖通恒拴谍SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单击单击“OK”按钮,即可得到直方图如图按钮,即可得到直方图如图2-30左所示。左所示。 单单击击图图形形框框左左下下角角处处的的三三角角形形,在在打打开开的的菜菜单单中中选选择择“Values

53、(值值)”,即即可可在在图图中中显显示示频频数数值值,如如图图2-30右所示。右所示。 裙乘再萍钙酥议彩浸楷甫旋家贩赏岸竹母蒜旧阮禾唱寄吏琉婿浦陋灯览涉SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 绘制条形图绘制条形图 INSIGHT模模块块对对分分类类变变量量绘绘制制条条形形图图。首首先先单单击击R_Id变变量量名名上上边边的的变变量量作作用用按按钮钮,在在弹弹出出的的菜菜单单中中选选择择“Nominal(列名型)(列名型)”,如图左所示。,如图左所示。 选选择择菜菜单单“Analyze”“Hist

54、ogram/Bar Chart (Y)”,打打开开“Histogram/Bar Chart (Y)”对对话话框框。在在数数据据集集的的变变量量列列表表中中选选择择变变量量,然然后后单单击击“Y”按按钮钮,如如图图右右所示。所示。 刻娶侯诬塞哪辛源割谚卑昆贱献泣焙费驰眉簇挫格坎维根纷皿痰仓叹辈齿SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中选选择择“Labels(标标签签)”选选项项,单单击击“OK”按按钮钮返返回回对对话话框。框。 单

55、单击击“OK”按按钮钮,即即可可得得到到条条形形图图如如图图2-34左左所所示示。如如果果选选择择Income_freq(见见2.2.2节节)作作为为分分析析变变量量,则则可以得到图可以得到图2-34右所示的条形图。右所示的条形图。 辗坊夯跳谈啥赵诗愤沮鲜辖序器庆气妥辕姿吟父痈雇盒再得刑严卖们屉觉SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 绘制盒形图绘制盒形图 选选择择菜菜单单“Analyze”“Box Plot/Mosaic Plot (Y)”,可可以以对对区区间间型型变变量量作作盒盒形形图图,对

56、对分分类类型型变变量量作作马马赛赛克克图图。打打开开“Box Plot/Mosaic Plot (Y)”对对话话框框。在在数数据据表表sryzc的的变变量量列列表表中中,选选择择income变变量量,然然后后单单击击“Y”按钮,按钮,income变量被选定,如图左所示。变量被选定,如图左所示。 单单 击击 “Output”按按 钮钮 , 在在 打打 开开 的的 对对 话话 框框 中中 选选 择择“Labels”选项,取消选项,取消“Y Axis Vertical”如图右所示。如图右所示。 算拿尚粹兴吭埔怖铅褒什垂腿霜笆干狱朴遵仪律坡辰争旬修厦剐欠傻孝嗣SAS软件与统计应用教程SAS软件与统计应

57、用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 单击单击“OK”按钮,即可得到盒形图如图按钮,即可得到盒形图如图2-36左所示。左所示。 胡韶盅锯焚姆设飞描厚稍室庭宙狠撬筒船柿志犀卤隐宇渤挺惋豌棘痒欺勒SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程在在“Box Plot/Mosaic Plot (Y)”对对话话框框中中选选定定多多个个分分析析变变量量,可可以以将将多多个个盒盒形形图图画画在在一一个个坐坐标标系系下下,这这样样便便于于比比较变量的取值情况,如图所示。较变量的取

58、值情况,如图所示。 图图形形分分析析:从从图图中中可可以以看看到到支支出出数数据据在在均均值值两两边边的的分分布布近近似似对对称称,说说明明低低于于和和高高于于平平均均支支出出的的家家庭庭几几乎乎各各占占一一半半;收收入入数数据据的的二二分分之之一一分分位位数数在在均均值值的的左左边边,说说明明大大部部分分人人的的收收入入低低于于平平均均收收入入。另另外外,10号号家家庭庭的的收收入入是一个极端值,它不具有代表性。是一个极端值,它不具有代表性。 涉机焚胖茄钵瞩猫彦椒采淋金喳碎仅勒咎肮悬载翘犯宛潜饮王猿驾壤苏屿SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSAS

59、SAS软件与统计应用教程软件与统计应用教程4. 4. 绘制马赛克图绘制马赛克图 选选择择“Analyze(分分析析)”“Box Plot/Mosaic Plot (Y)(盒盒形形图图/马马赛赛克克图图)”命命令令,可可以以对对分分类类变变量量作作马马赛赛克克图图。下下面面以以2.2.2中中修修改改过过的的数数据据集集sryzc为为例例,作作出出R_Id变量和变量和Income_freq变量的马赛克图。变量的马赛克图。哎氖失袭消惭澄淑董帅栽条屡杏忙捅缩俄檬洱镭宏蔚软漏蜕章商劫赘垢慑SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与

60、统计应用教程4. 4. 绘制马赛克图绘制马赛克图首先将首先将R_Id变量改为变量改为“列名型列名型”(参见图(参见图2-33左)。左)。 选选择择菜菜单单“Analyze(分分析析)”“Box Plot/Mosaic Plot (Y)( 盒盒 形形 图图 /马马 赛赛 克克 图图 ) ”, 打打 开开 “Box Plot/Mosaic Plot (Y)”对对话话框框。在在数数据据集集sryzc的的变变量量列列表表中中,选选择择R_Id变变量量,然然后后单单击击“Y”按按钮钮,R_Id变变量量被选定,单击被选定,单击“OK”按钮,得到结果如图按钮,得到结果如图2-38所示。所示。懂逝扭藏阅酵邀漏

61、揣啃耘缎莎堵释涣剃护橇荚春泵扑玖费观纺雨庄闻毅账SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5. 5. 绘制散点图绘制散点图 选选择择菜菜单单“Analyze”“Scatter Plot (Y X)”,打打开开“Scatter Plot (Y X)”对对话话框框。在在变变量量列列表表中中,选选择择Income,单单击击“Y”按按钮钮,Income变变量量被被选选定定为为Y轴轴变变量量,选选择择Outgo,单单击击“X”按按钮钮,Outgo变变量量被被选选定定为为X轴变量,如图左所示。轴变量,如图左所示。 单单击

62、击“OK”按按钮钮,即即可可得得到到散散点点图图如如图图右右所所示示。可可以以看出收入与支出有一定的线性相关关系。看出收入与支出有一定的线性相关关系。 铬胁拣哄邹删壶捣巍睬伎沽衡敏迈捅钟乞渴泌孝粮汤非络梅斗刘释折灸酣SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 在在数数据据集集窗窗口口选选中中所所有有1号号地地区区的的观观测测号号,图图2-40是是在在散散点点图图中中区区分分两两个个地地区区的的情情况况,细细点点为为2号号地地区区,粗粗点点为为1号号地地区区。从从该该图图可可以以看看出出1号号地地区区比比2号号

63、地地区区在在收收入和支出水平上都要高出许多。入和支出水平上都要高出许多。除桅嗜蔫物枯届詹享董罐犊友睬趋似截鹤私书姿伊锥帘拐铅澎甘兴动惊娥SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程6. 6. 绘制线图绘制线图 选选择择菜菜单单“Analyze(分分析析)”“Line Plot (Y X)(分分布布)”,打打开开“Line Plot (Y X)”对对话话框框。在在数数据据集集sryzc的的变变量量列列表表中中,选选择择ID变变量量,单单击击“X”按按钮钮,ID变变量量被被选选定定为为X轴轴,然然后后选选择择Inc

64、ome变变量量,单单击击“Y”按按钮钮,如如图图左左所所示示。单单击击“OK”按按钮钮,即即可可得得到到线线图图如如图右所示。图右所示。 仗炬竟芽乃腔引慎魔零啃颁催各尿顾兔挤咨背影弯十搬选唇罩耸螺肉缠休SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 若若在在“Line Plot (Y X)”对对话话框框中中,将将ID变变量量选选定定为为X轴轴,选选择择Income变变量量和和Outgo变变量量,单单击击“Y”按按钮钮。单单击击“Output(输输出出)”按按钮钮,在在打打开开的的对对话话框框中中选选择择“Labe

65、ls(标标签签)”选选项项,如如图图左左所所示示,以以便便输输出出的的图图形形显显示示中中文文标标签签名名。两两次次单单击击“OK”按按钮钮,得得到到关关于于Income变量和变量和Outgo变量的复式线图(图右)。变量的复式线图(图右)。 腑判似咋岸卸位颤梢承晰谋笋侠蚜迭鲸难妊笆拨汇嗡时妻庇呀庸陕杨融灌SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.2 用用“分析家分析家”绘制统计图形绘制统计图形1. 1. 绘制饼图绘制饼图 在在“分析家分析家”中打开数据集中打开数据集mylib.sryzc。 选选择择主

66、主菜菜单单“Graphs”“Pie Chart”,打打开开“Pie Chart”对对 话话 框框 , 选选 择择 变变 量量 列列 表表 中中 的的 Income, 单单 击击“Chart”按按钮钮,选选定定分分析析变变量量,如如图图左左所所示示。所所得得饼饼图如图右所示。图如图右所示。 筹俞卧经妮菱孰炼焚伪假单犯臃瞬兴奄洒驱溃祸俺也穷召桑薛肯田醚虱吕SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 绘制条形图绘制条形图 选选择择主主菜菜单单“Graphs”“Bar Chart”“Horizontal”,

67、打打开开“Horizontal Bar Chart”对对话话框框,选选择择变变量量列列表表中中的的INCOME,单单击击“Chart”按按钮钮,选选定定分分析析变变量量,选选择择R_ID变变量量,单单击击“Stack By”按按钮钮,再再选选中中3-D选选项项,如如图图左左所所示示。单单击击“OK”按按钮,得到水平条形图,如图右所示。钮,得到水平条形图,如图右所示。 瑶咬沸纱锋优区贰失绩齐乳宫哥悯警骡抉佳缮稚勋洱蚤上沿心悉开薛货碳SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.3 编程绘制统计图编程绘制统计

68、图 SAS可可以以把把存存贮贮在在SAS数数据据集集中中的的数数据据以以图图形形的的方方式式形形象象直直观观地地显显示示出出来来。在在SAS/GRAPH模模块块的的支支持持下下,SAS可可以以作作散散点点图图、曲曲线线图图、直直方方图图、扇扇形形图图、三三维维曲曲面图、等高线图、地图,等等。面图、等高线图、地图,等等。炬蒸评水荔船窒确干逮标僵岳碌俗郸淘蜕玻讣锈儿恨初馁因襄关筐侄油嘛SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程1. GCHART1. GCHART过程过程(1) 语法格式语法格式 GCHART过过程

69、程用用于于绘绘制制直直方方图图、饼饼形形图图(扇扇形形图图)、三维直方图等表示变量分布的图形。其语法格式为:三维直方图等表示变量分布的图形。其语法格式为:PROC GCHART DATA = ; /RUN;桅狼伟繁疙妨绕迅赫抬秃糊集钡昌览估烦惯道玲升捧住颁志纹次仙促蝶捶SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 GCHART过过程程可可以以使使用用的的图图形形关关键键字字及及其其所所绘绘制制的的图形类型见表图形类型见表2-5。 图图形形关关键键字字后后的的变变量量名名用用以以指指定定进进行行图图形形描描述述时

70、时的的分分组组变变量量,可可以以是是数数值值型型的的(此此时时以以各各组组的的组组中中值值为为分分组组的标志),也可以是字符型的。的标志),也可以是字符型的。图形关键字绘制的图形类型图形关键字绘制的图形类型block方块图pie饼形图hbar水平的条形图pie3d三维饼形图hbar3d水平的三维条形图donut环形图vbar竖立的条形图star星形图vbar3d竖立的三维条形图狂春杠柏琅嗓苫燎叮咐蔼穷光宽圃吠破轻香夏棠用围倚邹廓侮富杭毖钩膀SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程选项比较重要的有:选项比较重

71、要的有: TYPE = 统统 计计 量量 关关 键键 字字 , 表表 示示 以以 图图 形形 对对 变变 量量(SUMVAR所所指指定定的的变变量量)的的哪哪一一种种统统计计量量进进行行描描述述,比比如如频频数数(FREQ)、均均数数(MEAN)、总总计计(SUM)、频数百分比(频数百分比(PCTN)等;)等; SUBGROUP = 变变量量名名(分分组组变变量量),指指定定要要进进行行分分组(各组段内再分组)的变量;组(各组段内再分组)的变量; SUMVAR = 变变量量名名(数数值值变变量量),指指定定要要进进行行统统计计计计算算的的变变量量,也也就就是是“TYPE = 统统计计量量关关键

72、键字字”选选项项中中统统计量的计算所依据的变量。计量的计算所依据的变量。繁露碎赏癸绍复帛阳羊穿剃方老屎笛荆坟擒械产吟蹲肠隔肆警酮箩财经宣SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2) 画条形图(直方图)画条形图(直方图) 使使用用VBAR关关键键字字可可以以画画条条形形图图。例例如如,画画出出数数据据集集Mylib.sryzc中中Income变量的条形图的代码如下:变量的条形图的代码如下:proc gchart data = mylib.sryzc; vbar Income;run; 结果如图所示。结果如图

73、所示。双槐蓖拼驰邪胳韶噶洪请洞花钓乔银吊攻减辩纪烘咀愚菜贰窑觉吱扎睫舌SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 其其中中绘绘图图用用的的变变量量用用VBAR语语句句给给出出,如如果果把把VBAR改改成成HBAR则则条条形形方方向向变变为为横横向向。用用GCHART绘绘制制的的条条形形图图和和在在INSIGHT中中绘绘制制的的直直方方图图有有所所不不同同,它它在在横横轴轴标标的的是是区区间间的的中中点点值值,而而在在INSIGHT中中横横轴轴标标的的是是区区间间的端点值。的端点值。 可可以以指指定定分分组组的

74、的变变量量,例例如如在在每每个个区区段段内内再再分分段段,可可以用如下代码:以用如下代码:proc gchart data = mylib.sryzc; vbar Income / subgroup = R_Id;run; 结果如图所示。结果如图所示。悟翱曝豢家镰湃意废椰桂搏爬扯专肋沿治普程恶肆欠疽勾勿行流絮戏莽蕉SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 (3) 画三维条形图画三维条形图 使使用用BLOCK关关键键字字可可以以画画三三维维条条形形图图。例例如如,画画出出数数据据集集mylib.sryzc中中

75、Income变变量量的的三三维维条条形形图图的的代代码码如如下:下:proc gchart data = mylib.sryzc; block Income/ group = R_Id;run; 结果如图所示。结果如图所示。搓圾旅弟琅帜典沤种诅街依顶蔬巷知盘轨帐柴倡寥纽惟疚圾灿釉扎掀颂易SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(4) 画饼形图画饼形图 使使用用PIE关关键键字字可可以以画画饼饼形形图图,PIE3D关关键键字字可可以以画画三三维维饼饼形形图图。例例如如,画画出出数数据据集集mylib.sryz

76、c中中Income变变量的三维饼形图的代码如下:量的三维饼形图的代码如下:proc gchart data = mylib.sryzc; PIE3D Income;run; 结果如图所示。结果如图所示。礼厌缅疽卯痰邓溪回唤皮炳凄印蔬囤厚搬俯寝佃柳嗅浪多传墩泵疡错崖翌SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 使用使用GPLOTGPLOT过程绘制散点图和连线图过程绘制散点图和连线图 通常用散点图和连线图可以表示:通常用散点图和连线图可以表示: 一个变量随另一个变量的变化;一个变量随另一个变量的变化;

77、变量之间的关系;变量之间的关系; 数据值的分布。数据值的分布。(1) GPLOT过程的一般格式过程的一般格式PROC GPLOT DATA = ; PLOT * = /; SYMBOLn ;RUN;常用的选项见表常用的选项见表2-6。砖只芦映踪峨泉遏菏妖钮菱熊衣株虚盂斟汰哎哮从慷五朔排捏壶屎马阂复SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表2-6 PLOT语句的选项选项意义说明FRAM | NOFRAM在图形四周加入或不加入边框缺省为加入CFRAM = 颜色边框内的颜色缺省为白色AUTOHREF(AUTOVE

78、REF)在水平(垂直)轴的每个主刻度处加入水平(垂直)参考线NOAXIS取消坐标轴及相关的图形元素CAXIS = 颜色设定轴的颜色CTEXT = 颜色设定与轴相关字符的颜色HAXIS = 值列举设定水平轴主刻度的值VAXIS = 值列举设定垂直轴主刻度的值衅札妒董岭汾睁钾椰叔股骸舰乘瞬瞎迢听缄品踩帚诉足烛汁蚁峙吊僧俱路SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 SYMBOL语语句句用用来来控控制制表表示示点点的的符符号号和和点点间间的的连连线线。其其中中n是是不不同同SYMBOL语语句句的的序序号号,可可以以

79、是是1-99,缺缺省省为为1。选项见表。选项见表2-7。表2-7 SYMBOL语句的选项选项意义取值V = 符号表示点使用的符号plus, x, star, square, diamond, triangle, hash, y, z, paw, point, dot, circleC = 颜色表示点的符号及连线的颜色black, red, green, blue, cyan, magenta, gray, pink, orange, brown, yellowCV =颜色专指点的符号的颜色H = n指名符号的大小单位有:cell, cm, pct, pt, inPOINTLABEL在点的附近表

80、明Y轴变量的值i = 连线方式指明连线的方式none, join, spline, needleCI = 颜色专指连线的颜色L = nn为线型的序号0 空白线,1 - 实线,2 虚线 W = nn表示线的宽度傍寓房酣粕薯抡坚袄庙惯康绽疑渡用咒惕锡栖求粕询灾曲丹杠袄裴绸吗窄SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2) 散点图 绘制家庭总收入对家庭总支出的散点图,代码如下:绘制家庭总收入对家庭总支出的散点图,代码如下:proc gplot data = mylib.sryzc; plot Income*out

81、go;run; 结结果果显显示示了了一一个个GRAPHICS窗窗口口,绘绘出出了了以以Income为纵轴、以为纵轴、以Outgo为横轴的散点图(见图)。为横轴的散点图(见图)。偶诣艺栅像嘎雏侩兰页火犊堂甫遭风帐佑集挞蔼郝擂褐蓟涟揍雁笛参津旦SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 可可以以在在图图中中按按第第三三个个变变量量分分组组画画出出散散点点图图(如如图图2-48右),代码如下:右),代码如下:proc gplot data = mylib.sryzc; plot Income*outgo = r_i

82、d; symbol1 color=black v = star; symbol2 color=blue v = dot;run;二肩怕南灯佃享睫搀筏桔乙绢畏狄吏迹俘蔗审博原仕省囱诚袁挠店夸群聚SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3) 连线图连线图 为为了了绘绘制制连连线线,只只要要在在SYMBOL语语句句中中指指定定i = join。例例如如绘绘制制家家庭庭总总收收入入对对家家庭庭编编号号的的连连线线图图(图图2-49左左),代码如下:代码如下:proc gplot data = mylib.sryz

83、c; plot Income*id; symbol i=join v=star;run;送垒绸霉丘烦庆豫崔污埂蔚缺筷炊石职束黑盟喜钱跑戳取酷葱燕滩滨裸读SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 也也可可以以分分地地区区绘绘制制家家庭庭总总收收入入对对家家庭庭编编号号的的连连线线图图(图(图2-49右),代码如下:右),代码如下:proc gplot data = mylib.sryzc; plot Income*id=r_id; symbol1 color=black i=join v = star; sy

84、mbol2 color=blue i=join v = dot;run;追凌攘膛菇锥体吟剁帝瘤殖倪耶鉴弘突登磅胯厢黑岛衅运岂垫法桓果弥步SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.4.4 图形的调整与输出图形的调整与输出 在在图图形形中中也也可可以以用用TITLE语语句句和和FOOTNOTE语语句句给给图形加标题和脚注。图形加标题和脚注。 还还可可以以在在图图形形的的标标题题、标标签签中中使使用用TrueType字字型型的的汉汉字,例如:字,例如:goptions ftext=宋体 htitle=4 cel

85、ls htext=3 cells;proc gplot data=sasuser.class; title 试验SAS图形的汉字功能; symbol i=none v=square; plot weight*height; label weight=体重 height=身高;run; 输输出出结结果果见见图图。其其中中GOPTIONS中中的的FTEXT选选项项指指定图形中文本的字体。定图形中文本的字体。叮谷谍闲督薛磊数菠珐妖碧浸抚秦专备紫棱港蛤撵碎韩磨讶纽帽卒钞五宰SAS软件与统计应用教程SAS软件与统计应用教程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程

86、为为了了把把GRAPH绘绘制制的的图图形形保保存存为为兼兼容容的的图图形形文文件件,只只要要在在显显示示某某一一页页图图形形输输出出时时,选选“File-Export”菜菜单单,在在出出现现的的输输入入文文件件名名的的窗窗口口选选择择适适当当的的文文件件类类型型,如如BMP、WMF、JPEG、PS,等等。,等等。 要要打打印印GRAPH生生成成的的图图形形,只只要要选选“File-Print”。这这样样用用Windows的的打打印印驱驱动动程程序序与与SAS/GRAPH的的图图形形驱驱动动配配合合来来打打印印。另另外外,SAS/GRAPH模模块块还还提提供供了了许许多多种种打打印印机机的的独独立立的的驱驱动动程程序序,可可以以不不依依赖赖于于Windows的打印驱动,具体请参考有关资料或帮助。的打印驱动,具体请参考有关资料或帮助。芥卑莎敲颜狱路险瞳埔驼讫挽泡颧蚁争鸣酮寐峦驱芬嚏钟擂杜验伐李萨舞SAS软件与统计应用教程SAS软件与统计应用教程

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号