统计分析软件教程(第2版)-4(图表制作)

上传人:宝路 文档编号:47044766 上传时间:2018-06-29 格式:PPT 页数:112 大小:2.79MB
返回 下载 相关 举报
统计分析软件教程(第2版)-4(图表制作)_第1页
第1页 / 共112页
统计分析软件教程(第2版)-4(图表制作)_第2页
第2页 / 共112页
统计分析软件教程(第2版)-4(图表制作)_第3页
第3页 / 共112页
统计分析软件教程(第2版)-4(图表制作)_第4页
第4页 / 共112页
统计分析软件教程(第2版)-4(图表制作)_第5页
第5页 / 共112页
点击查看更多>>
资源描述

《统计分析软件教程(第2版)-4(图表制作)》由会员分享,可在线阅读,更多相关《统计分析软件教程(第2版)-4(图表制作)(112页珍藏版)》请在金锄头文库上搜索。

1、第四章第四章 图表制作与矩阵运算图表制作与矩阵运算内容与要求掌握SAS系统的图表制作过程 掌握SAS系统的矩阵运算过程 *2第四章目录一 统计图制作 二 统计表制作 三 矩阵运算 *3第四章一 统计图1 GPLOT过程 GPLOT语句用于表现两个变量之间关系的图 形。横、纵坐标分别代表两个变量,每个点对应数 据集中的一个或几个观测。散点图 语句格式:PROC GPLOT 选择项;PLOT 图形表达式/选择项;BY 变量表;SYMBOLn 选择项;*4第四章语句说明:(1) 常用选择项:DATA = SAS数据集UNIFORM 要求用BY变量分组打印的散点图的坐标刻 度相同。(2) PLOT语句

2、:通过图形表达式和选择项对所绘制的散点图提出具体要 求。(3)BY语句:要求PLOT语句把观测按BY变量分组每组数据打印一个 散点图,但BY变量必须事先排序。*5第四章图形表达式纵坐标*横坐标:指定作为纵、横坐标的变量打印符号用系统设定的缺省值。纵坐标*横坐标打印点字符例如:“Y*X=#” 表示纵坐标为变量Y 横坐标为变量 X 在(X,Y)坐标点上打印。纵坐标*横坐标打印点变量例如:“Y*X=Z” 当三个变量值分别为X=a, Y=b,Z=F时在图中坐标为(a,b)点上打印字符F。返回*6第四章例41例41PROC PLOT DATA=DST.BCLASS;PLOT HEIGHT*WEIGHT;

3、RUN; 运 行 结 果*7第四章第四章8*返 回折线图如果需要生成折线图,则可由SYMBOL语句选项设定Interpol = 连线方式i = 连线方式。其中:NONE(不连线默认值)、JOIN(直线相连)、SPLINE (光滑曲线连接)、NEEDLE(每个点到横轴画垂直线)。CI= 颜色:指明连线的颜色。其中:BLACK(黑)、RED(红)、 GREEN(绿)、BLUE(蓝)、 CYAN(青)LINE = nL=n: 表示线型。0空白线,1实线(默认值),2虚线WIDTH=nW=n:线型的宽度。第四章9*例42例43例44例42数据集Data.Airqual记录了美国47 个州逐月的两项 空

4、气质量指标。它包含如下几个变量。STATE:州名,用两个字符的简称REGION:各州所在的区域,以l 一7 表示MONTH:月份(l 12 )AVE_TSP:空气中悬浮颗粒含量的平均值AVE_LEAD:铅含量的平均值以纽约(STATE=NY) 州的数据,制作逐月的平 均悬浮颗粒含量的散点图。时间为横轴。由于只需要纽 约州的数据,只需使用WHERE语句从数据集中取一个子 集。并利用SYMBOL语句进行一定的修改。第四章10*编 程proc gplot data=data.airqual; symbol v=dot cv=red h=1.5;plot ave_tsp*month; where st

5、ate =NY; run; 第四章11*第四章12*运行结果返回例43利用数据集Data.Airqual的数据用折线图表示 纽约州逐月的平均悬浮颗粒含量。编程:proc gplot data=data.airqual; symbol i=jion ci=blue v=dot cv=red h=1.2 pointlabel;plot ave_tsp*month; where state =NY; run;第四章13*运行结果第四章14*返 回例44第四章15*利用数据集Data.Airqual的数据用光滑曲线表 示纽约州逐月的平均悬浮颗粒含量。编程:proc gplot data=data.ai

6、rqual; symbol i=spline ci=blue v=point cv=red w=2 l=2 pointlabel;plot ave_tsp*month; where state =NY; run;第四章16*返 回多重折线图分析过程中,为了进行对比分析需要一次绘制多条图形,这些图形可以使用BY语句进行分组绘制,也可以在一个GPLOT过程中使用多个POLT语句进行绘制。所生成的图形既可以用不同坐标系表达也可以在一个坐标系中绘制。OVERLAY选项:使用OVERLAY选项是将若干图形在一个坐标系内表现出来。第四章17*例45例46例45数据集data.gmzb是1989年2003年

7、我国 宏观国民经济指标的资料,其中:TIME:年份(19892003)GDP:国内生产总值INC:人口自然增长率POP:年末人口总数AVE:人均国内生产总值要求在一个坐标系内绘制各年的GDP和AVE 折线图,时间为横轴。以比较两者的发展变化趋 势。第四章18*编 程proc gplot data=data.gmzb; symbol1 i=spline ci=blue v=square cv=black w=2 l=2; symbol2 i=spline ci=black v=diamond cv=red w=1 l=1 h=1.5; plot gdp*time ave*time /overla

8、y legend ; run;由于需要绘制两条折线,因此用两个SYMBOL语句分别定义。利用OVERLAY选项是这两条折线出现在一个坐标系中。使用LEGEND选项加入图例以说明不同的折线。第四章19*第四章20*返 回例46从运行结果上看由于两个指标GDP和AVE的数值差距 很大,指标AVE的变化反映的较为粗糙。为了解决这一问 题,可以使用PLOT2语句。编程:proc gplot data=data.gmzb; symbol1 i=spline ci=blue v=square cv=black w=2 l=2;symbol2 i=spline ci=black v=diamond cv=r

9、ed w=1 l=1 h=1.5;plot gdp*time /overlay legend ; plot2 ave*time /overlay legend;run;第四章21*第四章22*返 回菜单操作在SAS系统中可以通过菜单操作绘制 图形。第四章23*AnalysisInteractive Data Analysis选择数据库选择数据集Open折线图散点图曲面图三维图折线图散点图曲面图三维图2 GCHART过程语句格式:PROC GCHART 选择项;VBAR 绘图变量表 / 选择项;HBAR 绘图变量表 / 选择项;PIE 绘图变量表 / 选择项;BY 变量列表;*35第四章语句说明

10、:PROC GCHART语句: 可跟任意多个绘图语句。常用选择项:DATA = SAS数据集:指出该过程使用的数据集,如省略,用最新建立的SAS数据集。BY语句: 语句与PROC GCHART一起使用时,可得到 由BY变量定义的几个观测组分别画出的图表。*36第四章绘图语句:VBAR 绘图变量表/选择项:列出要画的垂直条形图的变量。每一个绘图变 量对应一张条形图。HBAR 绘图变量表/选择项:列出要画的水平条形图的变量。 PIE 语句:绘图变量表/选择项:绘制饼形图。其选择项与VBAR语句基本相同。例47*37第四章例47数据集data.jszl是某学校具有中级以上职称教师的基本资料,包含年龄

11、(AGE)、性别(SEX)、职称(TITL)、收入(INCOME)等变量。利用该资料绘制垂直条形图、水平条形图和饼形图。编 程*38第四章编 程proc gchart data=data.jszl; vbar titl; hbar titl; pie age; run;运 行 结 果*39第四章运 行 结 果运 行 结 果第四章40*返回第四章41*返回第四章42*返回条形图的调整(1)中心值点(MIDPOINT)的调整:MIDPOINTS:中点值表。当绘图变量是连续 变量时,用此选项指定变量分组的中点。中点值 表可以是一系列中点值,也可以用“起点TO终点 BY间隔”的方式来表示。LEVELS

12、:如果绘图变量是连续的,用此选 项指定产生N条图形。两者的结果是相同的。*43第四章(2)变量分组的调整:GROUP:分组变量,要求产生以分组变量值分组的并排图。SUBGROUP:细分变量,要求产生的条形图按细分变量的值再分组,分别表示每个条形图中细分变量的各值所占的比例。例48*44第四章例48利用选择项MIDPOINT、GROUP、SUBGROUP选项绘制水平条形图。其程序为:proc gchart data=data.jszl; hbar titl/group=sex; hbar titl/subgroup=sex; hbar age/ midpoints= 30 to 70 by 10

13、; run;运 行 结 果*45第四章对职工按职称和性别分组输出条形图。HBAR TITL / GROUP=SEX;表示为作变量TITL的水平条形图,在按变量SEX分组的基础上,按变量TITL对分组数据作图。运行结果:纵坐标为频数,横坐标表现为变量SEX和TITL的分组状况。运 行 结 果*46第四章第四章47*运 行 结 果采用选择项:GROUP采用SUBGROUP选择项: HBAR TITL / SUBGROUP=SEX;表示为作变量TITL 水平条形图,按变量 SEX对条形图进行分块。运行结果:纵坐标为频数,横坐标表现为 变量TITL分组状况,条形图表现为SEX的分块 状况。*48第四章

14、运 行 结 果采用选择项:SUBGROUP第四章49*运 行 结 果GCHART过程不仅可以生成平面的图形,还 可以绘制三维立体图。其图形语句为:VBAR3D:垂直柱形图;HBAR3D:水平柱形图;BLOCK: 平铺柱形图;PIE3D: 三维饼形图。第四章50*例49例49第四章51*利用数据集data.jszl绘制三维图形。 编程:proc gchart data=data.jszl;hbar3d titl;hbar3d titl/subgroup=sex;pie3d titl;pie3d titl/subgroup=sex;block age/subgroup=titl group=sex

15、midpoints= 30 to 60 by 10;run;运 行 结 果三维条形图第四章52*运 行 结 果细分的三维条形图第四章53*运 行 结 果三维饼形图第四章54*运 行 结 果细分的三维饼形图第四章55*运 行 结 果细分的三维柱状图第四章56*返回直方图在SAS系统中生成直方图的语句较为复杂,一般情况下是通过菜单操作完成的。在交互式数据分析和分析员应用两部分均可绘制直方图第四章57*Solutions选择数据库选择数据集Open直方图与条形图选择变量 OK二 统计表的制作统计表制作的TABULATE过程: 语句格式: PROC TABULATE 选择项;CLASS 分类变量表;V

16、AR 分析变量表;TABLE 表达式/选择项;FREQ 变量名;WEIGHT 变量名;*63第四章语句说明:PROC TABULATE:制图语句,要求定义两类变量,分类变量和分析变 量,分类变量可以是离散或连续变量,分析变量只能是 连续变量,常用选择项。(1)DATA=SAS数据集:定义TABULATE过程的 数据集,如省略,则使用最新建立的数据集。(2)MISSING: 规定TABULATE在分析中包括一个 或多个分类变量的缺失值,否则,缺失值不参加运算。(3)FORMAT=格式名:定义表中每个格子内统计值 的有效位数,默认值为12.2 *64第四章(4) TABULATE过程的其他说明全类变量ALL:ALL变量代表只有一个值的特殊类变量,当与其他分 类

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号