3.2 定性数据的统计描述及sas报表

上传人:人*** 文档编号:591278323 上传时间:2024-09-17 格式:PPT 页数:39 大小:247.02KB
返回 下载 相关 举报
3.2 定性数据的统计描述及sas报表_第1页
第1页 / 共39页
3.2 定性数据的统计描述及sas报表_第2页
第2页 / 共39页
3.2 定性数据的统计描述及sas报表_第3页
第3页 / 共39页
3.2 定性数据的统计描述及sas报表_第4页
第4页 / 共39页
3.2 定性数据的统计描述及sas报表_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《3.2 定性数据的统计描述及sas报表》由会员分享,可在线阅读,更多相关《3.2 定性数据的统计描述及sas报表(39页珍藏版)》请在金锄头文库上搜索。

1、FreqFreq过程可以生成单向到多向的频率表和交叉过程可以生成单向到多向的频率表和交叉表。对于双向表(二维表),该过程计算检表。对于双向表(二维表),该过程计算检验统计量和关联度。对于多向表,该过程进验统计量和关联度。对于多向表,该过程进行分层分析,计算每一层和交叉层的统计量。行分层分析,计算每一层和交叉层的统计量。这些频数也能够输出到这些频数也能够输出到sassas数据集里。数据集里。定性数据的统计描述(定性数据的统计描述(freq语句)语句)Proc FreqProc Freq过程可用于两个目的。它是一个描述过程。过程可用于两个目的。它是一个描述过程。产生频数表和交叉表,可简洁地描述数据

2、。它也是产生频数表和交叉表,可简洁地描述数据。它也是一个统计过程,产生各种统计量,可分析变量间的一个统计过程,产生各种统计量,可分析变量间的关系。关系。单向频数表:如果要一张一个变量的单向频数表,单向频数表:如果要一张一个变量的单向频数表,只要在只要在tables语句中写上变量名。该变量的值可以语句中写上变量名。该变量的值可以是数值的,也可以是字符的。例如:是数值的,也可以是字符的。例如:procfreqdata=class;Tablessex;Run;定性数据的统计描述(定性数据的统计描述(freq语句)语句)双向交叉表:如果要一张两个变量的双向交叉表,只要在双向交叉表:如果要一张两个变量的

3、双向交叉表,只要在tables语语句中用星号将两个变量连接起来第一个变量的值形成行,第二个句中用星号将两个变量连接起来第一个变量的值形成行,第二个变量的值形成列。例如:变量的值形成列。例如:procfreqdata=class;Tablessex*age;Run;n向交叉表:如果要一张三向(向交叉表:如果要一张三向(n)交叉表,只要在)交叉表,只要在tables语句中语句中用星号将三(用星号将三(n)个变量连接起来,最后一个变量的值形成列,倒)个变量连接起来,最后一个变量的值形成列,倒数第二个变量的值形成行,其余变量的每一水平(或水平组合)数第二个变量的值形成行,其余变量的每一水平(或水平组合

4、)形成一层。例如:形成一层。例如:procfreqdata=class;Tablesheight*weight*sex*age;Run;产生产生k张以张以sex为行,为行,age为列的表,其中为列的表,其中k为为height和和weight的各种的各种组合的个数组合的个数定性数据的统计描述(定性数据的统计描述(freq语句)语句)Procfreq;By变量串;变量串;Tables要求列表要求列表;/*可以有多个可以有多个tables语句语句*/Weight变量;变量;该过程该过程procfreq语句是必须的,其他语句都是任选语句是必须的,其他语句都是任选的。另外该过程只能使用一个的。另外该过程

5、只能使用一个output语句。若使用:语句。若使用:Procfreq;Run;则生成输入数据集中每个变量的单向频数表。则生成输入数据集中每个变量的单向频数表。Procfreq的格式的格式Data=Data=数据集名数据集名 指出该过程使用的数据集。指出该过程使用的数据集。若省略,用最近建立的若省略,用最近建立的sassas数据集;数据集;Page Page 要求要求freq freq 每页只输出一张表。否则每页只输出一张表。否则freqfreq按每页行数允许的空间输出几张表;按每页行数允许的空间输出几张表;NoprintNoprint 不打印显示;不打印显示;out=数据集名数据集名统计量列表

6、;统计量列表;/*当有多个当有多个tables语句时,数据集内容对应于语句时,数据集内容对应于tables语句的最后一个制表要求语句的最后一个制表要求*/Procfreq一个一个byby语句可以同语句可以同proc freqproc freq一起使用,以便对一起使用,以便对由由byby变量定义的分组观测分别进行分析。当使变量定义的分组观测分别进行分析。当使用用byby语句时,过程要求输入数据集已按语句时,过程要求输入数据集已按byby变量变量排序排序By语句语句Proc freq data=class;Tables height sex*age/out=d;Run;示例示例formatform

7、at:对连续数值变量做:对连续数值变量做FreqFreq时,系统会对每个时,系统会对每个数值进行频数统计,这个结果一般不是我们所需数值进行频数统计,这个结果一般不是我们所需要的。我们一般会将连续变量转换为离散变量,要的。我们一般会将连续变量转换为离散变量,这个可以通过这个可以通过FormatFormat过程步来实现。过程步来实现。proc format;value height_ctg 50-55=50-5556-60= 56-60 61-high=60;value weight_ctg 50-80=50-8080-90=80-9090-110=90-110110-high=110;run;p

8、roc freq data=class;tables weight*height;format weight weight_ctg.;format height height_ctg.;run;有时我们只需要频数,不需要各行各列的百分比,有时我们只需要频数,不需要各行各列的百分比,我们就可以在我们就可以在tablestables后面加上这些参数。后面加上这些参数。procfreqdata=class;tablesweight*height/norownocolnopercent;formatweightweight_ctg.;formatheightheight_ctg.;run;Norow:

9、不要行的百分比:不要行的百分比Nocol:不要列的百分比:不要列的百分比Nopercent:不要频数的百分比:不要频数的百分比Nocum:单变量时不要累积频数和累积百分比:单变量时不要累积频数和累积百分比Nofreq:不要频数:不要频数Noprint:不打印:不打印Nowarn:不输出警告信息:不输出警告信息Missing:将缺失值也进行统计:将缺失值也进行统计对变量加对变量加labellabel标识,使输出更直观标识,使输出更直观procfreqdata=class;tablesweight*height/norownocolnopercent;labelweight=高度高度;labelh

10、eight=重量重量;formatweightweight_ctg.;formatheightheight_ctg.;run;ByBy:对这个变量的值进行分页显示:对这个变量的值进行分页显示procfreqdata=class;tablesweight/norownocolnopercent;bysex;run;注意:一定要先对注意:一定要先对byby变量排序变量排序listlist当对多个变量进行交叉频率操作,我们当对多个变量进行交叉频率操作,我们只需要频数和百分比时可以用到。只需要频数和百分比时可以用到。proc freq data=class;tables sex*age/list ou

11、t=safreq ;run;proc print data= safreq(obs=10);run;输出数据集输出数据集与与list语句语句Sas报表报表Proc print;Proc tabulate;Procpint在在PROC PRINTPROC PRINT过程中,常常配合使用了许多其它过程中,常常配合使用了许多其它SASSAS语语句以达到所要求的输出报表格式句以达到所要求的输出报表格式. .具体使用时根据需具体使用时根据需要可能使用其中的几条语句。如下所示:要可能使用其中的几条语句。如下所示:PROCPRINT;VAR变量列表变量列表;ID变量列表变量列表;BY变量列表变量列表;PAG

12、EBY变量变量;SUM变量列表变量列表;TITLEn“标题内容标题内容”;FOOTNOTEn“标题内容标题内容”;LABEL变量变量1=“标签标签*内容内容”变量变量2=“标签标签*内容内容”;FORMAT变量输出格式变量输出格式;WHERE条件表达式条件表达式;Run;PROC PRINTPROC PRINT的选项列表包含许多选项,选项之间以的选项列表包含许多选项,选项之间以空格分隔,选项没有先后次序。我们下面列出一空格分隔,选项没有先后次序。我们下面列出一些主要选项:些主要选项:DATA=数据集名数据集名给出要打印输出的给出要打印输出的SAS数据集。如果数据集。如果省略,则为最近建立的省略

13、,则为最近建立的SAS数据集。数据集。N要求在输出这个数据集的数据列表之后,同时输出要求在输出这个数据集的数据列表之后,同时输出观测的总输出条数。如果使用了观测的总输出条数。如果使用了BY分组语句,在每一个分组语句,在每一个分组后输出各个分组输出观测的条数。分组后输出各个分组输出观测的条数。LABEL或或L使用变量的标签作为输出数据列表中每列使用变量的标签作为输出数据列表中每列的抬头。如果变量没有定义标签,则用变量名作为列抬头。的抬头。如果变量没有定义标签,则用变量名作为列抬头。SPLIT或或S=分隔符分隔符规定一个字符(如规定一个字符(如*号或号或#号)号)用于将较长的标签分隔成几行。在这个

14、选项里定义了某个用于将较长的标签分隔成几行。在这个选项里定义了某个分隔符以后,过程中的分隔符以后,过程中的LABEL语句里就可以使用这个分语句里就可以使用这个分隔符了。另外选项隔符了。另外选项SPLIT=和和LABEL不必同时使用。不必同时使用。NOOBS不输出观测数据的序号。当不用不输出观测数据的序号。当不用ID语句且又语句且又不要输出观测的序号时,可使用该选项。不要输出观测的序号时,可使用该选项。示例示例PROC PRINT data=class noobs n split=*;VAR name sex height weight ;*id height;SUM weight;TITLE1

15、 PROCEDURE PRINT;TITLE2 class sex;FOOTNOTE1 height;LABEL height=height of*class weight=weight of *class ;FORMAT sex $10. height 12.3;WHERE height=60;run;示例示例proc sort data=class;by sex;run;PROC PRINT data=class noobs n split=*;VAR name sex height weight ;by sex; pageby sex;SUM weight;TITLE1 PROCEDUR

16、E PRINT;TITLE2 class sex;FOOTNOTE1 height;LABEL height=height of*class weight=weight of *class ;FORMAT sex $10. height 12.3;*WHERE height=n m=n。比如原来我们定义了:比如原来我们定义了:title1 “title1 “timutimu”; title2 ”; title2 “timu2”;“timu2”;要想同时取消这两级题目只需在新程要想同时取消这两级题目只需在新程序中运用语句序中运用语句title1;title1;即可。若只想取消即可。若只想取消ti

17、tle2 title2 “timu2”; “timu2”; 运行语句运行语句title2title2;即可。;即可。Titie1Titie1与与titletitle等价。等价。Proc tabulate在在PROC TABULATEPROC TABULATE过程的一般过程形式如下:过程的一般过程形式如下:PROC TABULATE PROC TABULATE ; ;CLASS CLASS 分类变量列表分类变量列表 ; ;VAR VAR 分析变量列表分析变量列表 ; ;TABLE TABLE 行表达式,行表达式, 列表达式列表达式/ ; ;LABEL LABEL 变量变量1=“1=“标签标签*

18、*内容内容” ” 变量变量2=“2=“标签标签* *内容内容” ; ;KEYLABEL KEYLABEL 统计量名字统计量名字1=“1=“标记标记1” 1” 统计量名字统计量名字2=“2=“标记标记2” ;2” ;FORMAT FORMAT 变量输出格式变量输出格式 ; ;WHERE WHERE 条件表达式条件表达式 ; ;Run ;Run ;Proctabulate语句说明语句说明PROC TABULATEPROC TABULATE语句总是伴随着至少一个语句总是伴随着至少一个TABLETABLE语语句来规定如何制表。句来规定如何制表。用在用在TABLETABLE语句的分类变量必须用语句的分类

19、变量必须用CLASSCLASS语句说明。语句说明。用在用在TABLETABLE语句的分析变量必须用语句的分析变量必须用VARVAR语句说明。语句说明。同时出现在同时出现在CLASSCLASS语句和语句和VARVAR语句中的变量,只能语句中的变量,只能作为分类变量使用。作为分类变量使用。CLASSCLASS、VARVAR和和TABLETABLE语句是构成语句是构成PROC TABULATEPROC TABULATE过过程最基本的三条语句。程最基本的三条语句。示例示例例例1 1:TABLETABLE表达式中只有一个分类变量表达式中只有一个分类变量A A,既没有规定分析变量,也没有指明统计量,既没有

20、规定分析变量,也没有指明统计量,则缺省的统计量为频数则缺省的统计量为频数N N,即分类变量值的,即分类变量值的交叉频数。程序和输出汇总报表形式如下交叉频数。程序和输出汇总报表形式如下所示:所示:Proc tabulate Data=class;Class sex;Table sex;RUN;示例示例例例2 2:使用逗号操作符隔开:使用逗号操作符隔开TABLETABLE语句的两个表达式语句的两个表达式将产生一个两维表格,第一个表达式定义行,第将产生一个两维表格,第一个表达式定义行,第二个表达式定义列。程序和输出汇总报表形式如二个表达式定义列。程序和输出汇总报表形式如下所示:下所示: proc f

21、ormat;value age_ctg 11-13=11-1314-16= 14-16;run;Proc tabulate Data=class;Class sex age;Table sex, age;format age age_ctg.;Run;示例示例proc format;value age_ctg 11-13=11-1314-16= 14-16;value height_ctg 50-55=50-5556-60= 56-60 61-high=60;run;Proc tabulate Data=class;Class sex age height;Table sex, age, he

22、ight;format age age_ctg.;Format height height_ctg.;Run ;第第一一页页第第二二页页例例3 3:使用两个逗号操作符隔开:使用两个逗号操作符隔开TABLETABLE语句的三个表达式将产生语句的三个表达式将产生一个三维表格,第一个表达式定义页,第二个表达式定义行,一个三维表格,第一个表达式定义页,第二个表达式定义行,第三个表达式定义列。程序和输出汇总报表形式如下所示:第三个表达式定义列。程序和输出汇总报表形式如下所示:示例示例例例4 4:使用空格操作符隔开:使用空格操作符隔开TABLETABLE语句的两个表达式将产生一语句的两个表达式将产生一个连

23、排表格。程序和输出汇总报表形式如下所示:个连排表格。程序和输出汇总报表形式如下所示:Proc tabulate Data=class;Class sex age height;Table sex age height;format age age_ctg.;Format height height_ctg.;Run ;示例示例例例5 5:使用星号操作符隔开:使用星号操作符隔开TABLETABLE语句的两个表达式语句的两个表达式将产生一个交叉等级表格。程序和输出汇总报表形将产生一个交叉等级表格。程序和输出汇总报表形式如下所示:式如下所示:Proc tabulate Data=class;Clas

24、s sex age;Table sex*age;format age age_ctg.;Run;示例示例例例6 6:使用含有园括号、空格和星号操作符的复合表达式。:使用含有园括号、空格和星号操作符的复合表达式。在复合表达式中,交叉操作符星号优于连接操作符空格,但在复合表达式中,交叉操作符星号优于连接操作符空格,但可以使用园括号操作符来改变它们的次序,如(可以使用园括号操作符来改变它们的次序,如(A BA B)* *C C表表达式相当于达式相当于A*C B*CA*C B*C。程序和输出汇总报表形式如下所示:。程序和输出汇总报表形式如下所示: Proc tabulate Data=class; /

25、* options pagesize=60 linesize=200nodate;*/Class sex age height;Table sex*(age height);format age age_ctg.;Format height height_ctg.;Run ;汇总报告中计算统计量汇总报告中计算统计量在在TABLETABLE语语句句中中使使用用星星号号操操作作符符连连接接分分析析变变量量和和统统计计量量,如如TABLE TABLE A*X*MEANA*X*MEAN, ,其其中中A A是是分分类类变变量量,X X是是分分析析变变量量,MEANMEAN是统计量,则可以对指定的分析变量

26、是统计量,则可以对指定的分析变量X X计算指定计算指定MEANMEAN统计量。统计量。在在TABLETABLE语语句句中中如如果果没没有有规规定定分分析析变变量量,则则N N或或PCTNPCTN(频频数数N N的的百百分分数数)可可作作为为统统计计量量使使用用,如如TABLE TABLE A*NA*N或或TABLE TABLE A*PCTNA*PCTN。如如果果TABLETABLE语语句句中中规规定定了了分分析析变变量量,但但没没有有指指定定统统计计量量时时,如如TABLE A*XTABLE A*X,则,则SUMSUM作为统计量。作为统计量。如如果果TABLETABLE语语句句中中既既没没有有

27、出出现现分分析析变变量量如如X X,又又没没有有出出现现统统计计量量如如MEANMEAN,例例如如上上面面的的例例1616中中的的TABLETABLE语语句句都都没没有有规规定定分分析析变变量量和和统统计计量量,如如TABLE TABLE A A 语语句句只只规规定定了了分分类类变变量量A A,则每个表单元将给出分类变量的交叉频数。,则每个表单元将给出分类变量的交叉频数。在在TABLE语语句句中中如如果果规规定定了了分分析析变变量量,则则可可以以要要求求计计 算算 下下 表表 所所 示示 的的 一一 个个 或或 几几 个个 统统 计计 量量 。几点说明几点说明多个分析变量和多个统计量能够出现在

28、同一维中,也多个分析变量和多个统计量能够出现在同一维中,也可以出现在不同的维中。但是所有的分析变量必须可以出现在不同的维中。但是所有的分析变量必须出现在某一维中,所有的统计量也一样必须出现在出现在某一维中,所有的统计量也一样必须出现在同一维中。不能用一个分析变量同另一个分析变量同一维中。不能用一个分析变量同另一个分析变量交叉,统计量之间也不能交叉。例如下面两条语句交叉,统计量之间也不能交叉。例如下面两条语句都是合法的都是合法的(A,B,C(A,B,C分类分类;分类分类;X X分析变量分析变量) ): TABLE A*(X*MEAN X*MAX), BTABLE A*(X*MEAN X*MAX)

29、, B; TABLE A*X, B*MEAN C*MAXTABLE A*X, B*MEAN C*MAX;另外,统计量操作元素除了可以是统计量关键字,如另外,统计量操作元素除了可以是统计量关键字,如MEANMEAN或或MAXMAX,也可以是以下形式的百分数表达式:,也可以是以下形式的百分数表达式: TABLE A*B*PCTNTABLE A*B*PCTN;TABLE A*B*PCTNTABLE A*B*PCTN; 其中其中和和是求频数百分数时设定的分母,两是求频数百分数时设定的分母,两条语句所求出来条语句所求出来 的百分数显然是不同的。分母为的百分数显然是不同的。分母为的语句比分母为的语句比分母

30、为的语句求出的百分数要大。的语句求出的百分数要大。几点说明几点说明我们已经知道,在我们已经知道,在TABLETABLE语句中分类变量都要事先在语句中分类变量都要事先在CLASSCLASS语语句中定义过,但是有一个特殊的分类变量叫句中定义过,但是有一个特殊的分类变量叫ALLALL,也称全类变,也称全类变量。全类变量量。全类变量ALLALL可以直接用在可以直接用在TABLETABLE语句中,它仅有一个值,语句中,它仅有一个值,表示所有的子集和及总和,这是一个非常有用的类,常放在表示所有的子集和及总和,这是一个非常有用的类,常放在表格的最后一行和最后一列计算总和的统计量。例如下面的表格的最后一行和最

31、后一列计算总和的统计量。例如下面的语句:语句: TABLE A*X*MEAN ALL*X*MEANTABLE A*X*MEAN ALL*X*MEAN定义汇总报表的输出格式定义汇总报表的输出格式汇总报表的输出除了要构造汇总报表结构和正确地进行描述统汇总报表的输出除了要构造汇总报表结构和正确地进行描述统计计算外,还应满足用户对输出报表的有关数据和标题的格计计算外,还应满足用户对输出报表的有关数据和标题的格式要求。有以下几种定义报表输出格式的方法:式要求。有以下几种定义报表输出格式的方法:当一个分类变量、分析变量或统计量用作操作元素时,可当一个分类变量、分析变量或统计量用作操作元素时,可以跟随着等号

32、和标签。例如,假设原来的以跟随着等号和标签。例如,假设原来的TABLETABLE语句为:语句为: TABLE A*X*MEANTABLE A*X*MEAN 现在为了修改列标题改为:现在为了修改列标题改为: TABLE A=CLASS*X=QUANTITY*MEAN=AVERAGETABLE A=CLASS*X=QUANTITY*MEAN=AVERAGE 这样,输出的汇总报表中的列标题从原来的这样,输出的汇总报表中的列标题从原来的“A”A”变成变成“CLASS”CLASS”,“X”X”变成变成“QUANTITY”QUANTITY”,“MEAN”MEAN”变成变成“AVERAGE”AVERAGE”

33、。操作元素还可以进行格式说明,通过操作元素还可以进行格式说明,通过* *号连接号连接FORMATFORMAT或或F=F=输出格式名。例如:输出格式名。例如:TABLE TABLE A=CLASS*f=12.2A=CLASS*f=12.2* *X=QUANTITY*f=10.2X=QUANTITY*f=10.2* *MEAN=AVERAGE*f=8.MEAN=AVERAGE*f=8.要注意分类变量要注意分类变量A A这个元素后的输出格式是数字格式这个元素后的输出格式是数字格式f=12.2f=12.2,而不是字符格式,因为它说明的是交叉单元中而不是字符格式,因为它说明的是交叉单元中MEANMEAN

34、计算的数计算的数字结果。实际上起作用的是最后一个字结果。实际上起作用的是最后一个f=8.f=8.的格式说明。的格式说明。定义汇总报表的输出格式定义汇总报表的输出格式(3)(3)使用使用KEYLABLEKEYLABLE和和LABELLABEL语句。语句。KEYLABLEKEYLABLE语句用于语句用于对出现在页、行或列上的统计量名字和对出现在页、行或列上的统计量名字和ALLALL分类变分类变量名字重新标记。量名字重新标记。LABELLABEL语句用于对出现在页、行语句用于对出现在页、行或列上的分类变量或分析变量规定标签。例如:或列上的分类变量或分析变量规定标签。例如: KEYLABEL MEAN

35、=AVERAGE ALL=TOTALKEYLABEL MEAN=AVERAGE ALL=TOTAL LABEL A=SEX X=AMOUNT LABEL A=SEX X=AMOUNT 要注意要注意KEYLABLEKEYLABLE和和LABELLABEL语句中定义的标签,比在语句中定义的标签,比在TABLETABLE语句中变量后跟随着等号和标签的定义方法语句中变量后跟随着等号和标签的定义方法优先级低。优先级低。(4)(4)使用使用PROC TABULATEPROC TABULATE语句中的语句中的FORMAT=FORMAT=输出格式输出格式名选项。对每一个报表单元规定缺省的输出格式,名选项。对每

36、一个报表单元规定缺省的输出格式,如果没有规定此选项,缺省值是如果没有规定此选项,缺省值是BEST12.2BEST12.2。此选项。此选项主要用于减少报表中输出数值的域宽。但是如果遇主要用于减少报表中输出数值的域宽。但是如果遇到在到在TABLETABLE语句中规定有任何输出格式,它将被取语句中规定有任何输出格式,它将被取代。代。 定义汇总报表的输出格式定义汇总报表的输出格式(5)(5)使用使用PROC FORMATPROC FORMAT过程和过程和FORMATFORMAT语句。语句。PROC FORMATPROC FORMAT过程过程用来对字符变量或数值变量定义用户自己的输入输出格式。用来对字符

37、变量或数值变量定义用户自己的输入输出格式。FORMATFORMAT语句用于规定分类变量的输出格式。两者的配合使用语句用于规定分类变量的输出格式。两者的配合使用可以使分类变量按用户自定义格式输出。例如:可以使分类变量按用户自定义格式输出。例如:PROC FORMATPROC FORMAT;VALUE $SEXFMT A1=Female A2=MaleVALUE $SEXFMT A1=Female A2=Male;PROC TABULATE DATA=ABCXPROC TABULATE DATA=ABCX;FORMAT A $SEXFMT. FORMAT A $SEXFMT. ;RUN RUN ;

38、$SEXFMT$SEXFMT是用户自定义的输出格式名,注意在使用时要在输出是用户自定义的输出格式名,注意在使用时要在输出格式名后加一个小圆点。当分类变量格式名后加一个小圆点。当分类变量A A定义为输出格式定义为输出格式$SEXFMT.$SEXFMT.后,在输出的汇总报表中,分类变量后,在输出的汇总报表中,分类变量A A原先在行或原先在行或列标题上输出的是两个分类值列标题上输出的是两个分类值A1A1和和A2A2,现在改为输出,现在改为输出FemaleFemale和和MaleMale。示例示例1proc format;value age_ctg 11-13=11-1314-16= 14-16;va

39、lue height_ctg 50-55=50-5556-60= 56-60 61-high=60;run;可以给变量名加标签,可以给变量名加标签,如在上例中:如在上例中:Sex=xingbie*(weight*meanweight*max)可以给可以给sex加标签加标签xingbie。proc tabulate data=class;class sex height;var weight;tables sex*(weight*mean weight*max), height;format age age_ctg.;Format height height_ctg.;run;示例示例2 2pr

40、oc tabulate data=class;class sex height;var weight;tables sex*weight*mean all*weight*mean;run;AllAll分分类的类的应用应用示例示例3 3proc tabulate data=class;class sex height;var weight;tables sex*height*pctn;format age age_ctg.;Format height height_ctg.;run;示例示例4 4proc tabulate data=class;class sex;var weight;tabl

41、es sex=xingbie*f=10.3*weight=tizhong*f=12.1*mean=average*f=8.2;format age age_ctg.;Format height height_ctg.;run;要注意分类变量要注意分类变量sexsex这个元这个元素后的输出格式是数字格素后的输出格式是数字格式式f=10.3f=10.3,而不是字符格,而不是字符格式,因为它说明的是交叉式,因为它说明的是交叉单元中单元中MEANMEAN计算的数字结计算的数字结果。实际上起作用的是最果。实际上起作用的是最后一个后一个f=8.2f=8.2的格式说明。的格式说明。示例示例5 5proc t

42、abulate data=class;class sex;var weight;keylabel mean=average all=total;label sex=xingbie;tables sex*weight*mean all*weight*mean;format age age_ctg.;Format height height_ctg.;run;KEYLABLEKEYLABLE语句用于对语句用于对出现在页、行或列上出现在页、行或列上的统计量名字和的统计量名字和ALLALL分类变量名字重新标分类变量名字重新标记。记。LABELLABEL语句用于语句用于对出现在页、行或列对出现在页、行或

43、列上的分类变量或分析上的分类变量或分析变量规定标签变量规定标签 要注意要注意KEYLABLEKEYLABLE和和LABELLABEL语句中定义的语句中定义的标签,比在标签,比在TABLETABLE语语句中变量后跟随着等句中变量后跟随着等号和标签的定义方法号和标签的定义方法优先级低。优先级低。示例示例6 6options linesize=200;proc tabulate data=class format=8.3;class sex;var weight height;keylabel mean=average all=total;label sex=xingbie;tables (sex all)*(height weight)*(mean std);run;

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号