sas多元统计例题程序.ppt

资源描述

《sas多元统计例题程序.ppt》由会员分享，可在线阅读，更多相关《sas多元统计例题程序.ppt（11页珍藏版）》请在金锄头文库上搜索。

1、proc princomp data=duo.innovation prefix=z out=o; run;proc plot data=o; plot z2*z1 $ region=*/href=0 vref=0;run;proc sort data=o; by descending z1;run;proc print data=o; var z1 z2;run;quit;主成分分析在SAS中用princomp过程：plot过程已经很熟悉了。href=0表示在横坐标z1=0处画一条垂线，vref=0表示在纵坐标z2=0处画一条垂线。$region=*表示每个点在图上用*表示，并且在*后显示该

2、样本点的region变量的值。主成分分析有一个princomp过程就足够了。prefix=z表示，在输出数据集中（o中），主成分变量是z1、z2、sort和print过程也是很熟悉的过程了。proc standard data=vregex1 out=sv mean=0 std=1; var x1-x3 y;run;proc princomp data=sv prefix=z out=opcr ; var x1 x2 x3;run;proc print data=opcr; var z1 z2 y;run;proc reg data=opcr ; model y=z1 z2;run;quit;

3、proc reg data=vregex1 outest=out; model y=x1-x3/pcomit=1,2;run;quit;proc print data=out;run;首先对数据标准化然后对标准化后的数据进行主成分分析。这也就相当于是对相关系数进行的主成分分析。作回归分析，自变量取第1、2主成分，因变量为y。直接作主成分回归分析。pcomit=1,2表示分别作两个回归，分别是剔除1个主成分，和剔除2个主成分，所做的主成分回归。主成分回归的结果:由于刚才我们分析了y与z1、z2的回归，z1、z2的回归系数非0都是99%显著的。而z1、z2又有99%的累积贡献率。因此我们可以认为我

4、们对y与z1、z2、z3之间的回归，取y对z1、z2的回归最佳。y对z1、z2的回归，还原为x1、x2、x3的系数后就是上图中红线圈起的第2行。这是看_PCOMIT_=1知道的，这表示，这一行是主成分回归，而且删除了最不重要的一个主成分后，回归的结果。而y与z1回归，再还原为x1、x2、x3的系数，就是上图中最后一行。因这一行_PCOMIT_=2。proc princomp data=文件名 n=？out=文件名文件名1 outstat=文文件名件名2 cov prefix=？;run;SAS 程序程序data=文件名 prefix=n=说明说明指定主成分的个数指定用于分析的数据文件指定主成分

5、的代号out=outstat=文件名自己取，保存原始数据和主成分得分文件名自己取，保存主成分分析过程中的统计量特别注意，分号表示一个语句的结束，不能遗漏。特别注意，分号表示一个语句的结束，不能遗漏。cov指定基于协差阵分析，若省略，基于相关系数矩阵proc factor data=文件名 r=v n=？out=文件名文件名1 outstat=文文件名件名2;run;SAS 程序程序data=文件名 r=vn=说明说明指定公共因子的个数指定用于分析的数据文件指定旋转的方法，是rotate=varimax 的缩写，也可以用rotate=quartimax (r=q)out=outstat=文件名自

6、己取，保存原始数据和因子得分文件名自己取，保存因子分析过程中的统计量特别注意，分号表示一个语句的结束，不能遗漏。特别注意，分号表示一个语句的结束，不能遗漏。6proc factor data=tmp1.innovation r=v n=4 out=out;run;data a1;set out;f=(5.8617*factor1+2.6989*factor2+2.0995*factor3+1.5842*factor4)/14;run;data a2;set a1;keep region f factor1 factor2 factor3 factor4 ;run;proc sort data=

7、a2; by descending f;run;proc print data=a2;run;Proc cluster method=选项选项 data=文件名 outtree=文件名文件名1 standard; var variable-list; id variable; run;Proc tree data=文件名文件名1 horizontal graphics; id variable; run;Method选项选项single 最短距离法complete 最长距离法median 中间距离法centroid 重心法average 类平均法ward 离差平方和法（Ward法）聚类分析聚类

8、分析 SAS 程序程序Proc fastclus maxcluster= data=文件名 seep=文件名 mean=文件名 out=文件名文件名 ; var variable-list; run;Maxcluster = n快速聚类快速聚类程序程序指定所允许的最大分类个数seep= 指定一个SAS数据集，其中包括要选择的初始凝聚点，可以缺省Mean= 生成一个输出数据集，其中包含每个类的均值和一些统计量Out= 生成一个输出数据集，其中包含原始数据和新变量CLUSTER和DISTANCE9Proc cancorr data=SAS数据集 out= SAS数据集 outstat= SAS数

9、据集 all;with 变量名;Var 变量名;Run;典型相关典型相关 SAS 程序程序用来列出被分析的两组变量中的第二组第二组变量用来列出被分析的两组变量中的第一组第一组变量OUT= 包含原始数据和典型变量得分的数据集OUTSTAT= 包含分析中用到的各种统计量produce simple statistics, input variable correlations, and canonical redundancy analysisproc corresp data=tmp1.examp911 out=results rp cp all; tables 行变量名, 列变量名; weig

10、ht 变量名； run;proc plot data=results; plot dim1*dim2=_NAME_ /box vspace=6 hspace=10 haxis=-.30 to .30 by .15 vaxis=-.30 to .30 by .15;run;对应分析原始数据作图字符由变量=_NAME_ 给出，box 指要求画出的边框围住整个图形， vspace=6 ，hspace=10规定图中纵坐标、横坐标单位格在图中的实际长度.data examp911; input mental $ A B C D E; cards;0(好) 121 57 72 36 211(轻微症状形成

11、) 188 105 141 97 712(中等症状形成)112 65 77 54 543(受损) 86 60 94 78 71；proc corresp data=examp911 out=results rp cp short; var A B C D E; id mental;run;proc plot data=results; plot dim1*dim2=*$ mental /box vspace=6 hspace=10 haxis=-.30 to .30 by .15 vaxis=-.30 to .30 by .15;run;对应分析数据是列联表形式VAR 语句，指示列联表中的列是A ,B,C,D,E，id 语句，指定用mental的值作为输出列联表中行的名称。

展开阅读全文

sas多元统计例题程序.ppt

最新文档