SAS命令应用高级技巧

上传人:公**** 文档编号:489099387 上传时间:2022-08-07 格式:DOC 页数:17 大小:32KB
返回 下载 相关 举报
SAS命令应用高级技巧_第1页
第1页 / 共17页
SAS命令应用高级技巧_第2页
第2页 / 共17页
SAS命令应用高级技巧_第3页
第3页 / 共17页
SAS命令应用高级技巧_第4页
第4页 / 共17页
SAS命令应用高级技巧_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《SAS命令应用高级技巧》由会员分享,可在线阅读,更多相关《SAS命令应用高级技巧(17页珍藏版)》请在金锄头文库上搜索。

1、文档供参考,可复制、编制,期待您的好评与关注! SAS命令应用高级技巧SAS命令应用高级技巧-如何从一批SCL,SOURCE文件中查找或替换某字符串你是否有这样的麻烦,你在好几个CATALOG下建了上百个SCL或SOURCE文件,突然有一天因为系统变化,必须改动程序,比如有某个特征被大量程序引用了,那你必须一个一个的打开SCL文件,然后查找,然后在替换,想必你在那时肯定痛恨SAS公司的破编辑器了,功能弱智的像微软的记事本一样,如果你不幸不知道这样的技巧,那只能老老实实一个一个的打开,查找,替换、编译、保存、另存,然后在打开另一个文件,如此周而复此呵,不过幸运的是你看到了这篇文章,从此就可以中气

2、十足的对BOSS说,我绝对把那改动全部该过来了,没问题好了,不唠叨了,言归正传吧不知道你有没有用过大名鼎鼎的编辑器ULTRAEDIT呢,相信很多写CODE的人都在用它吧,确实很强的一个编辑器,今天我就用这编辑器中的一个小小功能,那就是查找、替换功能,它可是能在N多文件里做查找替换,我试了,打开上百个文件速度还是不错的,且操作非常方便好了,知道有这个功能就行了,下面的问题是怎么才能把SAS CATALOG里的程序文件导出来呢?且听我慢慢说来首先,我们知道,SAS提供了很多快捷的命令直接操作,比如在命令窗口敲入一个【open 表名】,楼主 SPSS新手速成随着速度越来越快,计算机的功能越来越多,计

3、算统计功能反而已经成为了计算机的一个次要部分。不过,对于我们这些从事社会学学习和研究的人来说,快速的计算和统计仍旧是我们使用计算机的主要功能,所以我们平日的工作总是离不开SPSS(Statistical Package for the Social Science社会科学统计软件)。SPSS虽然好用,但是学起来并不容易,特别是在目前高校的教育体制下,教材的过时以及课程设置的不合理,使得SPSS的学习成为了社会学、统计学以及其他社会科学学科学生极为头痛的一件事情。更为棘手的是:往往在学生还没有学会SPSS之前,一些调查研究任务却又强迫他们使用SPSS进行分析工作,使得他们十分 苦恼。本教程就是为

4、那些已经学习过统计学,并且粗通计算机,但尚未学习过SPSS的社会科学学科的学生准备的,运用面向问题的教学方法,通过一个调查问卷的具体分析过程使学生们对SPSS有一个感性认识,并能够再没有完全掌握SPSS的前提下利用SPSS完成一些分析任务。因此,本文不强调面面俱到只强调读者能够完成调查分析的任务,所以会故意忽略一些十分重要但未必会用到的功能,还请读者见谅。如果读者确实需要使用这些功能,建议参考一本好一点的辅导书。相信大家知道:依次完整的利用计算机辅助的问卷调查包括问卷设计、问卷访问、数据输入、数据分析、数据输出、调查报告的撰写六大部分。SPSS软件参与的主要是数据输入、数据分析和数据输出这三个

5、部分。接着,本文就将分成这三块,分别介绍SPSS的使用以及一些技巧、经验。数据输入在完成了问卷访问这个部分之后,我们手中便拥有了数百至上万份调查问卷,这些问卷计算机是无法直接识别处理的,我们必须将它们进行适当的编码。由于采用计算机分析,问卷在设计阶段就应该考虑到今后的编码问题,所以应该将问卷设计地以客观题为主,被访问者填写的应该只是注入数字、选项这些计算机能够处理的信息。我们首先要为问卷的每一个填写项都起一个代号,并决定它的数据属性(主要是区分为字符串、逻辑串还是数字)。笔者的习惯是首先用英文字母表示填写项的大题号,接着用阿拉伯数字表示填写项的小题号,然后再用英文字母表示填写项是本小题的第几项

6、,最后再加上表示数据属性的后缀,比如说第二大题第三小题的第四个字符串填写项的代号便为B3D_S。在以后的所有分析过程中便利用这个代号来表示数据的具体内容。接下来,便是具体的输入过程了。首先,我们要对SPSS的数据文件有一个大致的了解,这对以后的学习十分关键。打开SPSS之后,我们便会看到一个类似EXCEL电子表格的东西,但如果你因此便把SPSS的数据文件理解为是类似于EXCEL的东西那么就错了,虽然SPSS数据的表现形式酷似EXCEL,但就实质而言它更接近于一个数据库文件,每一个数据列都有它的列名称(也就是我们刚刚起的代号)、列属性(也就是刚刚我们决定的数据属性),这些都类似于数据库中的字段名

7、称、字段属性,如果读者以前学习过数据库的相关知识,那里理解起来就十分简单了。由于数据繁多,所以我们的输入过程往往不是由本人进行,而是请专业的数据录入人员代劳,而那些人员往往是不会使用SPSS的,所以我们在实际使用过程中数据往往不是在SPSS中输入的,而是在其它软件输入完毕之后利用SPSS导入的。在这里,导入用的文件格式是十分重要的。也许大家会习惯性的去选择使用EXCEL来录入数据,因为EXCEL与SPSS比较像。但是在笔者的实际使用过程中发现,最好的文件格式不是EXCEL的XLS文件,而是XBASE系列的DBF文件。之所以作这样的选择理由有两个:第一、DBF文件的字段名、字段属性这些在SPSS

8、导入过程中都会被直接利用,可以略去了SPSS之后的列名称、列属性设定工作。第二、EXCEL的XLS文件的具体格式并没有向公众公开,所以在实际使用中XLS文件中的中文信息时常会发生丢失的现象。在利用XBASE输入完文件之后,我们只需要调用SPSS的菜单FILE下的OPEN功能,选择DBASE数据格式打开文件,然后再另存为SPSS的SAV格式便完成了数据输入过程。接下来我们便要进入最为重要的数据分析这个阶段了。数据分析对于外行人来说。SPSS最为难学的部分便是它Analyze菜单下十多项子菜单以及这之下四五十项孙菜单的统计功能,每一项统计功能的用法和功能对于外行人来说就像是天书一般。但是对于学习过

9、统计学的读者来说,这应该不是问题。再加上SPSS在操作的简易性上还是十分优秀的,每一项统计功能一般只需要在窗口下选择统计用的变量,然后设置一下必要的选项,最后按下OK便可以了。所以在这里,具体的操作就不再介绍了。在这里,笔者觉得有必要先介绍一下SPSS的Viewer。在下面的数据分析和数据输出过程中,我们调用SPSS的数据分析和制图模块所得到的结果都会由SPSS自动输出到一个名为Viewer的程序中,并且可以以SPO为后缀名保存成为专门的文件。这样做的好处是如果你的分析和制图工作一次没有完成,那么利用保存的SPO文件,就不必下一次重新作过了。同时,将所有的分析和制图的结果都保存在一个SPO文件

10、中,并随调查报告作为电子附件一起陈送给客户,一来有利于客户检验分析的可靠性,二来也适合于今后电子化、网络化的趋势。据笔者的经验,SPSS的学习者在这一阶段最主要的问题在于以往学习的统计指标总是中文的,而SPSS中的统计指标是英文的,指标的中文和英文往往无法一一对应,因此,在这一部分中,笔者主要是附上一张统计指标的中英文对照表,如下:Summarize菜单项 数值分析过程 Frequencies子菜单项 单变量的频数分布统计 Descriptives子菜单项 单变量的描述统计 Explore子菜单项 指定变量的综合描述统计 Crosstabs子菜单项 双变量或多变量的各水平组合的频数分布统计 C

11、ompare Mean菜单项 均值比较分析过程 Means子菜单项 单变量的综合描述统计 Independent Sample T test子菜单项 独立样本的T检验 Paired Sample T test子菜单项 配对样本的T检验 One-Way ANOVA子菜单项 一维方差分析(单变量方差分析) ANOVA Models菜单项 多元方差分析过程 Simple Factorial子菜单项 因子设计的方差分析 General Factorial子菜单项 一般方差分析 Multivariate子菜单项 双因变量或多因变量的方差分析 Repeated Factorial子菜单项 因变量均值校验

12、Correlate菜单项 相关分析 Bivariate子菜单项 Pearson积矩相关矩阵和Kendall、Spearman非参数相关分析 Partial子菜单项 双变量相关分析 Distance子菜单项 相似性、非相似性分析 Regression菜单项 回归分析 Liner子菜单项 线性回归分析 Logistic子菜单项 二分变量回归分析(逻辑回归分析) Probit子菜单项 概率分析 Nonlinear子菜单项 非线性回归分析 Weight Estimation子菜单项 不同权数的线性回归分析 2-stage Least Squares子菜单项 二阶最小平方回归分析Loglinear菜单项

13、 对数线性回归分析 General子菜单项 一般对数线性回归分析 Hierarchical子菜单项 多维交叉变量对数回归分析 Logit子菜单项 单因变量多自变量回归分析 Classify菜单项 聚类和判别分析 K-means Cluster子菜单项 指定分类数聚类分析 Hierarchical Cluster子菜单项 未知分类数聚类分析 Discriminent子菜单项 聚类判别函数分析 Data Reduction菜单项 降维、简化数据过程 Factor子菜单项 因子分析 Correspondence Analysis子菜单项 对应表(交叉表)分析 Homogeneity Analysis

14、子菜单项 多重对应分析 Nonlinear Components子菜单项 非线性成分分析 OVERALS子菜单项 非线性典则相关分析 Scale菜单项 Reliability Ananlysis子菜单项 加性等级的项目分析 Multidimensional Scaling子菜单项 多维等级分析 Nonparametric Tests菜单项 Chi-Square子菜单项 相对比例假设检验 Binomial子菜单项 特定时间发生概率检验 Run子菜单项 随即序列检验 1-Sample Kolmogorov Smirnov子菜单项 样本分布检验 2-Independent Samples子菜单项 双不相关组分布分析 K Independent Samples子菜单项 多不相关组分布分析 2 Related Samples子菜单项 双相关变量分布分析 McNemar test子菜单项 相关样本比例变化分析 K Related Samples子菜单项 相关变量分布分析 Cocharn

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 国内外标准规范

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号