sas分析方法笔记

上传人:206****923 文档编号:37524642 上传时间:2018-04-17 格式:DOC 页数:18 大小:402KB
返回 下载 相关 举报
sas分析方法笔记_第1页
第1页 / 共18页
sas分析方法笔记_第2页
第2页 / 共18页
sas分析方法笔记_第3页
第3页 / 共18页
sas分析方法笔记_第4页
第4页 / 共18页
sas分析方法笔记_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《sas分析方法笔记》由会员分享,可在线阅读,更多相关《sas分析方法笔记(18页珍藏版)》请在金锄头文库上搜索。

1、SAS 数据分析笔记1. SAS INSIGHT 启动: 方法 1:SolutionAnalysisInteractive Date Analysis 方法 2:在命令栏内输入 insight 方法 3:程序编辑窗口输入以下代码,然后单击 Submit 按钮; Proc insight; Run; 1.1 一维数据分析 用 sas insight 做直方图、盒形图、马赛克图。 直方图:AnalysisHistogram/Bar Chart 盒形图:AnalysisBox plot 马赛克图:AnalysisBox plot/Mosaic plot(Y) 1.2 二维数据分析 散点图:Analy

2、sisScattery plot(Y X) 曲线图:AnalysisLine plot( Y X) 1.3 三维数据分析 旋转图:AnalysisRotationg Plot 曲面图:AnalysisRotationg Plot 设置 Fit Surface 等高线图:AnalysisCountor plot 1.4 分布分析 包括:直方图、盒形图、各阶矩、分位数表,直方图拟合密度曲线,对特定分布进行检验。1.4. 1 AnalysisDistribution(Y) 第一部分为盒形图,第二部分为直方图,第三部分为各阶矩,第四部分为分位数表。 1.4.2 添加密度估计 A:参数估计:给出各种已知

3、分布(正态,指数等) ,只需要对其中参数进行估计;CurvesParametric Density B:核估计:对密度函数没有做假设,曲线性状完全依赖于数据;CurvesKernel Density 1.4.3 分布检验CurvesCDF confidence band CurvesTest for Distribution 1.5 曲线拟合AnalysisFit(Y X):分析两个变量之间的关系 1.6 多变量回归AnalysisFit(Y X) 1.7 方差分析AnalysisFit(Y X) 1.8 相关系数计算AnalysisMultivariate 1.9 主成分分析Analysis

4、Multivariate2.SAS ANALYST 启动: 方法 1:SolutionAnalysisAnalyst 方法 2:在命令栏内输入 analyst 2.1 分类计算统计量:DataSummarize by group 2.2 随机抽样:DataRandom Sample 2.3 生成报表:ReportTables 2.4 变量计算:DateTransform 2.5 绘制统计图 2.5.1 条形图:GraphBar ChartHorizontal 2.5.2 饼图:GraphPie Chart 2.5.3 直方图:GraphHistogram 2.5.4 概率图:GraphProb

5、ality plot 2.5.5 散点图:GraphScatter plot 2.6 统计分析与计算 2.6.1 计算描述性统计量Statistics DescriptiveSummart Statistics 只计算简单统计量 Statistics DescriptiveDistribution 可计算一个变量的分布信息 Statistics DescriptiveCorrelations 可计算变量之间的相关关系 Statistics DescriptiveFrequency counts 可计算频数 2.6.2 列联表分析Statistics Table Analysis 2.7 假设检

6、验 2.7.1 单样本均值 Z 检验: 检验单样本均值与某个给定的数值之间的关系Statistics Hypothesis tests One-Sample Z-test for a mean 2.7.2 单样本均值 t 检验:适用于不了解变量的方差情形 推断该样本来自的总体均数 与已知的某一总体均属 0 是否相等Statistics Hypothesis tests One-Sample t-test for a mean 2.7.3 单样本比例检验:检验取离散值的变量取某个值的比例Statistics Hypothesis tests One-Sample test for a propo

7、rtion 2.7.4 单样本方差检验:检验样本方差是否等于给定的值。零假设方差等于某个给定的。Statistics Hypothesis testsOne-Sample test for a variance 2.7.5 两样本均值 t 检验:独立的两个总体的均值是否相等或者是否相差给定的值Statistics Hypothesis tests Two-Sample t-test for means 2.7.6 成对样本均值 t 检验:成对样本检验中总体是相关的。Statistics Hypothesis tests Two-Sample paired t-test for means 2.

8、7.7 两样本比例检验:检验两个总体中某个比例的值是否相等。Statistics Hypothesis tests Two-Sample test for proportions 2.7.8 两样本方差检验Statistics Hypothesis testsTwo Sample test for variance 2.8ANOVA 过程 2.8.1 单因素 ANOVA 过程Statistics ANOVAOne-Way Anova2.8.2 非参数的单因素方差分析:适用于正态分布假定或方差相等假设不能满足的单因素问 题Statistics ANOVAnonparameter one-way

9、Anova test Wilcoxon 法、Median 法、Van der Waerden 法、Savage 法。 2.8.2 因素方差分析:实验结果是连续数值而分类变量是两个以上的离散型数值。Statistics ANOVAFactorial Anova 2.8.3 线性模型:用最小二乘法拟合一般线性模型Statistics ANOVALinear Model 2.9 回归分析:Statistics Regression 2.9.1simple 回归:简单一类回归分析,单一的自变量,单一的因变量,模型可以是一次、 二次、三次。Statistics Regressionsimple 2.9.

10、2linear 回归:线性回归,回归模型可以有多个因变量,多个自变量,但是对因变量分别 进行回归Statistics Regressionlinear 2.9.3logistic 回归:用于解决因变量是一个二元变量Statistics Regressionlogistic3.报表以及图形输出 3.1 print 过程Proc print data = sasuser.score; /数据库.数据集 Run;Proc print data = sasuser.score; Var name math Chinese; /变量 Run;Proc print data = sasuser.score

11、 noobs; /去掉第一列(观测序号) Var name math Chinese; Run;Proc print data= sasuser.score; Where sex in(f ) ; /通过 where 语句 Run;Proc print data = sasuser.score noobs label;Title 女生成绩单 ; Label name =姓名Sex =性别Math = 数学Chinese = 语文English = 英语 ; Where sex in(f ) ; Run;Title “the sas system” ; /恢复系统标题 Proc print da

12、ta = sasuser.score;Footnote = 分数列表 ; /加分数列表的脚注 Run;Proc sort data = sasuser.score; By sex; Run; Proc print data = sasuser.score; /使用 by 分组输出前用 sort 排序 By sex; Run; Proc print data = sasuser.score; Sum math; Run;3.2 tabulate 过程Proc tabulate data =数据集名称; Class 分类变量; Var 分析变量; Table 页面说明 行维说明 列维说明/选项;

13、Run;3.3 sort 过程Proc sort data = 数据集名称; /默认升序排列By 变量名; Run;Proc sort data = 数据集名称; By descending 变量名; /降序排列 Run;3.4 means 过程:数量(N) 、均值(Mean)、标准差(Std Dev)、最大值(Maximum)、最小值 (Minimum)Proc means data = sasuser.stock;Var price; Run;3.5 univariate 过程Proc univariate data =数据集; Var 分析变量; Run; 结果: Moments:统计量

14、的各阶矩,例如一阶矩就是均值,二阶矩就是方差等; Basic Statistical Measures:基本统计量; Tests for location:检验均值是否为零; Quantiles:分位数表; Extreme Observations:极端观测值。3.6 freq 过程:离散变量的分布情况Proc freq data =数据集名; Tables 变量名; Run; 结果: 变量取值、频数、百分比、累计频数、 ;累计百分比3.7 corr 过程:相关系数Proc corr data =数据集; Var 变量名 变量名; Run; 结果: 简单统计量 相关系数及 p 值3.8 gpl

15、ot 过程:绘制散点图和曲线图,绘制回归曲线。Proc gplot data = 数据集名称; Symbol 曲线类型; Plot 竖轴变量*横轴变量; Run;Proc gplot data = sasuser.score; Symbol I = none v=star; Plot English*Chinese; Run;3.9 gchart 过程:绘制直方图、饼图、三维直方图等。Proc gchart data = 数据集名称; Vbar/pie/block =变量; Run;3.10 G3D 过程绘制三维曲面Proc g3d data =数据集; Plot 变量 x*变量 y=变量 z; Run;gcontour 过程:画出曲面的等高线Proc gcontour data =数据集名; Plot x*y=z; Run;4.基本统计分析 4.1 正态性检验:univariate 过程Proc univariate data= sasuser.stock normal; Var eps; Run;Proc univariate data= sasuser.stock normal; Var eps; Histogram eps; /画出直方图 Probplot eps; /画出概率分布图 Run;4.2 单变

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号