用SAS作统计分析

上传人:luobi****88888 文档编号:94013060 上传时间:2019-07-31 格式:PPT 页数:88 大小:1.11MB
返回 下载 相关 举报
用SAS作统计分析_第1页
第1页 / 共88页
用SAS作统计分析_第2页
第2页 / 共88页
用SAS作统计分析_第3页
第3页 / 共88页
用SAS作统计分析_第4页
第4页 / 共88页
用SAS作统计分析_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《用SAS作统计分析》由会员分享,可在线阅读,更多相关《用SAS作统计分析(88页珍藏版)》请在金锄头文库上搜索。

1、1,用SAS作统计分析,SAS Institute (Shanghai) Co., Ltd.,基本概念和方法浏览,2,统计的作用,对数据作出概要的描述 基于数据作出推断 (包括评价推断的有效性),3,SAS系统提供有力的统计分析 功能,Base SAS 和 SAS/GRAPH 包含常规的 分析功能 SAS 有专用于各种分析功能的模块 STAT, QC, ETS, OR INSIGHT, LAB, ASSIST IML SAS 将其分析功能与其数据管理功能结 合成强大的决策支持系统,4,SAS分析的特点,SAS 将常用的统计方法用程序实现,是 一个高品位的程序系统 SAS 是一个迅速发展的系统:

2、融入最新 的方法,不断适应用户的新需求 SAS 既可由编程也可用图形界面交互式 地实现分析功能 SAS 将各种专门分析方法融入为用户提 供的直接使用的专用系统中,5,了解学习SAS的分析决策功能,会找: 针对问题和数据选用合适的 分析工具 会用:选PROC,选Option, 写Statement 会解释:对SAS提供的计算结果给出 解释和分析,6,总体(母体 Population),关心的对象全体 关心对象的某些指标(Variable) Var1, Var2, . . . ,Var n 总体的分布:这些变量取什麽值, 各占多大比例 总体的分布的特征:均值,方差(及其他 参数) 抽样,7,样本(

3、子样 Sample ),样本:取自总体的若干(有代表性)的个体,计算统计量,8,统计量(Statistics),子样 总体 描述 推断 统计量-由样本运算而得到的量: 均值,方差 中位数,极差 直方图,经验分布 统计量能集中样本某一方面的信息,9,统计模型,母体(分布及其它特征),抽样,子样(分布及其它特征),计算统计量,统计量,描述,推断,10,统计模型,参数是总体的特征。 统计量是由样本观测值计算而得到的。 统计量可用于估计总体的参数。,11,抽样的随机性,总 体,子样,子样,子样,子样,子样,对同一个总体可以获得多个不同的样本,这些样本的观测值不全相同,相应的统计 量也不一样,这是由抽样

4、偶然性引起的 但当样本的容量增大时,不同样本间的差 异逐渐缩小,这是统计的规律性,rannor2, 原数据rannor1,12,抽样的随机性,13,抽样的随机性,14,抽样的随机性,15,抽样的随机性,16,抽样的随机性,17,抽样的随机性,18,用SAS作常规统计 的几种常用做法,用SAS作常规统计分析,在交互式运行方 式下常用的做法有: 用编程实现各种任务 用SAS提供的菜单系统实现各种任务 用SAS/ASSIST 用STATISTICAL ANALYST 发命令analyst 用SAS/INSIGHT 发命令insight,19,SAS/INSIGHT,是一个可视化的数据探索工具。将统计

5、 方法与交互式地图形显示融合在一起 随时为用户提供数据、图形和分析结果 三方面的内容,便于用户发现奇异数据 及包含在数据中的模式或规律,探索性 地使用各种统计分析方法并观察分析结 果。它为用户提供一种全新的使用统计 分析方法的环境。,20,SAS/INSIGHT,如何在SAS系统中进入SAS/INSIGHT 键入命令 INSIGHT 用下拉菜单 Globals Analyze Interactive data analysis 通过 SAS/ASSIST 或提交 Proc insight,21,SAS/INSIGHT,在SAS/INSIGHT中,变量按其测量水平分 为: 区间型的(Interv

6、al) 列名型的(Nominal),以连续变化尺度测量 具有可进行分析的数值,有数值或字符值 用于作分类变量,数值型 字符型,区间型 列名型,22,SAS/INSIGHT 对数据集的操作,在SAS/INSIGHT中,可对SAS数据集进行 数据输入和浏览 修改测量水平 移动变量显示次序 建立新的变量 按某个变量的值进行排序 选取子集,23,Analyst Application,分析员应用(Analyst Application)是在SAS系统中进行基本统计分析菜单界面系统 它将常用的统计方法按描述统计,表分析,假设检验,方差分析和回归分析等栏目提供菜单,也有制图和建表的功能菜单 它对所进行的每

7、项分析都提供按菜单设定的要求自动生成的程序 它对分析的过程和结果建立项目并进行管理,24,Analyst Application,在SAS中进入Analyst: 键入命令ANALYST 用下拉菜单Globals Analyze Statistical Analysis,25,Analyst Application,在Analyst中,可对SAS数据集进行 数据输入和浏览 移动变量显示次序 建立新的变量 按某个变量的值进行排序 选取子集 转置数据集,26,变量取值的宏观描述,分布全面地描述了变量取值的概况 分布:变量取什麽值,各占多少比例 字符型变量:用表列举其取值和比例或用 柱状图,拼花图(M

8、osaic),27,变量取值的宏观描述,连续变化数值型变量:用表列举其在各个 范围取值的比例,用直方图,Box图或 次序统计量、经验分布图,28,SAS/INSIGHT 数据取值频数的描述,柱状图与直方图 (Bar chart/Histogram),Analyze Histogram/Bar chart(Y),频数表,Analyze Distribution(Y) Output Frequency Table,29,Analyst 数据取值频数的描述,Statistics Descriptive Frequency Counts,30,变量取值特征的描述,运用各种统计量描述变量取值的不同特征

9、均值、中位数描述变量取值的中心位置 方差、极差描述变量取值的离散程度 次序统计量也可描述变量取值的分布,31,次序统计量,样本(Sample):,次序统计量(Order Statistics):,4, 3, 11, 3, 1 5, 8,1, 3, 3, 4, 5, 8, 11,32,描述数据中心位置的统计量,样本观测值:4, 3, 11, 3, 1, 5, 8,33,描述数据离散程度的统计量,34,描述数据离散程度的统计量,样本观测值:4, 3, 11, 3, 1, 5, 8,35,与均值方差有关的统计量,标准差(Std Dev):,标准误(Std Error):,变异系数(CV),未校平方和

10、(USS),校正平方和(CSS),36,偏度(Skewness),偏度: (Skewness),精确地, 0, 0,= 0,37,峰度(Kurtosis),峰度: (Kurtosis),精确地, 0,= 0, 0, 0, 0,38,分位数(Quantile),(0.4 分位数),39,分位数(Quantile),p分位数:,附近的一个数,(小于p-分位点的样本数约占样本总数的100p%),0.5-分位数即中位数,0.25-分位数称下四分位数,0.75-分位数称上四分位数,样本观测值:4, 3, 11, 3, 1, 5, 8(1,3,3,4,5,8,11),4,3,8,40,SAS/INSIGH

11、T 数据的图形描述-盒须图,41,SAS/INSIGHT与Analyst 生成描述统计量,Insight 生成描述性统计量: Analyze Distribution(Y),Analyst 生成描述性统计量: Statistics Descriptive Summary Statistics 或 Distributions,42,变量取值的宏观描述,对母体和样本都可考虑它们各自的分布,样本直方图,总体分布密度,样本经验分布,总体累计分布,43,中心极限定理,44,标准正态分布密度,45,对数正态分布,46,Weibull 分布,47,SAS/INSIGHT 分布拟合,直方图(Graphs)+拟

12、合分布密度(Curves),经验分布(Curves)+拟合累计分布(Curves),QQ图(Graphs)+参照线(Curves),非正态参数分布的拟合:Curves+ Parametric Density,非参数分布密度拟合: Curves + Kernel,由Analyze Distribution(Y) 进入后:,48,Q-Q图,49,Analyst 直方图与分布拟合,Statistics Descriptive Distributions.,50,方差分析(Analysis of Variance),对多个均值进行统计推断通常使用方差分析 方差分析是分析试验结果数据的重要方法,51,方

13、差分析(Analysis of Variance),在方差分析中: 连续应变量:记录在各种条件下的观测结果 若干个分类变量:设定观测条件(也称独立变量) 分类变量可表示固定效因或随机效因 分类变量的不同值又称为水平,52,方差分析(ANOVA),方差分析将观测到的应变量的变差分解为属 于不同分类变量的和随机误差进行分析,53,方差分析(ANOVA),54,方差分析(ANOVA),自由度分解,方差分解,55,方差分析(ANOVA),方差分解与检验 Total SS=SS(因素A)+Residual SS Total DF=DF(A)+Residual DF MS(.)=SS(.)/DF(.) F

14、(.)=MS(.)/Residual MS,56,方差分析 数据要求,使用SAS进行方差分析时要 求每条记录为一次观测的结 果。不同因素或水平下因变 量的观测值都记用同一个变 量表示,57,方差分析 SAS/INSIGHT,单因素方差分析图形表现: Analysis Box plot Y:区间型因变量, X:列名型独立变量,方差分析计算: Analysis Fit(X,Y) Y:区间型因变量, X:列名型独立变量,58,方差分析 Analyst,59,变量的相关关系,散点图是直观地观察连续变化变量间相依 关系的重要工具,Insight: Analyze Scatter plot(Y X) 或

15、Multivariate(Ys),编程:proc gplot,Analyst: Graphs Scatter plot,60,变量的相关关系,用直线描述,用曲线描述,可能有周期变化,无明显关系,61,相关系数(Correlation Coef.),线性联系是描述变量联系中最简单和最常 用的一种(Y=a1x1+a2x2+b) 相关系数是描述两个变量间线性联系程度 的统计指标 相关系数的计算公式:,62,相关系数(Correlation Coef.),正相关: 一个变量数值 增加时另一个 变量也增加,负相关: 一个变量数值 增加时另一个 变量减少,63,相关系数(Correlation Coef.

16、),强相关并不表示存在因果关系,弱相关并不表示变量间不存在关系,个别极端数据可能影响相关系数,64,相关系数的计算 SAS/INSIGHT,Analyze Multivariate (Ys) Output Corr,在多变量分析窗中,由下拉菜单 Tables Corr,在散点图上加置信椭圆认识相关大小 Curves Confidence Ellipse Prediction: . . .,65,相关系数的计算 Analyst,Statistics Descriptive Correlations,66,相关与回归,相关分析量化连续变化变量间线性相 关的强度 回归分析确定一个连续变量与另一些 连续变量间的关系,67,回归(Regression),描述一个变量与另一些变量间统计联系的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号