sas数据分析结果

上传人:206****923 文档编号:37505699 上传时间:2018-04-17 格式:DOC 页数:15 大小:527KB
返回 下载 相关 举报
sas数据分析结果_第1页
第1页 / 共15页
sas数据分析结果_第2页
第2页 / 共15页
sas数据分析结果_第3页
第3页 / 共15页
sas数据分析结果_第4页
第4页 / 共15页
sas数据分析结果_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《sas数据分析结果》由会员分享,可在线阅读,更多相关《sas数据分析结果(15页珍藏版)》请在金锄头文库上搜索。

1、1SASSAS 结课论文结课论文SASSAS 是在是在 19601960 年代末期由两位北卡州立大学年代末期由两位北卡州立大学(North(North CarolinaCarolina StateState University)University)统计系的教授开发第一版的统计系的教授开发第一版的 SASSAS 只含一般线性只含一般线性模型的分析法,而且只适用于模型的分析法,而且只适用于 IBMIBM 的主机;的主机;19761976 年成立年成立 SASSAS 公司负公司负责软件的发展、维护并提供相关服务责软件的发展、维护并提供相关服务PCPC 版本的版本的 SASSAS 于于 19871

2、987 年推年推出(出(V6.02V6.02) ,19891989 年推出年推出 SAS/PC(V6.04)SAS/PC(V6.04)版本;版本;19971997 年下半年推出年下半年推出2适用于多种操作系统的适用于多种操作系统的 V6.12V6.12 版本(版本(WindowsWindows 版)版) ;20002000 年年 2 2 月又推月又推出出 SASSAS 系统系统 V8V8 版本,版本,20012001 年推出年推出 SASSAS 系统系统 V8.2V8.2 版本;目前版本;目前 SASSAS 最最新版本为新版本为 V9.01V9.01在众多的统计软件中,在众多的统计软件中,SA

3、SSAS 以运行稳定、功能强大而著称。近以运行稳定、功能强大而著称。近 2020年来,年来,SASSAS 一直占据着统计软件的高端市场,用户遍及金融、医药一直占据着统计软件的高端市场,用户遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在数据处理和卫生、生产、运输、通讯、政府和教育科研等领域。在数据处理和统计分析领域,统计分析领域,SASSAS 系统被誉为国际上的标准软件,堪称统计软件系统被誉为国际上的标准软件,堪称统计软件界的巨无霸。界的巨无霸。在国际学术界有条不成文的规定,凡是用在国际学术界有条不成文的规定,凡是用 SASSAS 统计分统计分析的结果,在国际学术交流中可以不必说

4、明算法,由此可见其权威析的结果,在国际学术交流中可以不必说明算法,由此可见其权威性和信誉度。性和信誉度。SASSAS 的功能模块的功能模块: :SASSAS 系统由三十几个模块组成,其分析功能系统由三十几个模块组成,其分析功能散布在几乎所有的模块之中,较为集中的具有统计分析功能的是散布在几乎所有的模块之中,较为集中的具有统计分析功能的是SAS/BASESAS/BASE、SAS/STATSAS/STAT、SAS/QCSAS/QC、SAS/INSIGHTSAS/INSIGHT、SAS/ETSSAS/ETS 等一些模块,等一些模块,通过编程可以调用各种分析功能。通过编程可以调用各种分析功能。对于常用

5、的一些统计分析方法,对于常用的一些统计分析方法,SASSAS 系统中的如下三种方法系统中的如下三种方法可以达到同样的目的:可以达到同样的目的: INSIGHTINSIGHT(“交互式数据分析交互式数据分析” ) AnalystAnalyst(“分析家分析家” ) 直接编程直接编程方法一:区间分析方法一:区间分析1.1. 点估计和区间估计点估计和区间估计参数的估计方法主要有两种:点估计和区间估计。参数的估计方法主要有两种:点估计和区间估计。点估计是用样本的观测值估计总体未知参数的值。由于样本的点估计是用样本的观测值估计总体未知参数的值。由于样本的3随机性,不同样本观测值计算得出的参数的估计值间存

6、在着差异,随机性,不同样本观测值计算得出的参数的估计值间存在着差异,因此常用一个区间估计总体的参数,并把具有一定可靠性和精度的因此常用一个区间估计总体的参数,并把具有一定可靠性和精度的估计区间称为置信区间。利用构造的统计量及样本观测值,计算得估计区间称为置信区间。利用构造的统计量及样本观测值,计算得出参数的置信区间的方法称为参数的区间估计。出参数的置信区间的方法称为参数的区间估计。2.2. 参数的置信区间参数的置信区间在区间估计中,对于总体的未知参数在区间估计中,对于总体的未知参数,需要求出两个统计量,需要求出两个统计量1(1(X X1 1,X X2 2,.,XnXn) )和和2(2(X X1

7、 1,X X2 2,.,XnXn) )来分别估计总体参来分别估计总体参数数的上限和下限,使得总体参数在区间(的上限和下限,使得总体参数在区间(1 1,2 2)内的概率为)内的概率为P P 1 1 22 = = 1 1 其中其中 1 1 称为置信水平,而称为置信水平,而( (1 1,2)2)称为称为的置信区间,的置信区间,1,1,2 2 分别称为置信下限和置信上限。置信水平为分别称为置信下限和置信上限。置信水平为 1 1 的含的含义是随机区间义是随机区间( (1 1,2)2)以以 1 1 的概率包含了参数的概率包含了参数。3.3. 正态总体均值和方差的置信区间正态总体均值和方差的置信区间参数的区

8、间估计大多是对正态总体的参数进行估计,如对单总参数的区间估计大多是对正态总体的参数进行估计,如对单总体均值、方差的估计、两总体均值差的估计和两总体方差比的估计体均值、方差的估计、两总体均值差的估计和两总体方差比的估计等。等。4.4. 总体比例与比例差的置信区间总体比例与比例差的置信区间实际应用中经常需要对总体比例进行估计,如产品的合格率、实际应用中经常需要对总体比例进行估计,如产品的合格率、大学生的就业率和手机的普及率等。记大学生的就业率和手机的普及率等。记和和P P分别表示总体比例和分别表示总体比例和样本比例,则当样本容量样本比例,则当样本容量n n很大时(一般当很大时(一般当nPnP和和n

9、 n(1(1 P P) )均大于均大于5 5 时,就可以认为样本容量足够大)时,就可以认为样本容量足够大) ,样本比例,样本比例P P的抽样分布可用正的抽样分布可用正态分布近似。态分布近似。4分析步骤如下:分析步骤如下:1.1.对成交量做一个线图趋势统计:对成交量做一个线图趋势统计:选择菜单选择菜单“Analyze“Analyze(分析)(分析) ”“Line”“Line PlotPlot (Y(Y X)X)(分布)(分布) ” ,打开,打开“Line“Line PlotPlot (Y(Y X)”X)”对话框。在数据集对话框。在数据集 sryzcsryzc 的变量列表中,选择的变量列表中,选择

10、DATADATA 变量,单击变量,单击“X”“X”按钮,按钮,DATADATA 变量被选定为变量被选定为 X X 轴,然后选择轴,然后选择RQMCLRQMCL 变量,单击变量,单击“Y”“Y”按钮,如图左所示。单击按钮,如图左所示。单击“OK”“OK”按钮,即可按钮,即可得到线图如图所示。得到线图如图所示。有线图可以看出成交量和成交额的关系有线图可以看出成交量和成交额的关系2.2.成交量直方图:成交量直方图:首先在首先在 INSIGHTINSIGHT 中打开数据集中打开数据集 Mylib.sryzcMylib.sryzc5选择菜单选择菜单“Analyze“Analyze(分析)(分析) ”“H

11、istogram/Bar”“Histogram/Bar ChartChart (Y)(Y)(直方图(直方图/ /条形图)条形图) ” ,打开,打开“Histogram/Bar“Histogram/Bar ChartChart (Y)”(Y)”对话框。对话框。在数据集的变量列表中,选择在数据集的变量列表中,选择 IncomeIncome 变量,然后单击变量,然后单击“Y”“Y”按钮。按钮。成交额的统计量成交额的统计量这是一个(成对匹配)双样本均值检验问题,若这是一个(成对匹配)双样本均值检验问题,若1 1 和和2 2 分别分别表示两套试卷的平均成绩,则检验的是:表示两套试卷的平均成绩,则检验的是

12、:6H0H0:1 1 2 2 = = 0 0,H1H1:1 1 2 2 0 0;1)1) 在在“分析家分析家”中打开数据集中打开数据集 Mylib.sjdfMylib.sjdf;2)2) 选择菜单选择菜单“Statistics“Statistics(统计)(统计) ”“Hypothesis”“Hypothesis TestsTests(假设(假设检验)检验) ”“Two”“Two SampleSample PairedPaired t t - - TestTest forfor MeansMeans(均值的成(均值的成对双样本对双样本 t t - - 检验)检验) ” ;3)3) 在打开的在打

13、开的“Two“Two SampleSample PairedPaired t t - - TestTest forfor Means”Means”对话框对话框中,并设置双样本均值检验,然后单击中,并设置双样本均值检验,然后单击 PlotsanPlotsan 按钮,在打开的对按钮,在打开的对话框中选中话框中选中 t t distributiondistribution plotplot。两次单击。两次单击“OK”“OK”按钮,得到结按钮,得到结果如下图所示果如下图所示结果显示,无论两总体的方差是否相等,结果显示,无论两总体的方差是否相等,t t 统计量的统计量的p p值值 = = 0.00050

14、.0005 0.050.05,所以在,所以在 95%95%的置信水平下,拒绝原假设,两总体的的置信水平下,拒绝原假设,两总体的均值有显著差异。均值有显著差异。结果表明可以结果表明可以 95%95%的把握认为股票中最新和昨收有显著差异。的把握认为股票中最新和昨收有显著差异。方法二:回归分析方法二:回归分析71.1. 回归模型回归模型变量变量 Y Y 与其他有关变量与其他有关变量 X1X1,X2X2,XkXk 的关系的关系 Y Y = = f f (X1(X1,X2X2,Xk)Xk) + + 称为称为“回归模型回归模型” ,其中,其中 为均值为为均值为 0 0 的的随机变量。当随机变量。当 f f

15、 为线性函数时,回归模型:为线性函数时,回归模型:Y Y = = 0 0 + + 1X11X1 + + 2X2+2X2+ kXk+kXk+ 称为线性回归模型,本章主要讨论线性回归模型。特别地,称为线性回归模型,本章主要讨论线性回归模型。特别地,当当 k k = = 1 1 时称为一元线性回归模型。时称为一元线性回归模型。2.2. 回归分析的内容与目的回归分析的内容与目的 建立变量建立变量 Y Y 与与 X1X1,X2X2,XkXk 的经验公式(回归方程,预的经验公式(回归方程,预测公式)测公式) ,即从一组样本数据出发,确定出变量之间近似的数学关系,即从一组样本数据出发,确定出变量之间近似的数学关系式;式; 对经验公式的可信度进行检验;对经验公式的可信度进行检验; 判断每个自变量判断每个自变量 XiXi(i i = = 1 1,2 2,k k)对)对 Y Y 的影响是否显的影响是否显著;著; 对经验公式进行回归诊断(诊断经验公式是否适合这组数据)对经验公式进行回归诊断(诊断经验公式是否适合这组数据); 利用合适的经验公式,根据自变量的取值对因变

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号