SPSS使用教程－金锄头文库

资源描述

《SPSS使用教程》由会员分享，可在线阅读，更多相关《SPSS使用教程（25页珍藏版）》请在金锄头文库上搜索。

1、描述样本数据一般的，一组数据拿出来，需要先有一个整体认识。除了我们平时最常用的集中趋势外，还需要一些离散趋势的数据。这方面 EXCEL 就能一次性的给全了数据，但对于 SPSS，就需要用多个工具了，感觉上表格方面不如 EXCEL 好用。个人感觉，通过描述需要了解整体数据的集中趋势和离散趋势，再借用各种图观察数据的分布形态。对于 SPSS 提供的 OLAP cubes（在线分析处理表），Case mmary（观察值摘要分析表），Descriptives （描述统计）不太常用，反喜欢用 Frequencies（频率分析），Basic Table（基本报表），Crosstabs （列联表）这三个，另

2、外再配合其它图来观察。这个可以根据个人喜好来选择。一使用频率分析（Frequencies）观察数值的分布。频率分布图与分析数据结合起来，可以更清楚的看到数据分布的整体情况。以自带文件 Trends chapter 13.sav 为例，选择 Analyze-Descriptive Statistics-Frequencies，把 hstarts 选入 Variables，取消在 Display Frequency table 前的勾，在Chart 里面 histogram，在 Statistics 选项中如图 1图 1分别选好均数(Mean) ，中位数 (Median)，众数(Mode) ，数(

3、m) ，标准差(Std. deviation)，方差(Variance)，范围(range)，最小值(Minimum) ，最大值 (Maximum)，偏度系数(Skewness)，峰度系数(Kutosis)，按 Continue 返回，再按 OK，出现结果如图 2图 2表中，中位数与平均数接近，与众数相差不大，分布良好。标准差大，即数据间的变化差异还还小。峰度和偏度都接近 0，则数据基本接近于正态分布。下面图 3 的频率分布图就更直观的观察到这样的情况图 3二采用各种图直观观察数据分布情况，如采用柱型图观察归类的比例等。同样以自带文件 Trends chapter 13.sav 为例，我们可以

4、观察一下各年的数据和的对比：1选择 Graph-Bar-Simple，在“Data in chart are”一项选择 mmary of groups of cases，然后按 Define，出现图 4，图 42选择 Bars Represent-Other statistic(e.g. mean)，把 hstarts 一项选入 Variable 里面，把 YEAR, Periodic 一项选入 Category Axis 项中，并按 Change Statistic 键，出现图 5：图 53在 Statistic 选项中选 m of values 一项，按 Continue 返回，按 OK

5、即可出现图 6：图 6从图中可以非常直观的看出 1965 年-1975 年间，每年的体数量对比和各数值多少。三通过列联表来观察，数据的交错关系。以软件自带的文件 University of Florida graduate salaries.sav 来说明1、选择 Tables-Basic Table，在弹出对话框中，选择 Graduate 到 mmaries 栏，College 到 Down ，Gender 到 Across 栏，如图 7图 72、选择 Statistics 按键，选取 Count 和 layer%到 Cell Statistics 一栏，并按 Continue 键，如图 8

6、图 8三、选择 Layout 按键，选择 mmary Variable Labels-In separate labels（汇的标签，如本例的 Graduate，放在表外），Statistics Labels-Across top（数据的标签横放在顶部，如本例的 Count 和 Layer%），并在 Label groups with value labels only 前选择打勾( 表示只需要具体的标签名就可以，不需要汇名，如本例 Gender 和 College)，如图 9图 9四、选择 Total 按键，在 Totals over each group variable 一项前选勾，则输

7、出表会有增加汇一栏，如图 10图 10提示，需要什么表格形式可以根据要求来调整，但对输出按键都需要熟悉，多尝试几次就可以看出不同的区别。图 11 为输出的表格图 11重要提示：如果结果变成变量的汇（M），则先选择 Data-Weight Cases，把Graduate 的选项先选入 Weight Cases by 内，再选回 Do not weight Cases，按 OK 即可。对于其他带有编号的一项都可以这样做。这一点不知为何，本人屡次试过需要这样调整。参考图 12图 12几种常用的统计方法应用一般来说，最最常用的统计分析有假设检验和回归分析，在 SPSS 中也有很好的对应工具来做这些分析

8、，但对其基本思路和要求都必须了解，这样才能更灵活的发挥。下面抄录EXCEL 在市场调查中的应用一书中关于这方面的内容：1假设检验目的：是用来判断样本与样本，样本与体的差异是由抽样误差引起还是本质差别造成的统计推断方法。基本思想：小概率反证法思想。即 PSequence，如图 15图 15把 hstarts 选入 Variables 项，把 No.选入 Time Axis Lables，然后按 OK，出现图 16：图 16从图可以看出，数据是在一个周期内反复在上下波动，虽然高低的位置不一样，但这种波动显然是随着时间的不同而变化。因此可以察看，因变量与时间的关系如何。选择 Data-Define

9、Dates，出现图 17图 17在 Year 一栏填入 1965，Month 一栏填入 1，表示数据从 1965 年 1 月开始计算。选择 Analyze-Correlate-Bivariate，出现图 18图 18把 hstarts，Year 和 Month 都选入 Varibales 选项，Correlation Coefficients 选择 Pearson和 Spearman（其实只需要选 Spearman 就可以，这里只是试一下，作为比较）。注：相关检验中有 Pearson（皮尔森）相关系数和 Spearman（斯皮尔曼）等级相关，前者也称皮尔森相关系数，是对两个定距变量关系的刻画；

10、后者是用来考察两个变量中至少有一个定序变量时的相关关系。Zero-order Correlations（零阶偏听偏相关系数）是按Pearson 简单相关系数公式计算得到的相关系数。在皮尔森系数 r 是对两个定距变量关系的刻画:若-1r1，|r|越大，表明两个变量之间的相关程度越强。若 0若-1rRegression-Curve Estimation，出现图 22图 22把 hatarts 选入 Dependents 选项，Independent 选择 Time，Models 选择（Linear）线性回归，（Quadratic）二次曲线回归，（Cubic）三次曲线回归，（Exponential

11、）指数回归，选择 Include constant in equation 表示方程式有常数项， Plot models 则表示用图表示，然后按 OK，出现图 23图 23线性方程：Y=70.43 0.135X二次曲线方程：Y=64.171 0.415X-0.02X2三次曲线方程：Y=87.68-1.667X 0.037X2( 0X3)指数曲线方程：Y=68.229xe 0.002从 Sig 值判断，都小于 0.05，都接受回归成立，这样，只能从 R 拟合度和 F 值较大来判断三次曲线方程的拟合程度比较高。注意，如果方程成立的话，想要增加预测，则可以在 Save 选项中选择 Predicted

12、 Values 一项，如果还想预测未来的数值，则可以在原表上增加若干行（如 1 行），然后选择 Predict Cases 下面 Predict through，在 Year 填入 1976，在 Month 填入 1，这样就表示预测值到1976 年的一月。如图 24 所示。图 24注意，在 Independent 选择 Time 和把 ID 选入结果一样，则因为 ID 是以时间为序来排，所以结果一样。3时间序列因为 R 的似合度分别为 0.05，0.064 ，0.199 和 0.039，都比较低，方程的效果不太好，如果要预测数值还是选择时间序列比较合适，因为从刚才 Sequence 的图也可以

13、观察到，数据是以后的时间来波动的变化关系。选择 Analyze-Time Series-Exponential Smoothing，出现图 25图 25把 hstarts 选入 Variables 选项，并在 Model 选择 Winters（注意，三种不同的模型的选择：简单指数平滑适用于不包含长期趋势和季节成分的数据；Holt 方法适合于包含长期趋势但不包含季节成分的数据；Winters 方法适合于包含季节成分（以及长期趋势）的数据。EXCEL 中只有简单的指数回归，与这里的绝不相同，从这里也可以看到专业分析软件的优势更具体更仔细），又按 Save 键，如图 26图 26Predict Ca

14、se 选项中选择 Predict through，并在 Year 栏填入 1976，month 填入 6，这样就可以得到 1976 年 1-6 月份的预测值（注意，此处与上面的回归不同，不需要增加 6 个ID，不然结果会显示有缺失值）。返回，按 Parameters 键，如图 27图 27分别把 Alpha（截距项的平滑系数），Gamma（趋势项的平滑系数）和 Delta（季节指数的平滑系数），设为从 0 到 1 之间以步长 0.05 搜索最优的参数值，其它选项采用默认值。返回按 OK，出现结果如图 28：图 28从图可看到平滑指数分别是 Alpha0.75，Gamma=0，Delta=0，而

15、更重要的是，可以直接得到预测值，如图 29：图 29除了 Fit 一项的预测外，可以得到 1976 年 1-6 月的预测结果。同时，可以通过 FIT 1 的预测情况与上面三次曲线回归方程比较，采用平均绝对误差、均方根误差和平均绝对百分误差的结果选择更佳的答案。与 EXCEL 表现的比较和补充这一点是针对像我这样开始只懂得用 EXCEL 的人来说。从个人的体会来说，二种软件有一定相似，操作都简便，同时又有一些可以互补的地方。一、图型的表现力是 SPSS 的主要优点之一应该说，EXCEL 的图型表现主要是简便，对许多的人来说基本够用，但对于科学的表现，SPSS 就更为详细和准确，这一点据说在所有统

16、计软件中都突出。因为大多的书里面都谈到，这里从略。二、通过 SPSS 检验方差齐性和数据分布假设检验中，采用的 t 检验和方差检验都需要满足二个要求，即1样本方差齐性2样本体呈正态分布在 EXCEL 中，提供了 F 检验来检验方差齐性问题。也就是可以先通过 F 检验确定方差齐性与否来选择下一步用哪个 T 检验或方差检验分析工具。但只要数据多于二组则无从下手；通过描述统计大约能从峰度和偏度来了解样本的分布（实际工作中，只要分布单峰且近似对称分布，也可应用注 2），但要具体确定样本的分布也有难度。这二个问题在 SPSS 就可以解决。A、用 SPSS 检验方差齐性同样以 University of Florida graduate salaries.sav 文件作为例子来检验性别数据是否方差齐性a.选择 Analyze-

展开阅读全文