SPSS19中文版教程－金锄头文库

资源描述

《SPSS19中文版教程》由会员分享，可在线阅读，更多相关《SPSS19中文版教程（56页珍藏版）》请在金锄头文库上搜索。

1、用软件试验指导手册1及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后，再来掌握几种统计分析软件的实际操作，是十分必要的。常见的统计软件有。这些统计软件的功能和作用大同小异，各自有所侧重。其中的目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是界面友好、功能强大、易学、易用，包含了几乎全部尖端的统计分析方法，具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。各类院校以及科研机构中更为流行。为统计产品与服务解决方案）。自 20 世纪 60 年代生以来，为适应各种操作系统平台的要求

2、经历了多次版本更新，各种版本的同小异，在本试验课程中我们选择为统计分析应用试验活动的工具。1运行模式要有三种运行模式：（1）批处理模式这种模式把已编写好的程序（语句程序）存为一个文件，提交给开始菜单上程序运行。（2）完全窗口菜单运行模式这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程，简单易用。（3）程序运行模式这种模式是在语句（口中直接运行编写好的程序或者在脚本（口中运行脚本程序的一种运行方式。这种模式要求掌握语句或脚本语言。本试验指导手册为初学者提供入门试验教程，采用“完全窗口菜单运行模式” 。2启动（1）在始程序，在它的次级菜单中单击 “2.0 可启动件，进

3、入话框，如图示。用软件试验指导手册2图动图启动对话框3件的退出件的退出方法与其他用程序相同，有两种常用的退出方法：按顺序使用菜单命令退出程序。直接单击口右上角的“关闭”按钮，回答系统提出的是否存盘的问题之后即可安全退出程序。用软件试验指导手册34主要窗口介绍件运行过程中会出现多个界面，各个界面用处不同。其中，最主要的界面有三个：数据编辑窗口、结果输出窗口和语句窗口。（1）数据编辑窗口启动看到的第一个窗口便是数据编辑窗口，如图示。在数据编辑窗口中可以进行数据的录入、编辑以及变量属性的定义和编辑，是基本界面。主要由以下几部分构成：标题栏、菜单栏、工具栏、编辑栏、变量名栏、

4、观测序号、窗口切换标签、状态栏。图据浏览界面标题栏：显示数据编辑的数据文件名。菜单栏：通过对这些菜单的选择，用户可以进行几乎所有的作。关于菜单的详细的操作步骤将在后续实验内容中分别介绍。为了方便用户操作，件把菜单项中常用的命令放到了工具栏里。当鼠标停留在某个工具栏按钮上时，会自动跳出一个文本框，提示当前按钮的功能。另外，如果用户对系统预设的工具栏设置不满意，也可以用视图工具栏设定命令对工具栏按钮进行定义。编辑栏：可以输入数据，以使它显示在内容区指定的方格里。菜单栏工具栏编辑栏观测序号变量名栏窗口切换标签状态栏标题栏用软件试验指导手册4 变量名栏：列出了数据文件中所包含变量的变量名

5、观测序号：列出了数据文件中的所有观测值。观测的个数通常与样本容量的大小一致。窗口切换标签：用于“数据视图”和“变量视图”的切换。即数据浏览窗口与变量浏览窗口。数据浏览窗口用于样本数据的查看、录入和修改。变量浏览窗口用于变量属性定义的输入和修改。状态栏：用于说明显示前的运行状态。打开时，将会显示“提示信息。（2）结果输出窗口在大多数统计分析结果都将以表和图的形式在结果观察窗口中显示。窗口右边部分显示统计分析结果，左边是导航窗口，用来显示输出结果的目录，可以通过单击目录来展开右边窗口中的统计分析结果。当用户对数据进行某项统计分析，结果输出窗口将被自动调出。当然，出结果文件来打开该窗口。用

6、软件试验指导手册5试验1 数据文件管理一、试验目的与要求通过本试验项目，使学生理解并掌握件包有关数据文件创建和整理的基本操作，学习如何将收集到的数据输入计算机，建成一个正确的据文件，并掌握如何对原始数据文件进行整理，包括数据查询，数据修改、删除，数据的排序等等。二、试验原理据文件是一种结构性数据文件，由数据的结构和数据的内容两部分构成，也可以说由变量和观测两部分构成。一个典型的据文件如表示。表据文件结构姓名性别年龄张三 1 45 李四 2 23 王五 2 45 量的属性的变量共有 10 个属性，分别是变量名（、变量类型（、长度（、小数点位置（、变量名标签（、变量名值标签（、

7、缺失值（、数据列的显示宽度（、对其方式（度量尺度（。定义一个变量至少要定义它的两个属性，即变量名和变量类型，其他属性可以暂时采用系统默认值，待以后分析过程中如果有需要再对其进行设置。在据编辑窗口中单击“ 变量视窗”标签，进入变量视窗界面（如图示）即可对变量的各个属性进行设置。观测变量数据内容用软件试验指导手册6图量视窗三、试验内容与步骤1创建一个数据文件数据文件的创建分成三个步骤：（1）选择菜单【文件】【新建】【数据】新建一个数据文件，进入数据编辑窗口。窗口顶部标题为“据编辑器” 。（2）单击左下角【变量视窗】标签进入变量视图界面，根据试验的设计定义每个变量类型。（3）变量定义完成以

8、后，单击【数据视窗】标签进入数据视窗界面，将每个具体的变量值录入数据库单元格内。2读取外部数据当前版本的以很容易地读取据，步骤如下：（1）按【文件】【打开】【数据】的顺序使用菜单命令调出打开数据对话框，在文件类型下拉列表中选择数据文件,如图示。用软件试验指导手册7图话框（2）选择要打开的件，单击“打开”按钮，调出打开据源对话框，如图示。对话框中各选项的意义如下：工作表下拉列表：选择被读取数据所在的作表。范围输入框：用于限制被读取数据在作表中的位置。图话框3数据编辑用软件试验指导手册8在，对数据进行基本编辑操作的功能集中在单中。4据的保存据录入并编辑整理完成以后应及时

9、保存，以防数据丢失。保存数据文件可以通过【文件】【保存】或者【文件】【另存为】菜单方式来执行。在数据保存对话框（如图示）中根据不同要求进行据保存。图据的保存5. 数据整理在，数据整理的功能主要集中在【数据】和【转换】两个主菜单下。（1）数据排序（数据按照某一个或多个变量的大小排序将有利于对数据的总体浏览，基本操作说明如下：选择菜单【数据】【排列个案】，打开对话框，如图示。（2）抽样（在统计分析中，有时不需要对所有的观测进行分析，而可能只对某些特定的对象有兴趣。利用令可以实现这种样本筛选的功能。以装配套数据文件例，选择年龄大于 10 的观测，基本操作说明用软件试验指导手册9图

10、排列个案对话框如下：打开数据文件择【数据】【选择个案】命令，打开对话框，如图择个案对话框指定抽样的方式：【全部个案】不进行筛选；【如果条件满足】按指定条件进行筛选。本例设置：产品数量150，如图示；用软件试验指导手册10图择个案对话框设置完成以后，点击入下一步。确定未被选择的观测的处理方法，这里选择默认选项【过滤掉未选定的个案】。单击行筛选，结果如图择个案的结果（3）增加个案的数据合并（【合并文件】【添加个案】）将新数据文件中的观测合并到原数据文件中，在实现数据文件纵向合并的方法如下：用软件试验指导手册11选择菜单【数据】【合并文件】【添加个案】，如图择

11、需要追加的数据文件，单击打开按钮，弹出话框，如图择个体数据来源的文件图择变量（4）增加变量的数据合并（【合并文件】【添加变量】）增加变量时指把两个或多个数据文件实现横向对接。例如将不同课程的成绩文用软件试验指导手册12件进行合并，收集来的数据被放置在一个新的数据文件中。在实现数据文件横向合并的方法如下：选择菜单【数据】【合并文件】【添加变量】,选择合并的数据文件，单击“打开” ，弹出添加变量，如图示。图单击行合并命令。这样，两个数据文件将按观测的顺序一对一地横向合并。（5）数据拆分（进行统计分析时，经常要对文件中的观测进行分组，然后按组分别进行分析。例如要求按性别不同分组。在

12、具体操作如下：选择菜单【数据】【分割文件】，打开对话框，如图示。用软件试验指导手册13图割文件对话框选择拆分数据后，输出结果的排列方式，该对话框提供了 3 种方式：对全部观测进行分析，不进行拆分；在输出结果种将各组的分析结果放在一起进行比较；按组排列输出结果，即单独显示每一分组的分析结果。选择分组变量选择数据的排序方式单击钮，执行操作（6）计算新变量在对数据文件中的数据进行统计分析的过程中，为了更有效地处理数据和反映事务的本质，有时需要对数据文件中的变量加工产生新的变量。比如经常需要把几个变量加总或取加权平均数，通过【计算】菜单命令来产生这样的新变量，其步骤如下：选择菜单【

13、转换】【计算变量】，打开对话框，如图示。用软件试验指导手册14图话框在目标变量输入框中输入生成的新变量的变量名。单击输入框下面类型与标签按钮，在跳出的对话框中可以对新变量的类型和标签进行设置。在数字表达式输入框中输入新变量的计算表达式。例如“年龄20” 。单击【如果】按钮，弹出子对话框，如图示。包含所有个体：对所有的观测进行计算；如果个案满足条件则包括：仅对满足条件的观测进行计算。单击钮，执行命令，则可以在数据文件中看到一个新生成的变量。用软件试验指导手册15图果子对话框四、备择试验某航空公司 38 名职员性别和工资情况的调查数据，如表示，试在 1）将数据输入到数据编

14、辑窗口中，将义为字符型变量，将义为数值型变量，并保存数据文件，命名为“试验（2）插入一个变量义为数值型变量。（3）将数据文件按性别分组（4）查找工资大于 40000 美元的职工（5）当工资大于 40000 美元时，职工的奖金是工资的 20；当工资小于 40000 美元时，职工的奖金是工资的 10%，假设实际收入工资奖金，计算所有职工的实际收入，并添加到量中。表航空公司 38 名职员情况的调查数据表d $ 57000 20 F $ 26250用软件试验指导手册162 M $ 40200 21 F $ 388503 F $ 21450 22 M $ 217504 F $ 21900 23

15、 F $ 240005 M $ 45000 24 F $ 169506 M $ 32100 25 F $ 211507 M $ 36000 26 M $ 310508 F $ 21900 27 M $ 603759 F $ 27900 28 M $ 3255010 F $ 24000 29 M $ 13500011 F $ 30300 30 M $ 3120012 M $ 28350 31 M $ 3615013 M $ 27750 32 M $ 11062514 F $ 35100 33 M $ 4200015 M $ 27300 34 M $ 9200016 M $ 40800 35 M

16、$ 8125017 M $ 46000 36 F $ 3135018 M $103750 37 M $ 2910019 M $ 42300 38 M $ 31350用软件试验指导手册17试验2 描述统计一、试验目的与要求统计分析的目的在于研究总体特征。但是，由于各种各样的原因，我们能够得到的往往只能是从总体中随机抽取的一部分观察对象，他们构成了样本，只有通过对样本的研究，我们才能对总体的实际情况作出可能的推断。因此描述性统计分析是统计分析的第一步，做好这一步是进行正确统计推断的先决条件。通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度，或对数据进行初步的探索性分

17、析（包括检查数据是否有错误，对数据分布特征和规律进行初步观察）。本本试验旨在于：引到学生利用正确的统计方法对数据进行适当的整理和显示，描述并探索出数据内在的数量规律性，掌握统计思想，培养学生学习统计学的兴趣，为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。二、试验原理描述统计是统计分析的基础，它包括数据的收集、整理、显示，对数据中有用信息的提取和分析，通常用一些描述统计量来进行分析。集中趋势的特征值：算术平均数、调和平均数、几何平均数、众数、中位数等。其中均数适用于正态分布和对称分布资料，中位数适用于所有分布类型的资料。离散趋势的特征值：全距、内距、平均差、方差、标

18、准差、标准误、离散系数等。其中标准差、方差适用于正态分布资料，标准误实际上反映了样本均数的波动程度。分布特征值：偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。三、试验内容与步骤下面给出的一个例题是来自件自带的数据文件“该文件包含某公司员工的工资、工龄、职业等变量，我们将利用此例题给出相关的描述统计说明，本例中，我们将以员工的当前工资为例，计算该公司员工当前工资的一些描述统计量，如均值、频数、方差等描述统计量的计算。1频数分析（11频数分析多适用于离散变量，其功能是描述离散变量的分布特征。用软件试验指导手册18基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况，对把握数

19、据的分布特征是非常有用的。比如，在某项调查中，想要知道被调查者的性别分布状况。频数分析的第一个基本任务是编制频数分布表。的频数分布表包括的内容有：（1）频数（即变量值落在某个区间中的次数。（2）百分比（即各频数占总样本数的百分比。（3）有效百分比（各频数占有效样本数的百分比。这里有效样本数总样本缺失样本数。（4）累计百分比（各百分比逐级累加起来的结果。最终取值为百分之百。频数分析的第二个基本任务是绘制统计图。统计图是一种最为直接的数据刻画方式，能够非常清晰直观地展示变量的取值状况。频数分析中常用的统计图包括：条形图，饼图，直方图等。频数分析的应用步骤在的频数分析的实现步骤如下：选择菜单“【

20、文件】【打开】【数据】 ”在对话框中找到需要分析的数据文件“，然后选择 “打开”。选择菜单“【分析】【描述统计】【频率】 ”。如图示如年龄在变量选择确定之后，在同一窗口上，点击“钮，打开统计量对话询问是否输出频数分布表用软件试验指导手册19框，如下图示，选择统计输出选项。话框中的“钮，即得到下面的结果。述性统计量 74表给出了总样本量（N ），其中变量有效个数（ 474 个、缺失值（ 0。16 58 74 表，频数，按总样本量为分母计算的百分比，以有效样本量为分母计算的百分比，累计百分比。图量条形图，图量饼图。量量述统计（22 描述统计主要对定距型或定比型数据

21、的分布特征作具体分析。用软件试验指导手册21【描述】命令专门用于计算各种描述统计性统计量。本节利用某年国内上市公司的财务数据来介绍描述统计量在的计算方法。具体操作步骤如下：选择菜单【分析】【描述统计】【描述】，如图示图述对话框将待分析的变量移入表框，例如将每股收益率、净资产收益率、资产负债率等 2 个变量进行描述性统计，以观察上市公司股权集中度情况和负债比率的高低。as 所选择的每个变量进行标准化处理，产生相应的 Z 分值，作为新变量保存在数据窗口中。其变量名为相应变量名前加前缀 z。标准化计算公式：单击【选项】按钮，如图示，选择需要计算的描述统计量。各描述统计量同令中的对

22、话框中大部分相同，这里不再重复。用软件试验指导手册22图项子对话框在主对话框中单击行操作。结果输出与分析在结果输出窗口中给出了所选变量的相应描述统计，如表示。从表中可以看到，我国上市公司前两大股东持股比例之比平均高达明“一股独大”的现象比较严重；前五大股东持股比例之和平均为另外，从偏态和峰度指标看出，前两大股东持股比例之比的分布呈现比较明显的右偏，而且比较尖峭。为了验证这一结论，可以利用令画出变量 z 的直方图，如图述统计量表15 137 274前五大股东持股比例的平方和 315 1496003 137 274用软件试验指导手册23资产负债率 315 16773 137 274

23、 (315 东东36091250量 Z 的直方图3探索分析（调用此过程可对变量进行更为深入详尽的描述性统计分析，故称之为探索分析。它在一般描述性统计指标的基础上，增加有关数据其他特征的文字与图形描述，显得更加细致与全面，对数据分析更进一步。探索分析一般通过数据文件在分组与不分组的情况下获得常用统计量和图形。一般以图形方式输出，直观帮助研究者确定奇异值、影响点、还可以进行假设检验，以及确定研究者要使用的某种统计方式是否合适。在打开的数据文件上，选择如下命令：选择菜单“【分析】【描述统计】【探索】 ”，打开对话框。用软件试验指导手册24因变量列表；待分析的变量名称，例如将每股收益率作为研究变量

24、。因子列表：从源变量框中选择一个或多个变量进入因子列表，分组变量可以将数据按照该观察值进行分组分析。标准个案：在源变量表中指定一个变量作为观察值的标识变量。在输出栏中，选择两者都，表示输出图形及描述统计量。选择【统计量】按钮，选择想要计算的描述统计量。如图所示对所要计算的变量的频数分布及其统计量值作图打开“话框” ，出现如下图。结果的输出与说明用软件试验指导手册25（1）在中可以看出216个个体，无缺失值。（2） 26,25,95% 7,5% 25,24,7,15,750 58,125 42,375 7,013 16633041,1,39,95% 3,5% 39,32,19,19,6

25、50 135,000 115,350 22,675 152302（3）职位员工薪水直方图显示用软件试验指导手册26$20,$30,$40,$50,$60,$26,）茎叶图描述茎叶图自左向右可以分为3 大部分：频数（茎（叶（茎表示数值的整数部分，叶表示数值的小数部分。每行的茎和每个叶组成的数字相加再乘以茎宽（即茎叶所表示的实际数值的近似值。 1 . 1 . 1 . 2 . 2 . 2 . 2 . 2 . 3 . 3 . 3 . 3 . 3 . 88 (=40800) 10000 1 s)（5）箱图 2,$40,6,$80,1,$20,14,3150634822413768 29031图中灰色

26、区域的方箱为箱图的主体，上中下3 条线分别表示变量值的第75、50、25百分位数，因此变量的50%观察值落在这一区域中。方箱中的中心粗线为中位数。箱图中的触须线是中间的纵向直线，上端截至线为变量的最大值，下端截至线为变量的最小值。四、备择试验完成下列试验内容，并按试验（1）所附试验报告的格式撰写报告。其进行频数分析，并对实验报告作出说明。表班 16 位学生的身高数据学号性别身高（学号性别身高（ M 170 9 M 1502 F 173 10 M 157用软件试验指导手册283 F 169 11 F 1774 M 155 12 M 1605 F 174 13 F 1696 F 17

27、8 14 M 1547 M 156 15 F 1728 F 171 16 F 其进行描述统计量分析，并对试验结果作出说明。表 8 台笔记本电脑重量表序号 1 2 3 4 5 6 7 8 9重量 0 11 12 13 14 15 16 17 18重量用软件试验指导手册29试验3 ：统计推断一、验演示内容与步骤题：为研究在黄金时段中,即每晚8:300 内,电视广告所占时间的多少。美国广告协会抽样调查了20个最佳电视时段中广告所占的时间（单位：分钟）。请给出每晚8:30 开始的半小时内广告所占时间区间估计，给定的置信度为95。操作程序：打开立数据文件：“ 。这里，研究变量为：每天看电视的时

28、间。选择区间估计选项，方法如下：选择菜单【分析】【描述统计】【探索】” ，话框。从源变量清单中将“ 量移入单击上图右方的“统计量”按钮打开“ 探索：统计量” 对话框。在设置均值的置信水平，如键入95，完成后单击 “继续” 按钮回到主窗口。索统计量设置窗口返回主窗口点击计算结果简单说明：述统计量1348095% 5% 363 60287 95 295 992 如上表显示。从上表“ 95 中可以得出，每晚8:30 开始的半小时内广告所占时间区间估计（置信度为95）为：(其中示置信区间的下限，估计是：用软件试验指导手册312两个总体均值之差的区间估计例题：994,7 ）声称在制造业中，

29、元。想通过统计方法，对这个观点是否正确给出检验。假设抽取了7位女性工会会员与8位非工会会员女性报酬数据。要求对制造业中参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差进行区间估计，预设的置信度为95。打开如下图示格式输入原始数据，建立数据文件：“。这里，“会员 ”表示是否为工会会员的变量，y 表示是工会会员，报酬”表示女性员工报酬变量，单位：千美元。计算两总体均值之差的区间估计，采用“独立样本T 检验” 方法。选择菜单“ 【分析】【比较均值】独立样本打开对话框。变量选择（1）从源变量清单中将“报酬” 变量移入检验变量框中。表示要求该变量的均值的区间估计。（2）从源变量清

30、单中将“变量移入分组变量框中。表示总体的分类变量。立样本话框定义分组单击定义组按钮，打开话框。在输用软件试验指导手册32入1，在输入2（1表示非工会会员,2 表示工会会员）。完成后单击“继续”按钮回到主窗口。图3.4 计算结果单击上图中“按钮，输出结果如下图所示。（1）组统计量）表分别给出不同总体下的样本容量、均值、标准差和平均标准误。从该表中可以看出，组统计量 46522 0 7 52236 ）独立样本T 检验）表 s 方差检验，在原假设：方差相等）下，F=因为其：说明不能拒绝方差相等的原假设，接受两个总体方差是相等的假设。因此参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差95的区间估计为检验总体均值是否相等的t 检验，由于在本例中，其：因此不应该拒绝原假设，也就是说参加工会的妇女跟未参加工会的妇女的报酬没有显著差异。本次抽样推断结论不支持994,7 ）提出的“参加工会的妇女比未参元”观点，即参加工会的妇女不比未参加工会的妇女的报酬多。立样本s t (2of 444 3 25485 33271413 25697 341083单个总体均值的假设检验（单样本T

展开阅读全文