第3章-SPSS描述性统计分析课件

上传人:M****1 文档编号:569482693 上传时间:2024-07-29 格式:PPT 页数:85 大小:2.58MB
返回 下载 相关 举报
第3章-SPSS描述性统计分析课件_第1页
第1页 / 共85页
第3章-SPSS描述性统计分析课件_第2页
第2页 / 共85页
第3章-SPSS描述性统计分析课件_第3页
第3页 / 共85页
第3章-SPSS描述性统计分析课件_第4页
第4页 / 共85页
第3章-SPSS描述性统计分析课件_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《第3章-SPSS描述性统计分析课件》由会员分享,可在线阅读,更多相关《第3章-SPSS描述性统计分析课件(85页珍藏版)》请在金锄头文库上搜索。

1、 统计分析的目的是研究总体的数量特征。为实现上述分析,统计分析的目的是研究总体的数量特征。为实现上述分析,往往采用两种方式实现:第一,数值计算,即计算常用的基本往往采用两种方式实现:第一,数值计算,即计算常用的基本统计量的值,通过数值来准确反映数据的基本统计特征;第二,统计量的值,通过数值来准确反映数据的基本统计特征;第二,图形绘制,即绘制常见的基本统计图形,通过图形来直观展现图形绘制,即绘制常见的基本统计图形,通过图形来直观展现数据的分布特点。通常,这两种方式都是混合使用的。数据的分布特点。通常,这两种方式都是混合使用的。 1.1.使用目的使用目的 频数分布表是描述性统计中最常用的方法之一。

2、它频数分布表是描述性统计中最常用的方法之一。它主要能够了解变量取值的状况,对把握数据分布特主要能够了解变量取值的状况,对把握数据分布特征非常有用。例如,了解某班学生考试的学习成绩、征非常有用。例如,了解某班学生考试的学习成绩、了解某地区居民的收入水平等都可以借助于频数分了解某地区居民的收入水平等都可以借助于频数分析。析。 3.1.1 3.1.1 频数分析的基本原理频数分析的基本原理 频率分析频率分析 过程就是专门为产生频数表而设计的。它不过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百分仅可以产生详细的频数表,还可以按要求给出某百分位点的数值以及常用的条图、饼

3、图等统计图。同时,位点的数值以及常用的条图、饼图等统计图。同时,SPSSSPSS的频数分析还可以进行分位数、描述集中趋势的的频数分析还可以进行分位数、描述集中趋势的基本统计量等计算功能。这些统计量的具体分析会在基本统计量等计算功能。这些统计量的具体分析会在以后章节中讲解。以后章节中讲解。(1 1)采用重抽样技术从原始样本中抽取一定数量(自)采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样。己给定)的样本,此过程允许重复抽样。 (2 2)根据抽出的样本计算给定的统计量)根据抽出的样本计算给定的统计量T T。 (3 3)重复上述)重复上述N N次(一般大于次(一般大于1

4、0001000),得到),得到N N个统计量个统计量T T。 (4 4) 计算上述计算上述N N个统计量个统计量T T的样本值,最终得到统计的样本值,最终得到统计量的估计值。量的估计值。 选择菜单栏中的选择菜单栏中的【分析分析】【描述统计描述统计】【频率频率】命令,弹出命令,弹出【频率频率】对话框,如图对话框,如图3-13-1所示,这所示,这是频数分析的主操作窗口。是频数分析的主操作窗口。Step 01图图3-13-1【频率频率】对话框对话框 在左侧的候选变量列表框中,选取一个或多个在左侧的候选变量列表框中,选取一个或多个待分析变量,单击待分析变量,单击 按钮,将它们移入右侧的按钮,将它们移入

5、右侧的【变量变量】列列表框中。表框中。 勾选勾选【显示频率表格显示频率表格】复选框,输出频数分析表。复选框,输出频数分析表。 在该对话框中还可以单击在该对话框中还可以单击【统计量统计量】和和【图表图表】等按钮,进行其他基本统计分析,这些选项提供了丰富的统等按钮,进行其他基本统计分析,这些选项提供了丰富的统计输出结果。计输出结果。Step02Step03Step 04 单击单击【统计量统计量】按钮,弹出如图按钮,弹出如图3-23-2所示的所示的【频率:频率:统计量统计量】对话框,该对话框主要用于输出各类基本统计对话框,该对话框主要用于输出各类基本统计量结果。量结果。图图3-2 3-2 【频率:统

6、计量频率:统计量】对话框对话框 单击单击【图表图表】按钮,弹出如图按钮,弹出如图3-33-3所示的所示的【频率:图频率:图表表】对话框对话框,该对话框主要用于输出图形结果。该对话框主要用于输出图形结果。图图3-3 3-3 【频率:图表频率:图表】对话框对话框 单击图单击图3-13-1中的中的【格式格式】按钮,弹出如图按钮,弹出如图3-43-4所示的所示的【频率:格式频率:格式】对话框,在此对话框中可以设对话框,在此对话框中可以设置频数表输出的格式。置频数表输出的格式。Step 05图图3-4 3-4 【频率:格式频率:格式】对话框对话框 单击图单击图3-13-1中的中的【BootstrapBo

7、otstrap】按钮,弹出如图按钮,弹出如图3-53-5所示的所示的【BootstrapBootstrap】对话框,在此对话框中可以进行下述对话框,在此对话框中可以进行下述统计量的统计量的BootstrapBootstrap估计估计。 支持均值、标准差、方差、中位数、偏度、峰度和百分位支持均值、标准差、方差、中位数、偏度、峰度和百分位数的数的BootstrapBootstrap估计。估计。 支持百分比的支持百分比的BootstrapBootstrap估计。估计。Step 06图3-5 【Bootstrap】对话框 单击单击【确定确定】按钮结束操作,按钮结束操作,SPSSSPSS软件自动软件自动

8、输出结果。输出结果。Step 07 假设某公司每周大约卖出假设某公司每周大约卖出20002000万件产品,但市场的需求不万件产品,但市场的需求不稳定,该公司的生产经理想更好的掌握近期该产品的分布情稳定,该公司的生产经理想更好的掌握近期该产品的分布情况。假设下面给出的销售数字(单位:百万)代表近期公司况。假设下面给出的销售数字(单位:百万)代表近期公司该产品每周的销售数据。利用频数分析你能得到什么有助于该产品每周的销售数据。利用频数分析你能得到什么有助于生产及销售的的信息?生产及销售的的信息? 24 18 18 26 24 23 16 18 21 20 21 24 19 24 18 18 26

9、24 23 16 18 21 20 21 24 19 19 14 22 21 26 27 15 19 17 20 20 19 22 19 14 22 21 26 27 15 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 1923 16 23 21 15 19 21 20 22 15 24 19 打开打开SPSSSPSS软件和数据文件软件和数据文件3-1.sav3-1.sav,选择菜单栏,选择菜单栏中的中的【分析分析】【描述统计描述统计】【频率频率】命令,弹出命令,弹出【频率频率】对话框,如图对话框,如图3-63-6所示。所示。Step 0

10、1图图3-6 3-6 【频率频率】对话框对话框 在左侧的候选变量列表框中选择在左侧的候选变量列表框中选择“salesale”变量,将变量,将其添加至其添加至【变量变量】列表框中,表示它是进行频数分析的变量,列表框中,表示它是进行频数分析的变量,如图如图3-73-7所示。所示。Step 02图图3-7 3-7 选择分析变量选择分析变量 单击单击【统计量统计量】按钮,弹出如图按钮,弹出如图3-83-8所示的所示的【频率:频率:统计量统计量】对话框;勾选对话框;勾选【四分位数四分位数】复选框,要求输出四分复选框,要求输出四分数,然后单击数,然后单击【继续继续】按钮,返回按钮,返回【频率频率】对话框。

11、对话框。Step 03图图3-8 3-8 选择输出统计量选择输出统计量 单击单击【图表图表】按钮,弹出如图按钮,弹出如图3-93-9所示的所示的【频率:图频率:图表表】对话框,由于该数据属于数值型,因此点选对话框,由于该数据属于数值型,因此点选【条形图条形图】单选钮,表示结果输出条形图;再单击单选钮,表示结果输出条形图;再单击【继续继续】按钮,返回按钮,返回【频率频率】对话框。对话框。Step 04图图3-9 3-9 选择输出图形类型选择输出图形类型 单击单击【确定确定】按钮完成操作。按钮完成操作。(1 1)基本统计结果输出)基本统计结果输出 Step 05 频数分析基本统计结果频数分析基本统

12、计结果N N有效有效3838缺失缺失0 0PercentilesPercentiles252518.0018.00505020.0020.00757523.0023.00(2 2)频数分析表输出)频数分析表输出 频数分析表频数分析表频率频率百分百百分百 有效百分比有效百分比 累积百分比累积百分比有有效效14141 12.62.62.62.62.62.615153 37.97.97.97.910.510.516162 25.35.35.35.315.815.817171 12.62.62.62.618.418.418183 37.97.97.97.926.326.319196 615.815.8

13、15.815.842.142.120204 410.510.510.510.552.652.621215 513.213.213.213.265.865.822223 37.97.97.97.973.773.723233 37.97.97.97.981.681.624244 410.510.510.510.592.192.126262 25.35.35.35.397.497.427271 12.62.62.62.6100.0100.0TotTotal al3838100.0100.0100.0100.0(3)(3)直方图直方图3.2.1 3.2.1 描述统计分析的基本原理描述统计分析的基本原理

14、 1.1.使用目的使用目的 2.2.刻画集中趋势的描述统计量刻画集中趋势的描述统计量 3. 3.刻画离散程度的描述统计量刻画离散程度的描述统计量 4. 4.刻画分布形态的描述统计量刻画分布形态的描述统计量 描述过程过程是连续资料统计描述应用最多的一个过程,描述过程过程是连续资料统计描述应用最多的一个过程,它可对变量进行描述性统计分析计算,并列出一系列相应的它可对变量进行描述性统计分析计算,并列出一系列相应的统计指标。这和其他过程相比并无不同。但该过程还有个特统计指标。这和其他过程相比并无不同。但该过程还有个特殊功能,就是可将原始数据转换成标准化值,并以变量的形殊功能,就是可将原始数据转换成标准

15、化值,并以变量的形式保存。式保存。 选择菜单栏中的选择菜单栏中的【分析分析】【描述统计描述统计】【描描述述】命令,弹出命令,弹出【描述性描述性】对话框,如图对话框,如图3-123-12所示,该对话所示,该对话框是描述性统计分析的主操作窗口。框是描述性统计分析的主操作窗口。Step 01图图3-12 3-12 【描述描述】对话框对话框 在在左侧的候选变量列表框中选取一个或多个待分左侧的候选变量列表框中选取一个或多个待分析变量,将它们移入右侧的析变量,将它们移入右侧的【变量变量】列表框中。列表框中。 单击单击【选项选项】按钮,弹出如图按钮,弹出如图3-133-13所示的所示的【描描述:选项述:选项

16、】对话框,该对话框用于指定输出的描述性统计对话框,该对话框用于指定输出的描述性统计量。这些统计量的含义是:均数、总和、标准差、方差、量。这些统计量的含义是:均数、总和、标准差、方差、全距、最小值)、最大值、标准误差、峰度系数和偏度系全距、最小值)、最大值、标准误差、峰度系数和偏度系数。数。Step 02Step 03图图3-133-13【描述:选项描述:选项】对话框对话框 在在【描述性描述性】对话框中,勾选对话框中,勾选【将标准化得分另将标准化得分另存为变量存为变量】复选框,表示对所选择的每一个变量进行标准化复选框,表示对所选择的每一个变量进行标准化处理,同时产生相应的处理,同时产生相应的Z

17、Z得分,并作为新变量保存到数据窗得分,并作为新变量保存到数据窗口中。口中。 单击单击【BootstrapBootstrap】按钮,弹出如图按钮,弹出如图3-53-5所示的所示的【BootstrapBootstrap】对话框,在此对话框中可以进行均值、标准对话框,在此对话框中可以进行均值、标准差、方差、偏度和峰度的差、方差、偏度和峰度的BootstrapBootstrap估计。估计。 单击单击【确定确定】按钮结束操作,按钮结束操作,SPSSSPSS软件自动输软件自动输出结果。出结果。Step 04Step 05Step 06请你分析不同性别演员获得奥斯卡奖的年龄差异性。请你分析不同性别演员获得奥

18、斯卡奖的年龄差异性。 男演员:男演员:32 37 36 32 51 53 33 61 35 32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 38 56 45 55 39 76 37 42 40 32 60 38 56 48 48 40 43 62 43 42 44 41 56 39 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 6046 31 47 45 60 女演员:女演员:50 44 35 80 26 28 41 21 61 50 44 35 80 26 28 41 21 61 38 4

19、9 33 74 30 33 41 31 35 41 42 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 37 26 34 34 35 26 61 60 34 24 30 37 31 27 39 3431 27 39 34 打开随书光盘中的数据文件打开随书光盘中的数据文件3-2.sav3-2.sav,其中,其中“malemale”和和“femalefemale”列分别表示男演员和女演员;选择列分别表示男演员和女演员;选择菜单栏中的菜单栏中的【分析分析】【描述性统计描述性统计】【描述描述】命令,弹命令,弹出

20、出【描述性描述性】对话框,如图对话框,如图3-143-14所示。所示。Step 01图图3-14 3-14 【描述性描述性】对话框对话框 在左侧的候选变量列表框中选择在左侧的候选变量列表框中选择“malemale”和和“femalefemale”变量,将其添加至变量,将其添加至【变量变量】列表框中,表示它是列表框中,表示它是进行描述性统计分析的变量,如图进行描述性统计分析的变量,如图3-153-15所示。所示。Step 02图图3-15 3-15 选择分析变量选择分析变量 单击单击【选项选项】按钮,其主要目的是选择需要输出按钮,其主要目的是选择需要输出的描述性统计量,这里除了选择系统默认的统计

21、量外,还勾的描述性统计量,这里除了选择系统默认的统计量外,还勾选了范围、偏度系数和峰度系数复选框;再单击选了范围、偏度系数和峰度系数复选框;再单击【继续继续】按按钮,返回钮,返回【描述性描述性】对话框,如图对话框,如图3-163-16所示。所示。 单击单击【确定确定】按钮完成操作。按钮完成操作。Step 03Step 04图图3-16 3-16 选择输出图形类型选择输出图形类型男演员女演员Valid N (listwise)N统计量363636全距统计量4559极小值统计量3121极大值统计量7680均值统计量45.1438.94标准差统计量10.40613.546偏度统计量0.8981.50

22、3标准误0.3930.393峰度统计量0.7042.111标准误0.7680.7683.3.1 3.3.1 探索性分析的基本原理探索性分析的基本原理 1.1.使用目的使用目的 探索性数据分析(探索性数据分析(Exploratary Data AnalysisExploratary Data Analysis,简称简称EDAEDA)的基本思想是从数据本身出发,不拘泥于模)的基本思想是从数据本身出发,不拘泥于模型的假设而采用非常灵活的方法来探讨数据分布的大型的假设而采用非常灵活的方法来探讨数据分布的大致情况,也可以为进一步结合模型的研究提供线索,致情况,也可以为进一步结合模型的研究提供线索,为传统

23、的统计推断提供良好的基础和减少盲目性。为传统的统计推断提供良好的基础和减少盲目性。2.2.主要内容主要内容一般来说,进行探索性分析主要考察以下内容。一般来说,进行探索性分析主要考察以下内容。(1)(1)检查数据是否有错。过大或过小的数据均可能是异检查数据是否有错。过大或过小的数据均可能是异常值、影响点或错误值。要检查这样的数据,并分析常值、影响点或错误值。要检查这样的数据,并分析原因,然后决定是否从分析中剔除这些数据。原因,然后决定是否从分析中剔除这些数据。(2)(2)获得数据分布特征。很多统计方法模型对数据的分获得数据分布特征。很多统计方法模型对数据的分布有要求,如方差分析就需要数据服从正态

24、分布。布有要求,如方差分析就需要数据服从正态分布。(3)(3)对数据的初步观察,发现一些内在规律对数据的初步观察,发现一些内在规律。 SPSS SPSS中的探索过程用于计算指定变量的探索性统计量和中的探索过程用于计算指定变量的探索性统计量和有关的图形。它既可以对观测量整体分析,也可以进行分组有关的图形。它既可以对观测量整体分析,也可以进行分组分析。从这个过程可以获得箱线图、茎叶图、直方图、各种分析。从这个过程可以获得箱线图、茎叶图、直方图、各种正态检验图、频数表、方差齐性检验等结果,以及对非正态正态检验图、频数表、方差齐性检验等结果,以及对非正态或正态非齐性数据进行变换,并表明和检验连续变量的

25、数值或正态非齐性数据进行变换,并表明和检验连续变量的数值分布情况。分布情况。 选择菜单栏中的选择菜单栏中的【分析分析】【描述统计描述统计】【探索探索】命令,弹出命令,弹出【探索探索】对话框,如图对话框,如图3-173-17所示,所示,该对话框是探索性分析的主操作窗口。该对话框是探索性分析的主操作窗口。Step 01图图3-17 3-17 【探索探索】对话框对话框 在对话框左侧的候选变量列表框中选取一个或多在对话框左侧的候选变量列表框中选取一个或多个待分析变量,将它们移入右侧的个待分析变量,将它们移入右侧的【因变量列表因变量列表】列表框中列表框中,表示要进行探索性分析的变量。,表示要进行探索性分

26、析的变量。 在候选变量列表框中可以选取一个或多个分组变在候选变量列表框中可以选取一个或多个分组变量,将它们移入右侧的量,将它们移入右侧的【因子列表因子列表】列表框中。分组变量的列表框中。分组变量的选择可以将数据按该变量中的观测值进行分组分析。如果选选择可以将数据按该变量中的观测值进行分组分析。如果选择的分组变量不止一个,那么会以分组变量的不同取值进行择的分组变量不止一个,那么会以分组变量的不同取值进行组合分组。组合分组。 从候选变量列表框中选择一个变量作为标识变量从候选变量列表框中选择一个变量作为标识变量,并将其移入,并将其移入【标注个案标注个案】列表框中。选择标识变量的作用列表框中。选择标识

27、变量的作用在于,当系统在数据探索过程中发现异常值时,便可利用标在于,当系统在数据探索过程中发现异常值时,便可利用标识变量加以标记,以便于用户找这些异常值。如果不选择它识变量加以标记,以便于用户找这些异常值。如果不选择它,系统默认以,系统默认以IDID变量作为标识变量。变量作为标识变量。Step 02Step 03Step 04 在在【探索探索】对话框下面的对话框下面的【输出输出】选项组中可选项组中可以选择以下输出项。以选择以下输出项。 两者都:输出图形以及描述性统计量。两者都:输出图形以及描述性统计量。 统计量:只输出描述统计量。统计量:只输出描述统计量。 图:只输出图形。图:只输出图形。 在

28、在【探索探索】对话框中还可以点选对话框中还可以点选【统计量统计量】单单选钮,这个选项提供了各类基本描述性统计输出结果;选钮,这个选项提供了各类基本描述性统计输出结果;Step 06Step 07图图3-18 3-18 【探索:统计量)探索:统计量)】对话框对话框 在在【探索探索】对话框中还可以点选对话框中还可以点选【绘制绘制】单选钮,单选钮,它提供了图形输出类型。它提供了图形输出类型。Step 07图图3-19 3-19 【探索:图探索:图】对话框对话框 在在【探索探索】对话框中还可以单击对话框中还可以单击【选项选项】按钮按钮,弹出如图,弹出如图3-203-20所示的所示的【探索:选项探索:选

29、项】对话框,在该对话对话框,在该对话框中确定对待缺失值的方式。框中确定对待缺失值的方式。Step 08图图3-20 3-20 【探索:选项探索:选项】对话框对话框 单击单击【BootstrapBootstrap】按钮,弹按钮,弹【BootstrapBootstrap】对话框,在该对话框中可以进行如下统计量对话框,在该对话框中可以进行如下统计量BootstrapBootstrap估计。估计。 支持均值、支持均值、5% 5% 切尾均值、标准差、方差、中位数、切尾均值、标准差、方差、中位数、偏度、峰度和内距的偏度、峰度和内距的BootstrapBootstrap估计。估计。 M M估计量表支持估计量

30、表支持HuberHuber的的MM估计量、估计量、TukeyTukey的双权重的双权重、HampelHampel的的M M 估计量和估计量和AndrewAndrew的的WaveWave的的Bootstrap Bootstrap 估计。估计。 百分位数表支持百分位数的百分位数表支持百分位数的BootstrapBootstrap估计。估计。 单击单击【确定确定】按钮结束操作,按钮结束操作,SPSSSPSS软件自软件自动输出结果。动输出结果。Step 09Step 10 打开随书光盘中的数据文件打开随书光盘中的数据文件3-3.sav3-3.sav,其中增加变,其中增加变量量“地域地域”表示所在城市的

31、区域位置,表示所在城市的区域位置,“1 1”表示南方城市,表示南方城市,“2 2”表示北方城市。选择菜单栏中的表示北方城市。选择菜单栏中的【分析分析】【描述统描述统计计】【探索探索】命令,弹出命令,弹出【探索探索】对话框,如图对话框,如图3-213-21所示。所示。Step 01图图3-21 3-21 【探索探索】对话框对话框 在候选变量列表框中将变量在候选变量列表框中将变量“年平均温度年平均温度”添加至添加至【因变量列表因变量列表】列表框中,表示它是进行探索列表框中,表示它是进行探索性分析的变量。性分析的变量。 将变量将变量“地域地域”添加至添加至【因子列表因子列表】列表列表框中,表示根据地

32、域位置不同来进行数据分析。框中,表示根据地域位置不同来进行数据分析。Step 02Step 03 选择变量选择变量“城市城市”移入移入【标注个案标注个案】列表列表框作为标识变量,如图框作为标识变量,如图3-223-22所示。所示。Step04图图3-22 3-22 选择变量选择变量 单击单击【统计量统计量】按钮,在弹出的如图按钮,在弹出的如图3-233-23所示的所示的【探索:统计量探索:统计量】对话框中勾选对话框中勾选【M-M-估计量估计量】复选框,分析复选框,分析样本数据的稳定性,其他选项保持默认状态;单击样本数据的稳定性,其他选项保持默认状态;单击【继续继续】按钮,返回按钮,返回【探索探

33、索】对话框。对话框。Step05图图3-23 3-23 【探索:统计量探索:统计量】对话框对话框 单击单击【确定确定】按钮完成操作。按钮完成操作。Step 06(1)(1)基本统计信息汇总基本统计信息汇总 基本统计信息基本统计信息地地域域案例有效有效缺失缺失合计合计N N百分比百分比百百分分比比N N百分比百分比年平年平均气均气温温南南方方1616 100.0%100.0% 0 0 0%0% 1616100.0%100.0%北北方方1717 100.0%100.0% 0 0 0%0% 1717100.0%100.0%(2 2)描述性统计量表)描述性统计量表 地域地域统计量统计量标准误标准误年年

34、平平均均气气温温南方南方均值均值18.700018.70000.672000.67200均值的均值的95% 95% 置置信区间信区间下限下限17.267717.2677上限上限20.132320.13235% 5% 修整均值修整均值18.577818.5778均值均值17.800017.8000方差方差7.2257.225标准差标准差2.688002.68800极小值极小值14.6014.60极大值极大值25.0025.00范围范围10.4010.40四分位距四分位距3.253.25偏度偏度1.0011.0010.5640.564峰度峰度0.7820.7821.0911.091北方北方均值均值

35、11.035311.03530.800780.80078均值的均值的95% 95% 置置信区间信区间下限下限9.33779.3377上限上限12.732912.73295% 5% 修整均值修整均值11.105911.1059均值均值11.000011.0000方差方差10.90110.901标准差标准差3.301693.30169极小值极小值5.405.40极大值极大值15.4015.40范围范围10.0010.00四分位距四分位距5.655.65偏度偏度-0.251-0.2510.5500.550峰度峰度-1.178-1.1781.0631.063(3 3)M M估计量估计量 M M估计量结

36、果表估计量结果表a. a. 权数取值为权数取值为 1.339.1.339.b. b. 权数取值为权数取值为4.685.4.685.c. c. 权数取值分别为权数取值分别为1.700,3.400, 1.700,3.400, and 8.500and 8.500d. d. 权数取值为权数取值为1.340*pi.1.340*pi.地域地域HubeHuber r的的M-M-估计估计器器a aTukeyTukey的双的双权重权重b bHampelHampel的的M-M-估计器估计器c cAndrewsAndrews波波d d年平均气年平均气温温南方南方18.0618.06949417.7217.7208

37、0817.977617.977617.718217.7182北方北方11.2011.20757511.1711.17060611.174111.174111.169611.1696探索性分析的茎叶探索性分析的茎叶图年平均气温年平均气温Stem-and-LeafPlotfor地域地域=南方南方FrequencyStem&Leaf1.001.411.001.667777778893.002.0121.00Extremes(=25)Stemwidth:10.0Eachleaf:1case(s)年平均气温年平均气温Stem-and-LeafPlotfor地域地域=北方北方FrequencyStem&L

38、eaf6.000.5668898.001.001133343.001.555Stemwidth:10.0Eachleaf:1case(s)3.4.1 3.4.1 列联表分析的基本原理列联表分析的基本原理 1.1.使用目的使用目的 列列联联表表是是指指一一个个频频率率对对应应两两个个变变量量的的表表(一一个个变变量量用用来来对对行行分分类类,第第二二个个变变量量用用来来对对列列分分类类)。列列联联表表非非常常重重要要,它它经经常常被被用用来来分分析析调调查查结结果果。它它有有两两个个基基本本任任务务:第第一一,根根据据收收集集到到的的样样本本数数据据产产生生二二维维或或多多维维交交叉叉列列联联表

39、表;第第二二,在在列列联联表表基基础础上上,对对两两两两变量间是否存在一定的相关性进行分析。变量间是否存在一定的相关性进行分析。2.2.交叉列联表交叉列联表 3.3.行列变量间关系的分析行列变量间关系的分析 列联表的频数分布不可能用来直接确定行、列变量列联表的频数分布不可能用来直接确定行、列变量之间的关系及关系的强弱。令人感兴趣的二维列联表之间的关系及关系的强弱。令人感兴趣的二维列联表的检验问题是行、列变量的独立性检验。的检验问题是行、列变量的独立性检验。 独立性检验指的是对列联表中行变量和列变量无关独立性检验指的是对列联表中行变量和列变量无关这个零假设进行的检验,即检验行、列变量之间是否这个

40、零假设进行的检验,即检验行、列变量之间是否彼此独立。常用的衡量变量间相关程度的统计量是简彼此独立。常用的衡量变量间相关程度的统计量是简单相关系数,但在交叉列联表分析中,由于行、列变单相关系数,但在交叉列联表分析中,由于行、列变量往往不是连续等距变量,不符合计算简单相关系数量往往不是连续等距变量,不符合计算简单相关系数的前提要求。的前提要求。所以,一般采用的检验方法是卡方(所以,一般采用的检验方法是卡方(2 2)检验,)检验,它的计算公式为:它的计算公式为:其中,其中,f f0 0表示实际观察频数,表示实际观察频数,f fe e表示期望频数。表示期望频数。 选择菜单栏中的选择菜单栏中的【分析分析

41、】【描述统计描述统计】【交交叉表叉表】命令,弹出命令,弹出【交叉表交叉表】对话框,如图对话框,如图3-253-25所示,这是所示,这是列联表分析的主操作窗口。列联表分析的主操作窗口。Step 01图图3-25 3-25 【交叉表交叉表】对话框对话框 在左侧的候选变量列表框中选取一个或多个待分析在左侧的候选变量列表框中选取一个或多个待分析变量,将它们移入右侧的变量,将它们移入右侧的【行行】列表框中,作为列联表的行列表框中,作为列联表的行变量;同理,选择若干候选变量移入右侧的变量;同理,选择若干候选变量移入右侧的【列列】列表框中列表框中,作为列联表的列变量。,作为列联表的列变量。 如果要进行三维或

42、多维列联表分析,可以根据需如果要进行三维或多维列联表分析,可以根据需要选择控制变量进入要选择控制变量进入【层层1 1的的1 1】列表另外一个控制变量,首列表另外一个控制变量,首先单击先单击【下一张)下一张)】按钮,再选入一个变量;单击按钮,再选入一个变量;单击【上一张上一张】按钮可以重新选择以前确定的变量。按钮可以重新选择以前确定的变量。 在在【交叉表交叉表】对话框下面有两个复选框,它们用对话框下面有两个复选框,它们用来选择列联表的输出格式。来选择列联表的输出格式。 显示复式条形图:显示各变量交叉分组下的频数分布条形显示复式条形图:显示各变量交叉分组下的频数分布条形图。图。 取消表格:只输出统

43、计量,而不输出列联表。取消表格:只输出统计量,而不输出列联表。Step 02Step 03Step 04 在在【交叉表交叉表】对话框中单击对话框中单击【统计量统计量】按钮,弹按钮,弹出如图出如图3-263-26所示的所示的【交叉表:统计量交叉表:统计量】对话框。该对话框主对话框。该对话框主要是根据数据类型选择不同的独立性检验方法和相关度量,要是根据数据类型选择不同的独立性检验方法和相关度量,在对话框中选择输出统计量,完成后单击在对话框中选择输出统计量,完成后单击【继续继续】按钮,返按钮,返回主对话框。回主对话框。Step 05图图3-26 3-26 【交叉表:统计量)交叉表:统计量)】 在在【

44、交叉表交叉表】对话框中单击对话框中单击【单元格单元格】按钮,弹按钮,弹出如图出如图3-273-27所示的所示的【交叉表:单元显示交叉表:单元显示】对话框,在该对话对话框,在该对话框中可以选择显示在列联表单元格中的统计量,包括观测数框中可以选择显示在列联表单元格中的统计量,包括观测数量、百分比和残差,在对话框中选择相应选项,完成后单击量、百分比和残差,在对话框中选择相应选项,完成后单击【继续继续】按钮,返回主对话框。按钮,返回主对话框。Step 06图图3-27 3-27 【交叉表:单元显示交叉表:单元显示】对话框对话框 在在【交叉表交叉表】对话框中单击对话框中单击【格式格式】按钮,按钮,弹出如

45、图弹出如图3-283-28所示的所示的【交叉表:格式交叉表:格式】对话框,用于对话框,用于选择各单元格的输出排列顺序。选择各单元格的输出排列顺序。Step 07图图3-28 3-28 【交叉表:格式交叉表:格式】对话框对话框 在在【交叉表交叉表】对话框中单击对话框中单击【BootstrapBootstrap】按钮,按钮,弹出弹出【BootstrapBootstrap】对话框,在该对话框中可以进行如下统对话框,在该对话框中可以进行如下统计量的计量的BootstrapBootstrap估计。估计。 单击单击【OKOK】按钮结束操作,按钮结束操作,SPSSSPSS软件自动输出软件自动输出结果。结果。

46、Step 08Step 091.1.实例内容实例内容 在一次上海大学生身体素质的实际调查中,选择了部分在一次上海大学生身体素质的实际调查中,选择了部分大专院校的学生进行实际问卷调查,收集的数据见大专院校的学生进行实际问卷调查,收集的数据见3-4.sav3-4.sav。调查内容主要包括:性别、出生日期、身高、体重、血型、调查内容主要包括:性别、出生日期、身高、体重、血型、教育背景、学科、男女身高级别和男女体重级别等内容。请教育背景、学科、男女身高级别和男女体重级别等内容。请根据调查数据分析下面问题:根据调查数据分析下面问题: (1 1)进行)进行“性别性别”和和“体重级别体重级别”双因素交叉作用

47、下的列双因素交叉作用下的列联表分析,并研究联表分析,并研究“性别性别”对对“体重级别体重级别”有无显著性影响有无显著性影响。 (2 2)进行)进行“教育背景教育背景”和和“身高级别身高级别”双因素交叉作用下双因素交叉作用下的列联表分析,并研究的列联表分析,并研究“教育背景教育背景”对对“身高级别身高级别”有无显有无显著性影响。著性影响。 打开数据文件打开数据文件3-4.sav3-4.sav,选择菜单栏中的,选择菜单栏中的【分析分析】【描述统计描述统计】【交叉表交叉表】命令,弹出命令,弹出【交叉表交叉表】对话对话框,如图框,如图3-293-29所示。所示。Step 01图图3-29 3-29 【

48、交叉表交叉表】对话框对话框 在候选变量列表框中将变量在候选变量列表框中将变量“性别(性别(sexsex)”添加添加至至【行行】列表框中,表示它是交叉列联表中的行变量;将变列表框中,表示它是交叉列联表中的行变量;将变量量“体重级别(体重级别(wmwm)”添加至添加至【列列】列表框中,表示它是列表框中,表示它是交叉列联表中的列变量,如图交叉列联表中的列变量,如图3-303-30所示。所示。Step 02图图3-30 3-30 选择行、列变量选择行、列变量 单击单击【统计量统计量】按钮,弹出按钮,弹出【交叉表:统计量交叉表:统计量】对话框,如图对话框,如图3-313-31所示;勾选所示;勾选【卡方卡

49、方】复选框,利用卡复选框,利用卡方检验来检验方检验来检验“性别性别”和和“体重级别体重级别”的独立性;再单击的独立性;再单击【继续继续】按钮,返回按钮,返回【交叉表交叉表】对话框。对话框。Step 03图3-31 【交叉表:统计量)】对话框 由于要进行由于要进行“性别性别”和和“体重级别体重级别”的频数分析的频数分析,因此在,因此在【交叉表交叉表】对话框中单击对话框中单击【CellsCells(单元)(单元)】选项选项,弹出,弹出【交叉表:单元显示交叉表:单元显示】对话框,如图对话框,如图3-323-32所示;勾所示;勾选选【百分比百分比】选项组中的选项组中的【行行】、【列列】和和【总数总数】

50、复选复选框,再单击框,再单击【继续继续】按钮,返回按钮,返回【交叉表交叉表】对话框。对话框。Step 04图图3-32 3-32 选择列联表输出格式选择列联表输出格式 勾选勾选【显示复式条形图显示复式条形图】复选框,表示利用条复选框,表示利用条形图来反映不同性别之间的体重级别差异,如图形图来反映不同性别之间的体重级别差异,如图3-333-33所示。所示。Step 05图图3-33 3-33 勾选复选框勾选复选框 单击单击【确定确定】按钮完成操作。按钮完成操作。Step 06 (1 1)基本统计信息汇总)基本统计信息汇总基本统计信息汇总基本统计信息汇总有效缺失合计N百分比N百分比N百分比性别 *

51、 体重级别214 100.0%00.0%214100.0%(2 2)“性别性别”和和“体重级别体重级别”的列联表的列联表 表表3-11 “3-11 “性别性别”和和“体重级别体重级别”变量的列联表变量的列联表体重级别体重级别合计合计轻(轻(60-60-)中等中等(60607070)重重(70+70+)性别性别男男计数计数1717353517176969性别中的性别中的%24.6%24.6%50.7%50.7%24.6%24.6%100.0100.0%体重级别中体重级别中的的%11.1%11.1%85.4%85.4%85.0%85.0%32.2%32.2%总数的总数的% % 7.9%7.9%16

52、.4%16.4%7.9%7.9%32.2%32.2%女女计数计数1361366 63 3145145性别中的性别中的%93.8%93.8%4.1%4.1%2.1%2.1%100.0100.0%体重级别中体重级别中的的%88.9%88.9%14.6%14.6%15.0%15.0%67.8%67.8%总数的总数的% % 63.6%63.6%2.8%2.8%1.4%1.4%67.8%67.8%合计合计计数计数15315341412020214214性别中的性别中的%71.5%71.5%19.2%19.2%9.3%9.3%100.0100.0%体重级别中体重级别中的的%100.0%100.0%100.

53、0%100.0%100.0%100.0%100.0100.0%总数的总数的% % 71.5%71.5%19.2%19.2%9.3%9.3%100.0100.0%(3 3)“性别性别”和和“体重级别体重级别”的独立性检验的独立性检验表表3-12 3-12 卡方检验结果卡方检验结果值值dfdf渐进渐进 Sig. Sig. (双侧)(双侧)Pearson Pearson 卡方卡方2 20.0000.000似然比似然比111.290111.2902 20.0000.000线性和线性组合线性和线性组合92.73992.7391 10.0000.000有效案例中的有效案例中的N N214214(4 4)体

54、重级别条形图)体重级别条形图3.5.1 3.5.1 比率分析的基本原理比率分析的基本原理 比率分析生成比率变量,并对该比率变量计算基本描比率分析生成比率变量,并对该比率变量计算基本描述性统计量(如均值、中位数、标准差、全距等),进述性统计量(如均值、中位数、标准差、全距等),进而刻画出比率变量的集中趋势和离散程度。除此之外,而刻画出比率变量的集中趋势和离散程度。除此之外,SPSS 21.0SPSS 21.0还提供了其他对比描述指标,大致也属于集中还提供了其他对比描述指标,大致也属于集中趋势描述指标和离散程度描述指标的范畴。趋势描述指标和离散程度描述指标的范畴。 选择菜单栏中的选择菜单栏中的【分

55、析分析】【描述统计描述统计】【比率比率】命令,弹出命令,弹出【比值统计量)比值统计量)】对话框,如图对话框,如图3-353-35所示,这是所示,这是比率分析的主操作窗口。比率分析的主操作窗口。Step 01图图3-35 3-35 【比值统计量比值统计量】对话框对话框 在对话框左侧的候选变量列表框中选取一个分在对话框左侧的候选变量列表框中选取一个分析变量作为比率分析的分子,将它移入右侧的析变量作为比率分析的分子,将它移入右侧的【分子分子】列表列表框中。框中。 在对话框左侧的候选变量列表框中选取一个分析在对话框左侧的候选变量列表框中选取一个分析变量作为比率分析的分母,将它移入右侧的变量作为比率分析

56、的分母,将它移入右侧的【分母分母】列表框列表框中。中。 在对话框左侧的候选变量列表框中选取一个变在对话框左侧的候选变量列表框中选取一个变量作为分组变量,将它移入右侧的量作为分组变量,将它移入右侧的【组变量组变量】列表框中。列表框中。 在主对话框中,用户可以选择如下比率分析的结在主对话框中,用户可以选择如下比率分析的结果输出类型。果输出类型。 显示结果:系统默认项,选择是否显示结果。显示结果:系统默认项,选择是否显示结果。 将结果保存到外部文件:选择是否将分析结果保将结果保存到外部文件:选择是否将分析结果保存至外部文件。同时,外部文件的保存路径需要单击存至外部文件。同时,外部文件的保存路径需要单

57、击【文件文件】按钮来选择。按钮来选择。Step 02Step 03Step04Step05 单击单击【统计量统计量】按钮,弹出如图按钮,弹出如图3-363-36所示的所示的【比比率统计量:统计量率统计量:统计量】对话框,该对话框主要用于输出各类基对话框,该对话框主要用于输出各类基本统计量结果。本统计量结果。Step 06图图3-36 3-36 【比率统计量:统计量比率统计量:统计量】对话框对话框 单击单击【确定确定】按钮结束操作,按钮结束操作,SPSSSPSS软件自动输出软件自动输出结果。结果。Step 071. 1. 实例内容实例内容城乡居民消费水平城乡居民消费水平 打开打开SPSSSPSS

58、软件,选择菜单栏中的软件,选择菜单栏中的【分析分析】【描述统计描述统计】【比率比率】命令,弹出命令,弹出【比值统计量比值统计量】对话框,对话框,如图如图3-383-38所示。所示。Step 01图图3-38 3-38 【比值统计量)比值统计量)】对话框对话框 在左侧的候选变量列表框中选取变量在左侧的候选变量列表框中选取变量“城镇居民城镇居民”作为比率分析的分子,将它移入右侧的作为比率分析的分子,将它移入右侧的【分子分子】列表框中。列表框中。 在左侧的候选变量列表框中选取变量在左侧的候选变量列表框中选取变量“农村居民农村居民”作为比率分析的分母,将它移入右侧的作为比率分析的分母,将它移入右侧的【

59、分母分母】列表框中。列表框中。Step 02Step 03 在左侧候选变量列表框中选取变量在左侧候选变量列表框中选取变量“区域区域”作为作为分组变量,将它移入右侧的分组变量,将它移入右侧的【组变量组变量】列表框中,如图列表框中,如图3-393-39所示。所示。Step 04图图3-39 3-39 设置比率分析变量设置比率分析变量 单击单击【统计量统计量】按钮,弹出如图按钮,弹出如图3-403-40所示的对话框所示的对话框;除了系统默认的输出统计量外,勾选;除了系统默认的输出统计量外,勾选【中位数中位数】、【均值均值】和和【ADDADD】复选框,最后单击复选框,最后单击【继续继续】按钮,返回按钮

60、,返回【比值比值统计量统计量】对话框。对话框。Step 05图图3-40 3-40 选择输出统计量选择输出统计量 (1 1)样本统计结果输出)样本统计结果输出 样本统计结果表样本统计结果表计数计数百分比百分比计数计数百分比百分比区域区域华北华北5 519.2%19.2%区域区域西北西北5 519.2%19.2%东北东北3 311.5%11.5%总数总数2626100.0%100.0%华东华东5 519.2%19.2%排除的排除的0 0华中华中3 311.5%11.5%总计总计2626西南西南5 519.2%19.2%(2 2)比率分析结果表)比率分析结果表 比率分析结果表比率分析结果表组组均值

61、均值中位中位数数平均数绝对值平均数绝对值偏差偏差价格相关微分价格相关微分离散系数离散系数方差系数方差系数中值居中中值居中华北华北2.9122.9122.8872.8870.2840.2841.0471.0470.0980.09812.4%12.4%东北东北2.8662.8662.8762.8760.1350.1351.0071.0070.0470.0477.0%7.0%华东华东2.6972.6972.5742.5740.3570.3571.0751.0750.1390.13919.0%19.0%华中华中3.2073.2073.2173.2170.1550.1551.0051.0050.0480.0487.2%7.2%西南西南4.3364.3364.3314.3310.8090.8091.0411.0410.1870.18725.3%25.3%西北西北3.7953.7953.8813.8810.2440.2441.0041.0040.0630.0638.6%8.6%OverallOverall3.3433.3433.2273.2270.5650.5651.0981.0980.1750.17525.4%25.4%

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号