文档详情

第3章-SPSS描述性统计分析课件

M****1
实名认证
店铺
PPT
2.58MB
约85页
文档ID:569482693
第3章-SPSS描述性统计分析课件_第1页
1/85

统计分析的目的是研究总体的数量特征为实现上述分析,统计分析的目的是研究总体的数量特征为实现上述分析,往往采用两种方式实现:第一,数值计算,即计算常用的基本往往采用两种方式实现:第一,数值计算,即计算常用的基本统计量的值,通过数值来准确反映数据的基本统计特征;第二,统计量的值,通过数值来准确反映数据的基本统计特征;第二,图形绘制,即绘制常见的基本统计图形,通过图形来直观展现图形绘制,即绘制常见的基本统计图形,通过图形来直观展现数据的分布特点通常,这两种方式都是混合使用的数据的分布特点通常,这两种方式都是混合使用的 1.1.使用目的使用目的 频数分布表是描述性统计中最常用的方法之一它频数分布表是描述性统计中最常用的方法之一它主要能够了解变量取值的状况,对把握数据分布特主要能够了解变量取值的状况,对把握数据分布特征非常有用例如,了解某班学生考试的学习成绩、征非常有用例如,了解某班学生考试的学习成绩、了解某地区居民的收入水平等都可以借助于频数分了解某地区居民的收入水平等都可以借助于频数分析 3.1.1 3.1.1 频数分析的基本原理频数分析的基本原理 频率分析频率分析 过程就是专门为产生频数表而设计的。

它不过程就是专门为产生频数表而设计的它不仅可以产生详细的频数表,还可以按要求给出某百分仅可以产生详细的频数表,还可以按要求给出某百分位点的数值以及常用的条图、饼图等统计图同时,位点的数值以及常用的条图、饼图等统计图同时,SPSSSPSS的频数分析还可以进行分位数、描述集中趋势的的频数分析还可以进行分位数、描述集中趋势的基本统计量等计算功能这些统计量的具体分析会在基本统计量等计算功能这些统计量的具体分析会在以后章节中讲解以后章节中讲解 ((1 1)采用重抽样技术从原始样本中抽取一定数量(自)采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样己给定)的样本,此过程允许重复抽样     ((2 2)根据抽出的样本计算给定的统计量)根据抽出的样本计算给定的统计量T T     ((3 3)重复上述)重复上述N N次(一般大于次(一般大于10001000),得到),得到N N个统计量个统计量T T     ((4 4)) 计算上述计算上述N N个统计量个统计量T T的样本值,最终得到统计的样本值,最终得到统计量的估计值量的估计值 选择菜单栏中的选择菜单栏中的【【分析分析】】→→【【描述统计描述统计】】→→【【频率频率】】命令,弹出命令,弹出【【频率频率】】对话框,如图对话框,如图3-13-1所示,这所示,这是频数分析的主操作窗口。

是频数分析的主操作窗口Step 01图图3-13-1  【【频率频率】】对话框对话框 在左侧的候选变量列表框中,选取一个或多个在左侧的候选变量列表框中,选取一个或多个待分析变量,单击待分析变量,单击 按钮,将它们移入右侧的按钮,将它们移入右侧的【【变量变量】】列列表框中 勾选勾选【【显示频率表格显示频率表格】】复选框,输出频数分析表复选框,输出频数分析表 在该对话框中还可以单击在该对话框中还可以单击【【统计量统计量】】和和【【图表图表】】等按钮,进行其他基本统计分析,这些选项提供了丰富的统等按钮,进行其他基本统计分析,这些选项提供了丰富的统计输出结果计输出结果Step02Step03Step 04 单击单击【【统计量统计量】】按钮,弹出如图按钮,弹出如图3-23-2所示的所示的【【频率:频率:统计量统计量】】对话框,该对话框主要用于输出各类基本统计对话框,该对话框主要用于输出各类基本统计量结果图图3-2 3-2 【【频率:统计量频率:统计量】】对话框对话框 单击单击【【图表图表】】按钮,弹出如图按钮,弹出如图3-33-3所示的所示的【【频率:图频率:图表表】】对话框对话框,该对话框主要用于输出图形结果。

该对话框主要用于输出图形结果图图3-3 3-3 【【频率:图表频率:图表】】对话框对话框 单击图单击图3-13-1中的中的【【格式格式】】按钮,弹出如图按钮,弹出如图3-43-4所示的所示的【【频率:格式频率:格式】】对话框,在此对话框中可以设对话框,在此对话框中可以设置频数表输出的格式置频数表输出的格式Step 05图图3-4 3-4 【【频率:格式频率:格式】】对话框对话框 单击图单击图3-13-1中的中的【【BootstrapBootstrap】】按钮,弹出如图按钮,弹出如图3-53-5所示的所示的【【BootstrapBootstrap】】对话框,在此对话框中可以进行下述对话框,在此对话框中可以进行下述统计量的统计量的BootstrapBootstrap估计估计  支持均值、标准差、方差、中位数、偏度、峰度和百分位支持均值、标准差、方差、中位数、偏度、峰度和百分位数的数的BootstrapBootstrap估计  支持百分比的支持百分比的BootstrapBootstrap估计Step 06图3-5 【Bootstrap】对话框 单击单击【【确定确定】】按钮结束操作,按钮结束操作,SPSSSPSS软件自动软件自动输出结果。

输出结果Step 07 假设某公司每周大约卖出假设某公司每周大约卖出20002000万件产品,但市场的需求不万件产品,但市场的需求不稳定,该公司的生产经理想更好的掌握近期该产品的分布情稳定,该公司的生产经理想更好的掌握近期该产品的分布情况假设下面给出的销售数字(单位:百万)代表近期公司况假设下面给出的销售数字(单位:百万)代表近期公司该产品每周的销售数据利用频数分析你能得到什么有助于该产品每周的销售数据利用频数分析你能得到什么有助于生产及销售的的信息?生产及销售的的信息? 24 18 18 26 24 23 16 18 21 20 21 24 19 24 18 18 26 24 23 16 18 21 20 21 24 19 19 14 22 21 26 27 15 19 17 20 20 19 22 19 14 22 21 26 27 15 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 1923 16 23 21 15 19 21 20 22 15 24 19 打开打开SPSSSPSS软件和数据文件软件和数据文件3-1.sav3-1.sav,选择菜单栏,选择菜单栏中的中的【【分析分析】】→→【【描述统计描述统计】】→→【【频率频率】】命令,弹出命令,弹出【【频率频率】】对话框,如图对话框,如图3-63-6所示。

所示Step 01图图3-6 3-6 【【频率频率】】对话框对话框 在左侧的候选变量列表框中选择在左侧的候选变量列表框中选择““salesale””变量,将变量,将其添加至其添加至【【变量变量】】列表框中,表示它是进行频数分析的变量,列表框中,表示它是进行频数分析的变量,如图如图3-73-7所示Step 02图图3-7 3-7 选择分析变量选择分析变量 单击单击【【统计量统计量】】按钮,弹出如图按钮,弹出如图3-83-8所示的所示的【【频率:频率:统计量统计量】】对话框;勾选对话框;勾选【【四分位数四分位数】】复选框,要求输出四分复选框,要求输出四分数,然后单击数,然后单击【【继续继续】】按钮,返回按钮,返回【【频率频率】】对话框Step 03图图3-8 3-8 选择输出统计量选择输出统计量 单击单击【【图表图表】】按钮,弹出如图按钮,弹出如图3-93-9所示的所示的【【频率:图频率:图表表】】对话框,由于该数据属于数值型,因此点选对话框,由于该数据属于数值型,因此点选【【条形图条形图】】单选钮,表示结果输出条形图;再单击单选钮,表示结果输出条形图;再单击【【继续继续】】按钮,返回按钮,返回【【频率频率】】对话框。

对话框Step 04图图3-9 3-9 选择输出图形类型选择输出图形类型 单击单击【【确定确定】】按钮完成操作按钮完成操作1 1)基本统计结果输出)基本统计结果输出 Step 05 频数分析基本统计结果频数分析基本统计结果N N有效有效3838缺失缺失0 0PercentilesPercentiles252518.0018.00505020.0020.00757523.0023.00 ((2 2)频数分析表输出)频数分析表输出 频数分析表频数分析表频率频率百分百百分百 有效百分比有效百分比 累积百分比累积百分比有有效效14141 12.62.62.62.62.62.615153 37.97.97.97.910.510.516162 25.35.35.35.315.815.817171 12.62.62.62.618.418.418183 37.97.97.97.926.326.319196 615.815.815.815.842.142.120204 410.510.510.510.552.652.621215 513.213.213.213.265.865.822223 37.97.97.97.973.773.723233 37.97.97.97.981.681.624244 410.510.510.510.592.192.126262 25.35.35.35.397.497.427271 12.62.62.62.6100.0100.0TotTotal al3838100.0100.0100.0100.0 (3)(3)直方图直方图 3.2.1 3.2.1 描述统计分析的基本原理描述统计分析的基本原理 1.1.使用目的使用目的 2.2.刻画集中趋势的描述统计量刻画集中趋势的描述统计量 3. 3.刻画离散程度的描述统计量刻画离散程度的描述统计量 4. 4.刻画分布形态的描述统计量刻画分布形态的描述统计量 描述过程过程是连续资料统计描述应用最多的一个过程,描述过程过程是连续资料统计描述应用最多的一个过程,它可对变量进行描述性统计分析计算,并列出一系列相应的它可对变量进行描述性统计分析计算,并列出一系列相应的统计指标。

这和其他过程相比并无不同但该过程还有个特统计指标这和其他过程相比并无不同但该过程还有个特殊功能,就是可将原始数据转换成标准化值,并以变量的形殊功能,就是可将原始数据转换成标准化值,并以变量的形式保存 选择菜单栏中的选择菜单栏中的【【分析分析】】→→【【描述统计描述统计】】→→【【描描述述】】命令,弹出命令,弹出【【描述性描述性】】对话框,如图对话框,如图3-123-12所示,该对话所示,该对话框是描述性统计分析的主操作窗口框是描述性统计分析的主操作窗口Step 01图图3-12 3-12 【【描述描述】】对话框对话框 在在左侧的候选变量列表框中选取一个或多个待分左侧的候选变量列表框中选取一个或多个待分析变量,将它们移入右侧的析变量,将它们移入右侧的【【变量变量】】列表框中列表框中 单击单击【【选项选项】】按钮,弹出如图按钮,弹出如图3-133-13所示的所示的【【描描述:选项述:选项】】对话框,该对话框用于指定输出的描述性统计对话框,该对话框用于指定输出的描述性统计量。

这些统计量的含义是:均数、总和、标准差、方差、量这些统计量的含义是:均数、总和、标准差、方差、全距、最小值)、最大值、标准误差、峰度系数和偏度系全距、最小值)、最大值、标准误差、峰度系数和偏度系数Step 02Step 03图图3-133-13  【【描述:选项描述:选项】】对话框对话框 在在【【描述性描述性】】对话框中,勾选对话框中,勾选【【将标准化得分另将标准化得分另存为变量存为变量】】复选框,表示对所选择的每一个变量进行标准化复选框,表示对所选择的每一个变量进行标准化处理,同时产生相应的处理,同时产生相应的Z Z得分,并作为新变量保存到数据窗得分,并作为新变量保存到数据窗口中 单击单击【【BootstrapBootstrap】】按钮,弹出如图按钮,弹出如图3-53-5所示的所示的【【BootstrapBootstrap】】对话框,在此对话框中可以进行均值、标准对话框,在此对话框中可以进行均值、标准差、方差、偏度和峰度的差、方差、偏度和峰度的BootstrapBootstrap估计 单击单击【【确定确定】】按钮结束操作,按钮结束操作,SPSSSPSS软件自动输软件自动输出结果。

出结果Step 04Step 05Step 06 请你分析不同性别演员获得奥斯卡奖的年龄差异性请你分析不同性别演员获得奥斯卡奖的年龄差异性 男演员:男演员:32 37 36 32 51 53 33 61 35 32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 38 56 45 55 39 76 37 42 40 32 60 38 56 48 48 40 43 62 43 42 44 41 56 39 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 6046 31 47 45 60 女演员:女演员:50 44 35 80 26 28 41 21 61 50 44 35 80 26 28 41 21 61 38 49 33 74 30 33 41 31 35 41 42 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 37 26 34 34 35 26 61 60 34 24 30 37 31 27 39 3431 27 39 34 打开随书光盘中的数据文件打开随书光盘中的数据文件3-2.sav3-2.sav,其中,其中““malemale””和和““femalefemale””列分别表示男演员和女演员;选择列分别表示男演员和女演员;选择菜单栏中的菜单栏中的【【分析分析】】→→【【描述性统计描述性统计】】→→【【描述描述】】命令,弹命令,弹出出【【描述性描述性】】对话框,如图对话框,如图3-143-14所示。

所示Step 01图图3-14 3-14 【【描述性描述性】】对话框对话框 在左侧的候选变量列表框中选择在左侧的候选变量列表框中选择““malemale””和和““femalefemale””变量,将其添加至变量,将其添加至【【变量变量】】列表框中,表示它是列表框中,表示它是进行描述性统计分析的变量,如图进行描述性统计分析的变量,如图3-153-15所示Step 02图图3-15 3-15 选择分析变量选择分析变量 单击单击【【选项选项】】按钮,其主要目的是选择需要输出按钮,其主要目的是选择需要输出的描述性统计量,这里除了选择系统默认的统计量外,还勾的描述性统计量,这里除了选择系统默认的统计量外,还勾选了范围、偏度系数和峰度系数复选框;再单击选了范围、偏度系数和峰度系数复选框;再单击【【继续继续】】按按钮,返回钮,返回【【描述性描述性】】对话框,如图对话框,如图3-163-16所示 单击单击【【确定确定】】按钮完成操作按钮完成操作Step 03Step 04图图3-16 3-16 选择输出图形类型选择输出图形类型 男演员女演员Valid N (listwise)N统计量363636全距统计量4559极小值统计量3121极大值统计量7680均值统计量45.1438.94标准差统计量10.40613.546偏度统计量0.8981.503标准误0.3930.393峰度统计量0.7042.111标准误0.7680.768 3.3.1 3.3.1 探索性分析的基本原理探索性分析的基本原理 1.1.使用目的使用目的 探索性数据分析(探索性数据分析(Exploratary Data AnalysisExploratary Data Analysis,,简称简称EDAEDA)的基本思想是从数据本身出发,不拘泥于模)的基本思想是从数据本身出发,不拘泥于模型的假设而采用非常灵活的方法来探讨数据分布的大型的假设而采用非常灵活的方法来探讨数据分布的大致情况,也可以为进一步结合模型的研究提供线索,致情况,也可以为进一步结合模型的研究提供线索,为传统的统计推断提供良好的基础和减少盲目性。

为传统的统计推断提供良好的基础和减少盲目性 2.2.主要内容主要内容一般来说,进行探索性分析主要考察以下内容一般来说,进行探索性分析主要考察以下内容1)(1)检查数据是否有错过大或过小的数据均可能是异检查数据是否有错过大或过小的数据均可能是异常值、影响点或错误值要检查这样的数据,并分析常值、影响点或错误值要检查这样的数据,并分析原因,然后决定是否从分析中剔除这些数据原因,然后决定是否从分析中剔除这些数据2)(2)获得数据分布特征很多统计方法模型对数据的分获得数据分布特征很多统计方法模型对数据的分布有要求,如方差分析就需要数据服从正态分布布有要求,如方差分析就需要数据服从正态分布3)(3)对数据的初步观察,发现一些内在规律对数据的初步观察,发现一些内在规律 SPSS SPSS中的探索过程用于计算指定变量的探索性统计量和中的探索过程用于计算指定变量的探索性统计量和有关的图形它既可以对观测量整体分析,也可以进行分组有关的图形它既可以对观测量整体分析,也可以进行分组分析从这个过程可以获得箱线图、茎叶图、直方图、各种分析从这个过程可以获得箱线图、茎叶图、直方图、各种正态检验图、频数表、方差齐性检验等结果,以及对非正态正态检验图、频数表、方差齐性检验等结果,以及对非正态或正态非齐性数据进行变换,并表明和检验连续变量的数值或正态非齐性数据进行变换,并表明和检验连续变量的数值分布情况。

分布情况 选择菜单栏中的选择菜单栏中的【【分析分析】】→→【【描述统计描述统计】】→→【【探索探索】】命令,弹出命令,弹出【【探索探索】】对话框,如图对话框,如图3-173-17所示,所示,该对话框是探索性分析的主操作窗口该对话框是探索性分析的主操作窗口Step 01图图3-17 3-17 【【探索探索】】对话框对话框 在对话框左侧的候选变量列表框中选取一个或多在对话框左侧的候选变量列表框中选取一个或多个待分析变量,将它们移入右侧的个待分析变量,将它们移入右侧的【【因变量列表因变量列表】】列表框中列表框中,表示要进行探索性分析的变量表示要进行探索性分析的变量 在候选变量列表框中可以选取一个或多个分组变在候选变量列表框中可以选取一个或多个分组变量,将它们移入右侧的量,将它们移入右侧的【【因子列表因子列表】】列表框中分组变量的列表框中分组变量的选择可以将数据按该变量中的观测值进行分组分析如果选选择可以将数据按该变量中的观测值进行分组分析如果选择的分组变量不止一个,那么会以分组变量的不同取值进行择的分组变量不止一个,那么会以分组变量的不同取值进行组合分组。

组合分组 从候选变量列表框中选择一个变量作为标识变量从候选变量列表框中选择一个变量作为标识变量,并将其移入,并将其移入【【标注个案标注个案】】列表框中选择标识变量的作用列表框中选择标识变量的作用在于,当系统在数据探索过程中发现异常值时,便可利用标在于,当系统在数据探索过程中发现异常值时,便可利用标识变量加以标记,以便于用户找这些异常值如果不选择它识变量加以标记,以便于用户找这些异常值如果不选择它,系统默认以,系统默认以IDID变量作为标识变量变量作为标识变量Step 02Step 03Step 04 在在【【探索探索】】对话框下面的对话框下面的【【输出输出】】选项组中可选项组中可以选择以下输出项以选择以下输出项 两者都:输出图形以及描述性统计量两者都:输出图形以及描述性统计量   统计量:只输出描述统计量统计量:只输出描述统计量   图:只输出图形图:只输出图形 在在【【探索探索】】对话框中还可以点选对话框中还可以点选【【统计量统计量】】单单选钮,这个选项提供了各类基本描述性统计输出结果;选钮,这个选项提供了各类基本描述性统计输出结果;Step 06Step 07图图3-18 3-18 【【探索:统计量)探索:统计量)】】对话框对话框 在在【【探索探索】】对话框中还可以点选对话框中还可以点选【【绘制绘制】】单选钮,单选钮,它提供了图形输出类型。

它提供了图形输出类型Step 07图图3-19 3-19 【【探索:图探索:图】】对话框对话框 在在【【探索探索】】对话框中还可以单击对话框中还可以单击【【选项选项】】按钮按钮,弹出如图,弹出如图3-203-20所示的所示的【【探索:选项探索:选项】】对话框,在该对话对话框,在该对话框中确定对待缺失值的方式框中确定对待缺失值的方式Step 08图图3-20 3-20 【【探索:选项探索:选项】】对话框对话框 单击单击【【BootstrapBootstrap】】按钮,弹按钮,弹【【BootstrapBootstrap】】对话框,在该对话框中可以进行如下统计量对话框,在该对话框中可以进行如下统计量BootstrapBootstrap估计 支持均值、支持均值、5% 5% 切尾均值、标准差、方差、中位数、切尾均值、标准差、方差、中位数、偏度、峰度和内距的偏度、峰度和内距的BootstrapBootstrap估计  M M估计量表支持估计量表支持HuberHuber的的MM估计量、估计量、TukeyTukey的双权重的双权重、、HampelHampel的的M M 估计量和估计量和AndrewAndrew的的WaveWave的的Bootstrap Bootstrap 估计。

估计 百分位数表支持百分位数的百分位数表支持百分位数的BootstrapBootstrap估计 单击单击【【确定确定】】按钮结束操作,按钮结束操作,SPSSSPSS软件自软件自动输出结果动输出结果Step 09Step 10 打开随书光盘中的数据文件打开随书光盘中的数据文件3-3.sav3-3.sav,其中增加变,其中增加变量量““地域地域””表示所在城市的区域位置,表示所在城市的区域位置,““1 1””表示南方城市,表示南方城市,““2 2””表示北方城市选择菜单栏中的表示北方城市选择菜单栏中的【【分析分析】】→→【【描述统描述统计计】】→→【【探索探索】】命令,弹出命令,弹出【【探索探索】】对话框,如图对话框,如图3-213-21所示Step 01图图3-21 3-21 【【探索探索】】对话框对话框 在候选变量列表框中将变量在候选变量列表框中将变量““年平均温度年平均温度””添加至添加至【【因变量列表因变量列表】】列表框中,表示它是进行探索列表框中,表示它是进行探索性分析的变量性分析的变量。

将变量将变量““地域地域””添加至添加至【【因子列表因子列表】】列表列表框中,表示根据地域位置不同来进行数据分析框中,表示根据地域位置不同来进行数据分析Step 02Step 03 选择变量选择变量““城市城市””移入移入【【标注个案标注个案】】列表列表框作为标识变量,如图框作为标识变量,如图3-223-22所示Step04图图3-22 3-22 选择变量选择变量 单击单击【【统计量统计量】】按钮,在弹出的如图按钮,在弹出的如图3-233-23所示的所示的【【探索:统计量探索:统计量】】对话框中勾选对话框中勾选【【M-M-估计量估计量】】复选框,分析复选框,分析样本数据的稳定性,其他选项保持默认状态;单击样本数据的稳定性,其他选项保持默认状态;单击【【继续继续】】按钮,返回按钮,返回【【探索探索】】对话框Step05图图3-23 3-23 【【探索:统计量探索:统计量】】对话框对话框 单击单击【【确定确定】】按钮完成操作。

按钮完成操作Step 06 (1)(1)基本统计信息汇总基本统计信息汇总 基本统计信息基本统计信息地地域域案例有效有效缺失缺失合计合计N N百分比百分比百百分分比比N N百分比百分比年平年平均气均气温温南南方方1616 100.0%100.0% 0 0 0%0% 1616100.0%100.0%北北方方1717 100.0%100.0% 0 0 0%0% 1717100.0%100.0% ((2 2)描述性统计量表)描述性统计量表 地域地域统计量统计量标准误标准误年年平平均均气气温温南方南方均值均值18.700018.70000.672000.67200均值的均值的95% 95% 置置信区间信区间下限下限17.267717.2677上限上限20.132320.13235% 5% 修整均值修整均值18.577818.5778均值均值17.800017.8000方差方差7.2257.225标准差标准差2.688002.68800极小值极小值14.6014.60极大值极大值25.0025.00范围范围10.4010.40四分位距四分位距3.253.25偏度偏度1.0011.0010.5640.564峰度峰度0.7820.7821.0911.091 北方北方均值均值11.035311.03530.800780.80078均值的均值的95% 95% 置置信区间信区间下限下限9.33779.3377上限上限12.732912.73295% 5% 修整均值修整均值11.105911.1059均值均值11.000011.0000方差方差10.90110.901标准差标准差3.301693.30169极小值极小值5.405.40极大值极大值15.4015.40范围范围10.0010.00四分位距四分位距5.655.65偏度偏度-0.251-0.2510.5500.550峰度峰度-1.178-1.1781.0631.063 ((3 3))M M估计量估计量 M M估计量结果表估计量结果表a. a. 权数取值为权数取值为 1.339.1.339.b. b. 权数取值为权数取值为4.685.4.685.c. c. 权数取值分别为权数取值分别为1.700,3.400, 1.700,3.400, and 8.500and 8.500d. d. 权数取值为权数取值为1.340*pi.1.340*pi.地域地域HubeHuber r的的M-M-估计估计器器a aTukeyTukey的双的双权重权重b bHampelHampel的的M-M-估计器估计器c cAndrewsAndrews波波d d年平均气年平均气温温南方南方18.0618.06949417.7217.72080817.977617.977617.718217.7182北方北方11.2011.20757511.1711.17060611.174111.174111.169611.1696 探索性分析的茎叶探索性分析的茎叶图年平均气温年平均气温 Stem-and-Leaf Plot for地域地域= 南方南方 Frequency    Stem &  Leaf     1.00         1 .  4   11.00            1 .  66777777889     3.00            2 .  012     1.00 Extremes    (>=25) Stem width:  10.0 Each leaf:       1 case(s)年平均气温年平均气温 Stem-and-Leaf Plot for地域地域= 北方北方 Frequency    Stem &  Leaf     6.00            0 .  566889     8.00            1 .  00113334     3.00            1 .  555 Stem width:  10.0 Each leaf:       1 case(s) 3.4.1 3.4.1 列联表分析的基本原理列联表分析的基本原理 1.1.使用目的使用目的 列列联联表表是是指指一一个个频频率率对对应应两两个个变变量量的的表表((一一个个变变量量用用来来对对行行分分类类,,第第二二个个变变量量用用来来对对列列分分类类))。

列列联联表表非非常常重重要要,,它它经经常常被被用用来来分分析析调调查查结结果果它它有有两两个个基基本本任任务务::第第一一,,根根据据收收集集到到的的样样本本数数据据产产生生二二维维或或多多维维交交叉叉列列联联表表;;第第二二,,在在列列联联表表基基础础上上,,对对两两两两变量间是否存在一定的相关性进行分析变量间是否存在一定的相关性进行分析 2.2.交叉列联表交叉列联表 3.3.行列变量间关系的分析行列变量间关系的分析 列联表的频数分布不可能用来直接确定行、列变量列联表的频数分布不可能用来直接确定行、列变量之间的关系及关系的强弱令人感兴趣的二维列联表之间的关系及关系的强弱令人感兴趣的二维列联表的检验问题是行、列变量的独立性检验的检验问题是行、列变量的独立性检验 独立性检验指的是对列联表中行变量和列变量无关独立性检验指的是对列联表中行变量和列变量无关这个零假设进行的检验,即检验行、列变量之间是否这个零假设进行的检验,即检验行、列变量之间是否彼此独立常用的衡量变量间相关程度的统计量是简彼此独立常用的衡量变量间相关程度的统计量是简单相关系数,但在交叉列联表分析中,由于行、列变单相关系数,但在交叉列联表分析中,由于行、列变量往往不是连续等距变量,不符合计算简单相关系数量往往不是连续等距变量,不符合计算简单相关系数的前提要求。

的前提要求 所以,一般采用的检验方法是卡方(所以,一般采用的检验方法是卡方(χχ2 2)检验,)检验,它的计算公式为:它的计算公式为:其中,其中,f f0 0表示实际观察频数,表示实际观察频数,f fe e表示期望频数表示期望频数 选择菜单栏中的选择菜单栏中的【【分析分析】】→→【【描述统计描述统计】】→→【【交交叉表叉表】】命令,弹出命令,弹出【【交叉表交叉表】】对话框,如图对话框,如图3-253-25所示,这是所示,这是列联表分析的主操作窗口列联表分析的主操作窗口Step 01图图3-25 3-25 【【交叉表交叉表】】对话框对话框 在左侧的候选变量列表框中选取一个或多个待分析在左侧的候选变量列表框中选取一个或多个待分析变量,将它们移入右侧的变量,将它们移入右侧的【【行行】】列表框中,作为列联表的行列表框中,作为列联表的行变量;同理,选择若干候选变量移入右侧的变量;同理,选择若干候选变量移入右侧的【【列列】】列表框中列表框中,作为列联表的列变量作为列联表的列变量 如果要进行三维或多维列联表分析,可以根据需如果要进行三维或多维列联表分析,可以根据需要选择控制变量进入要选择控制变量进入【【层层1 1的的1 1】】列表另外一个控制变量,首列表另外一个控制变量,首先单击先单击【【下一张)下一张)】】按钮,再选入一个变量;单击按钮,再选入一个变量;单击【【上一张上一张】】按钮可以重新选择以前确定的变量。

按钮可以重新选择以前确定的变量 在在【【交叉表交叉表】】对话框下面有两个复选框,它们用对话框下面有两个复选框,它们用来选择列联表的输出格式来选择列联表的输出格式  显示复式条形图:显示各变量交叉分组下的频数分布条形显示复式条形图:显示各变量交叉分组下的频数分布条形图  取消表格:只输出统计量,而不输出列联表取消表格:只输出统计量,而不输出列联表Step 02Step 03Step 04 在在【【交叉表交叉表】】对话框中单击对话框中单击【【统计量统计量】】按钮,弹按钮,弹出如图出如图3-263-26所示的所示的【【交叉表:统计量交叉表:统计量】】对话框该对话框主对话框该对话框主要是根据数据类型选择不同的独立性检验方法和相关度量,要是根据数据类型选择不同的独立性检验方法和相关度量,在对话框中选择输出统计量,完成后单击在对话框中选择输出统计量,完成后单击【【继续继续】】按钮,返按钮,返回主对话框回主对话框Step 05图图3-26 3-26 【【交叉表:统计量)交叉表:统计量)】】 在在【【交叉表交叉表】】对话框中单击对话框中单击【【单元格单元格】】按钮,弹按钮,弹出如图出如图3-273-27所示的所示的【【交叉表:单元显示交叉表:单元显示】】对话框,在该对话对话框,在该对话框中可以选择显示在列联表单元格中的统计量,包括观测数框中可以选择显示在列联表单元格中的统计量,包括观测数量、百分比和残差,在对话框中选择相应选项,完成后单击量、百分比和残差,在对话框中选择相应选项,完成后单击【【继续继续】】按钮,返回主对话框。

按钮,返回主对话框Step 06图图3-27 3-27 【【交叉表:单元显示交叉表:单元显示】】对话框对话框 在在【【交叉表交叉表】】对话框中单击对话框中单击【【格式格式】】按钮,按钮,弹出如图弹出如图3-283-28所示的所示的【【交叉表:格式交叉表:格式】】对话框,用于对话框,用于选择各单元格的输出排列顺序选择各单元格的输出排列顺序Step 07图图3-28 3-28 【【交叉表:格式交叉表:格式】】对话框对话框 在在【【交叉表交叉表】】对话框中单击对话框中单击【【BootstrapBootstrap】】按钮,按钮,弹出弹出【【BootstrapBootstrap】】对话框,在该对话框中可以进行如下统对话框,在该对话框中可以进行如下统计量的计量的BootstrapBootstrap估计 单击单击【【OKOK】】按钮结束操作,按钮结束操作,SPSSSPSS软件自动输出软件自动输出结果Step 08Step 09 1.1.实例内容实例内容 在一次上海大学生身体素质的实际调查中,选择了部分在一次上海大学生身体素质的实际调查中,选择了部分大专院校的学生进行实际问卷调查,收集的数据见大专院校的学生进行实际问卷调查,收集的数据见3-4.sav3-4.sav。

调查内容主要包括:性别、出生日期、身高、体重、血型、调查内容主要包括:性别、出生日期、身高、体重、血型、教育背景、学科、男女身高级别和男女体重级别等内容请教育背景、学科、男女身高级别和男女体重级别等内容请根据调查数据分析下面问题:根据调查数据分析下面问题: ((1 1)进行)进行““性别性别””和和““体重级别体重级别””双因素交叉作用下的列双因素交叉作用下的列联表分析,并研究联表分析,并研究““性别性别””对对““体重级别体重级别””有无显著性影响有无显著性影响 ((2 2)进行)进行““教育背景教育背景””和和““身高级别身高级别””双因素交叉作用下双因素交叉作用下的列联表分析,并研究的列联表分析,并研究““教育背景教育背景””对对““身高级别身高级别””有无显有无显著性影响著性影响 打开数据文件打开数据文件3-4.sav3-4.sav,选择菜单栏中的,选择菜单栏中的【【分析分析】】→→【【描述统计描述统计】】→→【【交叉表交叉表】】命令,弹出命令,弹出【【交叉表交叉表】】对话对话框,如图框,如图3-293-29所示Step 01图图3-29 3-29 【【交叉表交叉表】】对话框对话框 在候选变量列表框中将变量在候选变量列表框中将变量““性别(性别(sexsex))””添加添加至至【【行行】】列表框中,表示它是交叉列联表中的行变量;将变列表框中,表示它是交叉列联表中的行变量;将变量量““体重级别(体重级别(wmwm))””添加至添加至【【列列】】列表框中,表示它是列表框中,表示它是交叉列联表中的列变量,如图交叉列联表中的列变量,如图3-303-30所示。

所示Step 02图图3-30 3-30 选择行、列变量选择行、列变量 单击单击【【统计量统计量】】按钮,弹出按钮,弹出【【交叉表:统计量交叉表:统计量】】对话框,如图对话框,如图3-313-31所示;勾选所示;勾选【【卡方卡方】】复选框,利用卡复选框,利用卡方检验来检验方检验来检验““性别性别””和和““体重级别体重级别””的独立性;再单击的独立性;再单击【【继续继续】】按钮,返回按钮,返回【【交叉表交叉表】】对话框Step 03图3-31 【交叉表:统计量)】对话框 由于要进行由于要进行““性别性别””和和““体重级别体重级别””的频数分析的频数分析,因此在,因此在【【交叉表交叉表】】对话框中单击对话框中单击【【CellsCells(单元)(单元)】】选项选项,弹出,弹出【【交叉表:单元显示交叉表:单元显示】】对话框,如图对话框,如图3-323-32所示;勾所示;勾选选【【百分比百分比】】选项组中的选项组中的【【行行】】、、【【列列】】和和【【总数总数】】复选复选框,再单击框,再单击【【继续继续】】按钮,返回按钮,返回【【交叉表交叉表】】对话框。

对话框Step 04图图3-32 3-32 选择列联表输出格式选择列联表输出格式 勾选勾选【【显示复式条形图显示复式条形图】】复选框,表示利用条复选框,表示利用条形图来反映不同性别之间的体重级别差异,如图形图来反映不同性别之间的体重级别差异,如图3-333-33所示Step 05图图3-33 3-33 勾选复选框勾选复选框 单击单击【【确定确定】】按钮完成操作按钮完成操作Step 06 ((1 1)基本统计信息汇总)基本统计信息汇总基本统计信息汇总基本统计信息汇总有效缺失合计N百分比N百分比N百分比性别 * 体重级别214 100.0%00.0%214100.0% ((2 2))““性别性别””和和““体重级别体重级别””的列联表的列联表 表表3-11 “3-11 “性别性别””和和““体重级别体重级别””变量的列联表变量的列联表体重级别体重级别合计合计轻(轻(60-60-))中等中等((6060~~7070))重重((70+70+))性别性别男男计数计数1717353517176969性别中的性别中的%%24.6%24.6%50.7%50.7%24.6%24.6%100.0100.0%%体重级别中体重级别中的的%%11.1%11.1%85.4%85.4%85.0%85.0%32.2%32.2%总数的总数的% % 7.9%7.9%16.4%16.4%7.9%7.9%32.2%32.2%女女计数计数1361366 63 3145145性别中的性别中的%%93.8%93.8%4.1%4.1%2.1%2.1%100.0100.0%%体重级别中体重级别中的的%%88.9%88.9%14.6%14.6%15.0%15.0%67.8%67.8%总数的总数的% % 63.6%63.6%2.8%2.8%1.4%1.4%67.8%67.8%合计合计计数计数15315341412020214214性别中的性别中的%%71.5%71.5%19.2%19.2%9.3%9.3%100.0100.0%%体重级别中体重级别中的的%%100.0%100.0%100.0%100.0%100.0%100.0%100.0100.0%%总数的总数的% % 71.5%71.5%19.2%19.2%9.3%9.3%100.0100.0%% ((3 3))““性别性别””和和““体重级别体重级别””的独立性检验的独立性检验表表3-12 3-12 卡方检验结果卡方检验结果值值dfdf渐进渐进 Sig. Sig. (双侧)(双侧)Pearson Pearson 卡方卡方2 20.0000.000似然比似然比111.290111.2902 20.0000.000线性和线性组合线性和线性组合92.73992.7391 10.0000.000有效案例中的有效案例中的N N214214 ((4 4)体重级别条形图)体重级别条形图 3.5.1 3.5.1 比率分析的基本原理比率分析的基本原理 比率分析生成比率变量,并对该比率变量计算基本描比率分析生成比率变量,并对该比率变量计算基本描述性统计量(如均值、中位数、标准差、全距等),进述性统计量(如均值、中位数、标准差、全距等),进而刻画出比率变量的集中趋势和离散程度。

除此之外,而刻画出比率变量的集中趋势和离散程度除此之外,SPSS 21.0SPSS 21.0还提供了其他对比描述指标,大致也属于集中还提供了其他对比描述指标,大致也属于集中趋势描述指标和离散程度描述指标的范畴趋势描述指标和离散程度描述指标的范畴 选择菜单栏中的选择菜单栏中的【【分析分析】】→→【【描述统计描述统计】】→→【【比率比率】】命令,弹出命令,弹出【【比值统计量)比值统计量)】】对话框,如图对话框,如图3-353-35所示,这是所示,这是比率分析的主操作窗口比率分析的主操作窗口Step 01图图3-35 3-35 【【比值统计量比值统计量】】对话框对话框 在对话框左侧的候选变量列表框中选取一个分在对话框左侧的候选变量列表框中选取一个分析变量作为比率分析的分子,将它移入右侧的析变量作为比率分析的分子,将它移入右侧的【【分子分子】】列表列表框中 在对话框左侧的候选变量列表框中选取一个分析在对话框左侧的候选变量列表框中选取一个分析变量作为比率分析的分母,将它移入右侧的变量作为比率分析的分母,将它移入右侧的【【分母分母】】列表框列表框中。

中 在对话框左侧的候选变量列表框中选取一个变在对话框左侧的候选变量列表框中选取一个变量作为分组变量,将它移入右侧的量作为分组变量,将它移入右侧的【【组变量组变量】】列表框中列表框中 在主对话框中,用户可以选择如下比率分析的结在主对话框中,用户可以选择如下比率分析的结果输出类型果输出类型   显示结果:系统默认项,选择是否显示结果显示结果:系统默认项,选择是否显示结果   将结果保存到外部文件:选择是否将分析结果保将结果保存到外部文件:选择是否将分析结果保存至外部文件同时,外部文件的保存路径需要单击存至外部文件同时,外部文件的保存路径需要单击【【文件文件】】按钮来选择按钮来选择Step 02Step 03Step04Step05 单击单击【【统计量统计量】】按钮,弹出如图按钮,弹出如图3-363-36所示的所示的【【比比率统计量:统计量率统计量:统计量】】对话框,该对话框主要用于输出各类基对话框,该对话框主要用于输出各类基本统计量结果。

本统计量结果Step 06图图3-36 3-36 【【比率统计量:统计量比率统计量:统计量】】对话框对话框 单击单击【【确定确定】】按钮结束操作,按钮结束操作,SPSSSPSS软件自动输出软件自动输出结果Step 07 1. 1. 实例内容实例内容城乡居民消费水平城乡居民消费水平 打开打开SPSSSPSS软件,选择菜单栏中的软件,选择菜单栏中的【【分析分析】】→→【【描述统计描述统计】】→→【【比率比率】】命令,弹出命令,弹出【【比值统计量比值统计量】】对话框,对话框,如图如图3-383-38所示Step 01图图3-38 3-38 【【比值统计量)比值统计量)】】对话框对话框 在左侧的候选变量列表框中选取变量在左侧的候选变量列表框中选取变量““城镇居民城镇居民””作为比率分析的分子,将它移入右侧的作为比率分析的分子,将它移入右侧的【【分子分子】】列表框中列表框中 在左侧的候选变量列表框中选取变量在左侧的候选变量列表框中选取变量““农村居民农村居民””作为比率分析的分母,将它移入右侧的作为比率分析的分母,将它移入右侧的【【分母分母】】列表框中。

列表框中Step 02Step 03 在左侧候选变量列表框中选取变量在左侧候选变量列表框中选取变量““区域区域””作为作为分组变量,将它移入右侧的分组变量,将它移入右侧的【【组变量组变量】】列表框中,如图列表框中,如图3-393-39所示Step 04图图3-39 3-39 设置比率分析变量设置比率分析变量 单击单击【【统计量统计量】】按钮,弹出如图按钮,弹出如图3-403-40所示的对话框所示的对话框;除了系统默认的输出统计量外,勾选;除了系统默认的输出统计量外,勾选【【中位数中位数】】、、【【均值均值】】和和【【ADDADD】】复选框,最后单击复选框,最后单击【【继续继续】】按钮,返回按钮,返回【【比值比值统计量统计量】】对话框Step 05图图3-40 3-40 选择输出统计量选择输出统计量 ((1 1)样本统计结果输出)样本统计结果输出 样本统计结果表样本统计结果表计数计数百分比百分比计数计数百分比百分比区域区域华北华北5 519.2%19.2%区域区域西北西北5 519.2%19.2%东北东北3 311.5%11.5%总数总数2626100.0%100.0%华东华东5 519.2%19.2%排除的排除的0 0华中华中3 311.5%11.5%总计总计2626西南西南5 519.2%19.2% ((2 2)比率分析结果表)比率分析结果表 比率分析结果表比率分析结果表组组均值均值中位中位数数平均数绝对值平均数绝对值偏差偏差价格相关微分价格相关微分离散系数离散系数方差系数方差系数中值居中中值居中华北华北2.9122.9122.8872.8870.2840.2841.0471.0470.0980.09812.4%12.4%东北东北2.8662.8662.8762.8760.1350.1351.0071.0070.0470.0477.0%7.0%华东华东2.6972.6972.5742.5740.3570.3571.0751.0750.1390.13919.0%19.0%华中华中3.2073.2073.2173.2170.1550.1551.0051.0050.0480.0487.2%7.2%西南西南4.3364.3364.3314.3310.8090.8091.0411.0410.1870.18725.3%25.3%西北西北3.7953.7953.8813.8810.2440.2441.0041.0040.0630.0638.6%8.6%OverallOverall3.3433.3433.2273.2270.5650.5651.0981.0980.1750.17525.4%25.4% 。

下载提示
相似文档
正为您匹配相似的精品文档