SPSS基本统计分析

上传人:宝路 文档编号:46591388 上传时间:2018-06-27 格式:PPT 页数:116 大小:1.54MB
返回 下载 相关 举报
SPSS基本统计分析_第1页
第1页 / 共116页
SPSS基本统计分析_第2页
第2页 / 共116页
SPSS基本统计分析_第3页
第3页 / 共116页
SPSS基本统计分析_第4页
第4页 / 共116页
SPSS基本统计分析_第5页
第5页 / 共116页
点击查看更多>>
资源描述

《SPSS基本统计分析》由会员分享,可在线阅读,更多相关《SPSS基本统计分析(116页珍藏版)》请在金锄头文库上搜索。

1、第五章SPSS基本统计分析 描述性统计分析SPSS的主要分析工具Analyze菜单报告Rports描述性统计分析Descriptive Statistics菜单表格Tables均数间的比较Compare Means菜单一般线性模型General Linear Model菜单相关分析Correlate菜单多元线性回归与曲线拟合 Regression菜单对数线性模型Loglinear菜单聚类分析与判别分析Classify菜单因子分析与对应分析Data Reduction菜单信度分析与多维尺度分析Scale菜单非参数检验Nonparametric Tests菜单时间序列分析Time series描述

2、性统计分析是统计分析的第一步,做好这第一步 是下面进行正确统计推断的先决条件。SPSS的许多模块 均可完成描述性分析,但专门为该目的而设计的几个模块 则集中在Descriptive Statistics菜单中,包括:Frequencies:频数分析过程,特色是产生频 数表(主要针对分类变量)Descriptives:数据描述过程,进行一般性的 统计描述(主要针对数值型变量)Explore:数据探察过程,用于对数据概况不清 时的探索性分析Crosstabs:多维频数分布交叉表分析(列联 表分析)Ratio statistics:比率分析5.1 频数分析5.1.1 频数分析的目的和基本任务1、目的

3、:基本统计分析往往从频数分析开始。通过频数 分析能够了解变量取值的状况,对把握数据的分布特征是 非常有用的。2、基本任务(1)频数分析的第一个基本任务是编制频数分布表。n频数(Frequency):即变量值落在某个区间 (或某个类别)中的次数n百分比(Percent):即各频数占总样本数的 百分比n有效百分比(Valid Percent):即各频数占 有效样本数的百分比,这里有效样本数总样本缺 失样本数n累计百分比(Cumulative Percent):即 各百分比逐级累加起来的结果。最终取值为100。(2)频数分析的第二个任务是绘制统计图n条形图(Bar Chart):用宽度相同的条 形的

4、高度或长短来表示频数分布变化的图形, 适用于定序和定类变量的分析。n饼图(Pie Chart):用圆形及圆内扇形 的面积来表示频数百分比变化的图形,以利于 研究事物内在结构组成等问题。n直方图(Histograms):用矩形的面积 来表示频数分布变化的图形,适用于定距型变 量的分析。5.1.2 频数分析的基本操作 (1)选择菜单AnalyzeDescriptive StatisticsFrequencies。 (2)将若干频数分析变量选择到Variable(s)框 中。 (3)单击Chart按钮选择绘制统计图形,在 Chart Values框中选择条形图中纵坐标(或饼 图中扇形面积)的含义,其

5、中Frequencies表 示频数;Percentages表示百分比。输出百分位数: 输出四分位数,显示 25%、50%、75%的百分 位数; 将数据平均分为所设定 的相等等份,可输入2 100 的整数,如键入4则输 出第25、50、75百分位数 自定义百分位数,可输 入0100 的整数。离散趋势分布形态栏集中趋势栏输出统计量对话框5.1.3 SPSS频数分析的扩展功能1、计算分位数(Percentile Values)分位数是变量在不同分位点上的取值。分位点在0 100之间。一般使用较多的是四分位点(Quartiles ),即将所有数据按升序排序后平均等分成四份,各分 位点依次是25,50,

6、75。于是四分位数便分别 是25,50,75点所对应的变量值。此外,还有 八分位数、十六分位数等。SPSS提供了计算任意分位数的功能,用户可以指 定将数据等分为n份(Cut points for n equal groups)。还可以直接指定分位点(Percentile) 。2、计算其他基本描述统计量SPSS频数分析还能够计算其他基本统 计量,其中包括描述集中趋势(Central Tendency)的基本统计量、描述离散程度 (Dispersion)的基本统计量、描述分布 形态(Distribution)的基本统计量等。Format 对话框控制频数表输出的分 类数量。默认为10多变量框中可设定

7、多 变量表格输出的格式设置频数表输出的格式选择频数表中排 列顺序 按变量升序排 列,此为默认 按变量降序排 列 按变量各种取 值发生的频数的 升序排列 按变量各种取 值发生的频数的 降序排列3、频数分布表格式(Format)的定义(1)调整频数分布表中数据的输出顺序( Order by):频数分布表中的内容的输出顺 序可以按变量值的升序输出(Ascending values),按变量值的降序输出( Descending values),按频数的升序输 出( Ascending counts),按频数的降 序输出( Descending counts)。(2)multiple variables

8、单选框组:如果选择了两个以上变量作频数表,则 compare variables可以将所有变量的结 果在同一个频数表过程输出结果中显示,便 于互相比较;organize output by variables则将结果在不同的频数表过程输 出结果中显示,每一个变量一张表。(3)压缩频数分布表(Suppress tables with more than n categories)如果变量取值的个数或取值区间的个数 太多,频数分布表将很庞大,此时可以压缩 它。SPSS默认,如果变量取值的个数或取 值区间的个数大于10,则不输出相应的频数 分布表。应用中可以修改该值。5.1.4 频数分析的应用举例利

9、用居民储蓄调查数据进行频数分析, 有以下两个分析目标:q目标一:分析储户的户口和职业的基本情 况。q目标二:分析储户一次存款金额的分布, 并对城镇储户和农村储户进行比较。分析: 目标一:分析储户的户口和职业的基本情况(1)户口和职业两个变量都是定类型变量, 可通过基本频数分析实现。(2)职业变量的取值(分类)数目较多,为 使频数分布表更一目了然,应对内容的输出顺 序进行调整,单击Format按钮,选择 Descending counts按频数的降序输出。(3)单击Chart按钮指定输出户口变量的饼 图和职业变量的条形图。目标二:分析储户一次存款金额的分布,并对城镇储户 和农村储户进行比较。 1

10、、分析思路: (1)由于存(取)款金额数据为定距型变量,直接采 用频数分析不利于对其分布形态的把握,因此考虑依 据第三章中的数据分组功能对数据分组后再编制频数 分布表。 (2)进行数据拆分,并分别计算城镇储户和农村储户 的一次存(取)款金额的四分位数,并通过四分位数 比较两者分布上的差异。2、分析过程: (1)数据分组,将存(取)款金额重新分成五组,五 组区间分布为,少于500元,5002000元, 20003500元,35005000元,5000元以 上。分组后进行频数分析并绘制带正态曲线的直方 图。 (2)利用SPSS的频数分析计算所有样本的存(取) 款金额的四分位数;然后,按照户口类型对

11、数据进 行拆分(Split file)并重新计算分位数,分别得到 城镇户口和农村户口的存(取)款金额的四分位数 。5.2 计算基本描述统计量5.2.1 基本描述统计量常见的基本描述统计量有三大类:n刻画集中趋势的统计量n刻画离中趋势的统计量n刻画分布形态的统计量1、刻画集中趋势的描述统计量集中趋势是指一组数据向某一中心值靠 拢的倾向。 (1)均值(Mean):即算术平均数,是反 映某变量所有取值的集中趋势或平均水平的 指标。如某企业职工的平均月收入。其计算 公式为:(2)中位数(Median):即一组数据按升 序排序后,处于中间位置上的数据值。如评 价社会的老龄化程度时,可用中位数。 (3)众

12、数(Mode):即一组数据中出现次 数最多的数据值。如生产鞋的厂商在制定各 种型号鞋的生产计划时应该运用众数。(4)均值标准误差(Standard Error of Mean) :描述样本均值与总体均值之间的平均差异程度的统 计量。其计算公式为:其中: 为总体标准差,n为样本单位数2、刻画离散程度的描述统计量离散程度是指一组数据远离其“中心值” 的程度。如果数据都紧密地集中在“中心值”的周 围,数据的离散程度较小,说明这个“中心值 ”对数据的代表性好;相反,如果数据仅是比 较松散地分布在“中心值”的周围,数据的离 散程度较大,则此“中心值”说明数据特征是 不具有代表性的。常见的刻画离散程度的描

13、述统计量如下: (1)全距(Range):也称极差,是数据的 最大值(Maximum)与最小值( Minimum)之间的绝对离差。 (2)方差(Variance):也是表示变量取 值离散程度的统计量,是各变量值与算数平 均数离差平方的算术平均数。其计算公式为 :(3)标准差(Standard Deviation:Std Dev):表示变量取值距离均值的平均离散 程度的统计量。其计算公式为:标准差值越大,说明变量值之间的差异 越大,距均值这个“中心值”的离散趋势越大 。3、刻画分布形态的描述统计量数据的分布形态主要指数据分布是否对 称,偏斜程度如何,分布陡峭程度等。刻画分布形态的统计量主要有两种

14、: (1)偏度(Skewness):描述变量取值分 布形态对称性的统计量。其计算公式为:当分布为对称分布时,正负总偏差相等 ,偏度值等于0;当分布为不对称分布时, 正负总偏差不相等,偏度值大于0或小于0。 偏度值大于0表示正偏差值大,称为正偏或 右偏;偏度值小于0表示负偏差值大,称为 负偏或左偏。偏度绝对值越大,表示数据分 布形态的偏斜程度越大。(2)峰度(Kurtosis):描述变量取值分布形态陡 峭程度的统计量。其计算公式为:当数据分布与标准正态分布的陡峭程度相同时 ,峰度值等于0;峰度大于0表示数据的分布比标准 正态分布更陡峭,为尖峰分布;峰度小于0表示数据 的分布比标准正态分布平缓,为

15、平峰分布。5.2.2 计算基本描述统计量的操作 (1)选择菜单AnalyzeDescriptive StatisticsDescriptives,出现如下窗口:(2)将需计算的数值型变量选择到Variable(s)框中。 (3)单击Option按钮指定计算哪些基本描述统计量,出 现如下窗口:Options 对话框 基本统计量当Variables框中有多个变量 时,此框确定其输出顺序: 按Variables框中的排列顺 序输出 按各变量的字母顺序输出 按均值的升序排列 按均值的降序排列分布在上面窗口中,用户可以指定分析多 变量时结果输出的次序(Display Order )。其中,Variabl

16、e list表示按变量在数 据窗口中从左到右的次序输出; Alphabetic表示按字母顺序输出; Ascending Means表示按均值升序输出; Descending Means表示按均值降序输出 。至此,SPSS便自动计算所选变量的 基本描述统计量并显示到输出窗口中。5.2.3 计算基本描述统计量的应用举例1. 利用居民储蓄调查数据,对一次存款 金额变量计算基本描述统计量。有以下分析 目标:计算存款金额的基本描述统计量,并 分别对城镇储户和农村储户进行比较分析:首先按照户口对数据进行拆分( Split file),然后计算存(取)款金额的 基本描述统计量。2. 分析储户一次存款的数量是否存在不均衡现象。分析:假设储户一次存款金额服从正态分布,跟据3 原则,异常值通常为3个标准差范围之外的值,可通过 对数据的标准化处理来判断。标准化的数学定义为:通过标准化可以得到一系列新变量值,通常称为 标准化值或

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号