spss描述性统计分析－金锄头文库

资源描述

《spss描述性统计分析》由会员分享，可在线阅读，更多相关《spss描述性统计分析（42页珍藏版）》请在金锄头文库上搜索。

1、第四章,描述性统计分析,主要内容,4.1 基本描述性统计量的定义及计算 4.2 频数分析 4.3 描述性分析 4.4 探索性分析 4.5 交叉列联表分析 4.6 多选项分析,4.1 基本描述性统计量的定义及计算,4.1 基本描述性统计量简介,4.1.1 描述集中趋势的统计量1.均值（Mean） 2.众数（Mode） 3.中位数（Median） 4.总和（Sum） 5.百分位数（Percentile Value）,4.1 基本描述性统计量的定义及计算,4.1.2 描述离散程度的统计量1.样本方差（Variance）2.样本标准差（Std. deviation）3.极差（Range）4.均值标准误

2、差（Standard Error of Mean）,4.1 基本描述性统计量的定义及计算,4.1.3 描述总体分布形态的统计量1. 偏度（Skewness）：是描述取值分布形态对称性的统计量；偏度系数大于0，表示其数据分布形态有一条长尾拖在右边，称为右偏或正偏，偏度系数小于0,表示其数据分布形态有一条长尾拖在左边，称为左偏或负偏。偏度系数的绝对值越大，与正态分布相比越偏斜。2. 峰度（Kurtosis）：是描述变量取值分布形态陡缓的统计量；峰度系数等于0，表明数据分布的陡峭程度与正态分布相同。峰度系数大于0时为尖峰分布，表明数据分布的陡峭程度比正态分布大，峰度系数小于0时为平峰分布，表明数据分

3、布的陡峭程度比正态分布小。,4.1 基本描述性统计量的定义及计算,4.1.3 描述总体分布形态的统计量来自于正态总体的偏度及峰度均近似为0，可以利用偏度和峰度的值是否接近0作为检验是否是正态分布的重要依据。,主要内容,4.1 基本描述性统计量的定义及计算4.3 描述性分析 4.4 探索性分析 4.5 交叉列联表分析 4.6 多选项分析,4.2 频数分析,4.2 频率分析,4.2.1 基本概念及统计原理频率就是一个变量在各个变量值上取值的个案数，分析时不考虑其实际取值。基本统计分析往往从频率分析开始。通过频率分析能够了解变量取值的状况，对把握数据的分布特征是非常有用的。例如，调查消费者拥有数码产

4、品的数量，首先分析受访者的总人数、家庭收入情况、受教育程度、性别等，获取样本是否具有总体代表性、抽样是否存在系统偏差等信息。这些可以通过频率分析来实现，经过频率分析可以得到如下结果：（1）频率分布表：该表中包含频率、各频率占总样本数的百分比、有效百分比、累计百分比。（2）统计图：用统计图形展示变量的取值状况，频率分析中提供的统计图形可以是条形图、饼图或者直方图。,4.2 频率分析,4.2.2 SPSS实例分析【例4-1】以下是调查问卷中针对被调查人设置的两个问题： 1、您的家庭月收入大约是：（请包括所有工资、奖金、津贴等在内，以人民币为单位）单选 500-10001 1000-19992

5、 2000-299933000-39994 4000-49995 5000-59996 6000-69997 7000-79998 8000-899999000-999910 10000及以上112、您的教育程度：（指您受过的最高或正在接受的教育程度）单选没有受过正式教育/小学.1 初中2 高中/中专/技校 3 大专/大学非本科/高职高专4 大学本科.5 研究生及以上6 从问卷中收集到的数据如表4.1所示 , 试对收集到的数据进行频数分析,4.2 频率分析,第1步数据组织：根据表4.1生成SPSS 数据文件，建2个变量：“收入”、“教育”，度量标准均为序号。第2步频率分析设置：选

6、择菜单：“分析描述统计频率”，打开“频率（F）”对话框，将“教育”和 “收入”加入到“变量”列表框中。打开“统计量”对话框，选中“百分位数”“众数”，并在“百分位数”中添加30.0、60.0、90.0；打开“图表”对话框，选中“直方图”及后面的复选框,表4.1,4.2 频率分析,第3步主要结果及分析：统计量表变量“教育”的频率分布表,表中分别显示两个分析变量“教育”及“收入”的有效个案数、缺失值个数、及两个分析变量的“众数”及对应于30%、60%及90%的百分位数。,表中显示了变量“教育”在各个取值上出现的次数（频率）、其频率占所有个案中的百分比、有效百分比及累积百分比。,4.2

7、频数分析,变量“收入”的频率分布表,表中显示了变量“收入”在各个取值上出现的次数（频率）、其频率占所有个案中的百分比、有效百分比及累积百分比。,4.2 频数分析,变量“教育”的直方图变量“收入”的直方图,表中显示了变量“教育”的直方图，从图上可以看出受访者教育程度同正态分布相比左偏，不具备明显的正态分布。,表中显示了变量“收入”的直方图，从图上可以看出受访者家庭收入同正态分布相比右偏，不具备明显的正态分布。,主要内容,4.1 基本描述性统计量的定义及计算 4.2 频数分析4.4 探索性分析 4.5 交叉列联表分析 4.6 多选项分析,4.3 描述性分析,4.3 描述性分析,4.3.1 基本概

8、念及统计原理描述性分析主要用于输出变量的各类描述性统计量的值，通过上一节的学习可知，频率分析同样可以做到，都是以计算数值型单变量的统计量为主。描述性统计分析没有图形功能，也不能生成频率表，但描述性分析可以将原始数据标准化为Z分数，并以变量形式存入数据文件中，以便后续分析时应用。,4.3 描述性分析,4.3.2 实例分析【例4-2】图3-38是5岁儿童体重、身高、胸围的部分SPSS数据，试对儿童身高作描述性统计分析。（数据文件：data3-8.sav）第1步打开数据文件data4-2.sav; 第2步描述性分析设置：选择菜单“分析描述统计描述” ，打开“描述性”主对话框，将要分析的变

9、量“身高”加入“变量”列表框中。打开“描述：选项”对话框，选中“均值”、“标准差”、“最小值”、“最大值”、“峰度”、“偏度”及显示顺序的“变量列表”等选项。,4.3 描述性分析,第3步运行结果及分析：描述性分析结果表,表中分析变量“身高”的个案数、所有个案中的极大值、极小值、均值、标准差及偏度和峰度,主要内容,4.1 基本描述性统计量的定义及计算 4.2 频数分析 4.3 描述性分析4.5 交叉列联表分析 4.6 多选项分析,4.4 探索性分析,4.4 探索性分析,4.4.1 基本概念及统计原理与前面介绍的两种分析方法相比，探索性分析更加强大，它是一种在对资料的性质、分布特点等完全不清

10、楚的情况下，对变量进行更深入研究的描述性统计方法。在进行统计分析前，通常需要寻求和确定适合所研究的问题的统计方法， SPSS提供的探索性分析是解决此类问题的有效办法。探索性分析提供了很多关于数据的概括分析和图表直观描述的方法，不仅对个案数据有效，而且还可以针对分组个案。在输出常用描述性统计量的基础之上，探索性分析增加了有关数据详细分布特征的文字与图形表述，如茎叶图、箱图等，显得更加详细、完整，还可以以方差齐性为目的的变量交换提供线索，有助于用户制定更进一步分析的方案。,4.4 探索性分析,4.4.2 实例分析【例4-3】下表是某班3门课程对应成绩的统计数据，试对其作探索性分析并做是否服从正态

11、分布的检验。第1步数据组织：定义2个变量，分别为：“科目”、“成绩”，“科目”的度量标准为“名义”，“成绩”的度量标准为“度量”。第2步探索分析设置：选择菜单“分析描述统计探索”，打开“探索” 对话框，将“成绩”字段移入“因变量列表”，“科目”移入“因子列表”。,4.4 探索性分析,打开“统计量”对话框，选中“描述性”及“M-估计量”选项；打开“探索：图”对话框，选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。打开“探索：选项”，选中“按列表排除个案”选项。第3步运行结果及分析： “成绩”按科目分组的案例处理摘要表,表中显示“成绩”按“科目”分组后各组的有效个

12、案数、个案缺失数及缺失比例等。,4.4 探索性分析,描述性统计量表,表中显示“成绩”按“科目”分组后各分组的描述性统计量，左表中只显示的是”语文“分组的均值、均值的95%置信区间的上下限、中值、方差、标准差、极大/小值、偏度、峰度等。,4.4 探索性分析,M均值估计量,表中提供了四种估计方法，每种估计方法的加权量在表下方给出，对于有异常值或极端值的数据,M均值估计有很好的稳定性，用M估计值代替均值或中位数，结果更准确。根据样本值的权重不同，可以得到不同的估计量,4.4 探索性分析,表中显示了按科目分为的3个分组的两种检验方法的正态性检验结果，包括各分组的统计量、自由度及显著性水平，以K-

13、S方法的“语文”分组为例分析：其自由度sig.=0.200,明显大于0.05，故应接受原假设，认为”语文“分组中的数据服从正态分布。,正态检验表,4.4 探索性分析,箱图,箱图中显示成绩按科目分成的三个分组，每个分组中的数据绘制成对应的箱体。每一个箱体上方那条线的取值代表该分组中最大值，下方那条线的取值代表最小值。箱体自身的三条线从上到下分别代表3/4分位点、中位点、1/4分位点的取值。,4.4 探索性分析,语文成绩的标准Q-Q图及趋降标准Q-Q图,上图为“科目=语文”分组的成绩标准Q-Q图，Q-Q图可以用来检验数据是否服从某种分布，在Q-Q图中，检验数据是否较好地服从给定分布的标准有两个：看

14、标准Q-Q图上的数据点与直线的重合度；Q-Q趋势图上的点是否关于直线Y=0在较小的范围内上下波动。从上图中可以看出，”科目=语文“的分组中的数据与直线重合度较好，故很好地服从正态分布，这与前面的正态检验表中的结果是一致的。,主要内容,4.1 基本描述性统计量的定义及计算 4.2 频数分析 4.3 描述性分析 4.4 探索性分析4.6 多选项分析,4.5 交叉列联表分析,4.5 交叉表分析,4.5.1基本概念及统计原理 1.交叉表分析的概念在实际分析中，常需要分析多个变量之间，一个变量是否对其他变量的取值存在影响，分析变量之间是否存在关系，这种分析就称为交叉表分析，用于定类型变量之间的关系分析。

15、交叉表是两个或多个变量交叉分组后形成的频数分布表，主要用于研究定类型变量之间有无相关性，给出了变量在不同取值下的数据分布。交叉表分析根据样本数据，产生二维或多维交叉表，并在产生交叉表的基础上，对两两变量间是否存在一定的相关性进行分析。,4.5 交叉表分析,2交叉表分析的相关关系的主要检验方法在分析中，难以在交叉表中直接发现行、列变量之间的关系及关系强度，需要借助非参数检验方法和度量变量间相关程度的统计量进行分析，通常采用检验和相关性检验。卡方统计检验：常用于检验行列变量之间是否相关。列联系数：用于名义变量之间的相关系数计算。V系数（Phi and Cramers V）：常用于名义变量之间的相

16、关系数计算。,4.5 交叉表分析,4.5.2 SPSS实例分析【例4-4】在设置学生评价实验教学的调查表中，“实验准备”是其中的一项指标，为分析“实验准备”情况与评价结果的关系，建立的SPSS数据文件中的部分数据如下图所示，变量值标签如下表所示。（参见数据文件：data4-4.sav。）,4.5 交叉列联表分析,第1步数据组织：数据文件中建立两个变量：“实验准备”、“评价结果”，两个变量均为数值型或字符型的分类变量，其度量标准为“名义”，保存为SPSS数据文件data4-3.sav。第2步交叉表分析设置：选择菜单：“分析描述统计交叉表” ，打开“交叉表”对话框，将“实验准备”及“评价结果”字段分别加入“行(s)”及“列(c)”列表框中。打开“统计量”对话框，选中“卡方”选项。打开“单元显示”对话框，选中“观察值”及“四舍五入单元格计数”选项，二者都是缺省设置。,

展开阅读全文

spss描述性统计分析

最新文档