01第1章SPSS的描述性分析内容介绍

资源描述

《01第1章SPSS的描述性分析内容介绍》由会员分享，可在线阅读，更多相关《01第1章SPSS的描述性分析内容介绍（77页珍藏版）》请在金锄头文库上搜索。

1、 SPSSSPSS的描述性分析的描述性分析SPSSSPSS的描述性分析的描述性分析FrequenciesFrequencies：频数分布表：频数分布表DescriptivesDescriptives：一般性描述：一般性描述ExploreExplore：探索性分析：探索性分析CrosstabsCrosstabs：交叉列表：交叉列表描述性分析描述性分析频数分布表频数分布表一般性描述一般性描述探索性分析探索性分析交叉列表交叉列表计算连续变计算连续变量的相对比量的相对比频数分布表频数分布表(Frequencies)(Frequencies)描述性分析描述性分析描述性分析描述性分析调用此过程可进行频数

2、分布表的分析调用此过程可进行频数分布表的分析调用此过程可进行频数分布表的分析调用此过程可进行频数分布表的分析. . . .频数分布表是描述性频数分布表是描述性频数分布表是描述性频数分布表是描述性统计中最常用的方法之一统计中最常用的方法之一统计中最常用的方法之一统计中最常用的方法之一, , , ,此外还可对数据的分布趋势进行初步此外还可对数据的分布趋势进行初步此外还可对数据的分布趋势进行初步此外还可对数据的分布趋势进行初步分析分析分析分析. . . .书中例题书中例题P29例例1-20用用EDTA络合滴定法测定工业硫酸锌中的络合滴定法测定工业硫酸锌中的锌含量锌含量(%)，10次测定结果为：次测定

3、结果为：21.49，21.36，22.65，22.65，21.71，22.44，22.15，22.07，22.38，22.19，求该组数，求该组数据的算术平均值、几何平均值、调和平据的算术平均值、几何平均值、调和平均值、样本标准差均值、样本标准差s、总体标准差、总体标准差、样、样本方差本方差s2、总体方差、总体方差2、算术平均误差、算术平均误差和极差和极差R。频数分布表频数分布表(Frequencies)(Frequencies)描述性分析描述性分析描述性分析描述性分析是否显示频数表是否显示频数表定义需要计算的统计量定义需要计算的统计量定义需要绘制的统计图定义需要绘制的统计图待分析变量的待分析

4、变量的列表列表百分位数百分位数分布特征描述分布特征描述离散趋势离散趋势集中趋势集中趋势描述性分析描述性分析描述性分析描述性分析FrequenciesFrequencies：定义统计量：定义统计量百分位数百分位数分布特征描述分布特征描述离散趋势离散趋势集中趋势集中趋势描述性分析描述性分析描述性分析描述性分析FrequenciesFrequencies：定义统计量：定义统计量Frequencies：定义统计量：定义统计量统计图类型统计图类型直方图加上正态曲线直方图加上正态曲线以频数绘制条图或饼图以频数绘制条图或饼图FrequenciesFrequencies：定义统计图：定义统计图描述性分析描述性

5、分析描述性分析描述性分析无图形无图形条图条图饼图饼图直方图直方图以构成比绘制条图或饼图以构成比绘制条图或饼图Frequencies：定义统计图：定义统计图频数表排列次序频数表排列次序FrequenciesFrequencies：定义表格：定义表格描述性分析描述性分析描述性分析描述性分析按数值升序按数值升序按数值降序按数值降序按频数升序按频数升序按频数降序按频数降序FrequenciesFrequencies：结果解释：结果解释描述性分析描述性分析描述性分析描述性分析均值（均值（MeanMean）和均值标准误差）和均值标准误差（S.E.meanS.E.mean）统计学上的定义和计算公式统计学上的

6、定义和计算公式定义：均值（平均值、平均数）定义：均值（平均值、平均数）表示的是某变量所有取值的集中表示的是某变量所有取值的集中趋势或平均水平。例如，学生某趋势或平均水平。例如，学生某门学科的平均成绩、公司员工的门学科的平均成绩、公司员工的平均收入、某班级学生的平均身平均收入、某班级学生的平均身高等。计算公式如下。高等。计算公式如下。总体平均数：若一组数据总体平均数：若一组数据X X1 1，X X2 2，X XN N，代表一个大小为，代表一个大小为N N的的有限总体，则其总体平均数为有限总体，则其总体平均数为样本平均数：若一组数据样本平均数：若一组数据x x1 1，x x2 2，x xn

7、n，代表一个大小为，代表一个大小为n n的有限样本，则其样本平的有限样本，则其样本平均数为均数为样本数据来自总体。样本的统计描述量可样本数据来自总体。样本的统计描述量可以反映总体数据的特征，但由于抽样等原因，以反映总体数据的特征，但由于抽样等原因，使得样本数据不一定能够完全准确地反映总体，使得样本数据不一定能够完全准确地反映总体，它可能与总体的真实值之间存在一定的差异。它可能与总体的真实值之间存在一定的差异。进行不同次抽样，会得到若干个不同的样本均进行不同次抽样，会得到若干个不同的样本均值，它们与总体均值存在着不同的差异。值，它们与总体均值存在着不同的差异。均值标准误差（均值标准误差（St

8、andard Error of MeanStandard Error of Mean，S.E. S.E. MeanMean）就是描述这些样本均值与总体）就是描述这些样本均值与总体均值之间平均差异程度的统计量。均值之间平均差异程度的统计量。 1. 平均数、标准误平均数、标准误中位数（中位数（MedianMedian）统计学上的定义和计算公式统计学上的定义和计算公式定义：中位数是将总体数据的各个数值按定义：中位数是将总体数据的各个数值按大小顺序排列，居于中间位置的变量，用大小顺序排列，居于中间位置的变量，用MedianMedian表示。中位数将所有的数据分成两半，表示。中位数将所有的数据分成两半

9、，中位数两端的数据个数相同，因此它也被称为中位数两端的数据个数相同，因此它也被称为二分位数。中位数的确定，仅仅取决于它在数二分位数。中位数的确定，仅仅取决于它在数列中的位置，不受极端值的影响，因此可以用列中的位置，不受极端值的影响，因此可以用它表示总体的一般水平。同时中位数比算术平它表示总体的一般水平。同时中位数比算术平均数具有更好的稳定性。均数具有更好的稳定性。计算公式：一个大小为计算公式：一个大小为N N的数列，要求其的数列，要求其中位数，首先应把该数列按大小顺序排列好，中位数，首先应把该数列按大小顺序排列好，如果如果N N为奇数，那么该数列的中位数就是为奇数，那么该数列的中位数就是位置

10、上的数；如果位置上的数；如果N N为偶数，中位数则是该数为偶数，中位数则是该数列中第列中第与第与第位置上两个数值的平均数。位置上两个数值的平均数。中位数（中位数（MedianMedian）众数（众数（ModeMode）统计学上的定义和计算公式统计学上的定义和计算公式定义：众数是指一组数据中，出现次数最定义：众数是指一组数据中，出现次数最多的那个变量值。众数在描述数据集中趋势方多的那个变量值。众数在描述数据集中趋势方面有一定的意义。例如，制鞋厂可以根据消费面有一定的意义。例如，制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。者所需鞋的尺码的众数来安排生产。计算公式：手工计算众数比较麻

11、烦，需要计算公式：手工计算众数比较麻烦，需要统计数据的次数分布。统计数据的次数分布。SPSSSPSS所提供的统计功能所提供的统计功能可以减少诸如此类烦琐的过程。可以减少诸如此类烦琐的过程。众数、中位数、算术平均数v众数、中位数与算术平均数之间存在一定的关系，这种关系决定于总体分布的状况。当总体颁布呈对称的钟形分布时，算术平均数位于分布曲线的对称点上，而该点又是曲线的最高点和中心点，因此，众数、中位数与算术平均数三者相等。当总体分布呈非对称的钟形分布时，由于这三种平均数受极端数值影响程度的不同，因而它们的数值就存在一定的差别，但三者之间仍有一定的关系。众数、中位数、算术平均数v当分布右偏时，算术

12、平均数受偏高数值影响较大，其位置必然在众数之右，中位数在众数与算术平均数之间。反之，当次数分布左偏时，算术平均数受偏小数值的影响较大，其位置在众数之左，中位数仍在众数与算术平均数之间。v以上的均值、中位数和众数都是反映数据集中趋势的统计量。三个中心度量的比较众数众数中位数中位数平均数平均数主要适用于定类变主要适用于定类变量量主要适用于定序变主要适用于定序变量量适用于定距或定比适用于定距或定比变量变量最不稳定最不稳定较平均数的稳定性较平均数的稳定性差差最稳定最稳定可容易计算，但不可容易计算，但不是永远存在，最不是永远存在，最不合适作为集中趋势合适作为集中趋势代表值代表值只需中间的数据只需中间的数

13、据计算时要用到全部计算时要用到全部数据，数据信息提数据，数据信息提取得最充分取得最充分有时候对个别值的有时候对个别值的变动也很敏感变动也很敏感对极端值不敏感对极端值不敏感受极端值的影响受极端值的影响分组变化时影响较分组变化时影响较大大分组变化时有些影分组变化时有些影响响分组变化时影响不分组变化时影响不大大统计学上的定义和计算公式统计学上的定义和计算公式全距（全距（RangeRange）定义：全距也称为极差，是数据的最大值定义：全距也称为极差，是数据的最大值与最小值之间的绝对差。在相同样本容量情况与最小值之间的绝对差。在相同样本容量情况下的两组数据，全距大的一组数据要比全距小下的两组数据，全距

14、大的一组数据要比全距小的一组数据更为分散。的一组数据更为分散。计算公式：最大值最小值计算公式：最大值最小值R RXmaxXmaxXminXmin。统计学上的定义和计算公式统计学上的定义和计算公式全距（全距（RangeRange）全距的缺点在于其方法过于粗略，因为它全距的缺点在于其方法过于粗略，因为它只考虑总体两端数值的差异，没有考虑中间数只考虑总体两端数值的差异，没有考虑中间数值差异的情况，因而它是测定离散程度的一种值差异的情况，因而它是测定离散程度的一种粗略的方法，不能全面反映总体数据的差异程粗略的方法，不能全面反映总体数据的差异程度。要充分利用每一个数据的信息，就需要利度。要充分利用

15、每一个数据的信息，就需要利用方差和标准差。用方差和标准差。统计学上的定义和计算公式统计学上的定义和计算公式方差（方差（方差（方差（VarianceVarianceVarianceVariance）和标准差（）和标准差（）和标准差（）和标准差（StandardStandardStandardStandard Deviation Deviation Deviation Deviation）定义：方差是所有变量值与平均数偏差平定义：方差是所有变量值与平均数偏差平方的平均值，它表示了一组数据分布的离散程方的平均值，它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根，它表示度的平均值。标准差

16、是方差的平方根，它表示了一组数据关于平均数的平均离散程度。方差了一组数据关于平均数的平均离散程度。方差和标准差越大，说明变量值之间的差异越大，和标准差越大，说明变量值之间的差异越大，距离平均数这个距离平均数这个“中心中心”的离散趋势越大。的离散趋势越大。方差方差(Variance)和标准差和标准差(Standard Deviation)v虽然标准差有计量单位，而方差无计量单位，但两者的作用一样，故在此仅介绍标准差。标准差用平方的方法消除了正负号，因而它是最常用、最重要的离散趋势统计量。标准差越大，表示变量值之间的差异越大，各数据距离均值越远，则平均数的代表性就越低。反之，标准差越小，表示变量值

17、之间的差异越小，各数据距离均值较近，则平均数的代表性就越高。v全距、方差和标准差都是反映数据离散趋势的统计量。四分位数（四分位数（QuartilesQuartiles）、十分位数）、十分位数（DecilesDeciles）和百分位数）和百分位数（PercentilesPercentiles）统计学上的定义统计学上的定义定义：四分位数是将一组个案由小到大定义：四分位数是将一组个案由小到大（或由大到小）排序后，用（或由大到小）排序后，用3 3个点将全部数据个点将全部数据分为四等份，与分为四等份，与3 3个点上相对应的变量称为四个点上相对应的变量称为四分位数，分别记为分位数，分别记为Q1Q1（第一

18、四分位数）、（第一四分位数）、Q2Q2（第二四分位数）、（第二四分位数）、Q3Q3（第三四分位数）。其（第三四分位数）。其中，中，Q3Q3到到Q1Q1之间的距离的一半又称为四分位差，之间的距离的一半又称为四分位差，记为记为Q Q。四分位差越小，说明中间的数据越集。四分位差越小，说明中间的数据越集中；四分位数越大，则意味着中间部分的数据中；四分位数越大，则意味着中间部分的数据越分散。越分散。十分位数是将一组数据由小到大（或由大十分位数是将一组数据由小到大（或由大到小）排序后，用到小）排序后，用9 9个点将全部数据分为十等个点将全部数据分为十等份，与份，与9 9个点位置上相对应的变量称为十分位个

19、点位置上相对应的变量称为十分位数，分别记为数，分别记为D D1 1，D D2 2，D D9 9，表示，表示10%10%的数据的数据落在落在D D1 1下，下，20%20%的数据落在的数据落在D D2 2下，下，90%90%落在落在D D9 9下。下。百分位数是将一组数据由小到大（或由大百分位数是将一组数据由小到大（或由大到小）排序后分割为到小）排序后分割为100100等份，与等份，与9999个分割点个分割点位置上相对应的变量称为百分位数，分别记为位置上相对应的变量称为百分位数，分别记为P P1 1，P P2 2，P P9999，表示，表示1%1%的数据落在的数据落在P P1 1下，下，2%2

20、%的数据落在的数据落在P P2 2下，下，99%99%落在落在P P9999下。下。频数（频数（FrequencyFrequency）统计学上的定义和计算公式统计学上的定义和计算公式定义：频数就是一个变量在各个变量值定义：频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成上取值的个案数。如要了解学生某次考试的成绩情况，需要计算出学生所有分数取值，以及绩情况，需要计算出学生所有分数取值，以及每个分数取值有多少个人，这就需要用到频数每个分数取值有多少个人，这就需要用到频数分析。分析。变量的频数分析正是实现上述分析的最好变量的频数分析正是实现上述分析的最好手段，它可以使人们非常

21、清楚地了解变量取值手段，它可以使人们非常清楚地了解变量取值的分布情况。的分布情况。峰度（峰度（KurtosisKurtosis）统计学上的定义和计算公式统计学上的定义和计算公式定义：峰度是描述某变量所有取值分布形定义：峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分态陡缓程度的统计量。这个统计量是与正态分布相比较的量，峰度为布相比较的量，峰度为0 0表示其数据分布与正表示其数据分布与正态分布的陡缓程度相同；峰度大于态分布的陡缓程度相同；峰度大于0 0表示比正表示比正态分布高峰要更加陡峭，为尖顶峰；峰度小于态分布高峰要更加陡峭，为尖顶峰；峰度小于0 0表示比正态分布的高峰

22、要平坦，为平顶峰。表示比正态分布的高峰要平坦，为平顶峰。具体的计算公式为具体的计算公式为偏度（偏度（SkewnessSkewness）统计学上的定义和计算公式统计学上的定义和计算公式定义：偏度也是描述数据分布形态的，它定义：偏度也是描述数据分布形态的，它是描述某变量取值分布对称性的统计量。具体是描述某变量取值分布对称性的统计量。具体的计算公式为的计算公式为这个统计量是与正态分布相比较的量，偏这个统计量是与正态分布相比较的量，偏度为度为0 0表示其数据分布形态与正态分布偏度表示其数据分布形态与正态分布偏度x x相相同；偏度大于同；偏度大于0 0表示正偏差数值较大，为正偏表示正偏差数值较大，为

23、正偏或右偏，即有一条长尾巴拖在右边；偏度小于或右偏，即有一条长尾巴拖在右边；偏度小于0 0表示负偏差数值大，为负偏或左偏，有一条表示负偏差数值大，为负偏或左偏，有一条长尾拖在左边。而偏度的绝对值数值越大表示长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。分布形态的偏斜程度越大。频数分布、峰度、偏度频数分布、峰度、偏度频数频数（Frequency) 就是一个变量的各个观测值出现的次就是一个变量的各个观测值出现的次数。比如某班语文考试的成绩，可以统计出各分数值的人数数。比如某班语文考试的成绩，可以统计出各分数值的人数。峰度（峰度（Kurtosis) : 是描述某变量所有取值的

24、分布形态陡缓是描述某变量所有取值的分布形态陡缓程度的统计量，而峰度对陡缓程度的度量是与正态分布进行比程度的统计量，而峰度对陡缓程度的度量是与正态分布进行比较的结果。如果峰度等于较的结果。如果峰度等于 0 ，其数据分布的陡缓程度与正态分，其数据分布的陡缓程度与正态分布相同布相同；峰度大于；峰度大于 0，其数据分布比正态分布更陡峭；峰度小，其数据分布比正态分布更陡峭；峰度小于于0，其数据分布比正态分布更平坦，其数据分布比正态分布更平坦。偏度（偏度（ Skewness ) 是描述数据分布对称性的统计量是描述数据分布对称性的统计量，而，而且也是与正态分布的对称性相比较而得到的。如果分布的偏度且也

25、是与正态分布的对称性相比较而得到的。如果分布的偏度等于等于0 ，则其数据分布的对称性与正态分布相同，则其数据分布的对称性与正态分布相同；如果偏度大；如果偏度大于于0，则其分布为正偏或右偏则其分布为正偏或右偏，即在峰的右边有大的偏差值即在峰的右边有大的偏差值，使使右边出现一个拖得较远的尾巴；如果偏度小于右边出现一个拖得较远的尾巴；如果偏度小于 0，则为负偏或，则为负偏或左偏，即在峰的左边有大的偏差值左偏，即在峰的左边有大的偏差值，使左边出现一个拖得较远使左边出现一个拖得较远的尾巴。的尾巴。FrequenciesFrequencies：结果解释：结果解释描述性分析描述性分析描述性分析描述性分析F

26、requenciesFrequencies：结果解释：结果解释描述性分析描述性分析描述性分析描述性分析FrequenciesFrequencies：结果解释：结果解释描述性分析描述性分析描述性分析描述性分析一般性描述一般性描述( (DescriptivesDescriptives) )描述性分析描述性分析描述性分析描述性分析调用此过程可对变量进行描述性统调用此过程可对变量进行描述性统计分析，计算并列出一系列相应的统计分析，计算并列出一系列相应的统计指标，且可将原始数据转换成标准计指标，且可将原始数据转换成标准Z Z分值并存入数据库，所谓分值并存入数据库，所谓Z Z分值是指某分值是指某原始数值

27、比其均值高或低多少个标准原始数值比其均值高或低多少个标准差单位，高的为正值，低的为负值，差单位，高的为正值，低的为负值，相等的为零。相等的为零。一般性描述一般性描述( (DescriptivesDescriptives) )描述性分析描述性分析描述性分析描述性分析一般性描述一般性描述( (DescriptivesDescriptives) )是否保存标准是否保存标准变换后的数据变换后的数据描述性分析描述性分析描述性分析描述性分析DescriptivesDescriptives：定义统计量：定义统计量DescriptivesDescriptives：结果解释：结果解释描述性分析描述性分析描述性分

28、析描述性分析DescriptivesDescriptives：结果解释：结果解释描述性分析描述性分析描述性分析描述性分析此外，系统以此外，系统以此外，系统以此外，系统以zheightzheightzheightzheight和和和和zweightzweightzweightzweight为变为变为变为变量名将原始数据转换成量名将原始数据转换成量名将原始数据转换成量名将原始数据转换成标准标准标准标准z z z z分值，存放在原数分值，存放在原数分值，存放在原数分值，存放在原数据库中。新变量具有均据库中。新变量具有均据库中。新变量具有均据库中。新变量具有均值为值为值为值为0 0 0 0、标准差为

29、、标准差为、标准差为、标准差为1 1 1 1的特的特的特的特征，亦即变量的标准化征，亦即变量的标准化征，亦即变量的标准化征，亦即变量的标准化过程。过程。过程。过程。探索性分析探索性分析(Explore)(Explore)描述性分析描述性分析描述性分析描述性分析调用此过程可对变量进行更为深入详尽的描述性统计分析，故称之为探调用此过程可对变量进行更为深入详尽的描述性统计分析，故称之为探调用此过程可对变量进行更为深入详尽的描述性统计分析，故称之为探调用此过程可对变量进行更为深入详尽的描述性统计分析，故称之为探索性统计。它在一般描述性统计指标的基础上，增加有关数据其它特征的文索性统计。它在一般描述性

30、统计指标的基础上，增加有关数据其它特征的文索性统计。它在一般描述性统计指标的基础上，增加有关数据其它特征的文索性统计。它在一般描述性统计指标的基础上，增加有关数据其它特征的文字与图形描述，显得更加细致与全面，有助于用户思考对数据进行进一步分字与图形描述，显得更加细致与全面，有助于用户思考对数据进行进一步分字与图形描述，显得更加细致与全面，有助于用户思考对数据进行进一步分字与图形描述，显得更加细致与全面，有助于用户思考对数据进行进一步分析的方案。析的方案。析的方案。析的方案。1探索分析的内容包括下面几个方面探索分析的内容包括下面几个方面检查数据是否有错误：过大或过小的检查数据是否有错误：过大或

31、过小的数据均有可能是奇异值、影响点或错误数据。数据均有可能是奇异值、影响点或错误数据。要找出这样的数据，并分析原因，然后决定是要找出这样的数据，并分析原因，然后决定是否从分析中删除这些数据。因为奇异值和影响否从分析中删除这些数据。因为奇异值和影响点往往对分析的影响较大，不能真实反映数据点往往对分析的影响较大，不能真实反映数据的总体特征。的总体特征。对数据规律的初步观察：通过初步观对数据规律的初步观察：通过初步观察获得数据的一些内部规律，例如，两个变量察获得数据的一些内部规律，例如，两个变量间是否线性相关。间是否线性相关。2探索分析的考察方法探索分析的考察方法探索分析一般通过数据文件在分组与

32、不分探索分析一般通过数据文件在分组与不分组的情况下，获得常用统计量和图形。一般以组的情况下，获得常用统计量和图形。一般以图形方式输出，直观帮助用户确定奇异值、影图形方式输出，直观帮助用户确定奇异值、影响点、进行假设检验，以及确定用户要使用的响点、进行假设检验，以及确定用户要使用的某种统计方式是否合适。某种统计方式是否合适。3正态分布检验正态分布检验常用的正态分布检验是常用的正态分布检验是Q-QQ-Q图。本例中进图。本例中进行了正态分布检验。行了正态分布检验。4方差齐次性检验方差齐次性检验对数据分析不仅需要进行正态分布检验，对数据分析不仅需要进行正态分布检验，有时候还需要比较各个分组的方差是

33、否相同，有时候还需要比较各个分组的方差是否相同，这就要进行方差齐次性检验。例如，在进行独这就要进行方差齐次性检验。例如，在进行独立右边的立右边的T T检验之前，就需要事先确定两个数检验之前，就需要事先确定两个数据的方差是否相同。据的方差是否相同。如果通过分析发现各个方差不同，还需要如果通过分析发现各个方差不同，还需要对数据进行方差分析，那么就需要对数据进行对数据进行方差分析，那么就需要对数据进行转换使得方差尽可能相同。在探索分析中可以转换使得方差尽可能相同。在探索分析中可以使用使用LeveneLevene检验。检验。 LeveneLevene检验对数据进行方差齐次性检验时，检验对数据进行方差

34、齐次性检验时，不强求数据必须服从正态分布，它先计算出各不强求数据必须服从正态分布，它先计算出各个观测值减去组内均值的差，然后再通过这些个观测值减去组内均值的差，然后再通过这些差值的绝对值进行单因素方差分析。如果得到差值的绝对值进行单因素方差分析。如果得到显著性水平小于显著性水平小于0.050.05，那么就可以拒绝方差相，那么就可以拒绝方差相同的假设。同的假设。探索性分析探索性分析(Explore)(Explore)描述性分析描述性分析描述性分析描述性分析两者均有两者均有统计量统计量图图分组变量列表分组变量列表待分析变量列表待分析变量列表ExploreExplore：定义统计量：定义统计量Des

35、criptivesDescriptivesDescriptivesDescriptives：输出均数、均数的输出均数、均数的输出均数、均数的输出均数、均数的95%95%95%95%可信区间、去掉可信区间、去掉可信区间、去掉可信区间、去掉5%5%5%5%极端值的均数、极端值的均数、极端值的均数、极端值的均数、中位数、方差、标准差、最小值、最大值、全距、四分位数间距、偏度中位数、方差、标准差、最小值、最大值、全距、四分位数间距、偏度中位数、方差、标准差、最小值、最大值、全距、四分位数间距、偏度中位数、方差、标准差、最小值、最大值、全距、四分位数间距、偏度系数、峰度系数。系数、峰度系数。系数、峰度系

36、数。系数、峰度系数。M-estimatorsM-estimatorsM-estimatorsM-estimators：作中心趋势的作中心趋势的作中心趋势的作中心趋势的粗略最大似然确定，输出四个粗略最大似然确定，输出四个粗略最大似然确定，输出四个粗略最大似然确定，输出四个不同权重的最大似然确定数。不同权重的最大似然确定数。不同权重的最大似然确定数。不同权重的最大似然确定数。OutliersOutliersOutliersOutliers：输出五个最大值与输出五个最大值与输出五个最大值与输出五个最大值与五个最小值。五个最小值。五个最小值。五个最小值。PercentilesPercentilesPe

37、rcentilesPercentiles：输出第输出第输出第输出第5%5%5%5%、10%10%10%10%、25%25%25%25%、50%50%50%50%、75%75%75%75%、90%90%90%90%、95%95%95%95%位数。位数。位数。位数。描述性分析描述性分析描述性分析描述性分析箱图绘制方式箱图绘制方式茎叶图茎叶图正态性检验正态性检验/ /正态分布图正态分布图描述性分析描述性分析描述性分析描述性分析ExploreExplore：定义统计图：定义统计图直方图直方图1. 用直方图直观地反映数据的总体分布用直方图直观地反映数据的总体分布调调用用数数据据文文件件并并得得到到直直方

38、方图图直方图直方图:是一种频数分布图是一种频数分布图, 它它反映处在某一观测值范围内的反映处在某一观测值范围内的个案数。图中每个直方条下部个案数。图中每个直方条下部的中点坐标是该观测值范围的的中点坐标是该观测值范围的中点、直方条的宽度代表该观中点、直方条的宽度代表该观测值范围、直方条的高度代表测值范围、直方条的高度代表该观测值范围内的个案数。该观测值范围内的个案数。2. 2. 用用LeveneLevene检验方差是否齐性检验方差是否齐性方差齐性检验是统计分析中的一种常见过程，它是从样本方方差齐性检验是统计分析中的一种常见过程，它是从样本方差以至样本各自所代表的总体方差是否相同而判断两个样本同

39、质差以至样本各自所代表的总体方差是否相同而判断两个样本同质性（性（homogeneity) 的方法。简单地说，方差齐性检验就是检验各的方法。简单地说，方差齐性检验就是检验各个方差是否存在显著性差异。一般采用个方差是否存在显著性差异。一般采用Levene方法：先将各组观方法：先将各组观测值均转换为离差绝对值，然后对各组离差绝对值进行方差分析，测值均转换为离差绝对值，然后对各组离差绝对值进行方差分析，如果方差分析的显著性水平大于如果方差分析的显著性水平大于 0.05，则认为方差齐性（即方差，则认为方差齐性（即方差具有相同性）；方差分析的显著性水平小于具有相同性）；方差分析的显著性水平小于0.05，

40、则认为方差不，则认为方差不齐性（即方差具有不同质性）。齐性（即方差具有不同质性）。Exclude case Exclude case Exclude case Exclude case listwiselistwiselistwiselistwise: : : :不分析有任一缺失值的记录不分析有任一缺失值的记录不分析有任一缺失值的记录不分析有任一缺失值的记录Exclude case Exclude case Exclude case Exclude case pairwisepairwisepairwisepairwise: : : :不分析计算某统计量时有缺失值的记录不分析计算某统计量时有缺

41、失值的记录不分析计算某统计量时有缺失值的记录不分析计算某统计量时有缺失值的记录Report values:Report values:Report values:Report values:报告缺失值报告缺失值报告缺失值报告缺失值缺失值的缺失值的处理方式处理方式ExploreExplore：缺失值的处理：缺失值的处理描述性分析描述性分析描述性分析描述性分析描述性分析描述性分析描述性分析描述性分析ExploreExplore：结果解释：结果解释原始数据的基本情况：男性有效数据原始数据的基本情况：男性有效数据原始数据的基本情况：男性有效数据原始数据的基本情况：男性有效数据459459459459，

42、缺失，缺失，缺失，缺失1 1 1 1，合，合，合，合计计计计460460460460；女性有效数据；女性有效数据；女性有效数据；女性有效数据538538538538，缺失，缺失，缺失，缺失2 2 2 2，合计，合计，合计，合计540540540540。ExploreExplore：结果解释：结果解释描述性分析描述性分析描述性分析描述性分析ExploreExplore：结果解释：结果解释描述性分析描述性分析描述性分析描述性分析左面为箱图，图左面为箱图，图左面为箱图，图左面为箱图，图中方箱为四分位数，中方箱为四分位数，中方箱为四分位数，中方箱为四分位数，中心粗线为中位数，中心粗线为中位数，中心粗线

43、为中位数，中心粗线为中位数，两端线为最大值与最两端线为最大值与最两端线为最大值与最两端线为最大值与最小值，之外的圆圈代小值，之外的圆圈代小值，之外的圆圈代小值，之外的圆圈代表可疑的离群值。表可疑的离群值。表可疑的离群值。表可疑的离群值。用箱图用箱图（或叫框图）反映数据的集中趋势和特异值（或叫框图）反映数据的集中趋势和特异值调调用用数数据据文文件件并并得得到到箱箱图图返回本章首页返回本章首页批注批注 : 箱图可以直观地反映箱图可以直观地反映一组观测值的集中趋势、离一组观测值的集中趋势、离散趋势、不正常观测值（奇散趋势、不正常观测值（奇异值和极值，均可被排除后异值和极值，均可被排除后重新分析）。

44、左图中箱图的重新分析）。左图中箱图的高度代表了高度代表了25 位数到位数到 75 位数的距离；箱图中的位数的距离；箱图中的粗线代表中位数；箱图上下粗线代表中位数；箱图上下中央的垂直线叫触须线，触中央的垂直线叫触须线，触须线的上下截止线分别对于须线的上下截止线分别对于观测值的最大值和最小值；观测值的最大值和最小值；用用 0标记的是奇异值标记的是奇异值(与框边与框边距离超出框高距离超出框高1.5倍倍)、用用*标记的为极大值或极小标记的为极大值或极小值值(与框边距离超出框高与框边距离超出框高3倍倍) 。4. 4. 用用Q-QQ-Q概率图检验数据是否正态分布概率图检验数据是否正态分布可以用正态概率可

45、以用正态概率Q-Q图和离散正态概率图和离散正态概率Q-Q 图检验观测值图检验观测值的分布是否是或接近于正态分布。正态概率图是由观测值与按的分布是否是或接近于正态分布。正态概率图是由观测值与按正态分布的预期值作出来的散点图正态分布的预期值作出来的散点图，如果实际值为正态分布，如果实际值为正态分布，则其与预期值具有线性对应关系，散点图回归一条斜线，该，则其与预期值具有线性对应关系，散点图回归一条斜线，该斜线是正态分布的标准线，散点图组成的回归线越接近于标准斜线是正态分布的标准线，散点图组成的回归线越接近于标准线，表示实际观测数据越接近正态分布；如果以观测值、其与线，表示实际观测数据越接近正态分

46、布；如果以观测值、其与正态分布期望值的离差值做散点图，则当散点近似随机地落在正态分布期望值的离差值做散点图，则当散点近似随机地落在过原点的中间横线周围时，数据分布接近于正态分布。过原点的中间横线周围时，数据分布接近于正态分布。正态概率图（正态概率图（Normal Q-Q Plot)Normal Q-Q Plot)的的SPSSSPSS过程过程离散正态概率图（离散正态概率图（DetrendedDetrended Normal Q-Q Plot) Normal Q-Q Plot)的的SPSSSPSS过程过程返回本章首页返回本章首页交叉列表交叉列表(Crosstabs)(Crosstabs)描述性分析

47、描述性分析描述性分析描述性分析调用此过程可进行计数资料和某些等级资料的交叉表分析，在分析中，调用此过程可进行计数资料和某些等级资料的交叉表分析，在分析中，调用此过程可进行计数资料和某些等级资料的交叉表分析，在分析中，调用此过程可进行计数资料和某些等级资料的交叉表分析，在分析中，可对二维至多维交叉表资料进行统计描述和可对二维至多维交叉表资料进行统计描述和可对二维至多维交叉表资料进行统计描述和可对二维至多维交叉表资料进行统计描述和x x x x2 2 2 2检验，并计算相应的百分数。检验，并计算相应的百分数。检验，并计算相应的百分数。检验，并计算相应的百分数。交叉列表交叉列表(Crosstabs

48、)(Crosstabs)描述性分析描述性分析描述性分析描述性分析行行列列CrosstabsCrosstabs：定义统计量：定义统计量描述性分析描述性分析描述性分析描述性分析X X2 2检验检验CrosstabsCrosstabs：定义交叉表内容：定义交叉表内容描述性分析描述性分析描述性分析描述性分析实际观察数实际观察数理论数理论数行百分数行百分数列百分数列百分数合计百分数合计百分数残差残差CrosstabsCrosstabs：结果解释：结果解释描述性分析描述性分析描述性分析描述性分析CrosstabsCrosstabs：结果解释：结果解释描述性分析描述性分析描述性分析描述性分析* * * *红底数字为实际观察值；黄底数字为列百分数。红底数字为实际观察值；黄底数字为列百分数。红底数字为实际观察值；黄底数字为列百分数。红底数字为实际观察值；黄底数字为列百分数。CrosstabsCrosstabs：结果解释：结果解释描述性分析描述性分析描述性分析描述性分析谢谢！谢谢！

展开阅读全文

01第1章SPSS的描述性分析内容介绍

最新文档