的描述性分析内容介绍

上传人:宝路 文档编号:49802518 上传时间:2018-08-03 格式:PPT 页数:77 大小:1.68MB
返回 下载 相关 举报
的描述性分析内容介绍_第1页
第1页 / 共77页
的描述性分析内容介绍_第2页
第2页 / 共77页
的描述性分析内容介绍_第3页
第3页 / 共77页
的描述性分析内容介绍_第4页
第4页 / 共77页
的描述性分析内容介绍_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《的描述性分析内容介绍》由会员分享,可在线阅读,更多相关《的描述性分析内容介绍(77页珍藏版)》请在金锄头文库上搜索。

1、 SPSSSPSS的描述性分析的描述性分析SPSSSPSS的描述性分析的描述性分析 Frequencies:频数分布表 Descriptives:一般性描述 Explore:探索性分析 Crosstabs:交叉列表描述性分析描述性分析频数分布表一般性描述探索性分析交叉列表 计算连续变 量的相对比频数分布表频数分布表(Frequencies)(Frequencies)描述性分析描述性分析调用此过程可进行频数分布表的分析调用此过程可进行频数分布表的分析. .频数分布表是描述性频数分布表是描述性 统计中最常用的方法之一统计中最常用的方法之一, ,此外还可对数据的分布趋势进行初步此外还可对数据的分布趋

2、势进行初步 分析分析. .书中例题 P29例1-20 用EDTA络合滴定法测定工业硫酸锌中的 锌含量(%),10次测定结果为:21.49, 21.36,22.65,22.65,21.71,22.44, 22.15,22.07,22.38,22.19,求该组数 据的算术平均值、几何平均值、调和平 均值、样本标准差s、总体标准差、样 本方差s2、总体方差2、算术平均误差 和极差R。频数分布表频数分布表(Frequencies)(Frequencies)描述性分析描述性分析是否显示频数表定义需要计算的统计量定义需要绘制的统计图待分析变量的 列表百分位数分布特征描述离散趋势集中趋势描述性分析描述性分析

3、 FrequenciesFrequencies:定义统计量:定义统计量百分位数分布特征描述离散趋势集中趋势描述性分析描述性分析 FrequenciesFrequencies:定义统计量:定义统计量FrequenciesFrequencies:定义统计量:定义统计量统计图类型直方图加上正态曲线以频数绘制条图或饼图FrequenciesFrequencies:定义统计图:定义统计图描述性分析描述性分析无图形条图饼图直方图以构成比绘制条图或饼图FrequenciesFrequencies:定义统计图:定义统计图频数表排列次序FrequenciesFrequencies:定义表格:定义表格描述性分析描

4、述性分析按数值升序按数值降序按频数升序按频数降序FrequenciesFrequencies:结果解释:结果解释描述性分析描述性分析均值(均值(MeanMean)和均值标准误差()和均值标准误差( S.E.meanS.E.mean)统计学上的定义和计算公式统计学上的定义和计算公式定义:均值(平均值、平均数定义:均值(平均值、平均数 )表示的是某变量所有取值的集)表示的是某变量所有取值的集 中趋势或平均水平。例如,学生中趋势或平均水平。例如,学生 某门学科的平均成绩、公司员工某门学科的平均成绩、公司员工 的平均收入、某班级学生的平均的平均收入、某班级学生的平均 身高等。计算公式如下。身高等。计算

5、公式如下。总体平均数:若一组数据总体平均数:若一组数据X X1 1,X X2 2,X XNN,代表一个大小为,代表一个大小为NN 的有限总体,则其总体平均数为的有限总体,则其总体平均数为 样本平均数:若一组数据x1,x2,xn ,代表一个大小为n的有限样本,则其样本平 均数为 样本数据来自总体。样本的统计描述量可 以反映总体数据的特征,但由于抽样等原因, 使得样本数据不一定能够完全准确地反映总体 ,它可能与总体的真实值之间存在一定的差异 。进行不同次抽样,会得到若干个不同的样本 均值,它们与总体均值存在着不同的差异。均值标准误差(Standard Error of Mean ,S.E. Mea

6、n)就是描述这些样本均值与总体 均值之间平均差异程度的统计量。 1. 平均数、标准误中位数(中位数(MedianMedian)统计学上的定义和计算公式统计学上的定义和计算公式定义:中位数是将总体数据的各个数值按 大小顺序排列,居于中间位置的变量,用 Median表示。中位数将所有的数据分成两半, 中位数两端的数据个数相同,因此它也被称为 二分位数。中位数的确定,仅仅取决于它在数 列中的位置,不受极端值的影响,因此可以用 它表示总体的一般水平。同时中位数比算术平 均数具有更好的稳定性。计算公式:一个大小为N的数列,要求其中位数,首先应把该数列按大小顺序排列好,如果N为奇数,那么该数列的中位数就是

7、 位置上的数;如果N为偶数,中位数则是该数列中第 与第 位置上两个数值的平均数。 中位数(中位数(MedianMedian)众数(众数(ModeMode)统计学上的定义和计算公式定义:众数是指一组数据中,出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。计算公式:手工计算众数比较麻烦,需要统计数据的次数分布。SPSS所提供的统计功能可以减少诸如此类烦琐的过程。众数、中位数、算术平均数v众数、中位数与算术平均数之间存在一定的关 系,这种关系决定于总体分布的状况。当总体 颁布呈对称的钟形分布时,算术平均数位于分 布曲线的对称点

8、上,而该点又是曲线的最高点 和中心点,因此,众数、中位数与算术平均数 三者相等。当总体分布呈非对称的钟形分布时 ,由于这三种平均数受极端数值影响程度的不 同,因而它们的数值就存在一定的差别,但三 者之间仍有一定的关系。众数、中位数、算术平均数v当分布右偏时,算术平均数受偏高数值影响较 大,其位置必然在众数之右,中位数在众数与 算术平均数之间。反之,当次数分布左偏时, 算术平均数受偏小数值的影响较大,其位置在 众数之左,中位数仍在众数与算术平均数之间 。v以上的均值、中位数和众数都是反映数据集中 趋势的统计量。三个中心度量的比较众数中位数平均数主要适用于定类变类变 量主要适用于定序变变 量适用于

9、定距或定比 变变量最不稳稳定较较平均数的稳稳定性 差最稳稳定可容易计计算,但不 是永远远存在,最不 合适作为为集中趋势趋势 代表值值只需中间间的数据计计算时时要用到全部 数据,数据信息提 取得最充分有时时候对对个别值别值 的 变动变动 也很敏感对对极端值值不敏感受极端值值的影响分组变组变 化时时影响较较 大分组变组变 化时时有些影 响分组变组变 化时时影响不 大统计学上的定义和计算公式全距(全距(RangeRange)定义:全距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。计算公式:最大值最小值RXmaxXmin

10、。 统计学上的定义和计算公式全距(全距(RangeRange)全距的缺点在于其方法过于粗略,因为它只考虑总体两端数值的差异,没有考虑中间数值差异的情况,因而它是测定离散程度的一种粗略的方法,不能全面反映总体数据的差异程度。要充分利用每一个数据的信息,就需要利用方差和标准差。统计学上的定义和计算公式方差(方差(VarianceVariance)和标准差()和标准差(StandardStandard Deviation Deviation)定义:方差是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。方差和标

11、准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。方差方差( (VarianceVariance) )和标准差和标准差( (StandardStandard DeviationDeviation) )v虽然标准差有计量单位,而方差无计量单位,但两者 的作用一样,故在此仅介绍标准差。标准差用平方的 方法消除了正负号,因而它是最常用、最重要的离散 趋势统计量。标准差越大,表示变量值之间的差异越 大,各数据距离均值越远,则平均数的代表性就越低 。反之,标准差越小,表示变量值之间的差异越小, 各数据距离均值较近,则平均数的代表性就越高。v全距、方差和标准差都是反映数据离散趋势的

12、统计量 。四分位数(四分位数(QuartilesQuartiles)、十分位数()、十分位数( DecilesDeciles)和百分位数()和百分位数(PercentilesPercentiles) 统计学上的定义定义:四分位数是将一组个案由小到大( 或由大到小)排序后,用3个点将全部数据分 为四等份,与3个点上相对应的变量称为四分 位数,分别记为Q1(第一四分位数)、Q2(第 二四分位数)、Q3(第三四分位数)。其中, Q3到Q1之间的距离的一半又称为四分位差,记 为Q。四分位差越小,说明中间的数据越集中 ;四分位数越大,则意味着中间部分的数据越 分散。十分位数是将一组数据由小到大(或由大

13、到小)排序后,用9个点将全部数据分为十等 份,与9个点位置上相对应的变量称为十分位 数,分别记为D1,D2,D9,表示10%的数据 落在D1下,20%的数据落在D2下,90%落在 D9下。百分位数是将一组数据由小到大(或由大 到小)排序后分割为100等份,与99个分割点 位置上相对应的变量称为百分位数,分别记为 P1,P2,P99,表示1%的数据落在P1下,2% 的数据落在P2下,99%落在P99下。频数(频数(FrequencyFrequency)统计学上的定义和计算公式定义:频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数

14、取值有多少个人,这就需要用到频数分析。变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。峰度(峰度(KurtosisKurtosis)统计学上的定义和计算公式定义:峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。具体的计算公式为偏度(偏度(SkewnessSkewness)统计学上的定义和计算公式定义:偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。具体的计算

15、公式为这个统计量是与正态分布相比较的量,偏度为0表示其数据分布形态与正态分布偏度x相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。频数分布、峰度、偏度频数 (Frequency) 就是一个变量的各个观测值出现的次数。比如某班语文考试的成绩,可以统计出各分数值的人数。峰度(Kurtosis) : 是描述某变量所有取值的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比 较的结果。如果峰度等于 0 ,其数据分布的陡缓程度与正态分布相同 ;峰度大于

16、 0,其数据分布比正态分布更陡峭;峰度小于0,其数据分布比正态分布更平坦。偏度( Skewness ) 是描述数据分布对称性的统计量 ,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度 等于0 ,则其数据分布的对称性与正态分布相同 ;如果偏度大于0,则其分布为正偏或右偏,即在峰的右边有大的偏差值,使右边出现一个拖得较远的尾巴;如果偏度小于 0,则为负偏或左偏,即在峰的左边有大的偏差值,使左边出现一个拖得较远的尾巴。FrequenciesFrequencies:结果解释:结果解释描述性分析描述性分析FrequenciesFrequencies:结果解释:结果解释描述性分析描述性分析FrequenciesFrequencies:结果解释:结果解释描述性分析描述性分析一般性描述一般性描述( (DescriptivesDescriptives) )描述性分析描述性分析调用此过程可对变量进行描述性统调用此过程可对变量进行描述性统 计分析,计算并列出一系列相应的统计分析,计算并列出一系列相应的统 计

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号