spss描述性统计－金锄头文库

资源描述

《spss描述性统计》由会员分享，可在线阅读，更多相关《spss描述性统计（31页珍藏版）》请在金锄头文库上搜索。

1、第八章描述统计,1/31,第八章描述统计的原理与应用,Data Graphing,第八章描述统计,2/31,课程目标,介绍描述统计的原理了解集中量数的特性与各量数了解变异量数的特性与各量数了解相对量数的特性与各量数了解标准分数的特性与各量数熟习描述统计的SPSS运作,第八章描述统计,3/31,描述统计,描述统计的定义一套用以整理、描述、解释资料的系统方法与统计技术数据从初始状态（raw data）成为可被理解的统计量数（statistic）的一套操作程序透过统计量数来描述大量资料，并作为彼此沟通的共同符号语言,第一节,第八章描述统计,4/31,集中量数,集中量数（me

2、asures of central location）用以描述一组数据或一个分配集中点的统计量数一个能够描述数据的共同落点的指标。常用的集中量数有平均数、中位数及众数,第一节,第八章描述统计,5/31,平均数,平均数（mean；以M表示）取某一变项的所有数值的总和除以观察值个数所得到的值因为是将数据直接以数学算式来计算平均值，又称为算术平均数（arithmetic mean）。母体资料得出的平均数需以希腊字表示,第一节,第八章描述统计,6/31,中位数,中位数（median；或以Mdn表示）又称为中数、百分等级为50的百分位数（P50）或第二四分位数（Q2; second q

3、uartile）。将某一个变项的数据依大至小或由小至大排列，取位居最中间、或能够均匀对分全体观察值的分数在中位数之上与之下，各有50%的观察值。,50、55、60、60、60、65、66、70、90,50、55、60、60、60、65、66、70、90 、95,62.5,第一节,第八章描述统计,7/31,众数,众数（mode；或以Mo表示）一组分数中，出现次数最多的一个分数一组数据中最典型（typical）的数值或次数分配最高点所对应的分数是各集中量数当中，最容易辨认的量数一个分配有两个分数具有相同的最高次数，此时即出现了双众数，称为双峰分配（bimodal distributi

4、on）,50、55、60、60、60、65、66、70、90,第一节,第八章描述统计,8/31,集中量数的特性与优缺点比较,第一节,第八章描述统计,9/31,三种集中量数与分配形状的关系,第一节,第八章描述统计,10/31,变异量数,变异量数（measures of variation）或离散量数用来描述观察值在某一个变项上的分数分散情形的统计量描述统计中，集中量数必须搭配变异量数，才能反应一组数据的分布特征常用的变异量数包括全距、四分差、变异数及标准差,第二节,第八章描述统计,11/31,全距,全距（range）一组分数中最大值（Xmax）与最小值（Xmin）之差是一群分数

5、变异情形最粗略的指标全距容易计算，适用性高，可以应用在名义变项与顺序变项，来求出变项当中类别的多寡。缺点是不精确也不稳定，无法反应一个分配的每个数值的状态。,第二节,第八章描述统计,12/31,四分差,四分差（semi-interquartile range; QR）是一组数据当中的第三四分位数（区隔高分端的前25%的分数，简称Q3）与第一四分位数（区隔低分端的后25%的分数，简称Q1）距离的一半中间百分之五十的样本分数差距的二分之一,第二节,第八章描述统计,13/31,离均差与平方和,离均差一组数据中，各分数与平均数的距离，通常以小写的x来表示当离均差为正值时，表示分数落在平

6、均数的右方离均差为负值时，表示分数落在平均数的左方平均数是每一个分数加总后的平均值，为一组分数的重心位置离均差平方和（sum of squares; SS） SS的概念可以类比为面积的概念，表示分数与平均数变异的面积和,deviation score= x =(X - ),第二节,第八章描述统计,14/31,变异数与标准差,变异数平均化的离均差平方和标准差变异数的开方，以表示。标准差或变异数越大者，表示该分配的变异情形较大。,第二节,第八章描述统计,15/31,变异数的不偏估计数,标准差与变异数的不偏估计数的主要差别在于分母项为N-1而非原来的N N-1称为自由度（degree

7、 of freedom；df），表示一组分数当中，可以自由变动的分数的个数。在离均差的计算上，自由度为样本数减1，表示在N个观察值中，只有N-1个数字可以自由运用于离均差的计算。,第二节,第八章描述统计,16/31,变异量数的特性与优缺点比较,第二节,第八章描述统计,17/31,偏态（Skewness）,描述一个变项的对称性（symmetry）的量数称为偏态系数不对称的资料称为偏态资料，依其方向可分为负偏（negatively skewed）（或左偏，即左侧具有偏离值）、正偏（positively skewed）（或右偏，即右侧具有偏离值）与对称（symmetrical）三种情形,第三

8、节,第八章描述统计,18/31,地板与天花板效应,地板效应（floor effect）指数据多数集中在偏低的一端，但在高分端则有极端值，分数不容易突破低分端，但会往高分端延伸，彷彿有一个地板（或真的存在一个低分限制条件）阻挡了数据往低分移动。由于地板阻隔作用，地板效应常伴随正偏态现象。天花板效应（ceiling effect）则与负偏态有关，是指数据多数集中在偏高的一端，但在低分端则有极端值，分数不容易突破高分端，彷彿有一个天花板（或真的存在一个高分限制条件）阻挡了数据往高分移动。,第三节,第八章描述统计,19/31,峰度（Kurtosis）,是指一个次数分配集中部份的陡峭程度。

9、两个分配都是对称的单峰钟型曲线时，并不一定具有一样的平坦或陡峭形态（峰度）。一个对称的钟型分配，变项的数值会集中于众数所在位置，如果集中于众数附近的分数多，分散于两侧的分数少，将形成高狭峰（leptokurtic）的分配当集中于众数附近的分数较少，两侧分数多，则形成低阔峰（platykurtic）。在常态分配时的理想峰度称为常态峰（mesokurtic）。,第三节,第八章描述统计,20/31,偏态与峰度系数的特性,偏态与峰度系数是一种标准分数的概念，因此不受分配变异程度的影响而可相互比较偏态与峰度系数具有标准分数的特性，因此均以0为常态值，也就是说，当偏态与峰度系数为0或接近0之时，

10、次数分配可以说是一个对称、不偏的常态峰分配偏态与峰度系数在正负0.5到1之间是为偏态或特殊峰度，超过正负1的偏态与特殊峰度情况即属严重。严重的偏态与峰度会影响统计分析的运用。,第三节,第八章描述统计,21/31,偏态与峰度系数的统计考验,检定原理求出偏态与峰度系数系数可利用Z考验来判定统计显著性 Z值绝对值大于1.96时（设定为.05），即可推论S系数或K系数显著不等于0，也就是变项呈现非常态，常态化假设遭到违反。,第三节,第八章描述统计,22/31,相对量数,数据的解读：绝对意义：由数值大小反应相对意义：需从相对比较，甚至于进行变项数据的标准化，才能对于数据的意义进行正确解读。

11、相对量数或相对地位量数（measures of relative position）描述个别观察值在团体中所在相对位置的统计量将某特定观察值在样本中所处的位置，以其他分数进行参照，计算出观察值在该变项上分数的团体地位（位置）常用的相对量数包括百分等级,百分位数,标准分数,第四节,第八章描述统计,23/31,百分等级与百分位数,百分等级（percentile rank; PR）系指观察值在变项上的分数在团体中所在的等级在一百个人中，该分数可以排在第几个等级。例如PR50代表某一个分数在团体中可以胜过50的人，他的分数也恰好是中位数。百分位数（percentile point; P

12、p）系指在样本中位居某一个等级的观察值之分数若想在一百个人的样本中赢过多少百分之多少的人，则他的分数必须得到多少分例如中位数为60分时，表示有50的人比60分还低，此时我们可以说第50百分位数为60分，以P50=60表示之。两者的数学关系百分等级是将原始分数转化为等级（百分比）百分位数则是由某一等级来推算原始分数,第四节,第八章描述统计,24/31,百分等级与百分位数的计算,样本数少时将资料依序排列，算出累积百分比，即可对应出每一分数的百分等级亦可从百分等级推算出各特定百分位数样本数大时百分等级的计算必须以分组资料的方式来整理资料百分等级的换算，必须以公式来计算之,第四

13、节,第八章描述统计,25/31,标准分数,标准分数（standard scores）利用线性转换的原理，将一组数据转换成不具有实质的单位与集中性的标准化分数。不同的标准分数，其共通点是利用一个线性方程式y=bx+a进行集中点的平移与重新单位化，使得不同量尺与不同变项的测量数据具有相同的单位与相同的集中点，因此得以相互比较。常用的标准分数 Z分数 T分数(T=10Z+50) SAT考试（Scholastic Assessment Test）（SAT=100Z+500）比西测验IQ分数（平均数为100，标准差为16的标准分数）（IQ=16Z+100), 魏氏智力测验为15Z+100,第五

14、节,第八章描述统计,26/31,Z分数,定义指原始分数减去其平均数，再除以标准差后所得到的新分数表示该原始分数是落在平均数以上或以下几个标准差的位置上 Z分数的特性任何一组数据经过Z公式转换后，均具有平均数为0，标准差为1的特性 Z分数可以作分配内与跨分配的比较。 Z分数仅是将原始分数进行线性转换，并未改变各分数的相对关系与距离，因此Z分数转换并不会改变分配的形状。,以母体资料为基础时,以样本资料为基础时,第五节,第八章描述统计,27/31,常态分配,常态分配（normal distribution）指一个随机变项的观察值，呈现对称的钟形曲线分配由德国数学家Gauss（Karl

15、F. Gauss；1777-1855）所提出，因此又称为高斯分配（Gaussian distribution）。,第五节,第八章描述统计,28/31,常态分配的特性,常态曲线并没有两端点极限值当x=时，函数值f(x)达到最高点当x趋近无限大时，函数值f(x)则趋近为0 机率分配常态曲线内的机率变化呈现数学规则分配内绝大多数的机率（99.7%）落于正负3个标准差之内一般来说，常态化的分配全距约为6个标准差反曲点（inflection points）距离平均数负一个标准差位置上，切线斜率由渐增转为渐减在距离平均数正一个标准差位置上，切线斜率由渐减转为渐增,第五节,第八章描述统计

16、,29/31,标准化常态分配与其应用,标准化常态分配（standard normal distribution）某一变项的观察值呈现常态分配，经转换后的Z分数所形成的分配称之常态分配的变量X已经不是原始分数，而是Z分数 Z分数是距离平均数几个标准差的量数，不同的Z值，即代表距离平均值多少个标准差，透过机率对照表，可以很快的查出Z值与机率间的关系在常态分配中 68.26%的观察值落在Z值1个标准差）的区间内 95.44%的观察值会落在Z值2个标准差的区间内 99.74的观察值会落在Z=3个标准差的区间内,第五节,第八章描述统计,30/31,T分数,定义将Z分数以下列线性转换公式转换成平均数50，标准差10的T分数T分数可改善z分数的缺点 Z值多介于3之间，计算时多半带有一至二位的小数点，加上低于平均数的Z分数带有负号，实际使用上较为不便,T50 + 10Z,第五节,第八章描述统计,31/31,Time for rest,Chapter 8 is done here See you later!,

展开阅读全文