统计第五章变异指标

上传人:宝路 文档编号:6909771 上传时间:2017-08-09 格式:PPT 页数:55 大小:451.51KB
返回 下载 相关 举报
统计第五章变异指标_第1页
第1页 / 共55页
统计第五章变异指标_第2页
第2页 / 共55页
统计第五章变异指标_第3页
第3页 / 共55页
统计第五章变异指标_第4页
第4页 / 共55页
统计第五章变异指标_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《统计第五章变异指标》由会员分享,可在线阅读,更多相关《统计第五章变异指标(55页珍藏版)》请在金锄头文库上搜索。

1、第五章 离中趋势测量法,主要内容:(1)变异指标; (2)全距; (3)平均差、标准差和标准分; (4)绝对离势和相对离势;(5)偏度。,离中趋势,所谓离中趋势,是指数列中各变量值之间的差距和离散程度。例如有A、B、C、D四组学生各5人的成绩如下: A组:60 ,60,60,60,60 B组:58,59,60,61,62 C组:40,50,60,70,80 D组:80,80,80,80,80 数据显示,平均数相同,离势可能不同;平均数不同,离势可能相同。,变异指标,离中趋势用变异度指标来衡量.变异度指标又称标志变动度指标,是综合反映总体各单位标志值及其分布的差异程度的指标。变异指标与平均指标相

2、对应,从另一个侧面反映了总体的特征。,变异指标的作用,其主要作用是:(1)说明平均数的代表性。在相同平均数的情况下。离势小,平均数的代表性高;离势大,平均数代表性低。(2)反映经济活动过程的均衡性、节奏性或稳定性。,变异指标如按数量关系来分有以下两类;凡用绝对数来表达的变异指标,统称绝对离势;凡用相对数来表达的变异指标,统称相对离势;,主要有极差、平均差、四分位差、标准差等。,主要有异众比率、标准差系数、平均差系数和一些常用的偏态系数。,第一节 全距,1.全距(Range) 对于未分组资料或者单项式分组资料 R =Xmax Xmin 例 求74,84,69,91,87,74,69这些数字的全距

3、。 解 把数字按顺序重新排列:69,69,74,74,84,87,91,显然有 R =Xmax Xmin 916922,全距(R):最大值和最小值之差。也叫极差。全距越大,表示变动越大。,运用上述方法计算左边数列的全距,对分组资料,不能确知最大值和最小值,求全距: (1)用组值最大组的组中值减去最小组的组中值 (2)用组值最大组的上限减去最小组的下限 (3)用组值最大组的组中值减去最小组的下限;或最大组的上限减去最小组的组中值(常用的办法),优点:缺点:,计算简单、直观。,(1)受极端值影响大; (2) 没有量度中间各个单位间的差异性,数据利用率低,信息丧失严重; (3)受抽样变动影响大,大样

4、本全距比小样本全距大。因为大样本更可能包含最极端的值.,第二节 平均差(Mean absolute deviation),要测定变量值的离中趋势,尤其是要测定各变量值相对于平均数的差异情况,一个很自然的想法就是计算各变量值与算术平均数的离差。平均差是各变量值与算术平均数(中位数)的离差绝对值的算术平均数.由于各变量值与其算术平均数离差的代数和的值为0,所以采取算绝对值的办法;能够全面反应一组数据的离散程度;数学性质较差,实际运用的比较少;,计算方法,1.对于未分组资料 A D= 2.对于分组资料 A D=,例1,1、 试分别以算术平均数为基准,求85,69,69,74,87,91,74这些数字

5、的平均差。,例2:根据下表求平均差,练习:试以算术平均数为基准,求下表所示数据的平均差。,计算左边数列的平均差,平均差的性质,(1)虽然是变异指标,但是从算法上仍属于算术平均数; (2)受抽样变动影响小、受极端值影响大、对于不确定组距要经过特殊处理; (3)平均差不能用于其它的代数运算,理论意义不能给予很好的说明,标准差、方差的应用更好; (4)使用的范围比较小;,第三节 标准差(standard deviation),各变量值对其算术平均数的离差平方的算术平均数的平方根,又称均方差,用S表示。 即克服平均差带有绝对值的缺点,又保留其综合平均的优点。最常用的测度值,反应了各变量值和均值的平均差

6、异,计算方法,对于未分组资料,求72、81、86、69、57这些数字的标准差。,2. 对于分组资料,计算左边数列的标准差,例 调查大一男生60人的身高情况如下表所示,求他们身高的标准差。,解 因为是分组资料,计算标准差运用加权式,并参见下表,练习,假设一个班的成绩分布如下,求标准差,标准差是反映总体各单位标志值的离散状况和差异程度的最佳测度。 (1)以算术平均数为基准计算的标准差比以其他任何数值为基准计算的标准差要小。(为什么?)“最小二乘方”性质各变量值对算术平均数的离差的平方和,必定小于他们对任何其他数偏差的平方和。 (2)它将总体中各单位标志值的差异全包括在内,受抽样变动影响小。但在受极

7、端值影响以及处理不确定组距方面,缺点同算术平均数。(3)标准差同平均差一样,虽然都是变异指标,但是就其计算的数学方法来看,仍然是属于算术平均数;(4)受抽样变动的影响小,受极端值影响,处理开放组距时要经过特殊处理,3. 标准差的性质,方差,值得注意的是,在推论统计中我们将发现,方差是比标准差更有理论价值的概念。所谓方差,即标准差的平方,它直接写成 。 也常被称为变异数。,标准分(standard score),以离差和标准差的比值来测定变量 与 的相对位置。使原来不能直接比较的离差标准化,可以相互比较,加、减、平均。,(1)Z是和X一一对应的变量值; (2)Z分数没有单位,是一个不受原资料单位

8、影响的相对数,所以可以用于不同单位资料的比较; (3)Z分数实际表达了变量值距总体均值有几个标准差。,Z分数也有标准正态变量之称。按Z值大小编制出的正态分布表,其用途十分广泛。 Z分数的性质:,Z分数之和等于0,Z分数的算术平均数等于0,Z分数的标准差等于1,方差也等于1,三 定则及其应用,社会经济统计是研究大量社会经济现象数量方面的。在大量观察下,许多现象总体内的次数分布呈正态分布,即以平均数为中心,中间大,两头小的分布状态。数理统计证明,在正态分布情况下: 可包括总体单位数的 68.27% 可包括总体单位数的 95.45% 可包括总体单位数的 99.73% 这就是“三 定则”。当计算出平均

9、数和标准差之后,便可利用三 定则来推断次数分配的状况。,例子:某车间 100 个工人日产量资料,已经计算出平均日产量 =42.5 件,标准差 =8.87 件,试推断日产量分布情况 .有 68.27% 工人日产量在 33.63 到 51.37 之间;有 95.45% 工人的日产量在 24.76 到 60.24 之间;有 99.73% 工人的日产量在 15.89 到 69.11 之间。,第四节 相对离势,上述各种反映离中趋势的变异指标,都具有和原资料相同的计算单位,称绝对离势。但欲比较具有不同单位的资料的参差程度,或比较单位虽相同而均值不相同的资料的参差程度,离势的绝对指标则很可能导致某些错误结论

10、。所以,我们还得了解和学习相对离势。,相对离势,凡是用相对数来表达的变异指标,统称为相对离势,主要有异众比率、标准差系数、平均差系数等;比较具有不同单位的资料的参差程度;比较单位虽然相同而均值不相同的资料的参差程度;要想实现计量单位不同或者平均水平不一的对象之间的直接比较: 绝对离势/平均指标相对离势;,1. 变异系数,绝对离势统计量与其算术平均数的比率,用V表示。变异系数是最具有代表性的相对离势。全距系数 平均差系数标准差系数,全距系数 全距系数是众数据的全距与其算术平均数之比,其计算公式是平均差系数 平均差系数是众数据的平均差与其算术平均数之比,其计算公式是标准差系数 标准差系数是众数据的

11、标准差与其算术平均数之比,其计算公式是,2、异众比率(概念要点),1.离散程度的测度值之一2.非众数组的频数占总频数的比率3.计算公式为,4. 用于衡量众数的代表性5.不仅用于定距变量,还可以用于定类与定序变量.,异众比率(例题),根据下表中的数据,计算异众比率,例1,某项调查发现,现今三口之家的家庭最多(32%),求异众比率。某开发商根据这一报导,将房屋的户型大部分都设计为适合三口之家居住的样式和面积,你认为如何呢?,例2,设为测体重,得到成人组和婴儿组各100人的两个抽样总体。成人组平均体重为65千克,全距为10千克;婴儿组平均体重为4千克,全距为2.5千克。能否认为成人组体重的离势比婴儿

12、组体重的离势大?,例3,对一个群体测量身高和体重,平均身高为170.2厘米,身高标准差为5.30厘米;平均体重为70千克,体重标准差为4.77千克。比较身高和体重的离散程度。,第五节 偏态系数,变异指标离中趋势平均指标集中趋势偏度偏斜情况(1) 偏度的概念反映总体次数分布偏斜程度的指标(2)偏度的种类: 右偏分布(正偏) 左偏分布(负偏)(3)偏度的测算:算术平均数与众数比较法、动差法A. 偏度算术平均数众数 若偏度0,则右偏;若偏度0,则左偏,偏态系数,我们在前面讨论统计图时已经对频数分布的正态和偏态有所认识。我们又看到了算术平均数与中位数、众数之间存在的关系:当总体呈对称分布时,、三者完全

13、相等;当总体呈不对称的偏态分布时,它们之间存在着数量(位置)的差异。因此,偏态可由与的差来表示,即,偏态系数,为了使不同数列的偏态值可比,同样可计算偏态的相对数,即偏态系数,用来表示 (1)0,对称分布(正态分布); (2)3,极端右偏; (3)3,极端左偏;,例 甲车间300工人,日产量资料如表所示:,求偏态系数。,表明甲车间日产量的分布右偏,偏斜程度为0.07。其偏态系数较小,说明工人日产量的众数接近平均数水平。,练习:某企业职工的数据如右图,求数据的分布形态,以及其偏度?,数据的特征和测度,习题,一、填空1对收集来的数据,数值最大者和最小者之差叫作( ),又称之为( )。2各变量值对其算

14、术平均数(或中位数)离差绝对值的算术平均数,称之为( )。3全距由于没有度量( )之间的变异性,所以数据资料的利用率很低。4用绝对离势除以均值得到的相对指标,即为( )。5所谓( ),是指非众数的频数与总体单位数的比值6偏斜系数是以标准差为单位的算术平均数与众数的离差,其取值一般在( )之间。偏斜系数为0表示( ),偏斜系数为+3或-3则表示极右或极左偏态。7、某学生两次统计课作业的分数为:3分、5分,那么其两次作业的平均分数为( )分,离差之和为( )分,方差为( )分,标准差为()分,二、不定项选择,1、全距的优点是:A、资料的利用率很高;B、受抽样变动的影响微小;C、计算简单便于直观;D、受极端数值的影响不大;2、关于平均差的性质,下面不正确的描述是:A、受极端值影响大;B、受抽样变动影响微小;C、适合于代数运算;D、有不确定组距时,不经过特殊处理不能够运算;,3、标准差系数抽象了( ) A、总体指标数值大小的影响; B、总体单位数多少的影响; C、标志变异程度的影响; D、平均水平高低对离中趋势的影响;4、不同总体间的标准不能进行简单对比,是因为() A、平均数不一致; B、计量单位不一致; C、标准差不一致; D、总体单位数不一致;5、在下列指标中,易受极端值影响的有(),受抽样变动大的有() A、平均差; B、标准差;C、算术平均数; D、众数;E、全距;,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号