推荐-第五章---集中趋势和离中趋势的度量

上传人:人*** 文档编号:470314102 上传时间:2024-01-08 格式:DOC 页数:40 大小:1.27MB
返回 下载 相关 举报
推荐-第五章---集中趋势和离中趋势的度量_第1页
第1页 / 共40页
推荐-第五章---集中趋势和离中趋势的度量_第2页
第2页 / 共40页
推荐-第五章---集中趋势和离中趋势的度量_第3页
第3页 / 共40页
推荐-第五章---集中趋势和离中趋势的度量_第4页
第4页 / 共40页
推荐-第五章---集中趋势和离中趋势的度量_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《推荐-第五章---集中趋势和离中趋势的度量》由会员分享,可在线阅读,更多相关《推荐-第五章---集中趋势和离中趋势的度量(40页珍藏版)》请在金锄头文库上搜索。

1、第五章 数据分布特征的描述第一节 集中趋势指标概述一、集中趋势指标及其特点集中趋势(Central tendency),是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是要寻找数据一般水平的代表值或是心值。在现象的同质总体中,各个单位的标志值是不尽相同的。如果我们的目的是要对总体的数量水平有一个概括地、一般地认识,显然不能用某一单位的标志值表示。统计平均数就是用来反映总体的一般水平和集中趋势的指标。通俗的理解就是,在不变更总体总量的情况下,对总体内的全部标志值进行“截长补短”,使得总体各单位拥有同一水平的数量表现,这个同一水平的数量表现就是平均数,即集中趋势指标。统计平均数有两个重要的特点

2、:第一,平均数是一个代表值,表示被研究总体的一般水平。例如,某企业职工的工资水平有高有低,有的职工月工资1680元,有的职工月工资1900元,有的职工月工资1870元,有的职工月工资2200元,等等。若根据该企业各个职工月工资额综合计算出职工月平均工资为1860元,那么,1860元就是一个代表值。它反映了该企业职工月工资的般水平。第二,平均数把被研究总体各单位的标志值的数量差异抽象化了。例如,某企业职工的月平均工资为1860元,但是各个职工的工资水平有高有低,高于1860元的工资和低于1860元的工资互相抵消了,从而得出平均工资1860元。由此可见,平均工资(1860元)已把各职工月工资水平的

3、差别抽象化了。二、集中趋势指标的作用集中趋势指标统计平均数,在统计研究中被广泛应用,平均数的作用可以归纳为以下几点:1.利用平均数对比不同总体的一般水平。平均数可以用来对同类现象在各单位、各部门、各地区之间进行比较,以说明生产水平的高低或经济效果的好坏。例如,要比较不同的生产企业生产水平的好坏,仅对比企业的产品总产量是不足以说明问题的,因为产品总产量受到企业规模大小的影响。要比较,需要计算各企业生产人员的平均产品产量,即劳动生产率,并分析不同的生产条件,才能做出正确的判断。2.利用平均数比较和反映同一单位某一标志不同时期一般水平的发展变化,说明事物的发展过程和变化趋势。表51 北京市历年在岗职

4、工平均工资年 度2000200120022003200420052006职工年平均工资(元)15726180922072824045283483280836097资料来源:北京市劳动和社会保障局由此可以看出,历年来,北京市在岗职工的工资水平在不断的提高。若用工资总额这个总量指标分析,会受职工人数变动的影响,从而得不到正确的结果,而以平均工资这个平均数对比,则能正确地反映该市职工工资水平的动态以及变化的趋势。3.利用平均数分析现象之间的相互关系,并推算其它有关的指标。在统计估算中经常用一部分单位标志值的平均数去推算总体平均数,并据以推算总体的相关总量指标。例如,在抽样推断中,可以用某种农作物产量

5、抽样调查的平均单位面积产量,推断农作物的总平均单位面积产量,并据以推算某地区或全国的某种农作物的总产量。推荐精选三、集中趋势指标的类型集中趋势指标平均数包括静态平均数和动态平均数两种。静态平均数是根据分布数列计算而得到的一种平均数,它主要是从静态上说明总体各单位标志值的一般水平。本章的集中趋势指标就是指静态平均数。静态平均数根据其处理的方法不同又可以分为两种,一种是数值平均数,主要包括算术平均数、调和平均数、几何平均数三种;另一种是位置平均数,主要包括众数和中位数两种。另外,还有分位数,分位数也是位置平均数。动态平均数则是根据时间序列计算而得到的一种平均数,它主要是从时间变化的动态上说明一段时

6、期内现象发展的一般水平,它的具体计算将在第九章进行详细阐述。第二节 数值平均数数值平均数,就是对统计分布数列中的所有各项数据进行计算所得到的平均数,它能概括地说明频数分布中全部数据的一般水平和集中趋势。如前所述,数值平均数主要包括算术平均数、调和平均数、几何平均数三种。一、算术平均数(一)算术平均数的基本公式算术平均数(Arithmetic mean)是最常用的一种平均数。它是总体各单位某一数量的全部标志值的平均,它等于总体各单位某一数量标志的标志值的总和除以总体单位数。 (公式5.1)可见,在具备总体单位标志值总数和总体单位总数时,可直接利用基本公式计算算术平均数。例如,2006年我国职工工

7、资总额为23439亿元,职工人数为11160.9万人,则我国2006年的职年平均工资为:利用上述基本公式计算平均数时,要注意公式的子项和母项在总体范围上的可比性,也就是说,分子和分母必属同一总体,我们也可以称之为计算算术平均数时必须遵循的同质性原则。同时,平均数是一个具有计量单位的名数,它的计量单位应当和总体标志值总数的计量单位一致。由于所掌握的资料不同,在实际计算算术平均数时,可以分别采用为简单算术平均数和加权算术平均数两种计算形式。(二)简单算术平均数推荐精选简单算术平均数( Simple arithmetical average)是将变量数列中各标志值简单相加求得标志值总数,然后除以总体

8、单位总数而求得的平均数。适应于根据未分组的资料计算平均数。设代表标志值,代表算术平均数,则简单算术平均数的计算公式为: (公式5.2)例5-l有五名学生参加统计学原理高等教育自学考试,成绩分别为70、78、80、82、90分,则这五名学生的统计学原理平均成绩为:(三)加权算术平均数当掌握的资料是由标志值和次数所组成的变量数列时,可采用加权算术平均数(Weighted arithmetical average)的形式计算平均数。它是先将各组标志值与相同组的频数相乘以后得到各组标志值总数,再将各组标志值总数加总求得总体标志值总数,同时,把各组频数相加得到总体单位总数,再将两者相除得到加权算术平均数

9、。其计算公式为: (公式5.3)式中:f表示各组标志值出现的次数,即各组的总体单位数。例5-2某企业某班组工人产量资料如表5-1所示。表5-2 某企业某班组工人日产量统计表日产量(公斤)工人数(人)每组工人产量(公斤)35424854594115146140462240756354合 计401952根据表中资料计算工人的平均日产量如下: 须注意的是:当分组数列为组距式数列时,应先求出各组的组中值来代替各组的组平均数以后才能计算加权算术平均数。此时用组中值代替组平均数是假定标志值的分布在该组距范围内的变化是均匀的。所以,由组距式数列计算加权算术平均数是一个近似值。推荐精选例5-3 某储蓄所贷款资

10、料如表5-2所示。由此可知该储蓄所每个商业者的平均贷款额为:表5-3 某储蓄所为120个商业者贷款情况贷款额(万元)组中值贷款户数(户)各组贷款总额(万元)20以下204040606080801001030507090162845211016084022501470900合计-1205620 不难看出,加权算术平均数受两个因素的影响,一个是频数分布中各组标志值的水平,另一个是各组标志值出现的频数。当各组标志值确定不变时,各组频数则起着决定作用。出现次数多的标志值对平均数的影响大,使平均数向其靠拢,出现频数少的标志值对平均数的影响小,平均数远离该标志值,如上例贷款额第三组的户数最多,所以平均贷款

11、额接近第三组的水平。从而可以看出,各组标志值出现的频数在计算平均数的过程中起着权衡轻重的作用,故称为权数,按这种方法计算得到的平均数也就叫做加权算术平均数。但权数的权衡作用不在于其本身绝对数值的大小,而在于它所占总次数比重的大小。因此,权数也可以用各组单位数占全部总体单位数的比重,即频率表示。这个权数叫做实质权数。加权算术平均数的计算公式又可表示如下: (公式5.4)例5-4 根据表5-1资料计算按频率计算平均数如下:平均日产量为:表5-4 按频率计算平均数推荐精选日产量(公斤)各组工人数占总人数比重() 日产量与频率乘积.354248545910.027.512.535.015.03.501

12、1.556.0018.908.85合 计100.048.80由此可以看出,如果各组的单位数相等,即 ,即各组的频率相等时,权数失去权衡轻重的作用。这时,加权算术平均数等于简单算术平均数。即: (公式5.5)(四)算术平均数的主要数学性质算术平均数具有很多数学性质,在此只介绍其中四条主要性1.变量数列中各个标志值与算术平均数的离差之和等于零。即: (公式5.6)证明:2.变量数列中各标志值与算术平均数的离差平方和最小。也就是说变量数列中各标志值对其它任意数的离差平方之和都大于变量数列中各标志值对算术平均数的离差平方之和。即:。 (公式5.7)证明:设为任意数,则以为中心的离差平方和为: 所以为最

13、小值。同样的方法可以证明出最小值也是成立的。推荐精选3.任何两个变量代数和的算术平均数等于两个变量的算术平均数的代数和。即: (公式5.8)证明:设变量x有n个值,变量y有m个值,则两个变量之和(xy)的值则共有nm个,推导过程如下: 这一结论还可以推广到任意多个变量。即: (公式5.9)4.对被平均的变量施行某种线性变换后,新变量的算术平均数就等于对原变量的算术平均数施行同样线性变换后的结果,即: (公式5.10)其中,a和b均为常数。证明: 以上四条数学性质主要说明了两个方面的问题,第一条和第一条说明了算术平均数是概括反映整个变量数列集中趋势的优良的代表值;第三条和第四条说明了算术平均数在

14、计算和分析上具有非常简捷、便利的特点。二、调和平均数调和平均数是平均数的一种。但统计调和平均数,与数学调和平均数不同。在数学中调和平均数与算术平均数都是独立的自成体系的。计算结果两者不相同且前者恒小于后者。 因而数学调和平均数定义为:数值倒数的平均数的倒数。但统计调和平均数则与之不同,它是算术平均数的变形,附属于算术平均数,不能单独成立体系。且计算结果与加权算术平均数完全相等。所以统计调和平均数的概念应为:用平均标志值(变量值)的倒数作为新变量进行的算术平均数的倒数。(一)简单调和平均数简单调和平均数适应于未分组的资料计算调和平均数。计算公式如下: (公式5.11)式中:代表调和平均数;x代表各个标志值;n代表标志值的项数;为总和符号。推荐精选例5-5 市场上某种蔬菜的早市价格2.2元/斤,午市价格1.8元/斤,晚市价格1.6元/斤,如果早、中、晚各买1元钱的蔬菜,则平均每斤的价格为:(二)加权调和平均数加权调和平均数适应于已分组的资料。如果掌握各组的标志值水平和各组的标志值总数,而不知道各组的总体单位数时,应采用加权调和平均数的方法计算调和平均数。计算公式如下: (公式5.12)式中:代表调和

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号