统计学课件:第3章 统计综合指标

上传人:汽*** 文档编号:568788512 上传时间:2024-07-26 格式:PPT 页数:92 大小:3.08MB
返回 下载 相关 举报
统计学课件:第3章 统计综合指标_第1页
第1页 / 共92页
统计学课件:第3章 统计综合指标_第2页
第2页 / 共92页
统计学课件:第3章 统计综合指标_第3页
第3页 / 共92页
统计学课件:第3章 统计综合指标_第4页
第4页 / 共92页
统计学课件:第3章 统计综合指标_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《统计学课件:第3章 统计综合指标》由会员分享,可在线阅读,更多相关《统计学课件:第3章 统计综合指标(92页珍藏版)》请在金锄头文库上搜索。

1、1-1第三章第三章 统计综合指标统计综合指标n第一节第一节 总量指标和相对指标总量指标和相对指标n第二节第二节 平均指标平均指标n第三节第三节 变异指标变异指标1-2第一节第一节 总量指标和相对指标总量指标和相对指标一、总量指标一、总量指标 反映客观总体现象在一定时间、地点条反映客观总体现象在一定时间、地点条件下的总规模或工作总量的的综合指标,是件下的总规模或工作总量的的综合指标,是各项数据代数和运算的结果,以绝对数的形各项数据代数和运算的结果,以绝对数的形式表现为有名数。式表现为有名数。 (一)总量指标的分类(一)总量指标的分类 1.按反映总体内容的不同可分为总体单位总量按反映总体内容的不同

2、可分为总体单位总量和总体标志总量。和总体标志总量。 总体单位数总体单位数1-32.按反映时间状况的不同,可分为时期指标和按反映时间状况的不同,可分为时期指标和时点指标。时点指标。 (1)时期指标反映社会经济现象在一段时间)时期指标反映社会经济现象在一段时间内发生的总量。内发生的总量。 特点:可加性,指标值大小与时间长短有直接联特点:可加性,指标值大小与时间长短有直接联系,指标值采用连续登记的方式取得。系,指标值采用连续登记的方式取得。 (2)时点指标反映社会经济现象在某一时刻时点指标反映社会经济现象在某一时刻状态上的总量。状态上的总量。 特点:不可加性,指标值的大小与其时点间隔的特点:不可加性

3、,指标值的大小与其时点间隔的长短没有直接联系,指标值采用间断登记的方式取长短没有直接联系,指标值采用间断登记的方式取得。得。1-41.下面时期指标有(下面时期指标有( ) A 耕地面积耕地面积 B 播种面积播种面积 C 扩大的耕扩大的耕地面积地面积 D 新建的住宅面积新建的住宅面积 E国民生产总值国民生产总值2.有有5个经济指标:个经济指标: A 进出口贸易总额进出口贸易总额 B储蓄存款余额储蓄存款余额 C平均平均工资工资 D股票价格股票价格 E年末工人数年末工人数 属于总量指标有(属于总量指标有( ),时点指标有(),时点指标有( )。)。1-53.总量指标的计量单位总量指标的计量单位 实物

4、单位、货币单位和时间单位实物单位、货币单位和时间单位4.总量指标的数学性质总量指标的数学性质1-6二、二、 相对指标相对指标 反映社会经济现象之间数量的对比关系,是由反映社会经济现象之间数量的对比关系,是由两个相互联系的指标对比而成。以相对数的形式表两个相互联系的指标对比而成。以相对数的形式表现出来,倍数、成数、百分数、千分数等。现出来,倍数、成数、百分数、千分数等。(一)相对指标的种类(一)相对指标的种类 1.结构相对指标结构相对指标=2.比例相对指标比例相对指标=1-73.计划完成程度计划完成程度 相对指标相对指标4.动态相对指标动态相对指标=5.比较相对指标比较相对指标=6.强度相对指标

5、强度相对指标=n相对数的具体类型n总体的部分数值n总体的全部数值n1.结构相对数n恩格尔系数nn男性人口比重n第三产业产值占总产值比重恩格尔系数(%)= (食品支出总额 /家庭或个人消费支出总额)100% 国际上常常用恩格尔系数来衡量一个国家和地区人民生活水平的状况。根据联合国粮农组织提出的标准,恩格尔系数在59%以上为贫困,50-59%为温饱,40-50%为小康,30-40%为富裕,低于30%为最富裕。例:例:19881988年我国职工人数年我国职工人数1351113511万人,其中全民所有制单位职万人,其中全民所有制单位职工工99849984万人,城镇集体所有制单位职工万人,城镇集体所有制

6、单位职工35273527万人,则:万人,则:n结构相对指标的分子与分母之比,可以是结构相对指标的分子与分母之比,可以是部分的总体部分的总体单位数与全部总体单位数之比单位数与全部总体单位数之比,也可以是,也可以是部分单位的部分单位的标志总量与全部单位的标志总量之比标志总量与全部单位的标志总量之比。2.2.比例比例相对指标相对指标n是是总体中不同部分数量之比的相对指标总体中不同部分数量之比的相对指标,用以分析总,用以分析总体范围内各个局部、各个分组之间的比例关系和协调体范围内各个局部、各个分组之间的比例关系和协调平衡状况。平衡状况。n形式:计算结果通常以百分比来表示,还有以比较基形式:计算结果通常

7、以百分比来表示,还有以比较基数单位为数单位为1 1、100100、10001000时被比较单位数是多少的形式时被比较单位数是多少的形式来表示。来表示。例:例:设某校教学人员为设某校教学人员为200200人,行政人员为人,行政人员为300300人,教学人员与行政人员的对比为人,教学人员与行政人员的对比为66.7%66.7%,也可用,也可用1 1:1.51.5来表示。来表示。n一般以一般以总量指标总量指标进行对比,依据分析任进行对比,依据分析任务和提供资料的情况,也可运用现象务和提供资料的情况,也可运用现象总总体各部分的相对数或平均值进行对比体各部分的相对数或平均值进行对比。3.3.比较相对指标比

8、较相对指标n定义:是定义:是不同单位不同单位(国家、部门、地区、企业、个人(国家、部门、地区、企业、个人等等)等等)的同类现象数量对比的同类现象数量对比而确定的相对指标,用以而确定的相对指标,用以说明某一同类现象在同一时间内各单位发展的不平衡说明某一同类现象在同一时间内各单位发展的不平衡程度,以表明同类事物在不同条件下的数量对比关系。程度,以表明同类事物在不同条件下的数量对比关系。n形式:通常用百分数或倍数表示形式:通常用百分数或倍数表示n在实际工作中,也可以用相对指标或平均指标进行对比,在实际工作中,也可以用相对指标或平均指标进行对比,例如用人均粮食产量进行对比。例如用人均粮食产量进行对比。

9、例:例:某年,天津市工业总产量为某年,天津市工业总产量为405.51405.51亿元,亿元,北京市为北京市为436.98436.98亿元,上海市为亿元,上海市为1066.721066.72亿元,以天津市为基础,即为亿元,以天津市为基础,即为100%100%,n在实际工作中,也可以用相对指标或平均指标在实际工作中,也可以用相对指标或平均指标进行对比,例如用人均粮食产量进行对比。进行对比,例如用人均粮食产量进行对比。n则上海市为天津市的n北京市为天津市的4.4.强度相对指标强度相对指标n定义:是定义:是两个性质不同而有联系的总量指标之间的对两个性质不同而有联系的总量指标之间的对比比,用来表明某一现

10、象在另一现象中发展的强度、密,用来表明某一现象在另一现象中发展的强度、密度和普遍程度。度和普遍程度。n特点:特点:它不是同类现象指标的对比它不是同类现象指标的对比,所谓不同类现象,所谓不同类现象可能分别属于不同的总体也可能是同一总体中的不同可能分别属于不同的总体也可能是同一总体中的不同标志或指标。标志或指标。n n例:某年某地区年平均人口数为例:某年某地区年平均人口数为100100万人,在该年万人,在该年度内出生的人口数为度内出生的人口数为86008600人。则该地区人。则该地区n n例:某地区某年末现有总人口为例:某地区某年末现有总人口为100100万人,医万人,医院床位总数为院床位总数为2

11、470024700张。则该地区张。则该地区n n(正指标)(正指标)n n(逆指标)(逆指标)n正指标:正指标:相对指标的相对指标的数值大小数值大小与现象的与现象的发展程度发展程度或或密度成密度成正比。正比。n逆指标:逆指标:相对指标的相对指标的数值大小数值大小与现象的与现象的发展程度发展程度或或密度成密度成反比。反比。5 5. .动态相对指标动态相对指标n定义:又称定义:又称发展速度发展速度,表示同类事物的,表示同类事物的水平水平报告期报告期(被研究的时期又称本期、(被研究的时期又称本期、计算期)与计算期)与基期基期(作为比较基准的时期)(作为比较基准的时期)对比发展变化的程度。对比发展变化

12、的程度。 某现象报告期数值该现象基期数值发展速度6.6.计划完成程度相对指标计划完成程度相对指标n定义:简称计划完成程度指标、计划完成百分比,用来定义:简称计划完成程度指标、计划完成百分比,用来检查、监督计划执行情况,它以现象在某一段时间内的检查、监督计划执行情况,它以现象在某一段时间内的实际完成数与计划任务数对比实际完成数与计划任务数对比,借以观察计划完成程度。,借以观察计划完成程度。n特点:分子项是根据实际完成情况进行统计而得的数据,特点:分子项是根据实际完成情况进行统计而得的数据,分母项是下达的计划指标。分母项是下达的计划指标。计划数为绝对数时,计划完成情况相对指标的计算公式计划数为绝对

13、数时,计划完成情况相对指标的计算公式计划数为相对数时,计划完成情况相对指标的计算公式为计划数为相对数时,计划完成情况相对指标的计算公式为: :1-19n1.某企业计划规定劳动生产率比上年提高某企业计划规定劳动生产率比上年提高10%,实际提高,实际提高15%,求计划完成程度。,求计划完成程度。计划完成程度计划完成程度 相对指标相对指标n2.某企业计划规定某产品单位成本降低某企业计划规定某产品单位成本降低5%,实际降低实际降低7%,求计划完成程度。,求计划完成程度。计划完成程度计划完成程度 相对指标相对指标n结构相对数n比例相对数n比较相对数n动态相对数n计划完成相对数n强度相对数n n(部分与总

14、体关系)n n(部分与部分关系)n n(横向对比关系)n n(纵向对比关系)n n(实际与计划关系)n n(关联指标间关系)n n多种相对指标应当结合运用(二)相对指标的基数(二)相对指标的基数n【例例】根据大量资料统计结果,汽车的车祸根据大量资料统计结果,汽车的车祸有有70%发生于中速行驶时,发生于中速行驶时,30%发生于高发生于高速行驶时,就此能否认为高速行驶比中速行速行驶时,就此能否认为高速行驶比中速行驶更安全?驶更安全?车车速速车车次数(百万次)次数(百万次)车祸车祸情况情况车祸车祸率(率()绝对绝对数(百次)数(百次)相相对对数(数(% %)高速3024030300.800.80中速

15、28056070700.200.20合合计计3108001001000.260.261-22(三)相对指标的数学性质(三)相对指标的数学性质1-23指出下列指标是哪种指标指出下列指标是哪种指标(1)2008年年GDP是是2007年的年的107.8%。(2)2006年末,全民所有制职工占职工总人数的年末,全民所有制职工占职工总人数的73.5%。(3)2009某地区固定资产投资额是某地区固定资产投资额是2008年的年的6.3倍。倍。(4)1998年全国人均粮食产量为年全国人均粮食产量为410.5公斤。公斤。(5)在出生婴儿中,男性占)在出生婴儿中,男性占51.2%,女性占,女性占48.8%。(6)

16、2008年工业总产值超额完成计划年工业总产值超额完成计划1.7%。(7)1998年我国彩电产量比年我国彩电产量比1997年增加年增加786万台。万台。1-24第二节第二节 平均指标平均指标n一、平均指标的意义一、平均指标的意义n(一)定义:是同类社会经济现象在一定时间、地点条件下(一)定义:是同类社会经济现象在一定时间、地点条件下所达到的一般水平,是度量分布集中趋势或中心位置的指标。所达到的一般水平,是度量分布集中趋势或中心位置的指标。n(二)作用:(二)作用:n1.反映总体各单位变量分布的集中趋势和一般水平。反映总体各单位变量分布的集中趋势和一般水平。n2.比较同类现象在不同单位的发展水平。

17、比较同类现象在不同单位的发展水平。n3.比较同类现象在不同时期的发展变化趋势或规律。比较同类现象在不同时期的发展变化趋势或规律。n4.分析现象之间的依存关系。分析现象之间的依存关系。n(三)两种平均数两种平均数n数值平均数:算术平均数,调和平均数,几何平均数。数值平均数:算术平均数,调和平均数,几何平均数。n位置平均数:中位数,众数。位置平均数:中位数,众数。1-25二、算术平均数二、算术平均数 n(一)算术平均数的计算(一)算术平均数的计算n1.简单算术平均数:未分组的资料。简单算术平均数:未分组的资料。n例:生产小组例:生产小组5个工人的日产量分别为个工人的日产量分别为28、25、30、3

18、5、42件,则件,则平均工人日产量平均工人日产量=(28+25+30+35+42)/5=32(件)(件)n2.公式:公式: 强度相对指标强度相对指标: 算术平均数算术平均数:1-262.加权算术平均数:已编制分配数列的情况下加权算术平均数:已编制分配数列的情况下。n(1)单项式数列的算术平均数)单项式数列的算术平均数n例:某机械厂工人日产零件数例:某机械厂工人日产零件数的分配数列。的分配数列。权数权数加权加权公式公式:1-27例:某年我国例:某年我国80个产棉大县的个产棉大县的分配数列如表。分配数列如表。n以组中值作为各组的代表值,以组中值作为各组的代表值,假定假定各组标志值在组内分布各组标志

19、值在组内分布是均匀的。是均匀的。n(3)下列两种情况,分组资料可以不考虑权数,而用简单算术)下列两种情况,分组资料可以不考虑权数,而用简单算术平均数。平均数。n当各组的权数相同时。当各组的权数相同时。n当分布数列完全对称时。当分布数列完全对称时。(4)加权算术平均数的频率公式。加权算术平均数的频率公式。(2)组距式加权算术平均数)组距式加权算术平均数1-283.正确选择权数正确选择权数当从相对数或平均数求平均数时当从相对数或平均数求平均数时n选择权数的准则:最终的平均选择权数的准则:最终的平均指标的涵义要符合原来相对指指标的涵义要符合原来相对指标标(平均指标平均指标)本身的涵义本身的涵义例:某

20、管理局所属例:某管理局所属15个企业销售计划完成情况资料如下表:个企业销售计划完成情况资料如下表:1-29(二)算术平均数的数学性质(二)算术平均数的数学性质n1.各单位标志值与算术平均数的离差之和等于各单位标志值与算术平均数的离差之和等于0。2.各单位标志值与算术平均数的离差平方和为最小各单位标志值与算术平均数的离差平方和为最小。1-30n4.变量线性变换的平均数等于变量平均数的线性变换。变量线性变换的平均数等于变量平均数的线性变换。3.若对每一个标志值加、减、乘、除一个常数若对每一个标志值加、减、乘、除一个常数A,则平均数也加、,则平均数也加、减、乘、除这个常数减、乘、除这个常数A。或或1

21、-31n5.n个独立总体各变量的代数和的平均数等于各总体变量平均个独立总体各变量的代数和的平均数等于各总体变量平均数的代数和。数的代数和。对两变量,有对两变量,有若两变量分别取值如下:若两变量分别取值如下:则有则有那么那么1-32三、调和平均数(三、调和平均数(H)n (一)调和平均数的公式(一)调和平均数的公式n 1.调和平均数:又称倒数平均数,是标志值倒数的算术平均数的调和平均数:又称倒数平均数,是标志值倒数的算术平均数的倒数。倒数。n 2.简单调和平均数简单调和平均数 n例:某工厂工人日产零件数资料:例:某工厂工人日产零件数资料:3.加权调和平均数加权调和平均数(二)调和平均数的应用场合

22、(二)调和平均数的应用场合1.作为算术平均数的变形使用。权数作为算术平均数的变形使用。权数m为各组的标志总量。即为各组的标志总量。即1-332.从相对数或平均数求平均数时从相对数或平均数求平均数时例:某管理局所属例:某管理局所属15个企业销售计划完成情况资料如下表:个企业销售计划完成情况资料如下表:1-34n从相对数(或平均数)求平均数时从相对数(或平均数)求平均数时:n若已知的是相对数(或平均数)的分子指标若已知的是相对数(或平均数)的分子指标时,用调和平均数计算;时,用调和平均数计算;n若已知的是相对数(或平均数)的分母指标若已知的是相对数(或平均数)的分母指标时,用算术平均数计算。时,用

23、算术平均数计算。1-35例:已知某地区甲、乙、丙三个乡粮食平均亩产和粮食总产量如例:已知某地区甲、乙、丙三个乡粮食平均亩产和粮食总产量如表,求全区平均亩产。表,求全区平均亩产。n(三)在运用加权调和平均数时,各组权数相等,就可以采用简单调和平均数。(三)在运用加权调和平均数时,各组权数相等,就可以采用简单调和平均数。1-36四、几何平均数四、几何平均数n(一)公式(一)公式n 1.简单几何平均数:简单几何平均数:2.加权几何平均数加权几何平均数(二)应用:在某些情况下,若(二)应用:在某些情况下,若总体总量是由标志值相乘得出,总体总量是由标志值相乘得出,这时平均数就应该用几何平均数这时平均数就

24、应该用几何平均数的方式来计算。的方式来计算。例:例:1.某产品经过三个流水连续某产品经过三个流水连续作业的车间加工生产而成,本月作业的车间加工生产而成,本月第一车间的产品合格率为第一车间的产品合格率为90%,第二车间的产品合格率为第二车间的产品合格率为80%,第三车间的产品合格率为第三车间的产品合格率为70%。则全厂的总合格率为则全厂的总合格率为这样平均合格率为这样平均合格率为与算术平均数不同与算术平均数不同1-37例例2:以复利计算利息。:以复利计算利息。n若以单利计算:若以单利计算:n可以看出,以复利计算利息时,可以看出,以复利计算利息时,n年后本利率的总量为年后本利率的总量为n个个(1+

25、r)相乘,所以本利率的平均数用几何平均数计算。)相乘,所以本利率的平均数用几何平均数计算。若以复利计算:若以复利计算:例例:设某笔为期设某笔为期20年的投资按复利计算收益,前年的投资按复利计算收益,前10年的年利率为年的年利率为10%,中间,中间5年的利率为年的利率为8%,最后,最后5年的年利率为年的年利率为6%。求平均年。求平均年利率。利率。1-38*幂平均数幂平均数n1.k 阶简单幂平均数阶简单幂平均数n2.k 阶加权幂平均数阶加权幂平均数1-39n3.当当k取不同值时取不同值时n所以,当用同样变量值资料和权数资料来计算时,所以,当用同样变量值资料和权数资料来计算时,1-40练习:练习:n

26、 1.三个工人加工某零件所需的时间分别为三个工人加工某零件所需的时间分别为20、25、10分钟。分钟。问:问:n (1)各做)各做10小时工,平均每零件加工时间(分)。小时工,平均每零件加工时间(分)。n (2)各完成)各完成10件零件,平均每零件加工时间(分)。件零件,平均每零件加工时间(分)。n 2.银行为吸收存款,逐年提高存款利率,银行为吸收存款,逐年提高存款利率,5年各年分别为年各年分别为10%、12%、15%、18%、24%。若本金为。若本金为1000元。问:元。问:n (1)按算术平均数计算平均利率,第五年末的实际存款额是多)按算术平均数计算平均利率,第五年末的实际存款额是多少?少

27、?n (2)按几何平均数计算平均利率,第五年末的实际存款额是多)按几何平均数计算平均利率,第五年末的实际存款额是多少?少?n (3)哪种计算方法比较合理,为什么?)哪种计算方法比较合理,为什么?1-41n1.(1)n (2)n2.(1)n (2) 五、众数五、众数 n(一)(一)众数的含义众数的含义:n 众数是指统计总体或分布数列中出现的众数是指统计总体或分布数列中出现的频数最多、频率最高的标志值。频数最多、频率最高的标志值。n众数具有非常直观的代表性。从分布曲线的众数具有非常直观的代表性。从分布曲线的角度看,众数就是一个变量分布曲线的最高角度看,众数就是一个变量分布曲线的最高峰所对应的变量值

28、。峰所对应的变量值。xf(x)xMO1 MO2f(x)xMOf(x)(a)单众数(b)无众数(c)双众数n如果分布曲线没有明显的集中趋势或最高峰,则该变量无众数。如果分布曲线没有明显的集中趋势或最高峰,则该变量无众数。n如果分布曲线明显地存在一个众数,该变量的分布称为单峰分如果分布曲线明显地存在一个众数,该变量的分布称为单峰分布;布;n如果有两个不邻近的数据具有相对较高的频数(即使频数不相如果有两个不邻近的数据具有相对较高的频数(即使频数不相等),该分布可称为双峰分布;有几个相对较高的频数的分布等),该分布可称为双峰分布;有几个相对较高的频数的分布称为多峰分布。称为多峰分布。n计算和应用众数有

29、两个前提条件:计算和应用众数有两个前提条件:n(1)数据项数必须众多,否则众数就不具有)数据项数必须众多,否则众数就不具有“最普遍最普遍值值”的意义,而且其数值会很不稳定。的意义,而且其数值会很不稳定。n(2)数据具有明显的集中趋势。如果次数差别不大,)数据具有明显的集中趋势。如果次数差别不大,也就无所谓哪个值更具有普遍意义和代表性。也就无所谓哪个值更具有普遍意义和代表性。n众数不仅可度量定量变量(数值型数据)的集中趋势,也众数不仅可度量定量变量(数值型数据)的集中趋势,也可用来测度定性变量(非数值型数据)的集中趋势。因此,可用来测度定性变量(非数值型数据)的集中趋势。因此,在社会经济现象的管

30、理决策中有着十分广泛的应用。例如,在社会经济现象的管理决策中有着十分广泛的应用。例如,为了掌握农贸市场上某一农产品的价格水平,不一定要全为了掌握农贸市场上某一农产品的价格水平,不一定要全面登记该农产品每一次成交的价格,只要调查其最常见的面登记该农产品每一次成交的价格,只要调查其最常见的成交价格即可。成交价格即可。1-45n1999年某市年某市80个中型工业企业资个中型工业企业资料:料:假定众数组的标志值的分布是均匀的。假定众数组的标志值的分布是均匀的。1.未分组资料和单项式分组资料:出未分组资料和单项式分组资料:出现次数最多的变量值。现次数最多的变量值。2.组距分组数列组距分组数列:n(二)众

31、数的计算(二)众数的计算1-46n 1-47六、中位数(六、中位数( )n1.定义:将总体各单位按其标志值定义:将总体各单位按其标志值大小顺序排列,处于中点位置单位大小顺序排列,处于中点位置单位的标志值,即为中位数。的标志值,即为中位数。n2.未分组资料:未分组资料:n3.单项式分组:单项式分组:例:例:(1) 7个人的成绩分别为:个人的成绩分别为:56、64、67、75、79、85、87分,分,则中位数为则中位数为75分分(2) 若若6个人的成绩分别为:个人的成绩分别为:64、67、75、79、85、87分,分, 则中位数为(则中位数为(75+79)/2分,即分,即77分。分。中位数n (3

32、) 某工厂工人的月工资分布数列如表。某工厂工人的月工资分布数列如表。1-484.组距分组数列组距分组数列n(1)确定)确定“中位数组中位数组”。n(2)假定中位数组内分布是均匀的,计)假定中位数组内分布是均匀的,计算出中位数来。算出中位数来。20百万元30百万元第35个第55个第40个共20个向向上上累累计计时时向下累计时向下累计时1-49七、其他分位数七、其他分位数(quantile)n 一般,将能够将全部总体单位按标志值的大小等一般,将能够将全部总体单位按标志值的大小等分为分为K个部分的数值称为个部分的数值称为“k分位数分位数”, k分位数共分位数共有有K-1个。个。n中位数可以称为二分位

33、数。中位数可以称为二分位数。n常见的分位数有四分位数、十分位数。常见的分位数有四分位数、十分位数。1-50四分位数四分位数 n是将全部总体单位按标志值大小等分为四部分的是将全部总体单位按标志值大小等分为四部分的3个个数值:数值:1/4分位数,下四分位数分位数,下四分位数中位数中位数3/4分位数,上四分位数分位数,上四分位数1-51n若是未分组或单项式分组资料:若是未分组或单项式分组资料:n若是组距式分组资料:若是组距式分组资料:1-52八、各种平均数的比较八、各种平均数的比较(一)数值平均数与位置平均数比较(一)数值平均数与位置平均数比较 1.数值平均数具有更强的概括能力。数值平均数具有更强的

34、概括能力。 2.数值平均数容易受到数列中极端值的影响。数值平均数容易受到数列中极端值的影响。 3.对数据量化尺度的要求不同。对数据量化尺度的要求不同。 数值平均数只适用定距尺度和定比尺度;而位置平均数还数值平均数只适用定距尺度和定比尺度;而位置平均数还适用定序尺度和定类尺度。适用定序尺度和定类尺度。(二)各种数值平均数的比较(二)各种数值平均数的比较 1.各自的适用场合不同。各自的适用场合不同。 2.某些特殊值对数值平均数的影响。某些特殊值对数值平均数的影响。 例如:例如:0,负数等。,负数等。 1-53(三)众数、中位数和算术平均数的关系(三)众数、中位数和算术平均数的关系正态分布正偏分布负

35、偏分布皮尔生规则皮尔生规则在适度偏态情况下在适度偏态情况下1-54根据上述关系,可以从已知的两个平均指根据上述关系,可以从已知的两个平均指标推算另一个平均指标。标推算另一个平均指标。 例如,某科考试结果,有半数考生成绩在例如,某科考试结果,有半数考生成绩在80分以分以上,得上,得84分的考生最多,试估计平均成绩,以判断成分的考生最多,试估计平均成绩,以判断成绩分布的偏斜情况。绩分布的偏斜情况。解:已知解:已知me=80,mo=84 1-55前例中:1-56第三节第三节 变变 异异 指指 标标n 一、变异指标概述一、变异指标概述n 1.概念:用来描述总体分布的离中趋势或分散程度的指标。概念:用来

36、描述总体分布的离中趋势或分散程度的指标。n 2.作用:作用:n (1)用以说明平均指标的代表性程度。)用以说明平均指标的代表性程度。例如:假定某车间两个小组工人的月工资(元)资料如下。例如:假定某车间两个小组工人的月工资(元)资料如下。 甲:甲:800,900,1000,1100,1200。 乙:乙:900,950,1000,1050,1100。1-57n【例例】过过去三年中,某公司的年平均去三年中,某公司的年平均销销售售额额已达到已达到1 200万元,万元,这这可能有下面可能有下面A、B、C三种情况:三种情况: 年份A销售额B销售额C销售额12311001300120020030004001

37、6001200800nA种情况下,企业各年的销售额相当稳定;种情况下,企业各年的销售额相当稳定;nB种情况下,企业销售额出现突增和突减;种情况下,企业销售额出现突增和突减;nC种情况下,企业销售额呈持续下降趋势。种情况下,企业销售额呈持续下降趋势。n对这三种情况而言,年平均销售额对这三种情况而言,年平均销售额1 200万元的代表性是万元的代表性是不同的,显然不同的,显然A种情况的代表性最大,种情况的代表性最大,B种情况的代表性最种情况的代表性最小。小。单位:万元单位:万元1-58n【例例】某公司下属两个企某公司下属两个企业销业销售售额计额计划完成情况如表所示。划完成情况如表所示。表表3-113

38、-11 某公司下属两个企某公司下属两个企业销业销售售额计额计划完成情况划完成情况 单单位:万元位:万元企企计计划数划数 实际实际数数第一季度第一季度第二季度第二季度第三季度第三季度第四季度第四季度业业绝对绝对数数 比重比重% 绝对绝对数数比重比重%绝对绝对数数 比重比重% 绝对绝对数数 比重比重%甲甲乙乙1 0001 2001 0001 20014030014.025.010028010.023.346031046.025.830031030.025.8n乙企业全年各季度均衡地完成了销售计划,变动程度较小;乙企业全年各季度均衡地完成了销售计划,变动程度较小;甲企业则前松后紧,各季度销售变动程度

39、较大。如果不存甲企业则前松后紧,各季度销售变动程度较大。如果不存在季节因素影响,乙企业销售情况比甲企业好。在季节因素影响,乙企业销售情况比甲企业好。n变异指标可以表明生产过程的节奏性和其他经济活动的均衡变异指标可以表明生产过程的节奏性和其他经济活动的均衡性,因此可作为企业产品质量控制和评价经济管理工作的依据。性,因此可作为企业产品质量控制和评价经济管理工作的依据。(2)反映社会经济现象变动的均匀性和稳定性。)反映社会经济现象变动的均匀性和稳定性。1-593.两类变异指标:两类变异指标: (1)标志变异指标)标志变异指标 :反映总体中各变量值离散程度的指标。:反映总体中各变量值离散程度的指标。

40、有全距、平均差、标准差、变异系数等有全距、平均差、标准差、变异系数等 (2)分布变异指标:描述分布状态的指标,说明统计分布偏)分布变异指标:描述分布状态的指标,说明统计分布偏离正态分布的情况。离正态分布的情况。 偏度、峰度偏度、峰度 1-60二、全距(二、全距( )n又称又称“极差极差”例如:假定某车间两个小组工人的月工资(元)资料如下。例如:假定某车间两个小组工人的月工资(元)资料如下。 甲:甲:800,900,1000,1100,1200。 乙:乙:900,950,1000,1050,1100。在分组条件下在分组条件下:1-61三、四分位差(三、四分位差( Q.D ) 为了排除部分极端值对

41、变异指标的影响,从总体分布中为了排除部分极端值对变异指标的影响,从总体分布中剔除最大和最小各四分之一的单位,再对剩下的总体半数单剔除最大和最小各四分之一的单位,再对剩下的总体半数单位计算全距,即上四分位数与下四分位数之差,称为位计算全距,即上四分位数与下四分位数之差,称为“四分四分位间距位间距”。 “四分位间距四分位间距”的一半称为的一半称为 “四分位差四分位差”:1-62三、三、平均差(平均差( ) 1.公式:是总体各单位标志值对算术平均数的绝对离差是总体各单位标志值对算术平均数的绝对离差的算术平均数。的算术平均数。1-63n 2.平均差系数平均差系数n当水平不同或计量单位不同的总体之间比较

42、离当水平不同或计量单位不同的总体之间比较离散程度时,不能直接用平均差(标准差、极差散程度时,不能直接用平均差(标准差、极差)等变异指标,而要用变异系数(平均差系数、等变异指标,而要用变异系数(平均差系数、标准差系数、极差系数等。)标准差系数、极差系数等。) 例如:假定某车间两个小组工人的月工资(元)资料如下。例如:假定某车间两个小组工人的月工资(元)资料如下。 甲:甲:800,900,1000,1100,1200。 乙:乙:900,950,1000,1050,1100。又如:丙:1800,1900,2000,2100,2200。1-64四、方差四、方差variance( )和标准差()和标准差

43、( )n(一)公式:n 将平均差公式中的绝对值将平均差公式中的绝对值符号换成平方,得到方差的公符号换成平方,得到方差的公式,将方差开方便为标准差。式,将方差开方便为标准差。对于分组资料,有加权公式。对于分组资料,有加权公式。仍用前面的例子:仍用前面的例子:(二)标准差系数(二)标准差系数1-65例例1:某学校男子体操队:某学校男子体操队6名队员的体重分别为名队员的体重分别为55、54、52、52、51、53公斤,女子体操队公斤,女子体操队6名队员的体重分别为名队员的体重分别为46、45、44、44、43、42公斤。试比较那个队的队员体重更公斤。试比较那个队的队员体重更均匀?均匀?1-66400

44、100100040028002100019003200_10000例例2:1-67(三)总方差、组内方差和组间方差(三)总方差、组内方差和组间方差组间方差反映组平均数对总平均数的方差。组间方差反映组平均数对总平均数的方差。总方差表示总体各标志值对总平均数的方差。总方差表示总体各标志值对总平均数的方差。 有有 其中其中组内方差反映组内部标志值对组平均数的方差。组内方差反映组内部标志值对组平均数的方差。称为称为“方差的加法定理方差的加法定理”。可以计算:经验相关比指数可以计算:经验相关比指数表示在总体变异中,有多少是由于分组因素引起的。表示在总体变异中,有多少是由于分组因素引起的。 在总体分组的情

45、况下,变量的总方差可以分解为组内方在总体分组的情况下,变量的总方差可以分解为组内方差和组间方差两部分。差和组间方差两部分。1-68n例:某生产班组例:某生产班组11个工人日生产零个工人日生产零件数为件数为15,17,19,20,22,22,23,23,25,26,30。n要求:要求:n(1)计算平均数和方差)计算平均数和方差n(2)按照)按照1519,2024,25以上分成三组,计算组内方差和以上分成三组,计算组内方差和组间方差。组间方差。n(3)验证总方差等于组间方差与组)验证总方差等于组间方差与组内方差平均数之和。内方差平均数之和。1-69(1)计算各组的组平均数和组内方差和组内方差平均数

46、。)计算各组的组平均数和组内方差和组内方差平均数。第一组第二组第三组(2)计算组间方差。(3)验证1-70(四)方差的数学性质(四)方差的数学性质n1.变量的方差等于变量平方的平均数减去变量平均数的平方。变量的方差等于变量平方的平均数减去变量平均数的平方。由于2.变量线性变换的方差等于变量的方差乘以变量系数的平方。变量线性变换的方差等于变量的方差乘以变量系数的平方。对于标准差:对于标准差:3.n个独立总体各变量代数和的方差,等于各变量方差之和。个独立总体各变量代数和的方差,等于各变量方差之和。若两变量:对于标准差:对于标准差:1-71(五)标准得分(标准化成绩)(五)标准得分(标准化成绩)甲同

47、学甲同学乙同学乙同学实际分实际分4572平均分平均分3865标准差标准差7141-72科目科目平均分平均分标准差标准差原始分原始分标准化成绩标准化成绩甲考生甲考生乙考生乙考生甲考生甲考生 乙考生乙考生语文语文数学数学外语外语政治政治物理物理化学化学705642805040845104129150408560757164518070452.625-1.50-0.400.5002.5002.9170.1252.0001.8000.0005.0000.417合计合计4013816.642 9.3421-73五、成数指标五、成数指标n 1.“是非是非”标志:将总体分成具有标志:将总体分成具有 某种性质

48、和不具有某种性质两部分某种性质和不具有某种性质两部分,我们我们所关心标志的称为所关心标志的称为“是是”,另一部分称为,另一部分称为“非非”。n 2.成数:设总体的成数:设总体的n个单位中,具有个单位中,具有 某种特征的单位数是某种特征的单位数是n1个,不具有某个,不具有某种特征的单位数是种特征的单位数是n0个,个,n1+n0=n 。则有。则有n 具有某种特征的单位的成数为具有某种特征的单位的成数为n 3.是非标志数量化是非标志数量化 不具有某种特征的单位的成数为不具有某种特征的单位的成数为例如:设某批电子元件例如:设某批电子元件100件产品,经检验有件产品,经检验有92件合格,件合格,8件不和

49、格。则有件不和格。则有1(当单位具有某种特征)(当单位具有某种特征)0(当单位不具有某种特征)(当单位不具有某种特征)“01分布”1-744.“01”分布的数值特征分布的数值特征n当当p=q=0.5时,时,01变变量分布的方差有最大值,量分布的方差有最大值,即即0.25。1-75六、箱线图在统计描述中的应用六、箱线图在统计描述中的应用n箱线图:也称盒须图,或框须图。表现了总体的五个数量箱线图:也称盒须图,或框须图。表现了总体的五个数量特征值:极大值、极小值、中位数、上四分位数、下四分特征值:极大值、极小值、中位数、上四分位数、下四分位数。位数。极大值极大值上四分位数上四分位数中位数中位数下四分

50、位数下四分位数极小值极小值1-76【例例3-21】某大学统计学专业某大学统计学专业60名学生名学生8门专业主干课考试门专业主干课考试成绩分布的特征值如下表。成绩分布的特征值如下表。1-771-78七、七、 分布的偏度和峰度分布的偏度和峰度(一)统计动差(一)统计动差n1. 统计动差:也称为距,反映分布偏斜或离散程度统计动差:也称为距,反映分布偏斜或离散程度的指标。的指标。n 给定某个数给定某个数A0,以,以A为标准衡量各个准衡量各个标志志值对它的离差,所得离差的它的离差,所得离差的K次方的平均数,称次方的平均数,称为变量量关于关于A点的点的K阶动差:差:(未分组未分组)(分组分组)1-79n2

51、. 原点动差:当原点动差:当A=0时,表示各变量值对原时,表示各变量值对原点离差的情况,一般形式:点离差的情况,一般形式:(未分组未分组)(分组分组)nk= 1时,即时,即1阶的原点动差就是算术平均数。阶的原点动差就是算术平均数。nk= 2时,即时,即2阶的原点动差就是平方平均数。阶的原点动差就是平方平均数。1-803. 中心动差:中心动差:n当当A为变量的算术平均数时,为中心动差。为变量的算术平均数时,为中心动差。(未分组未分组)(分组分组) 当当k=2时,即二阶中心动差时,即二阶中心动差 当当k=0时,即零阶中心动差时,即零阶中心动差 当当k=1时,即一阶中心动差时,即一阶中心动差 1-8

52、1(二)偏度(二)偏度n1.偏度:衡量频数分配不对称程度,或偏斜程偏度:衡量频数分配不对称程度,或偏斜程度的指标。度的指标。n2.计算公式:(用距法测定)计算公式:(用距法测定)其中或1-82n当当 =0时,左右完全对称,为正态分布;当时,左右完全对称,为正态分布;当 0时为正偏斜;当时为正偏斜;当 0)(0时,表示频数分布比正态分布更集中,时,表示频数分布比正态分布更集中,分布呈尖峰状态,分布呈尖峰状态,0)(=0) (0)85 EXCEL在统计描述中的运用在统计描述中的运用 n利用描述统计分析工具利用描述统计分析工具n利用统计函数利用统计函数一、利用描述统计分析工具一、利用描述统计分析工具

53、n对于对于 未分组数据,可以使用未分组数据,可以使用描述统计描述统计分析工具或有关的函分析工具或有关的函数来计算描述统计有关指标数来计算描述统计有关指标;【例例3-20】现有50名工人完成某一装配工序所需时间(参见Excel文件),要求对装配工时进行描述统计分析。解:1输入数据。在A2:A51输入时间数据,在A1输入列标志“工时”。2调出描述统计对话框,按右图所示填写。3描述统计对话框填后, 单击确定 ,结果如图n有两点需要注意。有两点需要注意。n(1)各种分析工具对话框输出选项中)各种分析工具对话框输出选项中“输出区域输出区域”、“新工作表组新工作表组”和和“新工作簿新工作簿”的含义基本相同

54、。的含义基本相同。n(2)输出结果(上图)输出结果(上图)中指标的名称与统计中的习中指标的名称与统计中的习惯叫法不大一致,确切的指标名称如本例第惯叫法不大一致,确切的指标名称如本例第2步中所述。步中所述。二、利用统计函数二、利用统计函数n对于分组数据,不能直接用描述统计分析工具来计算描述统计有关指标。应综合应用Excel的公式与函数来实现。【例3-21】现有某粮食作物的产量和播种面积资料(参见Excel文件),请计算平均亩产量、标准差以及偏度和峰度等。n解:主要操作步骤如下。1输入数据。A2:A6输入亩产量的分组,这些数据在Excel中被认为是文本,不能直接参加数值运算,A1输入本列标志“亩产

55、量”。B2:B6输入各组的组中值,B1输入本列标志“组中值”。C2:C6输入播种面积数据,C1为本列标志“播种面积”。B9:B15存放的是最终结果与一些中间变量值,对应的A9:A15则是它们的名称。2定义变量名。先定义样本数据组中值及播种面积的变量名。选定B1:C7,执行菜单命令插入名称指定,单击“首行”选项,最后单击确定按钮。再定义最终结果与中间变量的名称,选定A9:B15,执行菜单命令插入名称指定,单击“最左列”选项,最后单击确定按钮。3计算加权平均亩产量。在B9单元格输入如下公式: =SUMPRODUCT(组中值*播种面积)/SUM(播种面积) 如果没有定义变量名,则要使用单元格引用,公

56、式如下: =SUMPRODUCT(B2:B7*C2:C7)/SUM(C2:C7)4计算其它指标。在B10:B14中,依次输入以下公式: =SQRT(SUMPRODUCT(组中值-加权平均亩产量)2*播种面积)/SUM(播种面积) =SUMPRODUCT(组中值-加权平均亩产量)3*播种面积)/SUM(播种面积) =SUMPRODUCT(组中值-加权平均亩产量)4*播种面积)/SUM(播种面积) =三阶动差/标准差3 =四阶动差/标准差4-35计算结果如下图所示。n(1)可参照本例的方法计算分)可参照本例的方法计算分组情况下的其它有关指标。组情况下的其它有关指标。n(2)对于众数及中位数的计算,

57、)对于众数及中位数的计算,只要将统计中的计算公式在只要将统计中的计算公式在Excel中实现即可。这时中实现即可。这时Excel更更像普通的计算器,但像普通的计算器,但Excel可记可记下公式,便于检查与修改,同时下公式,便于检查与修改,同时借助相关函数可很快地找出众数借助相关函数可很快地找出众数组和中位数所在组。如本例众数组和中位数所在组。如本例众数的计算,首先确定众数组,为的计算,首先确定众数组,为“700800”这一组。然后根据这一组。然后根据等距分组的上限公式,在等距分组的上限公式,在B15单单元格输入公式元格输入公式“=700+(C5-C4)*100/(C5-C4)+(C5-C6)”即可,其中即可,其中700为众数组为众数组下限,下限,100为组距,结果如图为组距,结果如图3-20所示。所示。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号