应用经济学课件 第4章数据分布特征的测度

上传人:mg****85 文档编号:56651443 上传时间:2018-10-14 格式:PPT 页数:73 大小:1.05MB
返回 下载 相关 举报
应用经济学课件 第4章数据分布特征的测度_第1页
第1页 / 共73页
应用经济学课件 第4章数据分布特征的测度_第2页
第2页 / 共73页
应用经济学课件 第4章数据分布特征的测度_第3页
第3页 / 共73页
应用经济学课件 第4章数据分布特征的测度_第4页
第4页 / 共73页
应用经济学课件 第4章数据分布特征的测度_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《应用经济学课件 第4章数据分布特征的测度》由会员分享,可在线阅读,更多相关《应用经济学课件 第4章数据分布特征的测度(73页珍藏版)》请在金锄头文库上搜索。

1、第四章 数据分布特征的测度,主要内容和学习目标,集中趋势的测度(掌握) 离散程度的测度(掌握) 偏度与峰度的测度(了解),一、集中趋势的测度,算术平均数,调和平均数,几何平均数,中位数,众 数,概念与测度指标,集中趋势的概念:是指一组数据向某一中心值靠拢的倾向,它反映了数据聚集的中心所在 。 集中趋势的测度:平均指标(平均数)众数、中位数、算术平均数、调和平均数、几何平均数,集中趋势的概念与测度指标,定义:是指一组数据中出现次数最多的变量值, 用MO表示。作用:主要用来测度分类数据的集中趋势也适用于测度顺序数据和数值型数据的集中趋势特点:不受数据中极端值的影响,众 数 (Mode),1、未分组

2、数据的众数MO次数最多的变量值 2、已分组数据的众数分类数据、顺序数据和单项式分组的数值型数据 MO 频数最多组的变量值(2) 组距式分组的数值型数据下限公式:上限公式:,众数的计算方法,某生产车间50名工人日加工零件数原始资料(单位:个),众数:122,Excel在众数计算中的应用,方法一:利用统计函数“MODE”计算方法二:利用“描述统计”工具计算,某城市居民关注广告类型的频数分布,众数:商品广告,甲城市家庭对住房状况满意程度的频数分布,众数:不满意,某200名手机使用者目前已更换手机数量频数分布表,众数:1,某地区农民家庭年人均收入资料,=1511.8(元),解:从表中的资料可以看出,出

3、现频数最多的是1050,即众数组为14001600,且,根据众数公式可得:,众数的计算过程,定义:是一组数据按从小到大排序后,处于中间位置上的变量值,用Me 表示。作用:主要用于测度顺序数据的集中趋势也适用于测度数值型数据的集中趋势 特点:不受数据中极端值的影响,中位数(Median),1、未分组数据的中位数 第一步:排序 第二步:确定中位数的位置中位数的位置 第三步:计算中位数的值,中位数的计算方法,某生产车间50名工人日加工零件数原始资料(单位:个),中位数:123,排序表,Excel在中位数计算中的应用,方法一:利用统计函数“MEDIN”计算方法二:利用“描述统计”工具计算,2、已分组数

4、据的中位数 (1)顺序数据和单项式分组的数值型数据第一步,确定中位数的位置中位数的位置第二步,确定中位数所在的组累积频数中首次大于或等于 的组 第三步,确定中位数的值,中位数组的变量值,甲城市家庭对住房状况满意程度的频数分布,中位数:一般,某200名手机使用者目前已更换手机数量频数分布表,中位数:2,(2)组距式分组的数值型数据第一步,确定中位数的位置:中位数的位置第二步,确定中位数所在的组累积频数中首次大于或等于 的组 第三步,确定中位数的值下限公式:上限公式:,某地区农民家庭年人均收入资料,解: 由表中资料可知,中位数的位置=,中位数在14001600组,且,,,,,根据中位数的公式,得,

5、中位数的计算过程,算术平均数(arithmetic mean),定义:是将一组数据的总和除以这组数据的个数,用 表示。作用:用于测度数值型数据的集中趋势特点:易受数据中极端值的影响,1、简单算术平均数,适用于未分组整理的数值型数据,算术平均数的计算方法,2、加权算术平均数,适用于已分组整理的数值型数据,某生产车间50名工人日加工零件数原始资料(单位:个),算术平均数:122.98,Excel在算术平均数计算中的应用,1、计算简单算术平均数方法一:利用统计函数“AVERAGE”计算方法二:利用“描述统计”工具计算2、计算加权算术平均数方法:利用鼠标拖曳复制进行计算(见教材P59),某地区农民家庭

6、年人均收入资料,求算术平均数。,调和平均数(Harmonic mean),定义:是各变量值的倒数的算术平均数, 用H表示。作用:用于测度数值型数据的集中趋势特点:易受数据中极端值的影响,1、简单调和平均数,适用于未分组整理的数值型数据,调和平均数的计算方法,2、加权调和平均数,适用于已分组整理的数值型数据,例 某商品有三种不同的规格,销售单价与销售额 如下表所示,求这三种不同规格商品的平均销售单价。,某商品三种规格的销售数据,解:,Excel在调和平均数计算中的应用,1、计算简单调和平均数方法:利用统计函数“HARMEAN”计算2、计算加权调和平均数方法:利用鼠标拖曳复制进行计算(见教材P62

7、),原则: 当计算算术平均数其分子资料未知时,就采用加权算术平均数计算平均数; 当计算算术平均数其分母资料未知时,就采用加权调和平均数计算平均数。,调和平均数与算术平均数的关系: 调和平均数是算术平均数的变形 调和平均数和算术平均数在本质上是一致的 惟一的区别是计算时使用了不同的数据,几何平均数(Geometric mean),定义:是n个变量值的连乘积的n次方根, 用G表示。作用:用于测度数值型数据的集中趋势用于计算平均比率和平均速度特点:易受数据中极端值的影响,1、简单几何平均数,适用于未分组整理的数值型数据,几何平均数的计算方法,2、加权几何平均数,适用于已分组整理的数值型数据,例 某产

8、品需经三个车间连续加工,已知 三个车间制品的合格率分别95%、90%、98%, 求三个车间平均合格率。,解:,例 某地区GDP 19911995年平均发展速度为107.2%,19961998年平均发展速度为108.7%,19992000年平均发展速度为110%,求该地区19912000年间的平均发展速度。,108.2%,解:,Excel在几何平均数计算中的应用,1、计算简单几何平均数方法:利用统计函数“GEOMEAN”计算2、计算加权调和平均数方法:利用鼠标拖曳复制进行计算(见教材P63),算术平均数、调和平均数和几何平均数的比较,2它们都是数值型数据集中趋势的代表值算术平均数适用于各变量值之

9、间存在相加关系的场合调和平均数通常是作为算术平均数的变形形式使用几何平均数适用于各变量值之间存在连乘积关系的场合,平均数的比较,1它们都是数值平均数,都易受极端值的影响算术平均数的影响最大极端值 调和平均数的影响次之几何平均数的影响最小,众数、中位数与算术平均数的比较,1众数和中位数都是位置平均数,不受极端值的影响,2众数、中位数与算术平均数之间存在以下关系,各变量值与其算术平均数的离差之和等于零,即,或,各变量值与其算术平均数的离差平方和最小,即,(最小),(最小),算术平均数的数学性质,返回,二、离散程度的测度,离散系数,方差,极差,概念与测度指标,标准差,离散程度的概念与测度指标,离散程

10、度的概念:是指一组数据远离其中心值的程度,也称为“离中趋势”, 反映了数据之间的变异程度。离散程度的测度:标志变异指标极差、方差、标准差和离散系数,集中趋势的代表值平均数,是对一组数据水平的 概括性度量,但其代表性的优劣取决于离散程度的大小。越大,其平均数的代表性就越差离散程度 越小,其平均数的代表性就越好,集中趋势与离散程度的关系,极差(Range),定义:是指一组数据的最大值与最小值之差, 用R表示。作用:反映一组数据的绝对变异程度特点:不能准确描述出数据的离散程度,最高组上限值最低组下限值,1未分组整理或单项式分组整理的数据,组距式分组整理的数据,极差的计算方法,某生产车间50名工人日加

11、工零件数原始资料(单位:个),极差:32,Excel在极差计算中的应用,方法一:利用统计函数“MAX”和“MIN”计算方法二:利用“描述统计”工具计算,方差(Variance) 标准差(Standard deviation),定义:方差是各变量值与其均值离差平方的算术平均数标准差是方差的平方根作用:反映一组数据的绝对变异程度说明平均数的代表性的强弱特点:能够准确描述出数据的离散程度,总体的方差和标准差,(未分组整理),(已分组整理),方差和标准差的计算方法,样本的方差和标准差,(未分组整理),(已分组整理),某生产车间50名工人日加工零件数原始资料(单位:个),求总体方差和标准差、样本方差和样

12、本标准差。,某地区农民家庭年人均收入资料,求总体方差和标准差、样本方差和样本标准差。,Excel在方差和标准差计算中的应用,1、未分组整理的数据方法一:利用统计函数计算总体方差:VARP 总体标准差:STDEVP样本方差:VAR 样本标准差:STDEV方法二:利用“描述统计”工具计算注意: “描述统计”结果中的“方差”是指“样本方差”,“标准差”是指“样本标准差”。2、已分组整理的数据方法:利用鼠标拖曳复制进行计算(见教材P66和P68),离散系数 (coefficient of variation),定义:是各变异指标与其算术平均数的比值,用V表示。作用:反映一组数据的相对变异程度用于比较多

13、组数据的平均值的代表性的强弱特点:能够准确描述出数据的离散程度,离散程度的计算方法,常用的离散系数是标准差系数,总体离散系数,样本离散系数,例 甲乙两组工人的平均工资分别为138.14元、176元, 标准差分别为21.32元、24.67元。计算两组工人工资水平 离散系数。,从两组的离散系数可以看出,甲组相对的变异程度大于乙组,因而乙组平均工资的代表性要大。,解,返回,三、偏度与峰度的测度,偏度的测度,峰度的测度,矩,矩,K阶中心矩,K阶原点矩,偏度的概念:是指一组数据分布的偏斜方向和程度,偏度的测度,偏度的测度:偏度系数,偏度系数的计算:,数据分布的偏度特征及测度示意图,偏度系数的意义,峰度的

14、概念:是指一组数据分布的尖峭状况和程度,峰度的测度,峰度的测度:峰度系数,峰度系数的计算:,数据分布的峰度特征及测度示意图,峰度系数的意义,Excel在偏度系数和峰度系数计算中的应用,1、未分组整理的数据方法一:利用统计函数计算偏度系数:SKEW 峰度系数:KERT方法二:利用“描述统计”工具2、已分组整理的数据方法:利用鼠标拖曳复制进行计算(见教材P71和P73),某生产车间50名工人日加工零件数原始资料(单位:个),计算偏度系数和峰度系数。,某地区农民家庭人均收入数据,计算偏度系数和峰度系数,计算相关数据,1596(元),305.26(元),解,从计算结果可以看出:偏态系数 ,而且数值较大, 说明该地区农民家庭人均收入的分布为右偏分布, 即人均收入较少的家庭占据多数, 而人均收入较高的家庭则占少数, 而且偏斜的程度较大。,峰度系数,说明该地区农民家庭人均收入的分布为尖峰分布, 说明低收入家庭占有较大的比重。,结果 分析,End of Chapter 4,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号