应用统计学 教学课件 ppt 作者 孙炎 第4章数据分布特征的测度

上传人:E**** 文档编号:89497448 上传时间:2019-05-25 格式:PPT 页数:73 大小:1.05MB
返回 下载 相关 举报
应用统计学  教学课件 ppt 作者 孙炎 第4章数据分布特征的测度_第1页
第1页 / 共73页
应用统计学  教学课件 ppt 作者 孙炎 第4章数据分布特征的测度_第2页
第2页 / 共73页
应用统计学  教学课件 ppt 作者 孙炎 第4章数据分布特征的测度_第3页
第3页 / 共73页
应用统计学  教学课件 ppt 作者 孙炎 第4章数据分布特征的测度_第4页
第4页 / 共73页
应用统计学  教学课件 ppt 作者 孙炎 第4章数据分布特征的测度_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《应用统计学 教学课件 ppt 作者 孙炎 第4章数据分布特征的测度》由会员分享,可在线阅读,更多相关《应用统计学 教学课件 ppt 作者 孙炎 第4章数据分布特征的测度(73页珍藏版)》请在金锄头文库上搜索。

1、第四章 数据分布特征的测度,主要内容和学习目标,集中趋势的测度(掌握) 离散程度的测度(掌握) 偏度与峰度的测度(了解),一、集中趋势的测度,算术平均数,调和平均数,几何平均数,中位数,众 数,概念与测度指标,集中趋势的概念:是指一组数据向某一中心值靠拢的倾向,它反映了数据聚集的中心所在 。 集中趋势的测度:平均指标(平均数)众数、中位数、算术平均数、调和平均数、几何平均数,集中趋势的概念 与测度指标,定义:是指一组数据中出现次数最多的变量值, 用MO表示。 作用:主要用来测度分类数据的集中趋势 也适用于测度顺序数据和数值型数据的集中趋势 特点:不受数据中极端值的影响,众 数 (Mode),1

2、、未分组数据的众数 MO次数最多的变量值 2、已分组数据的众数 分类数据、顺序数据和单项式分组的数值型数据 MO 频数最多组的变量值 (2) 组距式分组的数值型数据 下限公式: 上限公式:,众数的计算方法,某生产车间50名工人日加工零件数原始资料(单位:个),众数:122,Excel在众数计算中的应用,方法一:利用统计函数“MODE”计算 方法二:利用“描述统计”工具计算,某城市居民关注广告类型的频数分布,众数:商品广告,甲城市家庭对住房状况满意程度的频数分布,众数:不满意,某200名手机使用者目前已更换手机数量频数分布表,众数:1,某地区农民家庭年人均收入资料,=1511.8(元),解:从表

3、中的资料可以看出,出现频数最多的是1050, 即众数组为14001600,且,根据众数公式可得:,众数的计算过程,定义:是一组数据按从小到大排序后,处于 中间位置上的变量值,用Me 表示。 作用:主要用于测度顺序数据的集中趋势 也适用于测度数值型数据的集中趋势 特点:不受数据中极端值的影响,中位数(Median),1、未分组数据的中位数 第一步:排序 第二步:确定中位数的位置 中位数的位置 第三步:计算中位数的值,中位数的计算方法,某生产车间50名工人日加工零件数原始资料(单位:个),中位数:123,排序表,Excel在中位数计算中的应用,方法一:利用统计函数“MEDIN”计算 方法二:利用“

4、描述统计”工具计算,2、已分组数据的中位数 (1)顺序数据和单项式分组的数值型数据 第一步,确定中位数的位置 中位数的位置 第二步,确定中位数所在的组 累积频数中首次大于或等于 的组 第三步,确定中位数的值,中位数组的变量值,甲城市家庭对住房状况满意程度的频数分布,中位数:一般,某200名手机使用者目前已更换手机数量频数分布表,中位数:2,(2)组距式分组的数值型数据 第一步,确定中位数的位置: 中位数的位置 第二步,确定中位数所在的组 累积频数中首次大于或等于 的组 第三步,确定中位数的值 下限公式: 上限公式:,某地区农民家庭年人均收入资料,解: 由表中资料可知,中位数的位置=,中位数在1

5、4001600组,且,,,,,根据中位数的公式,得,中位数的计算过程,算术平均数(arithmetic mean),定义:是将一组数据的总和除以这组数据的个数, 用 表示。 作用:用于测度数值型数据的集中趋势 特点:易受数据中极端值的影响,1、简单算术平均数,适用于未分组整理的数值型数据,算术平均数的计算方法,2、加权算术平均数,适用于已分组整理的数值型数据,某生产车间50名工人日加工零件数原始资料(单位:个),算术平均数:122.98,Excel在算术平均数计算中的应用,1、计算简单算术平均数 方法一:利用统计函数“AVERAGE”计算 方法二:利用“描述统计”工具计算 2、计算加权算术平均

6、数 方法:利用鼠标拖曳复制进行计算 (见教材P59),某地区农民家庭年人均收入资料,求算术平均数。,调和平均数(Harmonic mean),定义:是各变量值的倒数的算术平均数, 用H表示。 作用:用于测度数值型数据的集中趋势 特点:易受数据中极端值的影响,1、简单调和平均数,适用于未分组整理的数值型数据,调和平均数的计算方法,2、加权调和平均数,适用于已分组整理的数值型数据,例 某商品有三种不同的规格,销售单价与销售额 如下表所示,求这三种不同规格商品的平均销售单价。,某商品三种规格的销售数据,解:,Excel在调和平均数计算中的应用,1、计算简单调和平均数 方法:利用统计函数“HARMEA

7、N”计算 2、计算加权调和平均数 方法:利用鼠标拖曳复制进行计算 (见教材P62),原则: 当计算算术平均数其分子资料未知时, 就采用加权算术平均数计算平均数; 当计算算术平均数其分母资料未知时, 就采用加权调和平均数计算平均数。,调和平均数与算术平均数的关系: 调和平均数是算术平均数的变形 调和平均数和算术平均数在本质上是一致的 惟一的区别是计算时使用了不同的数据,几何平均数(Geometric mean),定义:是n个变量值的连乘积的n次方根, 用G表示。 作用:用于测度数值型数据的集中趋势 用于计算平均比率和平均速度 特点:易受数据中极端值的影响,1、简单几何平均数,适用于未分组整理的数

8、值型数据,几何平均数的计算方法,2、加权几何平均数,适用于已分组整理的数值型数据,例 某产品需经三个车间连续加工,已知 三个车间制品的合格率分别95%、90%、98%, 求三个车间平均合格率。,解:,例 某地区GDP 19911995年平均发展速度为107.2%,19961998年平均发展速度为108.7%,19992000年平均发展速度为110%,求该地区19912000年间的平均发展速度。,108.2%,解:,Excel在几何平均数计算中的应用,1、计算简单几何平均数 方法:利用统计函数“GEOMEAN”计算 2、计算加权调和平均数 方法:利用鼠标拖曳复制进行计算 (见教材P63),算术平

9、均数、调和平均数和几何平均数的比较,2它们都是数值型数据集中趋势的代表值 算术平均数适用于各变量值之间存在相加关系的场合 调和平均数通常是作为算术平均数的变形形式使用 几何平均数适用于各变量值之间存在连乘积关系的场合,平均数的比较,1它们都是数值平均数,都易受极端值的影响 算术平均数的影响最大 极端值 调和平均数的影响次之 几何平均数的影响最小,众数、中位数与算术平均数的比较,1众数和中位数都是位置平均数,不受极端值的影响,2众数、中位数与算术平均数之间存在以下关系,各变量值与其算术平均数的离差之和等于零,即,或,各变量值与其算术平均数的离差平方和最小,即,(最小),(最小),算术平均数的数学

10、性质,返回,二、离散程度的测度,离散系数,方差,极差,概念与测度指标,标准差,离散程度的概念 与测度指标,离散程度的概念:是指一组数据远离其中心值的程度,也称为“离中趋势”, 反映了数据之间的变异程度。 离散程度的测度:标志变异指标极差、方差、标准差和离散系数,集中趋势的代表值平均数,是对一组数据水平的 概括性度量,但其代表性的优劣取决于离散程度的大小。 越大,其平均数的代表性就越差 离散程度 越小,其平均数的代表性就越好,集中趋势与离散程度的关系,极差(Range),定义:是指一组数据的最大值与最小值之差, 用R表示。 作用:反映一组数据的绝对变异程度 特点:不能准确描述出数据的离散程度,最

11、高组上限值最低组下限值,1未分组整理或单项式分组整理的数据,组距式分组整理的数据,极差的计算方法,某生产车间50名工人日加工零件数原始资料(单位:个),极差:32,Excel在极差计算中的应用,方法一:利用统计函数“MAX”和“MIN”计算 方法二:利用“描述统计”工具计算,方差(Variance) 标准差(Standard deviation),定义:方差是各变量值与其均值离差平方的算术平均数 标准差是方差的平方根 作用:反映一组数据的绝对变异程度 说明平均数的代表性的强弱 特点:能够准确描述出数据的离散程度,总体的方差和标准差,(未分组整理),(已分组整理),方差和标准差的计算方法,样本的

12、方差和标准差,(未分组整理),(已分组整理),某生产车间50名工人日加工零件数原始资料(单位:个),求总体方差和标准差、样本方差和样本标准差。,某地区农民家庭年人均收入资料,求总体方差和标准差、样本方差和样本标准差。,Excel在方差和标准差计算中的应用,1、未分组整理的数据 方法一:利用统计函数计算 总体方差:VARP 总体标准差:STDEVP 样本方差:VAR 样本标准差:STDEV 方法二:利用“描述统计”工具计算 注意: “描述统计”结果中的“方差”是指 “样本方差”,“标准差”是指“样本标准差”。 2、已分组整理的数据 方法:利用鼠标拖曳复制进行计算 (见教材P66和P68),离散系

13、数 (coefficient of variation),定义:是各变异指标与其算术平均数的比值,用V表示。 作用:反映一组数据的相对变异程度 用于比较多组数据的平均值的代表性的强弱 特点:能够准确描述出数据的离散程度,离散程度的计算方法,常用的离散系数是标准差系数,总体离散系数,样本离散系数,例 甲乙两组工人的平均工资分别为138.14元、176元, 标准差分别为21.32元、24.67元。计算两组工人工资水平 离散系数。,从两组的离散系数可以看出,甲组相对的变异程度 大于乙组,因而乙组平均工资的代表性要大。,解,返回,三、偏度与峰度的测度,偏度的测度,峰度的测度,矩,矩,K阶中心矩,K阶原

14、点矩,偏度的概念:是指一组数据分布的偏斜方向和程度,偏度的测度,偏度的测度:偏度系数,偏度系数的计算:,数据分布的偏度特征及测度示意图,偏度系数的意义,峰度的概念:是指一组数据分布的尖峭状况和程度,峰度的测度,峰度的测度:峰度系数,峰度系数的计算:,数据分布的峰度特征及测度示意图,峰度系数的意义,Excel在偏度系数和峰度系数计算中的应用,1、未分组整理的数据 方法一:利用统计函数计算 偏度系数:SKEW 峰度系数:KERT 方法二:利用“描述统计”工具 2、已分组整理的数据 方法:利用鼠标拖曳复制进行计算 (见教材P71和P73),某生产车间50名工人日加工零件数原始资料(单位:个),计算偏度系数和峰度系数。,某地区农民家庭人均收入数据,计算偏度系数和峰度系数,计算相关数据,1596(元),305.26(元),解,从计算结果可以看出: 偏态系数 ,而且数值较大, 说明该地区农民家庭人均收入的分布为右偏分布, 即人均收入较少的家庭占据多数, 而人均收入较高的家庭则占少数, 而且偏斜的程度较大。,峰度系数,说明该地区农民家庭人均收入的分布为尖峰分布, 说明低收入家庭占有较大的比重。,结果 分析,End of Chapter 4,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号