数据的概括性度量

上传人:飞*** 文档编号:5458715 上传时间:2017-08-07 格式:PPT 页数:138 大小:1.74MB
返回 下载 相关 举报
数据的概括性度量_第1页
第1页 / 共138页
数据的概括性度量_第2页
第2页 / 共138页
数据的概括性度量_第3页
第3页 / 共138页
数据的概括性度量_第4页
第4页 / 共138页
数据的概括性度量_第5页
第5页 / 共138页
点击查看更多>>
资源描述

《数据的概括性度量》由会员分享,可在线阅读,更多相关《数据的概括性度量(138页珍藏版)》请在金锄头文库上搜索。

1、第四章 数据的概括性度量,一名统计学家遇到一位数学家,统计学家调侃数学家说道:“你们不是说若且,则吗!那么想必你若是喜欢一个女孩,那么那个女孩喜欢的男孩你也会喜欢喽!?” 数学家想了一下反问道:“那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均的温度不过是五十度而已!”,统计学家与数学家,如果你的腳已經踩在爐子上,而頭卻在冰箱裡,統計學家會告訴你,平均而言,你相當舒服。,调侃统计学家,4.1 集中趋势的测定,一、集中趋势的涵义 二、平均指标的种类及计算方法,83名女生的身高,分布的集中趋势、中心数值,4.1 集中趋势的测定,一、集中趋势的涵义 二、平均指标

2、的种类及计算方法,二、平均指标的种类及计算方法, 算术平均数 调和平均数 几何平均数 中位数 众数,基本形式:,例:,直接承担者, 注意区分算术平均数与强度相对数,算术平均数,式中: 为算术平均数; 为总体单位总数; 为第 个单位的标志值。,算术平均数的计算方法,平均每人日销售额为:,算术平均数的计算方法,式中: 为算术平均数; 为第 组的次数; 为组数; 为第 组的标志值或组中值。,算术平均数的计算方法,【例】某企业某日工人的日产量资料如下:,计算该企业该日全部工人的平均日产量。,算术平均数的计算方法,解:,算术平均数的计算方法,分析:,起到权衡轻重的作用,算术平均数的计算方法,决定平均数的

3、变动范围,算术平均数的计算方法,权数是以某种数量形式对比、权衡被评价事物总体中诸因素相对重要程度的量值。,权数与加权,权数与加权,权数与加权,权数与加权,算术平均数的计算取决于变量值和权数的共同作用:变量值决定平均数的范围;权数则决定平均数的位置,变量值与其算术平均数的离差之和衡等于零,即:变量值与其算术平均数的离差平方和为最小,即:,算术平均数的主要数学性质,离差的概念,-1,-1,-2,1,3,思考题,比特啤酒公司雇用了468名员工,其中有56名管理人员,130名行政和技术人员,其余282人是工人。这三组人的周平均工资分别是500英镑、300英镑和200英镑。财务主管希望计算全体员工的平均

4、工资。,?,正确的计算方法,二、平均指标的种类及计算方法, 算术平均数 调和平均数 几何平均数 中位数 众数,【例】 设X=(2,4,6,8),则其调和平均数可由定义计算如下:,再求算术平均数:,求各标志值的倒数 : , , ,,再求倒数:,是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数,调和平均数harmean(harmonic mean),A. 简单调和平均数,适用于总体资料未经分组整理、尚为原始资料的情况,式中: 为调和平均数; 为变量值 的个数; 为第 个变量值。,调和平均数的计算方法,B. 加权调和平均数,适用于总体资料经过分组整理形成变量数列的情况,式中: 为第 组的变量

5、值; 为第 组的标志总量。,调和平均数的计算方法,当已知各组变量值和标志总量时,作为算术平均数的变形使用。,因为:,调和平均数的应用,调和平均数的用途:作为独立意义上的平均数使用基本上没有用途。作为算术平均数的变形使用是其常见的用法。但此时已经不能称为调和平均数,只能称其为调和平均方法。,计算该企业该日全部工人的平均日产量。,调和平均数的应用,即该企业该日全部工人的平均日产量为12.1375件。,调和平均数的应用,求解比值的平均数的方法,由于比值(平均数或相对数)不能直接相加,求解比值的平均数时,需将其还原为构成比值的分子、分母原值总计进行对比,设比值,则有:,求解比值的平均数的方法,【例A】

6、某季度某工业公司18个工业企业产值计划完成情况如下:,计算该公司该季度的平均计划完成程度。,求解比值的平均数的方法,【例A】某季度某工业公司18个工业企业产值计划完成情况如下:,计算该公司该季度的平均计划完成程度。,求解比值的平均数的方法,应采用加权算术平均数公式计算,【例B】某季度某工业公司18个工业企业产值计划完成情况如下(按计划完成程度分组):,计算该公司该季度的平均计划完成程度。,求解比值的平均数的方法,【例B】某季度某工业公司18个工业企业产值计划完成情况如下(按计划完成程度分组):,计算该公司该季度的平均计划完成程度。,求解比值的平均数的方法,应采用平均数的基本公式计算,二、平均指

7、标的种类及计算方法, 算术平均数 调和平均数 几何平均数 中位数 众数,式中: 为几何平均数; 为变量值的个数; 为第 个变量值。,几何平均数的计算方法,【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产线产品的平均合格率。,分析:,设最初投产100A个单位 ,则第一道工序的合格品为100A0.95;第二道工序的合格品为(100A0.95)0.92; 第五道工序的合格品为(100A0.950.920.900.85)0.80;,因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 100A0.950.920.900

8、.850.80;则该流水线产品总的合格率为:,即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:,即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,思考,若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求该企业的平均合格率。,几何平均数的计算方法,因各车间彼此独立作业

9、,所以有 第一车间的合格品为:1000.95; 第二车间的合格品为:1000.92; 第五车间的合格品为:1000.80。则该企业全部合格品应为各车间合格品的总和,即总合格品=1000.95+1000.80,几何平均数的计算方法,分析:,不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为,应采用加权算术平均数公式计算,即,式中: 为几何平均数; 为第 组的次数; 为组数; 为第 组的标志值或组中值。,几何平均数的计算方法,【例】某金融机构以复利计息。近12年来的年利率有4年为3,2年为5,2年为8,3年为10,1年为15。求平均年利率。,设本金为V,则至各年末的本利和应为:

10、,第1年末的本利和为:,第2年末的本利和为:, ,第12年末的本利和为:,分析:,则该笔本金12年总的本利率为:,即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。,解:,几何平均数的计算方法,分析,第1年末的应得利息为:,第2年末的应得利息为:,第12年末的应得利息为:, ,则该笔本金12年应得的利息总和为:=V(0.034+0.052+0.151),这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。因为,假定本金为V,所以,应采用加权算术平均数公式计算平均年利息率,即:,解:,(比较:按复利计息时的平均年

11、利率为6.85),就同一资料计算时,有:,设 x 取值为:、10,是否为比率或速度,各个比率或速度的连乘积是否等于总比率或总速度,是否为其他比值,算术平均法,求解比值的平均数的方法,数值平均数计算公式的选用顺序,指标,二、平均指标的种类及计算方法, 算术平均数 调和平均数 几何平均数 中位数 众数,不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。,中位数的作用:,二、平均指标的种类及计算方法,如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。,比如有5笔付款: 9元,10元,10元,11元,60元 平均付款为

12、100/5=20元。 很明显,这并不是一个好的代表值,而中位数10元是一个更好的代表值。,中位数的位次为:,即第3个单位的标志值就是中位数,中位数的确定,(未分组资料),中位数的位次为:,中位数应为第3和第4个单位标志值的算术平均数,即,中位数的确定,(未分组资料),【例C】某企业某日工人的日产量资料如下:,计算该企业该日全部工人日产量的中位数。,中位数的位次:,中位数的确定,(单值数列),中位数的确定,(组距数列),【例D】某车间50名工人月产量的资料如下:,计算该车间工人月产量的中位数。,中位数的确定,(组距数列),共 个单位,共 个单位,共 个单位,共 个单位,L,U,中位数组,组距为d

13、,共 个单位,假定该组内的单位呈均匀分布,中位数下限公式为,二、平均指标的种类及计算方法, 算术平均数 调和平均数 几何平均数 中位数 众数,二、平均指标的种类及计算方法,有时众数是一个合适的代表值,比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。,【例A】已知某企业某日工人的日产量资料如下:,众数的确定,(单值数列),计算该企业该日全部工人日产量的众数。,众数的确定,(组距数列),【例B】某车间50名工人月产量的资料如下:,计算该车间工人月产量的众数。,众数的原理及应用,83名女生身高原始数据,83名女生身高组距数列,当数据分布存在

14、明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)。,众数的原理及应用,没有突出地集中在某个年份,出现了两个明显的分布中心,形状 Shape,表明数据是如何分布的偏态Skew 与 对称Symmetry左偏: 均值中位数对称(零偏度) :均值 = 中位数,右偏的,左偏的,对称的,均值,=,中位数,=,众数,均值,中位数,众数,众数,中位数,均值,位置测度的一种常用方法: 百分位数(Percentile),概念:第p个百分位数是这样的数值:至少有p%个数值跟它一样大或比它小;至少有(100p)%个数值跟它一样大或比它大。,例如,一个考生入学考试的口语成绩是54分,对应第70个百分位数,我们就可以知道大约有70%的考生成绩比他低,或者说大约有30%的考生成绩比他高。,位置测度的另一种常用方法: 四分位数 (Quartile),通常将数据分成四个部分是合乎需要的,每一部分大约包括1/4或25%的数据,分位点称为四分位数。,位置测度的另一种常用方法: 四分位数 (Quartile),25%,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号