实用统计 教学课件 ppt 作者 樊培茗5 第5章

上传人:E**** 文档编号:89501209 上传时间:2019-05-26 格式:PPT 页数:88 大小:2.52MB
返回 下载 相关 举报
实用统计 教学课件 ppt 作者 樊培茗5 第5章_第1页
第1页 / 共88页
实用统计 教学课件 ppt 作者 樊培茗5 第5章_第2页
第2页 / 共88页
实用统计 教学课件 ppt 作者 樊培茗5 第5章_第3页
第3页 / 共88页
实用统计 教学课件 ppt 作者 樊培茗5 第5章_第4页
第4页 / 共88页
实用统计 教学课件 ppt 作者 樊培茗5 第5章_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《实用统计 教学课件 ppt 作者 樊培茗5 第5章》由会员分享,可在线阅读,更多相关《实用统计 教学课件 ppt 作者 樊培茗5 第5章(88页珍藏版)》请在金锄头文库上搜索。

1、第五章 数据分布特征的测度,能力要求: 掌握各种数据分布特征的测度方法 了解集中、离散趋势指标的含义、特点及计算方法 会使用Excel计算实际问题数据的分布特征的指标,并能准确分析,引入案例:职业学院毕业生薪资 根据我国有关部门最近进行的薪金调查,某地区职业学院毕业生工作收到的平均起薪为每年34500元。30名2006年毕业的毕业生组成了一个样本。请根据这些数据,计算: 1.起薪的平均数是多少? 2.起薪的中位数是多少? 3.众数是多少? 4.最高最低薪资各多少?相差有多少,表 2006年毕业生起薪数据(单位:千元),引入案例:乘车方式 人们每天去上班时可以乘坐公交车或开私家车。下面是这两种方

2、式所花费时间的样本数据,时间以分钟计。 公交车: 28 29 32 37 33 25 29 32 41 34 私家车: 29 31 33 32 34 30 31 32 35 33 1.计算每种方式所花费时间的样本平均数。 2.计算每种方法的样本标准差。 3.根据1和2的计算结果,哪一种方式上班去更好?,第一节 集中趋势的测度,集中趋势的测度工具主要由几种平均指标构成。平均指标亦称平均数,是社会经济统计广泛应用的一种综合游标,它表明同类现象在一定时间、地点、条件下所达到的一般水平,是总体内各单位参差不齐的标志值的代表值。 一、算术平均数 算术平均数是最常用的一种平均指标。其基本公式是:,第一节

3、集中趋势的测度,集中趋势的测度工具主要由几种平均指标构成。平均指标亦称平均数,是社会经济统计广泛应用的一种综合游标,它表明同类现象在一定时间、地点、条件下所达到的一般水平,是总体内各单位参差不齐的标志值的代表值。 一、算术平均数 算术平均数是最常用的一种平均指标。其基本公式是:,第一节 集中趋势的测度,(一)简单算术平均数 根据未分组的原始统计资料,将总体各单位的标志值简单加总形成总体标志总量,与总体单位数相除即可得到简单算术平均数。,第一节 集中趋势的测度,(二)加权算术平均数 根据分组整理而形成的变量数列计算算术平均数的方法,称为加权算术平均法。计算公式为:,简略形式为:,第一节 集中趋势

4、的测度,【实用范例5.1】某厂金工车间20名工人加工某种零售的产量资料如下: 表5.1.1 20名工人零件生产数量分组资料,20名工人平均的日产量:,第一节 集中趋势的测度,【实用范例5.2】某公司60名职工日工资分组资料如下: 表5.1.2 某公司60名职工日工资分组资料,60名职工月平均工资为:,第一节 集中趋势的测度,加权算术平均数可采用频率为权数。计算公式为:,第一节 集中趋势的测度,【实用范例5.3】表5.1.3 某公司60名职工日工资分组资料,各组频率 (),第一节 集中趋势的测度,(三)算术平均数的性质及特点: 各个变量值与平均数离差之和等于零加权算术平均数可采用频率为权数。 各

5、个变量值与平均数的离差平方之和为最小值 易受极端值的影响 用于数值型数据,不能用于定类数据和定序数据 二、调和平均数 调和平均数也称“倒数平均数”,它是变量值倒数的算术平均数的倒数,即对变量的倒数求平均,然后再取倒数而得到的平均数,第一节 集中趋势的测度,(一)简单调和平均数:,(二)加权调和平均数,第一节 集中趋势的测度,【实用范例5.4】某蔬菜批发市场三种蔬菜的日成交数据如表5.1.4,计算三种蔬菜该日的平均批发价格。 表5.1.4 某日三种蔬菜的批发成交数据,第一节 集中趋势的测度,【实用范例5.5】菜场上有l元钱起售的蔬菜,若某人早上用l元钱购买了一种蔬菜共3公斤,每公斤033元;中午

6、降价时又用1元钱买了4公斤,每公斤025元;晚上削价处理时又用1元钱买了5公斤,每公斤02元,现在问,某人早中晚各用1元钱购买的蔬菜平均每公斤多少钱? 1.如已知早上买3公斤、中午买4公斤、傍晚买5公斤,又知价格分别为033元公斤、025元公斤、02元公斤,则可用加权算术平均数方法计算平均价格:,第一节 集中趋势的测度,2.若已知早上买l元钱、中午买l元钱、傍晚也买l元钱,又知价格分别为033元公斤、025元公斤、02元公斤。这时由于每次购买的公斤数未知,就不能用加权算术平均方法,而要用调和平均方法计算其平均价格:,第一节 集中趋势的测度,三、几何平均数 几何平均数是n个变量值乘积的n次方根,

7、常用于发展速度、比率(如本利率)等变量的平均。 (一)简单几何平均:,(二)加权几何平均:,第一节 集中趋势的测度,几何平均也可用对数的算术平均形式表示。因此,几何平均数也称“对数平均数”。这时,简单几何平均数:,加权几何平均:,第一节 集中趋势的测度,【实用范例5.6】某企业生产某种产品须经过三个连续作业车间才能完成。若某月份第一车间粗加工产品的合格率为95,第二车间精加工产品的合格率为93,第三车间最后装配合格率为90,则该产品的企业合格率(即三个车间的平均合格率)为多少?,第一节 集中趋势的测度,【实用范例5.7】投资银行某笔投资的年利率是按复利计算的,若将过去25年的年利率资料整理为如

8、下变量数列,求25年的平均年利率。 表5.1.5 投资年利率分组表,第一节 集中趋势的测度,四、中位数 中位数是将总体各单位的标志值按大小顺序排列,处于中间位置的那个标志值。它把全部标志值分成两部分,一半标志值比它小,一半标志值比它大。 (一)由未分组资料计算中位数,第一节 集中趋势的测度,四、中位数 中位数是将总体各单位的标志值按大小顺序排列,处于中间位置的那个标志值。它把全部标志值分成两部分,一半标志值比它小,一半标志值比它大。 (一)由未分组资料计算中位数,若n为奇数,则对应于中位数位次的那个变量值即为中位数。,若n为偶数,则对应于中位数位次左、右相邻两个变量值的简单算术平均数即为中位数

9、。,第一节 集中趋势的测度,设五个工人的日产量(件)依次排列为10、11、12、13、14,则:,设有六个工人的日产量(件)依次排列为10、11、12、13、14、15,则:,(二)由分组资料计算中位数,中点位次为3 5说明中位数的位置在第3位与第4位的中间,取相邻两个变量值的简单算术平均为中位数,即:,第一节 集中趋势的测度,【实用范例5.8】某生产车间120名工人生产某种零件的日产量分组资料如表5.1.6所示,计算该车间工人日产量的中位数。 表5.1.6 某生产车间工人日产量分组资料,第一节 集中趋势的测度,【实用范例5.9】某市1993年城市住户抽样调查资料如表5.1.7所示。计算该城市

10、住户家庭月收入的中位数。 表5.1.7 某市1993年城市住户收入抽样调查资料,第一节 集中趋势的测度,五、众数 众数是指总体中出现次数最多的标志值,它能够鲜明地反映数据分布的集中趋势。 众数通常按分组资料计算。由单项数列计算众数时,把次数最多的组定为众数组,该组的变量值即为众数。 由组距数列计算众数,也要先确定众数组,然后利用上限公式或下限公式计算众数。 下限公式:,上限公式:,第一节 集中趋势的测度,【实用范例5.10】根据1993年城市住户抽样调查50户家庭月收入资料计算众数,次数最多的组即第三组为众数所在组,将有关数据代入上述两公式计算众数。 根据下限公式计算:,根据上限公式计算:,第

11、一节 集中趋势的测度,六、位置平均数与算术平均数的关系 (一)运用中位数、众数和算术平均数的数量关系判别总体分布特征 次数分布完全对称,即呈对称分布曲线时,算术平均数和中位数、众数三者完全相等。,第一节 集中趋势的测度,次数分布为右偏态时,算术平均数大于中位数且大于众数。,次数分布在左偏态时,算术平均数小于中位数且小于众数。,第一节 集中趋势的测度,(二)利用位置平均数与算术平均数的关系进行推算 根据经验,在分布偏斜程度不大的情况下,不论右偏或左偏态,算术平均数、中位数、众数存在一定的比例关系,中位数居中间,众数与中位数的距离约为算术平均数与中位数的距离的2倍,即:,由此可以得到三个推算公式:

12、,第一节 集中趋势的测度,【实用范例5.11】根据某城市住户家庭月收入的抽样调查资料计算得到众数为1040元,中位数为112857元,问算术平均数约为多少?其分布呈何形态?,第二节 离散程度的测度,一、极差 极差也称全距,是指总体分布中最大标志值与最小标志值之差。 通常用R表示全距。即,极差不能说明整体的差异程度,尤其是存在极端值情况下,使用极差往往会造成错误的结论。,第二节 离散程度的测度,二、平均差 平均差是各标志值与其平均数的绝对离差的算术平均。 根据未分组的资料计算平均差的公式为:,根据分组资料计算平均差的公式为:,第一节 集中趋势的测度,【实用范例5.12】某车间200名工人按日产量

13、分组资料如表5.2.1所示,计算工人日产量的平均差。 表5.2.1 200名工人日产量资料平均差计算表,第二节 离散程度的测度,三、标准差和方差 标准差是总体各单位标志值与平均数离差平方平均数的平方根,亦称均方差。标准差的平方即为方差。 根据未分组资料计算:,根据分组资料计算:,第一节 集中趋势的测度,【实用范例5.13】甲乙两企业某年各月总产值资料如表5.2.2所示。分别计算它们全年平均月产值及月产值分布的标准差。 表5.2.2 两企业各月产值资料对比分析计算表,离差,离差平方,离差,离差平方,第二节 离散程度的测度,根据上列资料计算得到:,实际应用中,标准差可采用下列简捷计算公式: 根据未

14、分组资料计算:,根据分组资料计算:,第一节 集中趋势的测度,【实用范例5.14】根据表5.2.3所示的数据,利用标准差的简便计算公式,计算该公司职工日工资的标准差。 表5.2.3 某公司职工日工资统计表,=368(元日),第二节 离散程度的测度,四、离散系数 离散系数是指消除平均数影响后的标志变异指标,其形式为相对数,因此,也称为标志变异相对数指标。常用的离散系数是平均差系数和标准差系数。计算公式如下:,第一节 集中趋势的测度,【实用范例5.15】设有两个班组的工人日产量资料如表5.2.4、表5.2.5所示。 表5.2.4 甲组 表5.2.5 乙组,第二节 离散程度的测度,计算各种标志变异指标

15、分别如表5.2.6所示。 表5.2.6 标志变异指标比较表,标准差,标准差系数,第三节 偏态与峰度的测度,一、偏度 偏度(Skewness)是描述数据分布偏斜性的测度。它是和正态分布相比较的。一般而言: 偏度=0 分布形态与正态分布偏度相同 偏度0 正偏差数值较大,为正偏或右偏。长尾巴拖在右边。 偏度0 负偏差数值较大,为负偏或左偏。长尾巴拖在左边。 Excel中的计算公式:Skew=,第三节 偏态与峰度的测度,第三节 偏态与峰度的测度,二、峰度 峰度(Kurtosis)是描述数据分布形态陡缓程度的测度。它是和正态分布相比较的。一般而言: 峰度=0 与正态分布的陡缓程度相同。 峰度0 比正态分布的高峰更加陡峭尖顶峰 峰度0 比正态分布的高峰来得平台平顶峰 Excel中的计算公式:Kurt=,第四节 本章内容用Excel

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号