统计学第三章数据的特征值

上传人:tian****1990 文档编号:82084796 上传时间:2019-02-23 格式:PPT 页数:100 大小:1.23MB
返回 下载 相关 举报
统计学第三章数据的特征值_第1页
第1页 / 共100页
统计学第三章数据的特征值_第2页
第2页 / 共100页
统计学第三章数据的特征值_第3页
第3页 / 共100页
统计学第三章数据的特征值_第4页
第4页 / 共100页
统计学第三章数据的特征值_第5页
第5页 / 共100页
点击查看更多>>
资源描述

《统计学第三章数据的特征值》由会员分享,可在线阅读,更多相关《统计学第三章数据的特征值(100页珍藏版)》请在金锄头文库上搜索。

1、2019/2/23,1,第一节 集中趋势数值平均数 第二节 集中趋势位置平均数 第三节 离中趋势的测度 第四节 偏度与峰度的 测度,第三章 数据分布特征的描述,2019/2/23,2,本章重点与难点,重点: 了解和掌握算术平均数、众数、中位数、方差、标准差、标准分数的含义及其计算方法;正确使用离散系数比较不同均值的代表性。 难点: 是偏度和峰度的含义及其计算方法。,2019/2/23,3,学习目标,正确理解平均指标与变异指标的概念的、意义与作用,明确其种类和区别;掌握平均指标和变异指标的计算方法,以及应用的原则和条件;掌握偏度和峰度的含义及其计算方法;了解各种分位数的概念与意义。,2019/2

2、/23,4,数据分布的特征:,一、集中趋势:反映数据向其中心靠拢或 聚集 程度; 二、离中趋势;数据远离中心的趋势(又称离散 程度); 三、偏态和峰态;偏态是对数据分布对称性的度 量;峰度是指数据分布的平峰或尖峰程度 (形状)。,数据分布的特征,数据分布特征的测度,2019/2/23,7,第一节 集中趋势数值平均数 p75,一、算术平均数 二、调和平均数 三、几何平均数,数 值 型 数 据 的 平 均 数,2019/2/23,8,集 中 趋 势 (central tendency),一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据水平的代表值或中心值 不同类型的数据用不同的集中趋势

3、测度值 注意:低层次数据的测度方法也适用于高层次的数据,但高层次数据的测度方法往往不适用于低层次的数据。,2019/2/23,9,一、算术平均数,均值(算术平均数)定义:将一组数据相加后除以数据的个数所得到的一个数值,称为算术平均数(average)或均值(mean)。 算数平均数, 又有简单算数平均数和加权平均数之分,一、算术平均数,设一组数据为: x1 ,x2 , ,xn (未分组数据) 各组的组中值为:x1 ,x2 , ,xk ( 组距分组数据) 相应的频数为: f1 , f2 , ,fk,简单算术平均数,加权算术平均数,【例3.1】根据表3.1中的数据,计算职工通信费用支出额平均水平

4、。p72 解:,身高 组中值 人数 比重 (cm) xi(cm ) fi(人) (%) 150- 155 152.5 3 3.61 155-160 157.5 11 13.25 160-165 162.5 34 40.96 165-170 167.5 24 28.92 170以上 172.5 11 13.25 总计 - 83 100.00,例3.2 分组资料均值的计算: 某年级83名女生身高资料,组距数据,次数 f,频率 f/f,变量值 x,加权算术平均数,【例3.3】依据整理所得表3-5中的数据,计算职工通信费用支出额平均水平 。p74 解: 或,2019/2/23,14,计算算数平均数,

5、注意:,用各组的组中值代表其实际数据计算算术平均数时,通常假定各组数据在组内是均匀分布的,相应的组中值近似等于各组的平均数。 权数:衡量变量值相对重要性的数值。 各个变量值的权数要起作用必须具备两个条件: 一是各个变量值之间有差异; 二是各个变量值的权数有差异。 简单算术平均数是加权算术平均数在权数相等时的特例。,2019/2/23,15,算术平均数的性质 p75-76,1各变量值与其算术平均数的离差之和等于零,即 。,算术平均数的性质,集中趋势的最常用测度值; 一组数据的均衡点所在; 易受极端值的影响; 各变量值与其均值的离差之和等于零; 5、 6.由组距分组资料计算的均值有近似值性质; 7

6、、用于数值型数据,不能用于分类数据和顺序数据,算术平均数(均值)特征:,2019/2/23,18,二、调和平均数,调和平均数也称“倒数平均数”,它是对变量的倒数求平均,然后再取倒数而得到的平均数,以 表示。 根据掌握的资料不同,调和平均数也有简单调和平均数和加权平均数两种形式。 其计 算公 式为:,2019/2/23,19,例题分析,【例3.4 假设甲、乙、丙三种苹果的价格分别为每斤2.4元、1.8元及1.5元(1)若三种苹果各买1元,试问所购苹果的平均价格又为多少?(2)如果甲、乙、丙三种苹果分别购买5元、8元和10元,试问其平均价格为多少?,解:计算平均价格的是用所付金额除以所购数量。 (

7、1) (2),2019/2/23,20,计算调和平均数 ,注意:,1.从数学定义角度看算术平均数与调和平均数是不一样的,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,惟一的区别是计算时使用了不同的数据。 2.计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用加权算术平均法;如果已知比率及其基本计算式的分子资料,则采用加权调和平均法。,2019/2/23,21,三、几何平均数 (geometric mean)p78,几何平均数也称几何均值,它是n个变量值乘积的n次方根。 几何平均法是计算平均比率或平均发展速度最适用的一种方法。 如果分布数

8、列中各变量值呈几何级数变化或频率分布极不对称,也常采用几何平均法来计算平均数。 根据统计资料的不同,几何平均数也有简单几何平均数和加权几何平均数之分。,2019/2/23,22,几何平均数的计算公式,用途:适用于对比率数据的平均。主要用于计算平均发展速度、平均增长率、平均比率 对于未分组的资料,几何平均数的计算公式为,补充:发展速度、增长速度概念及关系,环比发展速度 y1/y0 y2/y1 y3/y2 yn/yn-1 定基发展速度 y1/y0 y2/y0 y3/y0 yn/y0 注意:环比发展速度的连乘积=相应的定基发展速度 增长速度= 发展速度-1 环比增长速度=环比发展速度-1 定基增长速

9、度=定基发展速度-1,平均增长率(average rate of increase ),序列中各逐期环比值(也称环比发展速度) 的几何平均数减1后的结果 描述现象在整个观察期内平均增长变化的程度 通常用几何平均法求得。计算公式为,2019/2/23,25,例题分析,【例3.8】 已知某市20012005年国内生产总值的发展速度(以上年为100)依次分别为112%、108%、114%、116%和113%。试计算这5年国内生产总值的平均发展速度。,如果已知的是各年的增长速度,要计算若干年的平均增长速度,则需要先将增长率加上100%得到发展速度,再根据上述方法计算平均发展速度,最后用平均发展速度减1

10、00%则得到平均增长速度。,2019/2/23,26,例题分析,【例3.9】 甲投资银行某项投资的年利率是按复利 计算的,若将过去20年的年利率资料如表3.9所示. 要求:试计算20年的平均年利率。,解:,2019/2/23,27,应用几何平均数时注意,几何平均数在实际应用中受到很多限制; 如果被平均的变量值中有一个为零,则不能计算几何平均数; 如果变量值为负数,开偶次根会形成虚根,失去意义; 几何平均数在实际应用中的范围比算术平均数要窄。,2019/2/23,28,几何平均数的特点,1几何平均数受极端值的影响较算术平均数小。 2如果变量值有负值,计算出的几何平均数就会成为负数或虚数。 3它仅

11、适用于具有等比或近似等比关系的数据。 4几何平均数的对数是各变量值对数的算术平均数。,2019/2/23,29,第二节 集中趋势位置平均数 p80,一、众数 Mo 二、中位数Me 三、四分位数QU、QL,2019/2/23,30,集中趋势位置平均数,位置平均数,就是根据总体中处于特殊位置上的个别单位或部分单位的标志值来确定的代表值; 对于整个总体来说,具有非常直观的代表性,常用来反映分布的集中趋势; 常用的位置平均数有众数和中位数。,2019/2/23,31,一、众数 p80,(一) 众数的含义 众数是指一组数据中出现次数最多的变量值,用 表示。 众数直观地说明分布的集中趋势,并用它作为反映变

12、量值一般水平的代表值。 在某些场合只有众数才适合作为总体的代表值。,2019/2/23,32,(二) 众数的计算方法,1观察法求众数 如果数据已按单个变量值整理成频率分布表或者是分类数据表,则次数出现最多或频率最大的那个变量值即为众数。 【例3.11】 某制鞋厂要了解消费者最需要哪种型号的男皮鞋,调查了某百货商场2005年10月男皮鞋的销售情况,得到资料如表3.10所示。,众数的计算- 例题分析,要求:试根据上表资料计算男皮鞋销售量的众数。,解:销售量最多的是规格为25.5厘米的鞋号,销售量320双,占32%,故众数为25.5公分。,众数的计算- 例题分析 p81,【例3.10】 某高校电影院

13、在安排2010年影片放映计划时,分别 按性别随机抽取200名男女学生,登记其对影片类型的取向。统 计结果如表3.10所示。要求:试分析学生对影片取向的集中趋势。,解: 7种类型的影片中,男生最喜欢看动作片,人数为48人,占24%,众数即为动作片这种影片类型;女生最喜欢看言情片,人数为46人,占23%,众数即为言情片这种影片类型;男女生对影片类型的取向,综合而言是动作片,众数为动作片这种影片类型。,2019/2/23,35,数值型数据众数的确定方法 单变量值分组资料,某年级83名女生身高资料,身高 人数 (CM) (人) 152 1 154 2 155 2 156 4 157 1 158 2 1

14、59 2 160 12 161 7 162 8 163 4,身高 人数 (CM) (人) 164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1 总计 83,STAT,众数,2019/2/23,36,注意:,众数不仅适用于测度顺序数据和数值型数据的集中趋势,而且适用于测度不能计算平均数的分类数据的集中趋势。,2019/2/23,37,众数的计算方法,2插值法求众数 对于组距分组形成的分布数列,当频率分布属于完全对称分布,而众数所在组的变量值分布比较均匀时,可用观察法求众数,即以众数组的组中值作为所求的众数。 完全对称分布不存在,众

15、数组前后各组的次数不一定相等,众数就不等于组中值,因此需要采用插值法求众数。,2019/2/23,38,组距分组数据,众数的计算步骤,1、先找到众数所在的组; 2、按该组次数与前后相邻两组分布次数之差所占的比重来推算众数值。 如果众数组前一组的次数大于后一组的次数,则众数值小于其所在组的组中值;反之,众数值则大于其所在组的组中值; 若众数组前后相邻组的次数相等,则众数值等于其所在组的组中值。 3、计算众数有上限和下限公式之分。,2019/2/23,39,众数的计算方法,身高 人数 比重 (CM) (人) (%) 150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上 11 13.25 总计 83 100,某年级83名女生身高资料,数值型数据众数的确定方法 组距分组资料,STAT,众数组,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号