统计学之变量分布特征的描述

上传人:luobi****88888 文档编号:94013165 上传时间:2019-07-31 格式:PPT 页数:97 大小:2.44MB
返回 下载 相关 举报
统计学之变量分布特征的描述_第1页
第1页 / 共97页
统计学之变量分布特征的描述_第2页
第2页 / 共97页
统计学之变量分布特征的描述_第3页
第3页 / 共97页
统计学之变量分布特征的描述_第4页
第4页 / 共97页
统计学之变量分布特征的描述_第5页
第5页 / 共97页
点击查看更多>>
资源描述

《统计学之变量分布特征的描述》由会员分享,可在线阅读,更多相关《统计学之变量分布特征的描述(97页珍藏版)》请在金锄头文库上搜索。

1、信息技术教研中心,1,本资料来源,信息技术教研中心,2,第章 变量分布特征的描述,教师姓名: 杨凡 Email: 手机:15908161946 QQ:546529654,信息技术教研中心,3,第章 变量分布特征的描述,重点节:第一节 第一节 集中趋势的描述 第二节 离中趋势的描述 第三节 分布形状的描述,信息技术教研中心,4,学习内容及要求,理解变量分布三大特征及平均指标、离散指标的意义; 熟练掌握各种平均指标的计算方法及其相互之间的关系; 熟练掌握各种离散指标的计算方法; 掌握偏度和峰度系数的计算方法。,信息技术教研中心,5,集中趋势亦称为趋中性,是指变量分布以某一数值 为中心的倾向。作为中

2、心的数值就称为中心值,它反映 变量分布中心点的位置所在。 变量分布的集中趋势要用平均指标来反映。平均指标 是将变量的各变量值差异抽象化、以反映变量值一般水平 或平均水平的指标,也就是反映变量分布中心值或代表值 的指标。 平均指标的具体表现称为平均数,平均数因计算方法 不同可分为数值平均数和位置平均数两类。,第一节 集中趋势的描述 重点:数值平均数 一、集中趋势与平均指标,信息技术教研中心,6,是同质总体某标志值的一般水平 . (与强度相对数有别_两总体,性质不同,总量比总量) 反映总体各单位变量分布的集中趋势. (与变异指标有别 _ 反映离中趋势) (与序时平均数有别_用时间数列计算) 对某类

3、现象作综合分析和评价时,若两者的总量 差异过大,则可用平均数去对比。如: 甲企业总产值800000元,职工1000人; 乙企业总产值8000元,职工8人。 两个企业相比 因 总产值差异太大, (8000008000), 甲乙 故 用劳动生产率比较, (8001000). 甲乙,返回,信息技术教研中心,7,作用:,1、反映总体各单位变量分布的一般水平。 (比如:“农民家庭收入”高低) 2、比较同类现象在不同单位、地区、及总体各部分的差别。 (比如:用“劳动生产率”或“亩产量”来比较评价不同工业 企业或乡村的生产情况。) 3、分析现象之间的相互依存关系。 (比如:劳动生产率与单位产品价格之间的关系

4、; 施肥量与亩产量之间的关系。) ,信息技术教研中心,8,平均指标按其计算方法不同可分为: 数值平均数和位置平均数两类。 数值平均数:算术平均数、几何平均数。 位置平均数:中位数、众数。 二、数值平均数 (一) 算术平均数(亦称均值) 算术平均数是变量的所有取值的总和 除以变量个数的结果。,信息技术教研中心,9,例:平均人数=总人数 / 企业数 劳动生产率=产品产量 / 职工人数 平均工资=工资总额 / 职工人数 单位产品成本=总成本 / 总产量 单耗=原材料消耗总量 / 产品产量,返回,信息技术教研中心,10,1.简单算术平均数_标志未分组时,例 : 根据10个男篮队员的身高,计算平均身高,

5、信息技术教研中心,11,2、加权算术平均数_标志已分组,数量标志已分组 , 就形成了,单项式 组距式,单项式变量数列(表3-1) 组距式变量数列(表3-3),各组单位数(权数)所占比重的大小,直接影响平均数的大小。 表3-1: 若将各组人数排列顺序倒置,则分布频率相反,平均数也发生相应变化(变小)。,10 8 6 4 2,300 310 320 330 340 350 出口额,人数,信息技术教研中心,12,信息技术教研中心,13,权数(次数 . 一般多指总体单位数) 权衡轻重(影响平均数的大小) 权数的两种形式绝对数(次数)常用 f 表示; 相对数(比重)常用 表示. 计算公式如下:,*这种写

6、法在平均指标指数分析时有独特的意义作用。,信息技术教研中心,14,两种算法结果相同,都是325.36万元。,信息技术教研中心,15,组距式分组 各组标志是一个数值区间 表3-4 某高校教师平均年龄计算表,(*各组标志值X以该组的组中值为代表值),信息技术教研中心,16,根据组距数列计算加权算术平均数的方法的说明,假定条件:组内均匀分布或对称分布,组间分布可以不等。 X用各组的组中值(代表组平均水平) 开口组的组距以邻组组距为依据,从而计算确定出本 组组中值。所以,计算的结果是一个近似值。,信息技术教研中心,17,补充: 算术平均数的影响因素,算术平均数除受标志值出现次数(比重)的影响外(如前例

7、图示), 还受极端值的影响. 图示: x,300 250 200 150 100 50 0,1 2 3 4 5 6 7 8 9 10 f,即俗话所说的“一颗老鼠屎打坏一锅汤”,出现一个最大值,平均数会上移,一般正常分布下的平均数,出现一个最小值,平均数会下移,。,。,信息技术教研中心,18,3.算术平均数的数学性质 1) 各变量值与算术平均数的离差之和等于零,即:,(对于简单算术平均数) (对于加权算术平均数),信息技术教研中心,19,各变量值与算术平均数的离差平方之和为最小值,即:,只有当 时,等号成立。,信息技术教研中心,20,4.算术平均数的优缺点 算术平均数具有以下几个优点: 一是可以

8、利用算术平均数来推算总体标志总量,因为算术平均数与变量值个数之乘积等于总体标志总量 二是由算术平均数的两个数学性质可知,算术平均数在数理上具有无偏性与有效性(方差最小性)的特点,这使得算术平均数在统计推断中得到了极为广泛的应用 三是算术平均数具有良好的代数运算功能,即分组算术平均数的算术平均数等于总体算术平均数。 算术平均数也有其局限性,主要表现在以下两个方面: 一是算术平均数易受特殊值(特大或特小值)的影响,当变量 存在少数几个甚至一个特别大或特别小的变量值时,就会导致 算术平均数迅速增大或迅速变小,从而影响对变量值一般水平 的代表性; 二是根据组距数列计算算术平均数时,由于组中值 具有假定

9、性而使得计算结果只是一个近似值,尤其是当组距数 列存在开口组时,算术平均数的准确性会更差。,信息技术教研中心,21,(二)调和平均数 调和平均数_标志值倒数的算术 平均数的倒数。故亦称倒数平均数。 根据资料是否分组,而分为简单 或加权调和平均数.加权调和平均数 使用特定形式的权数( m = xf ).,信息技术教研中心,22,(二)调和平均数 1.简单调和平均数 当各组的标志总量相等时,所计算的调和平均数称为简单调和平均数。设总体分为k个组,每个组的标志总量都为m,则总体标志总量为km。现仍以x表示各组变量值,以H表示调和平均数,则简单调和平均数的计算公式为:,信息技术教研中心,23,例题:某

10、副食商店在两个农贸 市场收购某种农副产品,其收 购单价如下,计算该种农副产 品的平均价格。,信息技术教研中心,24,2.加权调和平均数,当各组的标志总量不相等时,所计算的调和平均 数要以各组的标志总量为权数,其结果即为加权调和 平均数。若以 表示各组标志总量,则加权调和平均 数的计算公式为:,(可简记为 ),信息技术教研中心,25,P46 例3-6: 不知道各市买的公斤数f的值,但是,可以间接求出。,信息技术教研中心,26,3、用相对数或平均数计算平均数 (用加权算术平均数求解) 例3-7: 某零售公司20家分店销售计划完成情况:,信息技术教研中心,27,用相对数或平均数计算平均数 (用加权调

11、和平均数求解) 例3-7: 某零售公司20家分店销售计划完成情况:,信息技术教研中心,28,信息技术教研中心,29,经验: 若要求平均工资、平均单位成本、平均计划完 成程度等指标时,所给资料与计算方法的关系为: 当已知权数f(分母)的直接数据资料,而无 标志总量时,采用算术平均数. (比如:已知人数, 产品数, 企业数、计划数) 当缺乏权数f(分母)的直接数据资料,而有 标志总量时,采用调和平均数。 (比如:已知工资总额,成本总额,利润额、实际数),信息技术教研中心,30,算术(调和)平均数一览表,信息技术教研中心,31,(三) 几何平均数 几何平均数通常用在总量等于各分 量乘积的情形。比如,

12、求某些平均比率, 平均速度等。,信息技术教研中心,32,例3-9: 某流水生产线前后衔接的五个车间(工序)产品 的合格率分别为96%、94%、95%、95% 、 96%,整个流水线产平均合格率(全厂平均合格率)?,五个车间(工序)的产品平均合格品率为95.2%. 思考:为什么要用几何平均数计算?,信息技术教研中心,33,例3-10 某企业10年销售收入的平均发展速度,又例:某金融机够以复利方式计息。近12年来的 年利率有4年为3%、 2年为5% 、 2年为8%、 3年为10%、1年为15%,则12年的平均年利率?,信息技术教研中心,34,(四)算术平均数、调和平均数、 几何平均数 的数学关系,

13、从数学上看,三者都是幂平均数中的一种。 幂平均数的定义是: 当 t =1时,幂平均数就是算术平均数; 当 t = -1时,幂平均数就是调和平均数; 当 t 趋向欲0时,幂平均数的极限形式就是 几何平均数; 从数学意义上看,三者的数量大小的关系是: H G ,信息技术教研中心,35,三、位置平均数 1. 中位数(Median) _是根据变量值的位置来确定的平均数。将变量值按大小顺序排序,处于中间位置的变量值(或数据)即中位数,用 表示。由于中位数是位置代表值,所以不会受极端值的影响,具有较高的稳健性。 (下图中,斜线表示总体单位(组)的累计数; 横线表示某现象按标志值的大小排序。),50 %,返

14、回,sm,50%,me,me,标志值,累计次数,信息技术教研中心,36,中位数位置的确定,信息技术教研中心,37,(1)根据未分组的原始数据确定中位数 数据是基数项,原始数据: 33 28 38 35 50 排 序: 28 33 35 38 50 位 置: 1 2 3 4 5,信息技术教研中心,38, 数据是偶数项,原始数据: 79 72 66 87 95 100 排 序: 66 72 79 87 95 100 位 置: 1 2 3 4 5 6,信息技术教研中心,39, 根据变量分布数列确定中位数 (即在组距数列中确定中位数),涉及“定组”和“定值”两个步骤.即首先确定出中位数的 位置在哪一组

15、;再确定(用公式计算)中位数的值具体是多少。 “定组”所使用的次数是累计次数. 方法: 计算向上(下)累计次数;,确定中位数的位置: 总体单位数刚好包含f /2 的所在组即是中位数组 ; 确定中位数(用公式):,信息技术教研中心,40,其中: L: 为中位数组的下限; U: 为中位数组的下限 f :为总次数; Sm -1: 为中位数组前一组的向上累计次数; Sm+1: 为中位数组前一组的向上累计次数; fm: 为中位数组的次数; d: 为中位数组的组距。,该公式假定中位数组的频数在该组内均匀分布。,信息技术教研中心,41, 在单项式数列中确定中位数: 例3-13,确定中位数的位置: 总体单位数刚好包 含f /2 的所在组 (即中位数组) 150/2=75 确定中位数: 对应的那个(唯一的)标志值就是中位数。 me =25,信息技术教研中心,42,组距式数列计算中位数 例表2-3 某高校教师年龄分组表 (累计数),确定中位数的位置:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号