统计学 第4章 综合指标与数据分布特征

上传人:woxinch****an2018 文档编号:44706671 上传时间:2018-06-14 格式:PPT 页数:42 大小:507KB
返回 下载 相关 举报
统计学 第4章  综合指标与数据分布特征_第1页
第1页 / 共42页
统计学 第4章  综合指标与数据分布特征_第2页
第2页 / 共42页
统计学 第4章  综合指标与数据分布特征_第3页
第3页 / 共42页
统计学 第4章  综合指标与数据分布特征_第4页
第4页 / 共42页
统计学 第4章  综合指标与数据分布特征_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《统计学 第4章 综合指标与数据分布特征》由会员分享,可在线阅读,更多相关《统计学 第4章 综合指标与数据分布特征(42页珍藏版)》请在金锄头文库上搜索。

1、 第四章 综合指标与数据分布特征第一节 总量指标 第二节 相对指标 第三节 数据分布集中趋势的测定 第四节 数据分布离散程度的测定 第五节 分布的偏度与峰度第一节 总量指标一、总量指标的概念、作用和种类 1、总量指标:是反映社会经济现象在一定时间、地点 、条件下的总体规模或水平的统计指标。也称绝对 数指标,其表现形式是绝对数。 2、总量指标的作用 3、总量指标的种类v按反映总体内容不同:总体单位总量和总体标志总 量v按反映时间状态不同:时期指标和时点指标时期指标和时点指标的区别:是否连续登记、是否 具有累加性、指标数值大小是否受时间长短制约。第一节 总量指标二、总量指标的计量单位 1、实物单位

2、v自然单位v度量衡单位v标准实物单位 2、货币单位 3、劳动单位指标类型登记方式累加性时间制约时期指标连续登记具备受时间长 短制约时点指标间断登记不具 备与时间间 隔长短无 关第二节 相对指标一、相对指标的概念和作用 1、相对指标:是两个有联系的指标对比计算的比率 ,反映事物在时间、空间、事物本身内部及不同事 物之间的联系程度和对比关系,也称相对数。 2、相对指标的作用二、相对指标的种类及计算方法 1、结构相对指标结构相对数=(总体部分数值总体全部数值)100%2、比例相对指标比例相对数=总体中某部分数值总体中另一部分数值第二节 相对指标3、比较相对指标:同类事物不同空间的静态比较比较相对数=

3、甲地区某一现象的水平乙地区同类现象的水平4、计划完成程度相对指标计划完成相对数=(实际完成数计划任务数)100%5、强度相对指标:性质不同但有联系的指标对比强度相对数=某一总量指标数值另一有联系而性质不同的总量指标数值6、动态相对指标动态相对数=报告期指标数值基期指标数值第二节 相对指标三、计算和运用相对指标的原则 1、可比原则要求分子、分母在:内容、范围、计算方 法、计算价格、计量单位等可比。 2、相对指标和总量指标结合运用的原则 3、相对指标和多个指标结合运用原则第三节 数据分布集中趋势的测定平均指标一、平均指标的概念及特点 1、平均指标:又称平均数,指同类现象在一定时间 、地点、条件下达

4、到的一般水平。 2、平均指标的特点v将数量差异抽象化v只能就同类现象计算v能反映总体变量的集中趋势 3、平均数有数值平均数和位置平均数两种v数值平均数是根据数据分布中的全部标志值计算得 到的,有算术平均数、调和平均数、几何平均数。v位置平均数是根据数据分布中的某些标志值在总体 中所处的位置来确定的,有众数、中位数。二、算术平均数算术平均数也称均值,是全部数据的算术平均。 1、简单算术平均数 (适用于未分组情况)例:某企业的一个生产班组有5名工人,其月工资分 别为700元、750元、800元、850元、900元。则这5 名工人的月平均工资为:第三节 数据分布集中趋势的测度2.加权算术平均数(适用

5、于已分组情况)例:某车间有50名工人,日生产某种零件如表1所 示,试求工人平均日产零件数。 解:工人平均日产零件数:第三节 数据分布集中趋势的测度表1: 日产零件加权平均数计算表 第三节 数据分布集中趋势的测度v 权数除用次数(频数)表示外,还可以用比重 (频率)表示。公式如下:例: 仍以表1资料为例,采用比重计算加权算术平 均数,平均每个工人日产零件数为:第三节 数据分布集中趋势的测度三、调和平均数调和平均数是总体各单位变量值倒数的算 术平均数的倒数,又称倒数平均数。1.简单调和平均数第三节 数据分布集中趋势的测度例:设某组5个学生的考试分数为70、 80、85、90、92,则5个学生成绩的

6、调和 平均数为: 第三节 数据分布集中趋势的测度2.加权调和平均数例: 某厂工人工资资料如表2所示,据此资料工人 平均工资为:第三节 数据分布集中趋势的测度表2 某工厂工人工资情况及平均工资计算表第三节 数据分布集中趋势的测度例: 已知某公司各企业产值计划完成程度及实际 完成数如表3所示,则全公司计划完成程度(即 各企业平均计划完成程度)为: 第三节 数据分布集中趋势的测度表3 某公司所属企业产值计划完成情况及 平均数计算表第三节 数据分布集中趋势的测度四、几何平均数 1.简单几何平均数例: 某地区20022006年国内生产总值环比发展 速度分别为108.0%、107.5%、108.3%、10

7、9.3% 、109.5%,则其平均发展速度为:第三节 数据分布集中趋势的测度2.加权几何平均数例:某银行对企业的一笔十年期的投资年利率是 :第1至3年是7%,第4至6年是8,第7至9年 是9,第10年是10。则平均年利率是:即平均年利率为 8.2。第三节 数据分布集中趋势的测度五、众数众数指总体或分布数列中,出现频数最多或 出现频率最高的那个标志值。如下图:v单项式数列和组距式数列的众数计算方法不同 。第三节 数据分布集中趋势的测度1.单项式数列的众数确定:统计分组以后找出 出现次数最多的标志值即可。某村农民按家庭儿童人数分组家庭按儿童数分组 (个/户)家庭数(户)0 1 2 3 44065

8、1259040合 计360 l在这个 例 子中,众数 就是两个儿 童。第三节 数据分布集中趋势的测度2.组距式数列众数的确定:先确定众数所在的组 (标志值出现最多的组),然后计算以求得近 似的众数值。或为:第三节 数据分布集中趋势的测度例:某县农民家庭按人均纯收入分组资料如表4所 示,求众数。解:表4表明,人均纯收入30004000元组户数最 多,故该组为众数组。其中,XL=3000、XU=4000、 d=1000, 260-236=24, 260-223=37。 按下限公式计算:按上限公式计算:即农民家庭人均收入众数为3393.44元。第三节 数据分布集中趋势的测度按人均纯收入额分 组(元)

9、农 户 数累 计 次 数向 上 累 计向 下 累 计1000以下 10002000 20003000 30004000 40005000 5000以上44 79 236 260 223 15844 123 359 619 842 10001000 956 877 641 381 158合 计1000表4 某县农民家庭人均纯收入中位数计算表第三节 数据分布集中趋势的测度3、众数的特点:不受极端值的影响一组数据可能没有众数或有几个众数无众数 原始数据:10 5 9 12 6 8一个众数 原始数据: 6 5 9 8 5 5多于一个众数 原始数据: 25 28 28 36 42 42第三节 数据分布集

10、中趋势的测度六、中位数把总体各单位的标志值按大小顺序排列后, 处于中点位置的标志值就是中位数。如:v未分组数列和分组数列中位数的求法不同第三节 数据分布集中趋势的测度1.未分组数列的中位数l把总体各单位的标志值从小到大顺序排列。l若数列有奇数项,中位数就是数列中间位次上的 那个标志值。l若数列有偶数项,中位数就是数列中间两个位次 上标志值的平均数。 例:某组有5名工人,年龄(岁)分别为34、35、36 、37、38,则中点位置为 ,中位数为 第三个工人的年龄36(岁)。如果有6名工人,年 龄(岁)分别为34、35、36、37、38、39,则中 点位置 为 ,中位数为第三个工人和第四个工 人年龄

11、的简单算术平均数36.5(岁)。 第三节 数据分布集中趋势的测度2.分组数列的中位数l单项式分组:首先确定中位数所在的组,即累计 频数达到f/2,然后确定中位数的具体值。 某村农民按家庭儿童人数分 组f/2=360/2=180和 f/2+1=360/2+1=181中位数的位置是在第 180和181家庭之间。从 第一组家庭户数开始向 后累加至180181户, 即中位数是两个儿童。家庭按儿童数分组 (个/户)家庭数(户 )0 1 2 3 44065 1259040合 计 360第三节 数据分布集中趋势的测度l组距式分组数列的中位数求法 (1)先确定中位数所在的组:求f/2,从第一组的总体单位数开始

12、向后累加 至f/2止 (2)计算中位数的近似值:下限公式:上限公式:第三节 数据分布集中趋势的测度例:根据表4的资料确定中位数。 解:据表中资料计算: ,第四组为中位数组。 XL=3000 XU=4000 d=10 359 381按上限公式计算中位数: 第三节 数据分布集中趋势的测度众数、中位数、均值的关系 1、对称分布:众数=中位数=均值 2、右偏分布: 众数中位数均值左偏分布左偏分布均值均值 中位数中位数众数众数对称分布对称分布均值均值 = = 中位数中位数 = = 众数众数右偏分布右偏分布众数众数中位数中位数均值均值第三节 数据分布集中趋势的测度第四节 数据分布离散程度的测定标志变异指标

13、一、标志变异指标 1、概念:是反映同质总体各单位标志值的差异程度 ,即数列的离散趋势的指标,又称标志变动度。 2、作用:v衡量平均指标的代表性v反映社会经济活动过程的均衡性v标志变异指标是统计分析的一个基本指标 3、种类:全距、四分位差、平均差、标准差、离散系数二、全距R 1、定义:全距也称极差,是一组数据的最大值与最小值 之差,是离散程度的最简单测度值。 2、计算:v未分组数据:R=最大值-最小值v分组数据:R=最大组上限-最小组下限 3、特点:v计算方便,便于理解v易受极端值影响v未考虑数据的分布第四节 数据分布离散程度的测定三、四分位差IQR1、定义:四分位差也称内距或修正极差,是上四分

14、位数与 下四分位数之差。 2、计算:内距= 上四分位数 下四分位数=Q3 Q13、特点:v反映了中间50%数据的离散程度v不值受极端的影响,v可以衡量中位数的代表性高低第四节 数据分布离散程度的测定第四节 数据分布离散程度的测定四、平均差A.D. 1、定义:平均差是数列中各单位标志值与平均数之差绝对 值的平均数。 2、计算:v未分组数据:v分组数据: 3、特点:v全面反映标志值的差异程度v不适合代数方法的演算使其使用受到限制五、方差和标准差 1、定义:方差是总体各单位某一数量标志的标志值与其算 术平均数的离差平方的平均数。方差的平方根为标准差,又称均方差。 2、计算:v总体方差与标准差v样本方

15、差与标准差 3、特点:v离散程度的最常用的测度值之一v反映了各变量值与均值的平均差异第四节 数据分布离散程度的测定总体方差和标准差(Population variance and Standard deviation)未分组数据 :分组数据:分组数据:未分组数据:未分组数据:分组数据:分组数据:方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式样本方差和标准差(simple variance and standard deviation)未分组数据:分组数据:分组数据:未分组数据:未分组数据:分组数据:分组数据:方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式注意:注意:样本方差用自样本方差用自 由度由度n n-1-1去除去除! !六、离散系数 1、定义:离散系数也称标准差系数,是一组数据的标准差 与其相应的均值之比2、计算:3、特点:v对数据相对离散程度的测度v消除了数据水平高低和计量单位的影响v用于对不同组别数据离散程度的比较第四节 数据分布离散程度的测定七、属性总体的概念及特征值的计算 1、概念:属性总体就是将可以将总体单位分为具有某种标 志的单位和不具有某种标志的单位的总体。可以用“是”或“否”来表示的标志称为是非标志,一 般用“1”表示具有某种

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号