统计学-分布数量特征的统计描述

上传人:206****923 文档编号:56867630 上传时间:2018-10-16 格式:PPT 页数:73 大小:1.72MB
返回 下载 相关 举报
统计学-分布数量特征的统计描述_第1页
第1页 / 共73页
统计学-分布数量特征的统计描述_第2页
第2页 / 共73页
统计学-分布数量特征的统计描述_第3页
第3页 / 共73页
统计学-分布数量特征的统计描述_第4页
第4页 / 共73页
统计学-分布数量特征的统计描述_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《统计学-分布数量特征的统计描述》由会员分享,可在线阅读,更多相关《统计学-分布数量特征的统计描述(73页珍藏版)》请在金锄头文库上搜索。

1、3-1,分布数量特征的统计描述,第一节 分布的平均水平、集中趋势和位置的度量 第二节 分布离散程度的度量 第三节 分布的偏度和峰度,3-2,统计资料经过加工整理形成分布数列后,我们对它的变化规律已有了一个直观的了解。然而,要作进一步的统计分析仅靠这些直观了解是远远不够的,我们还需要寻找一些能充分度量统计分布数量特征的统计指标,以便对不同的研究对象进行分析研究。对统计资料的度量包括:集中趋势的度量(平均指标);离中趋势的度量(变异指标)。,3-3,第一节 统计平均数 众数 中位数,一、统计平均数的含义与作用 (一) 含义:也称平均指标,是用来表示社会经济现象总体各单位某一标志在一定时间、地点条件

2、下所达到的一般水平 (二) 作用 反映总体各单位变量分布的一般水平和集中趋势 比较同类现象在不同单位的发展水平 比较同类现象在不同时期的发展变化趋势或规律 (三) 分类,3-4,静态平均数 同一时间不同单位的数据的平均 反映现象总体在一定历史条件下的一般水平,动态平均数 不同时间同一总体的数据的平均 反映现象在发展阶段上的一般水平,3-5,5,3-6,二、算术平均数,1.算术平均数:总体单位的标志值总量除以总体单位数所得的结果。 基本公式:例: 平均工资=工资总额职工人数单位成本=总成本产量,3-7,2.计算方法,由于所掌握资料的数据不同,有 (1)简单算术平均数。简单算术平均数主要用于未分组

3、资料,用总体各单位标志值简单加总得到的标志总量除以总体单位数而得。计算公式:,3-8,简单算术平均数资料未分组时,6名学生的考试成绩分别为(分)79、82、87、60、95、91,他们的平均成绩是多少? (79+82+97+60+60+95+91)/6=84(分),3-9,(2)加权算术平均数适合于分组资料,1、单项式数列 A. 加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。计算公式: fi 为各组标志值出现的次数。,3-10,3-11,不符合基本公式,总体单位总量不是5个工人,而是800个工人;工人人总产量(总体标志总量)不是60件,而是9710件,所以,应该这样计算:,可以

4、这样计算吗?,不能!,3-12,3-13,B.权数的意义和作用,权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。 当各组的次数都相同时,即当f1=f2=f3=fn时: 加权算术平均数就等于简单算术平均数。,3-14,2.是非标志的平均数,在总体中,具有某种性质的单位占总体的比率为p,不具有该种性质的单位占总体的比率为 q,以1作为具有某种性质的单位的标志值,以0作为不具有该种性质的单位的标志值: p也称为总体中具有某种属性的单位成数,是非标志的平均数。,3-15,3、组距式数列计算算术平均数,x各组的组中值(代表组平均水平)假定条件:组内均匀分布或对称分布一般地,计

5、算结果是近似值。,3-16,16,3-17,原来只是用组中值作为各组的代表值,3-18,4.算术平均数的数学性质,(1)算术平均数与标志值个数的乘积等于各标志值的总和。 简单算术平均数:加权算术平均数:,3-19,(2)各个标志值与其算术平均数的离差之和等于零。 简单算术平均数:加权算术平均数:,3-20,(3)各标志值与算术平均数离差的平方和为最小值。,3-21,三 调和平均数,1.简单调和平均数:标志值的倒数的算术平均数的倒数。,3-22,2.加权调和平均数,计算公式:在权数选择合适时,加权调和平均数实际上是加权算术平均数的变形:,3-23,当各组标志总量相等,m1=m2=mn时,加权调和

6、平均数可化简成为简单调和平均数形式。,3-24,3-25,某供销社分三批收购某种农副产品,其收购单价及各批收购额如下:,3-26,解:,3-27,某公司下属18个企业的计划完成情况(1),3-28,3-29,某公司下属18个企业的计划完成情况(2),3-30,18个企业的平均计划完成百分比:,3-31,四、几何平均数,1.几何平均数:是n项标志值连乘积的n次方根。 2.分类: (1)简单几何平均数:是n个标志值xi连乘积的n次方根。计算公式为:G= 式中G表示几何平均数,xi表示各项标志值。,3-32,(2)加权几何平均数,加权几何平均数是各标志值fi次方的连乘积的次方根,计算公式为:G=,3

7、-33,例:某流水生产线有前后衔接的五道工序。某日各工序产品的不合格率分别为5%、3%、1%、5% 、2%,整个流水线上产品的平均废品率?,平均废品率1 平均合格率196.793.21,3-34,某金融机够以复利方式计息。近12年来的年利率有4年为3%、 2年为5% 、2年为8%、3年为10%、 1年为15%。则12年的平均年利率?,平均年利率=106.82%-1=6.82,加权几何平均数,加权几何平均法,3-35,五、 众数 Mo,1.定义:众数是指社会现象总体中最普遍出现的标志值。 集中趋势的测度值之一 出现次数最多的变量值 不受极端值的影响 可能没有众数或有几个众数 可以用于定类数据,也

8、可用于定序数据和数值型数据,3-36,2.众数的确定,3-37,由品质数列(定类数据)确定众数,解:这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即 Mo商品广告,3-38,由品质数列(定序数据)确定众数,频率最大的组是“高中”,占52,因此,M0高中,3-39,单项式数列确定众数,M0=12,3-40,4. 组距式数列确定众数的公式,下限公式:上限公式:,3-41,(分),众数的近似公式,众数所在组的下限; 众数所在组的次数与其前一组的次数之差;

9、 众数所在的次数与其后一组的次数之差;,众数组的组距。,3-42,3. 众数的几何意义,3-43,六、中位数,1.定义: 中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点的那个单位的标志值,在总体中,标志值小于中位数的单位占一半;标志值大于中位数的单位也占一半。,3-44,2.中位数的确定,1)未分组资料确定中位数。 将总体各单位的标志值按照大小顺序排列,当总体单位数n为奇数时: 当总体单位数n为偶数时,:,3-45,例,原始数据: 84 82 81 86 80 排 序: 80 81 82 84 86 位 置: 1 2 3 4 5,中位数Me 82,3-46,原始数据: 84 82

10、 81 86 80 90 排 序:80 81 82 84 86 90 位 置: 1 2 3 4 5 6,中位数Me 83,中位数位置,n+1,3.5,2,2,6+1,3-47,2)单项式分组资料确定中位数,当 为奇数时: ,当 为偶数时,3-48,3) 组距式分组资料确定中位数,下限公式:上限公式:,3-49,某公司职工按月工资分组,3-50,(元),3-51,测度数据在特定位置上的水平,还可计算四分位数、十分位数和百分位数。与中位数计算原理相类似,它们是将数据由小到大排序后,分别位于全部数据1/4、1/10和1/100位置上的数值。实际上,中位数也就是第二个四分位数、第五个十分位数、第五十个

11、百分位数。,P是想要得到的那个分位数,n是数据的项数,是多少分位数。,3. 其他分位数,3-52,四分位数 四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。很显然,第二个四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值(下四分位数Q1 )和处在75%位置上的数值(上四分位数Q3 )。与中位数的计算方法类似,根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置。,3-53,中位数、众数和算术平均数的关系:中位数、众数和算术平均数之间的数量关系决定于总体内次数分配的状况。对称钟形分布情形下: 非对称左偏分布情形下: 非对称右偏分布

12、情形下:,3-54,众数、中位数和均值的关系图,3-55,英国著名的统计学家皮尔生(K.Pearson)提出了一个经验公式:在数据分布呈轻微偏态时,算术平均数和众数、中位数三者之间存在如下的近似关系:,3-56,第三节 分布离散程度的度量,一、变异指标的含义与作用 1.定义:变异指标反映总体内部的离中趋势或变异状况。变异指标值越大,表明总体各单位标志的变异程度越大。 2.作用: (1)衡量平均指标的代表性。 (2)反映社会经济活动的均衡性。 (3)研究总体标志值分布偏离正态的情况。 (4)资产风险的度量 (5 )进行抽样推断等统计分析的一个基本指标。,3-57,二、极差与四分位差,1、极差(R

13、ange): 1)极差也称全距,它是统计总体中两个极端标志值之差,表明总体中标志值变动的范围。用R表示。 2)计算公式:(未分组) (分 组) 式中:Umax代表最高组的上限;Lmin代表最低组的下限。 3)特点:计算简便,直观易于理解;易受极端值的影响,3-58,2、四分位差(Quartile Deviation) 1)计算公式:数列的3/4位次与1/4位次的标志值之差除以2。用QD表示。 2)特点:四分位差避免了数列中极端值的影响,但去头弃尾,丢失大量的原始数据。,3-59,三、平均差(Average Deviation),1、定义:平均绝对偏差,总体所有单位的标志值与其算术平均数的离差绝

14、对值的算术平均数。用表示 2、计算公式:3、特点:概括地反映了所有单位标志值的变异程度,但因取绝对值,数学性质不理想,实际中较少用。,3-60,某班学生考试成绩表平均差计算表,3-61,四、方差与标准差,(一)方差与标准差 1、方差:总体各单位标志值与其算术平均数离差平方的算术平均数。方差的平方根称为标准差。未分组的资料:方差: 标准差 :,3-62,用分组资料计算加权平均法,方差:标准差,3-63,某班学生考试成绩表标准差计算表,3-64,(二)是非标志的方差与标准差,3-65,五、变异系数,一群牛的平均体重是180公斤,标准差是18公斤;一群羊的平均体重是15公斤,标准差是3公斤。能不能说

15、羊的平均体重的代表性高些?为什么?,3-66,1、变异系数:变异系数也称离散系数,是各变异指标与其算术平均数的比值。 极差系数:极差与其平均数的比值。 标准差系数:标准差与其平均数的比值。 2、作用:消除现象由于不同计量单位、不同平均水平所产生的影响。,3-67,六、箱线图在统计描述中的运用,箱线图,也称盒须图,由一个箱子(或盒子)和两条线段组成。 中位数的位置表明了水平的高低 箱体的大小说明了分布的集中状况 箱线的长短说明了极大值与极小值的差异情况例3-21,3-68,第三节 分布的偏度和峰度,一、统计动差 1、统计动差:也称为距,反映分布偏斜或离散程度的指标。 2、原点动差:变量x关于原点的k阶距,一般形式:(未分组) ( 分组) k= 1时,即1阶的原点动差就是算术平均数。 k= 2时,即2阶的原点动差就是平方平均数。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号