统计数据的描述1

上传人:人*** 文档编号:568330880 上传时间:2024-07-24 格式:PPT 页数:89 大小:910.53KB
返回 下载 相关 举报
统计数据的描述1_第1页
第1页 / 共89页
统计数据的描述1_第2页
第2页 / 共89页
统计数据的描述1_第3页
第3页 / 共89页
统计数据的描述1_第4页
第4页 / 共89页
统计数据的描述1_第5页
第5页 / 共89页
点击查看更多>>
资源描述

《统计数据的描述1》由会员分享,可在线阅读,更多相关《统计数据的描述1(89页珍藏版)》请在金锄头文库上搜索。

1、 第第4 4章章 统计数据的描述统计数据的描述主要内容:主要内容:重难点:重难点:教学目的要求:教学目的要求:4.1 4.1 统计绝对数与相对数统计绝对数与相对数4.2 4.2 数据集中趋势的描述数据集中趋势的描述4.3 4.3 数据离散趋势的描述数据离散趋势的描述平均数、中位数、众数、方差、标准差、离散系数等指标平均数、中位数、众数、方差、标准差、离散系数等指标的含义和计算方法的含义和计算方法通过本章的学习,了解总量指标、相对指标、平均指标和标志变异指标的含义、种类,掌握各种指标的计算方法,并会从数据中提取有用信息的描述性手段4.1 4.1 统计统计绝对数与相对数绝对数与相对数1 1、绝对数

2、、绝对数 绝对数又称为总量指标,将总体单位数相加或总体单位标志值相加,就可得到说明社会经济现象总体的总规模、总水平的综合指标,这些指标通常用绝对数表示,故称绝对数。(1 1)绝对数的作用)绝对数的作用它是认识客观事物的起点它是现行经济管理的基本依据它是计算相对数和平均数的基础例如;温家宝:过去的一年国内生产总值47.2万亿元,比上年增长9.2;公共财政收入10.37万亿元,增长24.8;粮食产量1.14万亿斤,再创历史新高;城镇新增就业1221万人,城镇居民人均可支配收入和农村居民人均纯收入实际增长8.4和11.4。我们巩固和扩大了应对国际金融危机冲击成果,实现了“十二五”时期良好开局。 总体

3、单位总量总体标志总量按其反映的内容不同按其反映的时间状况不同时期指标时点指标(2 2)绝对数分类)绝对数分类时期指标具有可加性,时点指标没有时期指标数值大小与时期的长短有直接关系,时点指标没有时期指标数值经常性调查取得,时点指标数值一次性调查取得特点(3 3)绝对数的计量单位)绝对数的计量单位实物量单位价值量单位劳动量单位(4 4)绝对数的计算方法)绝对数的计算方法直接计算法推算法2 2、相对数、相对数相对数也称为相对指标。相对数也称为相对指标。是指两个有联系的指标数值的比值,它表明现象之间的数量对比关系。无名数有名数(1 1)相对指标的作用)相对指标的作用能从数量上反映现象之间的联系,表明现

4、象发展的相对水平、普遍程度、内部结构和比例关系等能使一些不能用总量指标直接比较的现象有了共同的可比性依据。(2 2)相对指标的种类及计算)相对指标的种类及计算u结构相对指标结构相对指标:是利用统计分组法,将总体区分为不同性质的若干部分,以总体部分数值与总体全部数值对比求得的比重或比率。反映总体内部的结构组成情况。 分组1978年 1985年 1995年 2001年 比重(%)比重(%) 比重(%) 比重(%) 第一产业 28.0 28.4 19.7 15.2 第二产业 48.2 43.1 48.9 51.2第三产业 23.8 28.5 31.4 33.6 合 计 100.0 100.0 100

5、.0 100.0 我国国内生产总值构我国国内生产总值构成表成表u比例相对指标:比例相对指标:是同一总体中各组成部分之间的数值之比,表明总体中个部分之间的比例关系u比较相对指标:比较相对指标:是同一时间的同类指标在不同空间的对比,它表明同类现象在不同空间条件下的数量对比关系u强度相对指标:强度相对指标:是指同一时期两个性质不同,但有一定联系的总量指标对比的比值,用来说明现象的强度、密度和普遍程度或利用程度的一种相对数。u计划完成相对指标:计划完成相对指标:是指以某现象在某一段时间内的实际完成数与计划任务数相比,用以说明所研究现象计划完成程度的综合指标。使用该指标时注意以下问题:使用该指标时注意以

6、下问题:在评价计划任务完成时,不能一概认为只有大于100%才是超额完成计划,要根据指标的性质来确定。正指标负指标例如:例如:某地区2006年计划造林800亩,实际造林840亩,则计划完成程度是?表明该地区2006年造林计划指标完成程度为105%,超额5%完成例如:例如:某企业年初计划规定产品单位成本为1500元,本年内实际单位成本达到1550元,则表明该企业本年度产品单位成本计划没有完成,实际比计划多消耗3.3%计划指标可以是总量指标、相对指标或平均指标,无论是哪种指标,计划指标和实际完成指标在时间、空间、口径上必须一致例如:某工厂计划规定第一节度产品合格率应达到98%,而本季度实际产品合格率

7、为95%,求计划完成程度?说明该季度产品合格率的计划没有完成,比计划少完成3.1%如果计划任务指标是以提高或降低的幅度来制定,那么在计算计划完成相对指标时,应该用实际完成的百分数与计划规定应达到的百分数进行对比,不能直接用提高率或降低率来对比例如:某企业劳动生产率计划本月比上月提高10%,而实际提高8%,则计划完成程度?表明该企业劳动生产率计划没有完成,实际比计划少完成1.8%例如:某企业单位产品原材料消耗计划本月比上月降低6%,而实际降低9%,则计划完成程度?说明该企业单位产品原材料消耗计划超额完成3.2%对中长期计划执行情况的检查。有水平法和累计法水平法累计法u动态相对指标:动态相对指标:

8、是将同类指标在不同时间上进行对比,即纵向对比,说明现象发展变化的方向与速度的一种相对数。通常将作为比较标准的时期成为基期,将与基期相比较的时期称为报告期4.2 4.2 数据集中趋势的描述数据集中趋势的描述 集中趋势集中趋势是反映统计数据向某一个位置聚集的趋势,对其度量的指标是平均指标。 平均指标平均指标是反映现象的一般水平或平均水平的指标。对其归纳如下:平均指标数值平均数位置平均数算术平均数调和平均数几何平均数中位数众数简单算术平均数加权算术平均数 均值是统计数据高低相互抵消的结果,反映现象的集中趋势,是数据集的重心。是指在同一总体内各单位某一数量标志值所达到的一般水平。特点:特点:对总体各单

9、位某一数量标志值之间差异抽象化代表总体各单位某一数量标志值的一般水平反映总体分布的集中趋势一、均一、均 值值( (算术平均数算术平均数) )作用作用反映现象的一般水平便于同一现象在不同时间和空间上的对比可用于推算其他有关指标均值的计算均值的计算 算术平均数算术平均数是最常用的集中趋势描述指标,它的基本公式是总体标志总量总体标志总量除以总体单位总体单位总量总量。1 1、简单算术平均数、简单算术平均数简单算术平均数简单算术平均数主要用于未分组资料,用总体各单位标志值简单加总得到的标志总量除以单位总数而得。计算公式:例:某班组织成立了一个篮球队,共有8名成员,他们的身高(单位:cm)分别为:175、

10、180、181、179、178、190、186、185,则该篮球队成员的平均身高是多少?解:2、加权算术平均数加权算术平均数主要用于原始资料已经分组,并得出次数分布的情况。计算公式:Xi Xi 表示各组组中值表示各组组中值 , fifi 为各组标志相应出为各组标志相应出现的次数,现的次数, pipi表示表示各组标志相应出现的频率各组标志相应出现的频率n权数和权数系数。权数和权数系数。“权数”是指各组对应的次数(频数)。它对平均数的大小具有权衡轻重的作用。但离开了全部单位数,某组次数的大小难于说明其对平均数的影响程度,即权数对于平均数大小的影响不取决于权数的绝对大小而取决于权数的相对大小,即取决

11、于频率p而不是频数f。 频率称为权数系数。 当各组的次数都相同时,即当f1=f2=f3=fn时:加权算术平均数就等于简单算术平均数某车间工人看管机器台数分组表某车间工人看管机器台数分组表按看管机器数分组工人数(人)比重()15033.3328053.3332013.33合计150100例如:某车间工人看管机器数量的统计资料如下表,试计算全部工人平均看管机器的台数?解:解:成绩(百分制)人数f人数比重60701319.4170802131.3480902537.3190100811.94合计67100某班学生期末考试成绩分布情况表某班学生期末考试成绩分布情况表解解: :例:某班学生的期末成绩分布

12、情况见下表所示,试计算该班学例:某班学生的期末成绩分布情况见下表所示,试计算该班学生的平均成绩?生的平均成绩?n算术平均数的数学特性算术平均数的数学特性(1)算术平均数与标志值个数的乘积等于各标志值的总和。简单算术平均数:简单算术平均数:加权算术平均数:加权算术平均数:(2)各个标志值与其算术平均数的离差之和等于零简单算术平均数:简单算术平均数:加权算术平均数:加权算术平均数:(3)各标志值与算术平均数离差的平方和为最小值n算术平均数不足之处算术平均数不足之处其数值大小容易受到极大值或极小值的影响练习练习1 1某工厂有4个车间,每个车间的工人数量及平均工资见下表,计算该工厂工人的月平均工资车间

13、月平均工资(元)工人数(人) 人数比例(%)一车间 9651219.35二车间 9871422.58三车间 9982032.26四车间 10241625.81练练习习2 2:某单位有40名职工,对其业务情况进行考核,考核成绩资料如下:68 89 88 84 86 87 75 73 72 68 68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 71 60 91 65 76 72 76 85 89 92 64

14、57 83 81 78 77 72 61 70 87 64 57 83 81 78 77 72 61 70 87 考核成绩资料表考核成绩资料表要求:(1)根据上述资料按成绩分成以下几组:60分以下,6070分,7080分,8090分,90100分,并根据分组整理成变量分布表 求该单位职工平均考核成绩?1 1、调和平均数、调和平均数(1 1)简单调和平均数:)简单调和平均数:标志值的倒数的算术平均数的倒数。设有n个观测值,则这n个观测值x1、x2、xn 的调和平均数为二、调和平均数二、调和平均数(2)(2)加权调和平均数加权调和平均数 当资料经过分组,且各组次数不同时,需要计算加权调和平均数。设

15、有n组变量值,xi为第i组变量值,mi为第i组的标志总量。例题1:市场上某种蔬菜的价格是早市每公斤1.25元,午市每公斤1.20元,晚市每公斤1.10元。若早、中、晚各买10元钱的蔬菜,问所购买蔬菜的平均价格是多少?若用简单算术平均数计算则:解解(错误)例题2:市场上某种蔬菜的价格是早市每公斤1.25元,午市每公斤1.20元,晚市每公斤1.10元。现若早、中、晚分别购买15元、12元、10元钱的蔬菜,问所购买蔬菜的平均价格是多少?解:三、几何平均数三、几何平均数u几何平均数几何平均数:是n项标志值连乘积的n次方根u分类:分类:(1 1)简单几何平均数)简单几何平均数:是n个标志值xi连乘积的n

16、次方根。设有n个观测值 x1、x2、xn,则这n个观测值的几何平均数为:例题:某机械厂五个流水作业车间的合格品率分别为96、94、95、95和96,则五个车间合格品率的平均数(即全厂的平均生产合格率)为多少?解解注意注意该厂总的合格率为(2 2)加权几何平均数)加权几何平均数 若数据资料已经分组,且每个数据出现的次数不同,则需用加权几何平均数法计算。加权几何加权几何平均数是各标志值平均数是各标志值f fi i次方的连乘积的次方的连乘积的 f fi i次方根。次方根。设有n个观测值 x1、x2、xn,分别出现了f1、f2、fn次,则这些观测值的加权几何平均数为:例题某企业最近10年销售收入的年发

17、展速度如下表,求年平均发展速度。年度发展速度()xi105106 107108 109年数(频数)fi33211某企业最近某企业最近1010年销售收入年发展速度数据年销售收入年发展速度数据解:解:(1)(1)定义:定义:将总体各单位某一数量标志值按大小顺序排列,居于中间位置的标志值就是中位数。(2)(2) 中位数的确定中位数的确定 1 1、中位数、中位数1) 1) 未分组资料确定中位数未分组资料确定中位数一组已按大小顺序排列的n个数据x1、x2、xn,求中位数的公式为:四、位置平均数四、位置平均数n 为奇数n 为偶数例:某班有10名学生期末考试成绩在80分以上,他们成绩分别是80、82、83、

18、85、87、90、91、93、96、99,试求中位数解解: :例:7名体育竞技专家对运动员协调性的评级依次为:B、A、A、A、A、A、A,问该运动员协调性评级的中位数是多少?2) 2) 单项式分组资料确定中位数单项式分组资料确定中位数已按大小顺序排列的n组数据x1、x2、xn,各组数据出现的次数为f1、f2、fn,求中位数的公式为:f 为奇数f 为偶数例:一家鞋店在一段时间内销售了某种女鞋65双,其中各种尺码的鞋的销售量如下表所示: 求中位数鞋的尺码x(单位:厘米)22225232352424525销售量f(单位:双)1811231561累计频数192043586465解:计算中位数的位置为3

19、3位 ,因为33位置也即累计频数33含在累计频数43的这一组,而累计频数为43的组为中位数所在的组,故中位数23.53) 3) 组距式分组资料确定中位数组距式分组资料确定中位数假设组距分组数据的次数分配如下表:组别组限次数累计次数1L1U1f1F12L2U2f2F2i-1Li-1Ui-1fi-1Fi-1iLiUifiFii+1Li+1Ui+1fi+1Fi+1kLkUkfkFk=n求中位数关键是找出中位数的位置,n/2是中位数的位置。具体方法:具体方法:Ui-1的值出现在第Fi-1次,Ui的值出现在第Fi 次,中位数出现在第n/2次,且中位数位于Ui-1和Ui之间, n/2位数Fi-1和Fi-1

20、之间,假设数据是均匀分布的,则可用线性比例的内插法求得Me例:杉达学院某班学生的身高情况分布见下表,例:杉达学院某班学生的身高情况分布见下表,试求该班学生身高的中位数?试求该班学生身高的中位数?身高身高人数人数比重比重% %向上累计频数向上累计频数150-155150-1553 33.613.613 3155-160155-160111113.2513.251414160-165160-165343440.9640.964848165-170165-170242428.9228.927272170-170-111113.2513.258383解:解:(1)确定中位数的位置:(2)确定中位数所在

21、的组,42位置含在累计频数48这一组,即160-165这一组(3)利用比例插值公式近似确定中位数: 练习练习1 1:某车间150名工人的日装配量如下表所示,要求确定工人日装配量的中位数。日装配量(件)工人数(频数)向上累计频数向下累计频数221010150231020140244060130255011090263014040271015010合计150练习2:根据下表数据计算某年年底某高校在职教师年龄的中位数教师按年龄分组(岁)人数*(人)累计频数203020120130403175184050366884506015110356070151050合计10502 2、众数(、众数(Mo)1)

22、1)众数:众数:是指一组数据中出现次数最多的那个数, 它可代表数据的集中趋势。2)2)众数可能不存在,也可能不只一个3)3)众数的确定众数的确定l单项式分配数列的众数确定:单项式分配数列的众数确定:出现次数最多的标志值就是众数例如:某车间工人按看管的机器台数分组如下某车间工人看管机器台数分组表某车间工人看管机器台数分组表 看管机器数工人数(人)比重()15033.3328053.3332013.33合计150100l 组距式分配数列的众数确定组距式分配数列的众数确定:先确定众数组,再通过一定的公式计算众数的近似值下限公式:下限公式:上限公式:上限公式: 众数的几何意义众数的几何意义例:某系某年

23、级女同学群体身高的组距式分组资料:身高身高人数人数比重比重% %150-155150-1553 33.613.61155-160155-160111113.2513.25160-165160-165343440.9640.96165-170165-170242428.9228.92170-170-111113.2513.25解:解:(1)确定众数组:即频数或频率最大所对应的组, 题中是160165这组(2)比例插值法求众数:练习:根据下表数据计算某年年底某高校在职教师年龄的众数教师按年龄分组(岁)人数*(人)累计频数203020120130403175184050366884506015110

24、356070151050合计1050五、算术平均数、众数、中位数的关系五、算术平均数、众数、中位数的关系算术平均数、众数、中位数各自有何特点,优缺点?以及它们之间有何区别和联系?1 1、区别:、区别:1)三者的含义不相同;2)三者的计算(确定)方法不同;3)对资料的要求不同,4) 对数据的“灵敏度”、“抗耐性”和“概括能力”不同。 2 2、联系:、联系:(1) 三者都是作为反映总体一般水平(或集中趋势)的平均指标(2)三者之间存在着一定的数量关系:变量分布呈对称状态 三者完全一样变量分布呈右偏态 变量分布呈左偏态 4.3 4.3 数据离散趋势的描述数据离散趋势的描述 离中趋势离中趋势是指一组数

25、据背离分布中心值的特征,反映各变量值远离其中心值的程度,还从侧面说明集中趋势测度值的代表程度。它由各种变异指标来测度。 变异指标变异指标是反映总体内部的离中趋势或变异状况。变异指标值越大,表明总体各单位标志的变异程度越大。变异指标的作用:变异指标的作用:(1)衡量和比较平均指标的代表性(2)反映现象变动的均衡性、节奏性和稳定性 (3)研究总体标志值分布偏离正态的情况(4 )进行抽样推断等统计分析的一个基本指标 变异指标的分类变异指标的分类变异指标绝对变异指标相对变异指标极差方差标准差极差系数标准差系数1 1、极差(全距)、极差(全距) 极差极差也称全距,它是统计总体中两个极端标志值之差(变量最

26、大值与最小值之差),表明总体中标志值变动的范围。l极差极差计算公式:极差极差计算公式:已分组数据式中: Umax代表最高组的上限 Lmin代表最低组的下限 Xmax代表最大标志值 Xmin代表最小标志值 l极差特点极差特点:计算简便,直观易于理解全距仅取决于两个极端数值,不能全面反映所有变量值变异的情况,不能拿来评价平均指标的代表性。2 2、方差和标准差、方差和标准差方差方差是一组数据资料中各数值与其算术平均数离差平方的平均数,通常用表示。标准差标准差是方差的平方根,用 表示方差与标准差的计算公式方差与标准差的计算公式(1 1)未分组资料:)未分组资料:(2 2)已分组资料)已分组资料例题例题

27、:某企业工人日产量分组数据如下表所示,要求计算其方差与标准差工人日产量分组(件)工人数(人)40以下1040502050601560以上5合计50解:(3)方差与标准差具有以下一些性质: 常数的方差为0。假设常数为a,其方差为则 若y=a + bx,a 、b为常数,则y的方差与x的方差 之间的关系为: 标准差s是计算标准化值的依据。假设变量的标准化统计量用z表示,标准化值用zi表示,则:Z服从均值为0,标准差为1的标准正态分布,是无量纲。Zi也叫标准得分或标准统计值。通过计算标准化值可以使处于不同均值水平、不同计量单位的变量之间的比较成为可能,使比较的对象找到同一标准的相对位置。3、变异系数:

28、变异系数:变异系数也称离散系数,是各变异指标与其算术平均数的比值。 极差系数:极差与其平均数的比值 标准差系数:标准差与其平均数的比值作用:作用:消除现象由于不同计量单位、不同平均水平所产生的影响 (1 1)极差系数)极差系数用Vr表示极差系数,其计算公式为:(2 2)标准差系数)标准差系数用 表示标准差系数,其计算公式为:例题:有两组学生的身高数据如下(单位:cm)第一组:156,158,160,163,169,169,170,171,175,181,167.2,155.96第二组 :131,133,137,141,143,145,146,147,150,156,142.9,解:第一组学生身

29、高的均值与标准差分别为:第二组学生身高的均值与标准差分别为:两组学生的标准差系数分别为:练习:练习:对成年组和幼儿组共500人身高资料分组,分组资料列表如下: 成年组幼儿组按身高分组(cm)人数(人)按身高分组(cm)人数(人)150155155160160165165170170以上30120904020707575808085859090以上2080403030合计300合计200要求:要求:(1)分别计算成年组和幼儿组身高的平均数、标准差和标准差系数。(2)说明成年组和幼儿组平均身高的代表性哪个大?为什么?解:(1) 成人组年龄(厘米)人数(人)组中值(厘米)总身高(厘米)离差离差平方离

30、差平方加权150155155160160165165170170以上合 计30120904020300152815751625167517254575189001462567003450482508333331676671167693911092794449136192081713308251117796272388167幼儿组年龄(厘米)人数(人)组中值(厘米)总身高(厘米)离差离差平方离差平方加权707575808085859090以上合 计20804030302007257758258759251450620033002625277516350925425075575107585561806056330611556171125144522599188346688763751(2)成年组平均身高与幼年组平均身高相比,其平均数的代表性大些,因为其标准差系数小。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号