统计学原理第4章数据特征的描述

上传人:鲁** 文档编号:571520620 上传时间:2024-08-11 格式:PPT 页数:77 大小:2.93MB
返回 下载 相关 举报
统计学原理第4章数据特征的描述_第1页
第1页 / 共77页
统计学原理第4章数据特征的描述_第2页
第2页 / 共77页
统计学原理第4章数据特征的描述_第3页
第3页 / 共77页
统计学原理第4章数据特征的描述_第4页
第4页 / 共77页
统计学原理第4章数据特征的描述_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《统计学原理第4章数据特征的描述》由会员分享,可在线阅读,更多相关《统计学原理第4章数据特征的描述(77页珍藏版)》请在金锄头文库上搜索。

1、第四章第四章数据特征的描述数据特征的描述统计学原理统计学原理(第(第3 3版)版)2/77 第一节第一节 总量与相对量的测度总量与相对量的测度第四章 数据特征的描述数据特征的描述学 习 目 标第二节第二节集中趋势的测度集中趋势的测度第三节第三节离散程度的测度离散程度的测度3/77学习要点学习要点1.总量指标的含义、计量单位、种类总量指标的含义、计量单位、种类2.相对指标的含义、计量单位、种类相对指标的含义、计量单位、种类 第四章第四章数据特征的描述数据特征的描述 第一节第一节总量与相对量的测度总量与相对量的测度4/77n中华人民共和国中华人民共和国20172017年国民经济和社会发展统计公报年

2、国民经济和社会发展统计公报 初步核算,全年国内生产总值初步核算,全年国内生产总值827122亿元,比上年亿元,比上年增长增长6.9%。其中,第一产业增加值。其中,第一产业增加值65468亿元,增亿元,增长长3.9%;第二产业增加值;第二产业增加值334623亿元,增长亿元,增长6.1%;第三产业增加值第三产业增加值427032亿元,增长亿元,增长8.0%。第一产业。第一产业增加值占国内生产总值的比重为增加值占国内生产总值的比重为7.9%,第二产业增,第二产业增加值比重为加值比重为40.5%,第三产业增加值比重为,第三产业增加值比重为51.6%。 第四章第四章数据特征的描述数据特征的描述第一节第

3、一节总量与相对量的测度总量与相对量的测度5/77总量指标的含义总量指标的含义 总量指标是计算相对指标和平均指标的总量指标是计算相对指标和平均指标的基础基础总量指标总量指标是反映社会经济现象总体在一定时间、是反映社会经济现象总体在一定时间、地点和条件下地点和条件下总规模或总水平总规模或总水平的统计指标的统计指标 因为其表现形式通常是因为其表现形式通常是绝对数绝对数,所以也称为绝,所以也称为绝对指标或绝对数对指标或绝对数1.总量指标总量指标 第四章第四章数据特征的描述数据特征的描述6/77总量指标的计量单位总量指标的计量单位实物单位实物单位货币单位货币单位劳动单位劳动单位自然单位:如自然单位:如“

4、人人”、“辆辆 ”、双、双”等等 度量衡单位:如度量衡单位:如“米米”、“吨吨”、“公升公升”等等 复合单位复合单位 ,如,如“吨公里吨公里”、“千瓦时千瓦时”等等 标准实物量标准实物量 (混合实物量(混合实物量折算系数)折算系数)工时、工日、工年等工时、工日、工年等 元、万元、亿元等元、万元、亿元等 第四章第四章数据特征的描述数据特征的描述1.总量指标总量指标7/77 总量指标的计算方法总量指标的计算方法如:如:国内生产总值国内生产总值= =总产出中间投入总产出中间投入相加计算相加计算平衡计算与推算平衡计算与推算对于同类的计算对象按对于同类的计算对象按实际计量单实际计量单位位直接加起来直接加

5、起来直接相直接相加加对于不同类的计算对象按对于不同类的计算对象按标准计量标准计量单位折算再单位折算再相加相加折算相折算相加加 第四章第四章数据特征的描述数据特征的描述1.总量指标总量指标8/77 总量指标的种类总量指标的种类 总量指标的种类总量指标的种类 按时间状态分按时间状态分 按内容分按内容分 时时期期总总量量 时时点点总总量量 单单位位总总量量 标标志志总总量量 第四章第四章数据特征的描述数据特征的描述1.总量指标总量指标9/77总体单位总量总体单位总量表示总体表示总体本身的规模大小,是本身的规模大小,是统计总体中总体单位统计总体中总体单位数的合计数,简称单数的合计数,简称单位总量位总量

6、总体标志总量总体标志总量反映统计反映统计总体中各个单位某个数量总体中各个单位某个数量标志值的总和,简称标志标志值的总和,简称标志总量总量研究某市国有商业企业的经营情况,该市全部国有商业企业研究某市国有商业企业的经营情况,该市全部国有商业企业就是一个就是一个 ,国有商业企业总数是这个总体的,国有商业企业总数是这个总体的 ,而该市国有商业企业实现的商品销售额、上缴利税总额、职而该市国有商业企业实现的商品销售额、上缴利税总额、职工总人数、职工工资总额等就是这个统计总体的工总人数、职工工资总额等就是这个统计总体的 。 统计总体统计总体单位总量单位总量标志总量标志总量 第四章第四章数据特征的描述数据特征

7、的描述1.总量指标总量指标10/77时期总量时期总量反映现象在一定反映现象在一定时间范围内发展变化的时间范围内发展变化的累积总量,又称流量累积总量,又称流量(FlowFlow)。)。特点特点 :可以简单累加;可以简单累加;连续不断的记录取得;连续不断的记录取得;数据大小与所包含时数据大小与所包含时期的长短成正比关系。期的长短成正比关系。 时点总量时点总量反映现象在某一时反映现象在某一时点或瞬间状态上的总规模,点或瞬间状态上的总规模,又称存量(又称存量(StockStock)。)。特点特点 :不可以简单累加;不可以简单累加;不必连续不断地登记,通不必连续不断地登记,通常在期初或期末登记一次;常在

8、期初或期末登记一次;数值的大小与时期长短无数值的大小与时期长短无直接关系。直接关系。 例如例如 某种产品产量、某地区的某种产品产量、某地区的GDP GDP 时期总量时期总量 人口数、商品库存量、固定资产价值人口数、商品库存量、固定资产价值 时点总量时点总量 时期总量时期总量时点总量时点总量 第四章第四章数据特征的描述数据特征的描述1.总量指标总量指标11/77 相对指标的含义相对指标的含义 相对指标是两个有相互联系的指标的对比,相对指标是两个有相互联系的指标的对比, 又称相对数。又称相对数。 用以反映现象的发展程度、结构、强度、用以反映现象的发展程度、结构、强度、 普遍程度或比例关系。普遍程度

9、或比例关系。2.相对指标相对指标 第四章第四章数据特征的描述数据特征的描述12/77 相对指标的计量单位相对指标的计量单位有名数有名数:由对比的两个指标的计量单位构成:由对比的两个指标的计量单位构成 无名数无名数 系数和倍数系数和倍数是将对比基数抽象化为是将对比基数抽象化为1 1而计而计 算的相对数算的相对数 百分数百分数是将对比的基数抽象化为是将对比的基数抽象化为100100而计而计 算的相对数算的相对数 千分数千分数是将对比的基数抽象化为是将对比的基数抽象化为10001000而计而计 算的相对数算的相对数 成数成数是将对比的基数抽象化为是将对比的基数抽象化为1010而计算的而计算的 相对数

10、相对数 分母为分母为分母为分母为10101010分母为分母为分母为分母为1 1 1 1分母为分母为分母为分母为100100100100分母为分母为分母为分母为1000100010001000 第四章第四章数据特征的描述数据特征的描述2.相对指标相对指标13/77 相对指标的种类相对指标的种类 相对指标的种类相对指标的种类 计计划划完完成成相相对对指指标标 结结构构相相对对指指标标 比比例例相相对对指指标标 比比较较相相对对指指标标 动动态态相相对对指指标标 强强度度相相对对指指标标 第四章第四章数据特征的描述数据特征的描述2.相对指标相对指标14/77计划完成程度相对指标计划完成程度相对指标实

11、际完成数与计划任务数之比实际完成数与计划任务数之比, ,一般用百分数(一般用百分数(% %)表示)表示短期计划的检查短期计划的检查中长期计划的检查中长期计划的检查 第四章第四章数据特征的描述数据特征的描述2.相对指标相对指标15/77短期计划的检查短期计划的检查【例例】某企业某企业8 8月份计划利润总额达到月份计划利润总额达到270270万元,实际利润总额为万元,实际利润总额为300300万元,求该企业万元,求该企业8 8月份计划完成程度。月份计划完成程度。【例例】某企业某企业9 9月份计划销售收入比上月增长月份计划销售收入比上月增长6%6%,实际增长了,实际增长了9%9%,求该企业,求该企业

12、9 9月份销售收入的计划完成程度。月份销售收入的计划完成程度。【例例】某企业某企业B B产品去年单位成本为产品去年单位成本为500500元,今年计划比去年单元,今年计划比去年单位成本降低位成本降低8%8%,实际单位成本降低,实际单位成本降低4%4%。求该企业。求该企业B B产品单位成本产品单位成本降低计划完成程度。降低计划完成程度。 第四章第四章数据特征的描述数据特征的描述2.相对指标相对指标16/77小知识:小知识:2、“百分数百分数”与与“百分点百分点”1、对、对百分数进行计算时应考虑其基数百分数进行计算时应考虑其基数 第四章第四章数据特征的描述数据特征的描述2.相对指标相对指标17/77

13、中长期计划的检查中长期计划的检查是对是对5年或年或5年以上计划任务的检查。年以上计划任务的检查。水平法水平法. .适合于只规定计划期末要达到某种水平的现象。适合于只规定计划期末要达到某种水平的现象。 【例例】某企业某种产品的零售额,按五年计划的规定,最后一某企业某种产品的零售额,按五年计划的规定,最后一年要达到年要达到100100万元。实际执行情况如下万元。实际执行情况如下: : 一年一年二年二年三年三年四年四年五年五年一季一季二季二季三季三季四季四季一季一季二季二季三季三季四季四季零售零售额额78788282898924242424242425252525262626262828 第四章第四

14、章数据特征的描述数据特征的描述2.相对指标相对指标18/77中长期计划的检查中长期计划的检查累计法累计法. .适合于规定计划期全期累计应达到某个总量的现象。适合于规定计划期全期累计应达到某个总量的现象。 【例例】某企业某企业2011-20152011-2015年计划基本建设投资总额为年计划基本建设投资总额为25002500万万元,实际完成情况如下元,实际完成情况如下: : 2011201120122012201320132014201420152015一季一季二季二季三季三季四季四季基本建设基本建设投资总额投资总额4804805085086006006126121201201801802502

15、50150150 第四章第四章数据特征的描述数据特征的描述2.相对指标相对指标19/77结构相对指标结构相对指标总体中的一部分数值与总体全部数值对比的结果总体中的一部分数值与总体全部数值对比的结果用于反映用于反映总体内部的构成总体内部的构成情况情况. .一般用百分数(一般用百分数(% %)表示,各部分占总体的比重之)表示,各部分占总体的比重之和应等于和应等于100%.100%.例:第三产业占例:第三产业占GDP的比重为的比重为42.6%。 第四章第四章数据特征的描述数据特征的描述2.相对指标相对指标20/77比例相对指标比例相对指标总体中某一部分数值与另一部分数值对比的结果总体中某一部分数值与

16、另一部分数值对比的结果. . 用于反映总体中用于反映总体中各部分数值之间的对比关系各部分数值之间的对比关系. . 比例相对指标既可以用百分数表示,也可以用小数、比例相对指标既可以用百分数表示,也可以用小数、倍数等形式表示。倍数等形式表示。比例相对指标的分子和分母可以互换位置。比例相对指标的分子和分母可以互换位置。比例相对指标的分子和分母可以互换位置。比例相对指标的分子和分母可以互换位置。例:一、二、三次产业之比为例:一、二、三次产业之比为1 14.434.434.034.03。 第四章第四章数据特征的描述数据特征的描述2.相对指标相对指标21/77比较相对指标比较相对指标同一时间不同空间条件下

17、同类指标数值对比的结果同一时间不同空间条件下同类指标数值对比的结果 可以揭示可以揭示可以揭示可以揭示研究对象之间的差异程度研究对象之间的差异程度研究对象之间的差异程度研究对象之间的差异程度. . . .一般用百分数或小数、倍数表示。一般用百分数或小数、倍数表示。比较相对指标的分子和分母可以互换位置。比较相对指标的分子和分母可以互换位置。比较相对指标的分子和分母可以互换位置。比较相对指标的分子和分母可以互换位置。例:例:20172017年某省城镇居民人均可支配收入是农村居民年某省城镇居民人均可支配收入是农村居民人均纯收入的人均纯收入的2.22.2倍。倍。 第四章第四章数据特征的描述数据特征的描述

18、2.相对指标相对指标22/77动态相对指标动态相对指标某一指标在不同时间上数值的对比某一指标在不同时间上数值的对比 说明现象发展说明现象发展变化的方向和程度变化的方向和程度一般用百分数(一般用百分数(%)表示)表示例:例:2017年某省地区生产总值年某省地区生产总值37156亿元,比上年亿元,比上年增长增长8.7% 第四章第四章数据特征的描述数据特征的描述2.相对指标相对指标23/77强度相对指标强度相对指标两个性质不同但又有密切联系的两个总量指标两个性质不同但又有密切联系的两个总量指标 对比的结果对比的结果反映现象的反映现象的强度、密度和普遍程度强度、密度和普遍程度 例:人口密度例:人口密度

19、“人人/ /平方公里平方公里”、 商业网点密度商业网点密度“千人千人/ /个个”或或“个个/ /千人等千人等 第四章第四章数据特征的描述数据特征的描述2.相对指标相对指标24/77学习要点学习要点 1. 1. 集中趋势的含义集中趋势的含义 2. 2. 集中趋势的度量方法集中趋势的度量方法 3. 3. 各种平均数的各种平均数的ExcelExcel操作操作算术平均数、调和平均数、中位数、众数、几何平均数算术平均数、调和平均数、中位数、众数、几何平均数第二节第二节 集中趋势的测度集中趋势的测度 第四章第四章数据特征的描述数据特征的描述25/77集中趋势集中趋势是一组数据向其中心值靠是一组数据向其中心

20、值靠拢的倾向和程度拢的倾向和程度测度集中趋势测度集中趋势就是寻找数据一般水就是寻找数据一般水平的代表值或中心值平的代表值或中心值中心值中心值即:平均水平即:平均水平1. 1. 集中趋势的含义集中趋势的含义 第四章第四章数据特征的描述数据特征的描述26/77 按测度方法分按测度方法分 算算术术平平均均数数 几几何何平平均均数数 众众 数数 中中 位位 数数 调调和和平平均均数数2. 2. 集中趋势的度量方法集中趋势的度量方法 第四章第四章数据特征的描述数据特征的描述27/77(1)算术平均数()算术平均数(average) 是一组数据相加后除以数据个数的是一组数据相加后除以数据个数的 结果,也称

21、为均值结果,也称为均值只能计算只能计算数值型数据数值型数据的平均水平的平均水平 优点是利用了全部数据的信息,优点是利用了全部数据的信息, 缺点是容易受数据中极端值的影响缺点是容易受数据中极端值的影响 有简单算术平均数和加权算术平均有简单算术平均数和加权算术平均 数两种计算形式数两种计算形式 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法28/77简单算术平均数简单算术平均数(simple mean(simple mean )适用于对适用于对未经分组未经分组的数据资料计算平均数的数据资料计算平均数 将变量值简单相加再除以变量的个数将变量值简单相加再除以变

22、量的个数 计算公式为计算公式为: :设一组数据为:设一组数据为:例:例:1010名工人的工资水平为名工人的工资水平为900900、11001100、12901290、850850、15001500、13001300、12001200、12601260、18001800、1400.1400.求求平均工资水平。平均工资水平。 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法29/77加权算术平均数加权算术平均数( (weighted meanweighted mean)适用于对适用于对已分组已分组的数据资料计算平均数的数据资料计算平均数 以各组的以各组的频数

23、或频率作为权数频数或频率作为权数对各组的变量值对各组的变量值 进行进行加权平均加权平均 计算公式为计算公式为: :绝对权数数相相对权数数 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法30/77 某公司某公司400400名职工平均工资计算表名职工平均工资计算表 单位单位: :元元 组中值组中值职工职工人数人数=按月工资按月工资分组分组 1100以下以下1100-13001300-15001500-17001700以上以上601001406040合计合计400加权算术平均数加权算术平均数( (例题例题) )人人数数为权数数1000120014001600

24、1800720006000012000019600096000544000 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法31/77某公司某公司400400名职工平均工资计算表名职工平均工资计算表 单位单位: :元元 组中值组中值职工职工人数人数比重比重=400400=按月工资按月工资分组分组1100以下以下1100-13001300-15001500-17001700以上以上100012001400160018006010014060400.150.250.350.150.1合计合计4001比重比重%为权数数(元)(元)150300180490240

25、1360 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法32/77某公司某公司400400名职工平均工资计算表名职工平均工资计算表 单位单位: :元元 组中值组中值职工职工人数人数比重比重(%)(%)=400400=按月工资按月工资分组分组 1100以下以下1100-13001300-15001500-17001700以上以上100012001400160018006010014060406000012000019600096000720001525351510150300490240180合计合计4005440001001360人人数数为权数数比重比

26、重%为权数数(元)(元) 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法33/77u算术平均数的数学性质算术平均数的数学性质各变量值与其平均数离差之和等于零,各变量值与其平均数离差之和等于零, 即即: : 各变量值与其平均数离差平方和最小各变量值与其平均数离差平方和最小 即即: : 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法34/77(2)调和平均数(调和平均数(harmean ) 调和平均数(调和平均数(harmeanharmean)是各变量值倒数的算术)是各变量值倒数的算术平均数的倒数,也称为倒数平均数

27、。平均数的倒数,也称为倒数平均数。 实际中,调和平均数一般作为算术平均数的变形实际中,调和平均数一般作为算术平均数的变形使用使用 调和平均数也分为简单调和平均数和加权调和平调和平均数也分为简单调和平均数和加权调和平均数两种形式。均数两种形式。 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法35/77l简单调和平均数简单调和平均数例例平均价格平均价格=例例加权调和平均数加权调和平均数平均价格平均价格= 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法36/77(3)众数(众数(mode) 是一组数据中出现频率最高的

28、数值,用是一组数据中出现频率最高的数值,用 “ ”表示,反映现象的一般水平。表示,反映现象的一般水平。一组数据一组数据有可能有可能无众数或存在双众数无众数或存在双众数。 适用于适用于数据足够多,且数据具有明显的集中趋势时数据足够多,且数据具有明显的集中趋势时。 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法37/77众数的确定众数的确定( (例例1)1) 某班有某班有3030名学生的年龄如下:名学生的年龄如下:19 20 20 20 20 20 21 19 20 20 19 20 20 20 20 20 21 19 20 20 20 19 18 20

29、20 20 20 20 20 20 20 19 18 20 20 20 20 20 20 20 21 20 20 20 20 22 20 20 20 2021 20 20 20 20 22 20 20 20 20求该班学生的平均年龄。求该班学生的平均年龄。平均年龄平均年龄2020岁(众数年龄)岁(众数年龄) 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法38/77众数的确定众数的确定( (例例2)2) 去旧货市场的去旧货市场的次数(次)次数(次)消费者人数消费者人数(人)(人)1 110102 224243 314144 48 85 5以上以上4 4合

30、计合计6060次数次数最多最多的组的组众数众数值值 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法39/77众数的确定众数的确定( (例例3)3) 按月工资分组按月工资分组( (元元) ) 职工人数职工人数( (人人) ) 11001100以下以下60601100-13001100-13001001001300-15001300-15001401401500-17001500-1700606017001700以上以上4040合计合计400400众数所在组众数所在组下限公式:下限公式: 上限公式:上限公式: 第四章第四章数据特征的描述数据特征的描述2.

31、2. 集中趋势的度量方法集中趋势的度量方法40/77(4)中位数(中位数(median) 是是一组数据按大小顺序排列后,处于一组数据按大小顺序排列后,处于中间位置上的数据,用中间位置上的数据,用“ ”表示。表示。 适用于存在极端数据(极大值或极小值)适用于存在极端数据(极大值或极小值),且数据偏斜程度较大的数据组,且数据偏斜程度较大的数据组。 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法41/77中位数的确定中位数的确定( (例例1)1) 根据未分组的数据确定中位数根据未分组的数据确定中位数中点位置中点位置7 7名消费者每月去旧货市场次数名消费者每月

32、去旧货市场次数 6 6名消费者每月去旧货市场次数名消费者每月去旧货市场次数 奇数项奇数项: 1 2 2 : 1 2 2 2 2 3 7 9 3 7 9偶数项偶数项: 2 2 : 2 2 2 32 3 7 9 7 9中位数中位数2 2 中位数中位数2.5 2.5 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法42/77中位数的确定中位数的确定( (例例2)2) 根据单变量数列确定中位数根据单变量数列确定中位数去旧货市场去旧货市场的次数的次数( (次次) )人数人数( (人人) )累积次数累积次数( (次次) )1 12 23 34 45 5及以上及以上1

33、010242414148 84 410103434484856566060合计合计6060计算累积次数计算累积次数中位数所在位置中位数所在位置: :首先包含总次数一首先包含总次数一半的累积次数所在半的累积次数所在组组中位数中位数为为2 2 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法43/77中位数的确定中位数的确定( (例例3)3) 根据组距变量数列确定中位数根据组距变量数列确定中位数计算累积次数计算累积次数中位数所在位置中位数所在位置: :首首先包含总次数一半的先包含总次数一半的累积次数所在组累积次数所在组中位数中位数( (下限公式推算下限公式推

34、算) )按工资分组按工资分组 ( (元元) )职工人数职工人数 ( (人人) ) 向上累积向上累积人数人数( (人人) )11001100以下以下1100-13001100-13001300-15001300-15001500-17001500-170017001700以上以上6060100100140140606040406060160160300300360360400400合计合计400400 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法44/77众数、中位数和均值的关系众数、中位数和均值的关系XfXf对称分布对称分布正偏态分布正偏态分布(右)

35、(右)负偏态分布负偏态分布(左)左)1212Xf 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法45/77(5)几何平均数(几何平均数(median) 是是 个变量值乘积的个变量值乘积的 次方根,用次方根,用 表示。表示。 适用于对比率数据的平均适用于对比率数据的平均, ,经常用于计算平均增长率经常用于计算平均增长率简单几何平均简单几何平均: 加权几何平均加权几何平均: 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法46/77适用于适用于未分组数据未分组数据 简单几何平均简单几何平均 【例例4-184-18】某

36、公司连续某公司连续4 4年实现了利润的正增长,从年实现了利润的正增长,从20142014年年至至20172017年利润分别比上年增长年利润分别比上年增长7%7%、10%10%、12%12%、14%14%,求,求4 4年的平年的平均增长率。均增长率。年平均增长率为年平均增长率为110.72%100%=10.72% 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法47/77加权几何平均加权几何平均 适用于适用于已分组数据已分组数据 【例例4-19】某银行对贷款利率是以复利计算的,某银行对贷款利率是以复利计算的,10年间的贷年间的贷款利率中,有款利率中,有2年

37、利率为年利率为6%;有;有5年利率为年利率为7%;有;有2年利率为年利率为8%;有;有1年利率为年利率为9%,计算该银行的平均年利率。,计算该银行的平均年利率。平均年利率为平均年利率为106.196%-100%=6.196% 第四章第四章数据特征的描述数据特征的描述2. 2. 集中趋势的度量方法集中趋势的度量方法48/773. 3. 集中趋势的集中趋势的ExcelExcel操作操作AVERAGEAVERAGE(算术平均数)(算术平均数)HARMEANHARMEAN(调和平均数)(调和平均数)MEDIANMEDIAN(中位数)(中位数) MODEMODE (众数)(众数)GEOMEANGEOME

38、AN(几何平均数)(几何平均数)利用利用ExcelExcel函数计算函数计算利用利用“描述统计描述统计”计算计算作业作业 第四章第四章数据特征的描述数据特征的描述49/77数据分布的特征和测度数据分布的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众 数数数数中位数中位数中位数中位数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差算术平均数算术平均数算术平均数算术平均数几何平均数几何平均数几何平均数几何平均数峰峰峰峰 度度度度偏偏偏偏 态态态态异众比率异众比率四分位差四分位差极差极差第三节第三节 离散程度的测度离散程度的测度 第四章第四章数

39、据特征的描述数据特征的描述50/77学习要点学习要点 1.离散程度的含义离散程度的含义 2.离散程度的度量方法离散程度的度量方法3.数据的标准化数据的标准化4.离散指标的离散指标的ExcelExcel操作操作5.偏态与峰度偏态与峰度 第四章第四章数据特征的描述数据特征的描述第三节第三节 离散程度的测度离散程度的测度51/77l离散程度离散程度: :各变量值远离其中心值的各变量值远离其中心值的各变量值远离其中心值的各变量值远离其中心值的 程度,也称为程度,也称为程度,也称为程度,也称为离中离中离中离中趋势趋势趋势趋势. . . .l从另一个侧面说明了集中趋势测度值从另一个侧面说明了集中趋势测度值

40、从另一个侧面说明了集中趋势测度值从另一个侧面说明了集中趋势测度值 的的的的代表程度代表程度代表程度代表程度中心值中心值1 1 离散程度的含义离散程度的含义 第四章第四章数据特征的描述数据特征的描述52/77l离散程度测度值的作用离散程度测度值的作用反映总体各单位变量值分布的均衡性反映总体各单位变量值分布的均衡性判断平均指标对总体各单位变量值代表性的高低判断平均指标对总体各单位变量值代表性的高低 第四章第四章数据特征的描述数据特征的描述1 1 离散程度的含义离散程度的含义53/77 离散程度测度指标离散程度测度指标 异异众众比比率率 四四分分位位差差 离离散散系系数数(标标准准差差系系数数)标标

41、准准差差 极极差差2. 2. 离散程度的度量方法离散程度的度量方法平平均均差差 第四章第四章数据特征的描述数据特征的描述54/77用于衡量用于衡量众数众数对一组数据的代表程度对一组数据的代表程度 。是是非众数组的频数之和占总频数的非众数组的频数之和占总频数的比重比重(% %)。 【例【例】随机抽选随机抽选100100名顾客,调查购买名顾客,调查购买AIAI牌产品的地点。其中牌产品的地点。其中2020人声称只去人声称只去AIAI专卖店,专卖店,7070人说只去商场或超市,人说只去商场或超市,1010人说专卖店和人说专卖店和商场都去。如果认为购买商场都去。如果认为购买AIAI牌产品的主要地点是商场

42、或超市,则牌产品的主要地点是商场或超市,则“商场或超市商场或超市”就是众数。众数的代表性如何呢就是众数。众数的代表性如何呢? ?“商场或超市商场或超市”作为主要购物地点是有代表性的。作为主要购物地点是有代表性的。 异众比率异众比率(1)异众比率)异众比率 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法55/77分位数:分位数:排序后处于排序后处于25%25%、50%50%和和75%75%位置上的值位置上的值反映了反映了中位数中位数对一组数据的代表程度。四分位差的意义是,对一组数据的代表程度。四分位差的意义是, 约有约有50%50%的数据应落在上四分位数

43、和下四分位数之间的数据应落在上四分位数和下四分位数之间。 u 的位置的位置= = 下四分位数下四分位数中位数中位数上四分位数上四分位数四分位差四分位差 的位置的位置= = 的位置的位置= = (2)四分位差)四分位差 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法56/77四分位数四分位数 ( (例子例子) )【例例】:9 9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630: 1500 750 780 1080 850 960 2000 1250 1630排

44、排 序序 750 780 850 960 1080 1250 1500 1630 2000 750 780 850 960 1080 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 9: 1 2 3 4 5 6 7 8 9四分位差四分位差 =1565-815=750=1565-815=7505个数个数据落据落在区在区间内间内 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法57/77 是一组数据的最大值与最小值之差,是一组数据的最大值与最小值之差, 又称为全距,用又称为全距,用“R R”表示表示离散程度的最简单测度值离

45、散程度的最简单测度值 易受极端值影响易受极端值影响(3)极差)极差 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法58/77(4)平均差)平均差平均差与标准差的区别平均差与标准差的区别 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法59/77是是离散程度最常用的测度值。离散程度最常用的测度值。根据全部数据计算,根据全部数据计算,反映了各变量值反映了各变量值 与其算术平均数的平均离差程度与其算术平均数的平均离差程度。 标准差标准差是方差的平方根是方差的平方根 ,有量纲单位,与变量,有量纲单位,与变量 值的计量单位

46、相同,其实际意义比方差清楚。值的计量单位相同,其实际意义比方差清楚。 (5)标准差)标准差 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法60/77计算公式计算公式总体标准差总体标准差未分组未分组 数据数据 分分 组组 数数 据据样本标准差样本标准差注意:样本的注意:样本的注意:样本的注意:样本的自由度是自由度是自由度是自由度是n-1n-1n-1n-1。2. 2. 离散程度的度量方法离散程度的度量方法61/77u标准差计算实例标准差计算实例例:简单式例:简单式甲组营业员(甲组营业员(5 5人)的销售量(件)为人)的销售量(件)为 :2020、4040、

47、5050、9090、50 50 平均数:平均数:标准差:标准差:=25.5=25.5(件)(件) 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法62/77u标准差计算实例标准差计算实例例:加权式例:加权式零件个数零件个数(件)(件) 天天 数数(天)(天) 组中值组中值(件)(件) 270270以下以下270-290270-290290-310290-310310-330310-330330330以上以上 151525253535656540 40 260260280280300300320320340 340 39003900700070001050

48、010500208002080013600 13600 25002500900900100100100100900 900 37500375002250022500350035006500650036000 36000 合计合计 180 180 55800 55800 106000 106000 乙批发商上半年日销售量资料乙批发商上半年日销售量资料 单位:件单位:件 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法63/77经验法则经验法则 假设一组数据呈对称分布,则:假设一组数据呈对称分布,则:约约68.27%68.27%的数据在平均数的数据在平均数1

49、 1个标准差的范围内个标准差的范围内 约约95%95%的数据在平均数的数据在平均数1.961.96个标准差的范围内个标准差的范围内约约95.45%95.45%的数据在平均数的数据在平均数2 2个标准差的范围内个标准差的范围内约约99.73%99.73%的数据在平均数的数据在平均数3 3个标准差的范围内个标准差的范围内 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法64/77是非变量的标准差是非变量的标准差 只表现为是与否、有或无的标志,称为是非变量,只表现为是与否、有或无的标志,称为是非变量, 也称为交替变量也称为交替变量是非变量用文字表示,在进行统计

50、处理时,具有某是非变量用文字表示,在进行统计处理时,具有某 种属性的用种属性的用“1 1”代表,不具有某种属性的用代表,不具有某种属性的用“0 0”代表。代表。假设总体有假设总体有“ ”个单位,具有某种属性的有个单位,具有某种属性的有 “ ”个,不具有某种属性的有个,不具有某种属性的有“ ”个,个, 则则 。 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法65/77是非变量的方差与标准差是非变量的方差与标准差 总体总体 样本样本比例的平均数比例的平均数比例的平均数比例的平均数 比例的方差比例的方差比例的方差比例的方差 比例的标准差比例的标准差比例的标准

51、差比例的标准差比比比比 例例例例 = 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法66/77例例从一批产品中随机抽取从一批产品中随机抽取100100件产品进行质件产品进行质量测试,测试的结果为量测试,测试的结果为9090件合格,件合格,1010件不合格,件不合格,试计算合格率的方差和标准差试计算合格率的方差和标准差解:解: 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法67/77(6)离散系数)离散系数是是对数据相对离散程度的测度对数据相对离散程度的测度。消除了数据水平高低和计量单位的影响消除了数据水平高低和

52、计量单位的影响。 用于对不同组别数据离散程度的比较。用于对不同组别数据离散程度的比较。一般计算标准差系数,公式为:一般计算标准差系数,公式为: 样样本本总总体体 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法68/77离散系数实例离散系数实例 身高身高 体重体重平均数为平均数为123.10cm 123.10cm 平均数为平均数为22.29kg22.29kg 标准差为标准差为4.71cm 4.71cm 标准差为标准差为2.26kg2.26kg 问问: :是身高的差异大还是体重的差异大是身高的差异大还是体重的差异大例:例:某地某地7 7岁男童岁男童结论:结

53、论:同一批儿童同一批儿童体重体重的差异更大的差异更大 第四章第四章数据特征的描述数据特征的描述2. 2. 离散程度的度量方法离散程度的度量方法69/77对某一个值在一组数据中相对位置的度量对某一个值在一组数据中相对位置的度量可用于判断一组数据是否有离群点可用于判断一组数据是否有离群点用于对变量的标准化处理用于对变量的标准化处理计算公式为计算公式为总体总体样本样本3. 3. 数据的标准化数据的标准化 第四章第四章数据特征的描述数据特征的描述70/77业务员编号业务员编号1 12 23 34 45 56 67 7原始数据原始数据标准化值标准化值850085000.77220.77225400540

54、0-1.2223-1.222395009500-1.4157-1.415751005100-1.4157-1.415765006500-0.5148-0.5148850085000.77220.7722760076000.19310.1931=1554=1554元元 标准差标准差例:例:1 1号业务员的号业务员的工资标准化值为:工资标准化值为:平均数平均数=7300=7300元元 第四章第四章数据特征的描述数据特征的描述3. 3. 数据的标准化数据的标准化71/774. 4. 离散程度的离散程度的ExcelExcel操作操作利用利用ExcelExcel函数计算离散指标函数计算离散指标利用利用E

55、xcelExcel的的“描述统计描述统计”功能功能MAX(最大值)(最大值)MIN(最小值)(最小值)QUARTILE(四分位点)(四分位点)STDEV(样本标准差)(样本标准差)VAR(样本标准差)(样本标准差)KURT(峰度系数)(峰度系数)SKEW(偏态系数)(偏态系数)数据数据数据分析数据分析描述统计描述统计 第四章第四章数据特征的描述数据特征的描述72/77偏态及其测度偏态及其测度峰度及其测度峰度及其测度5. 5. 偏态与峰度偏态与峰度 第四章第四章数据特征的描述数据特征的描述73/77偏态及其测度偏态及其测度偏态(偏态(Skewness)是)是指频数分布的指频数分布的偏斜方向和程偏

56、斜方向和程度度。 左偏分布左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布右偏分布与标准正态与标准正态与标准正态与标准正态分布比较!分布比较!分布比较!分布比较! 第四章第四章数据特征的描述数据特征的描述5. 5. 偏态与峰度偏态与峰度74/77偏态系数偏态系数(Skewness coefficient)是测度频数分布偏斜程是测度频数分布偏斜程度的统计指标度的统计指标,用,用SK表示。表示。计算公式为:计算公式为:即:即:SK=O,正态分布,正态分布SKO,右偏分布,右偏分布SKO,左偏分布,左偏分布 第四章第四章数据特征的描述数据特征的描述5. 5. 偏态与峰度偏态与峰度75/77扁平分布扁

57、平分布扁平分布扁平分布尖峰分布尖峰分布尖峰分布尖峰分布峰度及其测度峰度及其测度峰度:峰度:是指频数分布曲线顶端尖峭或扁平的程度。是指频数分布曲线顶端尖峭或扁平的程度。有时两组数有时两组数据的算术平均数、标准差和偏态系数都相同,但其频数分布曲线据的算术平均数、标准差和偏态系数都相同,但其频数分布曲线顶端的高耸程度却不同。顶端的高耸程度却不同。 第四章第四章数据特征的描述数据特征的描述5. 5. 偏态与峰度偏态与峰度76/77峰度系数峰度系数(Coefficient of kurtosis)峰度系数峰度系数是测度频数分布曲线顶端尖峭或扁平程度的是测度频数分布曲线顶端尖峭或扁平程度的指标指标,用用K表示。表示。计算公式为:计算公式为:即:即:K=O,正态分布,正态分布KO,尖峰分布,尖峰分布KO,扁平分布,扁平分布 第四章第四章数据特征的描述数据特征的描述5. 5. 偏态与峰度偏态与峰度77/77第四章第四章 要点回顾要点回顾

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号