统计数据的描述上课讲义

上传人:yulij****0329 文档编号:128930746 上传时间:2020-04-22 格式:PPT 页数:106 大小:1.67MB
返回 下载 相关 举报
统计数据的描述上课讲义_第1页
第1页 / 共106页
统计数据的描述上课讲义_第2页
第2页 / 共106页
统计数据的描述上课讲义_第3页
第3页 / 共106页
统计数据的描述上课讲义_第4页
第4页 / 共106页
统计数据的描述上课讲义_第5页
第5页 / 共106页
点击查看更多>>
资源描述

《统计数据的描述上课讲义》由会员分享,可在线阅读,更多相关《统计数据的描述上课讲义(106页珍藏版)》请在金锄头文库上搜索。

1、2020 4 22 1 第三章数据分布特征的描述 3 1集中趋势的度量3 2离散程度的度量3 3偏态与峰态的度量 2020 4 22 2 3 1 1什么是集中趋势 centraltendency 一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值注意 低层次数据的测度方法也适用于高层次的数据 但高层次数据的测度方法往往不适用于低层次的数据 2020 4 22 4 众数 不惟一性 无众数原始数据 10591268 一个众数原始数据 659855 多于一个众数原始数据 252828364242 5 有时众数是一个合适的代表值 比如在服

2、装行业中 生产商 批发商和零售商在做有关生产或存货的决策时 更感兴趣的是最普遍的尺寸而不是平均尺寸 2020 4 22 6 1 分类数据的众数 例题分析 解 这里的变量为 饮料品牌 这是个分类变量 不同类型的饮料就是变量值所调查的50人中 购买可口可乐的人数最多 为15人 占总被调查人数的30 因此众数为 可口可乐 这一品牌 即Mo 可口可乐 2020 4 22 7 2 顺序数据的众数 例题分析 解 这里的数据为顺序数据 变量为 回答类别 甲城市中对住房表示不满意的户数最多 为108户 因此众数为 不满意 这一类别 即Mo 不满意 2020 4 22 8 3 数值型数据的众数1 单变量值分组数

3、据 某年级83名女生身高资料 身高人数 CM 人 152115421552156415711582159216012161716281634 身高人数 CM 人 1643165816651673168716911705171217231741总计83 STAT 2020 4 22 9 2 组距分组数据众数的计算公式 2020 4 22 10 G E F D C A B f X f3 f2 f1 d L U M0 1 2 众数的计算公式可以从几何图形得到证明 2020 4 22 11 身高人数比重 CM 人 150 15533 61155 1601113 25160 1653440 96165

4、1702428 92170以上1113 25总计83100 某年级83名女生身高资料 组距分组数据的众数 STAT 2020 4 22 12 3 1 3顺序数据 中位数和分位数1 顺序数据 中位数 排序后处于中间位置上的值 不受极端值的影响主要用于顺序数据 也可用数值型数据 但不能用于分类数据各变量值与中位数的离差绝对值之和最小 即 2020 4 22 13 中位数 位置的确定 未分组数据 分组数据 2020 4 22 14 顺序数据的中位数 例题分析 解 中位数的位置为300 2 150从累计频数看 中位数在 一般 这一组别中中位数为Me 一般 2020 4 22 15 未分组数值型数据的中

5、位数 奇数个数据的算例 例 9个家庭的人均月收入数据原始数据 15007507801080850960200012501630排序 75078085096010801250150016302000位置 123456789 中位数 1080 2020 4 22 16 未分组数值型数据的中位数 偶数个数据的算例 例 10个家庭的人均月收入数据排序 66075078085096010801250150016302000位置 12345678910 2020 4 22 17 组距分组数据中位数的计算公式 2020 4 22 18 组距分组 共个单位 共个单位 共个单位 共个单位 L 中位数组 组距为d

6、 共个单位 假定该组内的单位呈均匀分布 中位数下限公式为 该段长度应为 U 2020 4 22 19 身高人数累计 CM 人 人数150 15533155 1601114160 1653448165 1702472170以上1183总计83 某年级83名女生身高资料 STAT 组距分组数据的中位数 20 如果统计资料中含有异常的或极端的数据 就有可能得到非典型的甚至可能产生误导的平均数 这时使用中位数来度量集中趋势比较合适 比如有5笔付款 9元 10元 10元 11元 60元平均付款为100 5 20元 很明显 这并不是一个好的代表值 而中位数10元是一个更好的代表值 2020 4 22 21

7、 2 顺序数据 分位数 1 四分位数 1 分位数有二分位数 中位数 四分位数 十分位数和百分位数等 其中主要有四分位数 2 排序后处于25 和75 位置上的值即四分位数 3 不受极端值的影响4 主要用于顺序数据 也可用于数值型数据 但不能用于分类数据 2020 4 22 22 A 原始数据四分位数的位置 下四分位数上四分位数 2020 4 22 23 例 某学习小组的统计学考试成绩如下 要求 1 计算前15个学生统计学考试成绩的四分位数 2 如果增加一个学生的成绩95分 试计算16个学生统计学考试成绩的四分位数 2020 4 22 24 2020 4 22 25 B 根据组距数列计算四分位数

8、2020 4 22 26 根据组距数列计算四分位数 2020 4 22 27 十分位数是指将按大小顺序排列的一组数据划分为10等分的9个变量值 用以反映一组数据在各个区间的一般水平 2 十分位数 2020 4 22 28 3 百分位数 29 位置测度的一种常用方法 百分位数 Percentile 含义 第p个百分位数是这样的数值 至少有p 个数值跟它一样大或比它小 至少有 100 p 个数值跟它一样大或比它大 例如 一个考生入学考试的口语成绩是55分 对应第70个百分位数 我们就可以知道大约有70 的考生成绩比他低 或者说大约有30 的考生成绩比他高 2020 4 22 30 算术平均数定义

9、全部变量值之和与变量值个数相除所得到的结果 按其计算形式又有简单算术平均数和加权算术平均数之分 STAT 平均数 average 的定义 变量值的一般水平 通常也称为均值 mean 有算术均值 调和均值和几何均值 3 1 4数值型数据 平均数一 算术平均数 2020 4 22 31 一 简单算术平均数 如果是未分组整理的原始资料 则直接将各个数据加总再除以数据的个数即得到平均数 设一组数据为 则其算术平均数的计算公式为 2020 4 22 32 二 加权算术平均数 根据分组整理的数据计算平均数时 需要先用每个组的变量值或组中值分别乘以各自的频数或频率 然后加总再除以总频数或总频率 即得算术平均

10、数 其计算公式为 2020 4 22 33 例 2005年某市红星幼儿园共有458名儿童 其年龄资料如表3 2所示 要求 试计算该幼儿园儿童的平均年龄 单变量值分组数据均值的计算 2020 4 22 34 身高组中值人数比重 cm xi cm fi 人 150 155152 533 61155 160157 51113 25160 165162 53440 96165 170167 52428 92170以上172 51113 25总计 83100 组距分组数据均值的计算某年级83名女生身高资料 组距数列 次数f 频率f f 变量值x STAT 加权算术平均数 2020 4 22 35 权数及

11、其起作用的条件 用各组的组中值代表其实际数据计算算术平均数时 通常假定各组数据在组内是均匀分布的 相应的组中值近似等于各组的平均数 权数 衡量变量值相对重要性的数值 各个变量值的权数要起作用必须具备两个条件 一是各个变量值之间有差异 二是各个变量值的权数有差异 简单算术平均数是加权算术平均数在权数相等时的特例 2020 4 22 36 集中趋势的最常用测度值 一组数据的均衡点所在 各变量值与其均值的离差之和等于零 即 各变量值与其均值的离差平方和最小 即由组距分组资料计算的均值有近似值性质 易受极端值的影响 主要用于数值型数据 不能用于分类数据和顺序数据 三 算术平均数 均值 特征 37 思考

12、题 比特啤酒公司雇用了468名员工 其中有56名管理人员 130名行政和技术人员 其余282人是工人 这三组人的周平均工资分别是500英镑 300英镑和200英镑 财务主管希望计算全体员工的平均工资 2020 4 22 38 二 调和平均数 harmonicmean 1 调和平均数也称 倒数平均数 它是对变量的倒数求平均 然后再取倒数而得到的平均数2 平均数的另一种表现形式3 易受极端值的影响4 计算公式为 原来只是计算时使用了不同的数据 2020 4 22 39 调和平均数 例题分析 例 某蔬菜批发市场三种蔬菜的日成交数据如表 计算三种蔬菜该日的平均批发价格 2020 4 22 40 算术平

13、均数与调和平均数的关系 1 从数学定义角度看算术平均数与调和平均数是不一样的 但在社会经济应用领域 调和平均数实际上只是算术平均数的另一种表现形式 二者本质上是一致的 惟一的区别是计算时使用了不同的数据 2 计算比率的平均数时 如果已知比率及其基本计算式的分母资料 则采用加权算术平均法 如果已知比率及其基本计算式的分子资料 则采用加权调和平均法 2020 4 22 41 例 某市某行业150个企业的产值利润率及相关资料如表3 8 要求 试分别计算该行业150企业第一季度和第二季度的平均产值利润率 算术平均数与调和平均数的关系 2020 4 22 42 三 几何平均数 geometricmean

14、 1 含义及应用条件 定义 n个变量值乘积的n次方根应用范围 适用于比率数据的平均 主要用于计算平均发展速度 平均增长率 平均比率应用的前提条件 各个比率或速度的连乘积等于总比率或总速度 相乘的各个比率或速度不为零或负值 2020 4 22 43 补充 发展速度 增长速度概念及关系 环比发展速度y1 y0y2 y1y3 y2yn yn 1定基发展速度y1 y0y2 y0y3 y0yn y0注意 环比发展速度的连乘积 相应的定基发展速度增长速度 率 发展速度 1环比增长速度 环比发展速度 1定基增长速度 定基发展速度 1 2020 4 22 44 平均增长率 averagerateofincre

15、ase 描述现象在整个观察期内平均增长变化的程度序列中各逐期环比值 也称环比发展速度 的几何平均数 即平均发展速度 减1后的结果通常用几何平均法求得 计算公式为 45 2020 4 22 2 几何平均数的计算方法 2020 4 22 46 简单几何平均数 例题分析 例 某水泥生产企业2006年的水泥产量为100万吨 2007年与2006年相比增长率为9 2008年与2007年相比增长率为16 2009年与2008年相比增长率为20 求各年的年平均增长率 年平均增长率 114 91 1 14 91 47 2020 4 22 例 某流水生产线有前后衔接的五道工序 某日各工序产品的合格率分别为95

16、92 90 85 80 求整个流水生产线产品的平均合格率 分析 设最初投产100A个单位 则第一道工序的合格品为100A 0 95 第二道工序的合格品为 100A 0 95 0 92 第五道工序的合格品为 100A 0 95 0 92 0 90 0 85 0 80 48 2020 4 22 因该流水线的最终合格品即为第五道工序的合格品 故该流水线总的合格品应为100A 0 95 0 92 0 90 0 85 0 80 则该流水线产品总的合格率为 即该流水线总的合格率等于各工序合格率的连乘积 符合几何平均数的适用条件 故需采用几何平均法计算 49 2020 4 22 因该流水线的最终合格品即为第五道工序的合格品 故该流水线总的合格品应为100A 0 95 0 92 0 90 0 85 0 80 则该流水线产品总的合格率为 即该流水线总的合格率等于各工序合格率的连乘积 符合几何平均数的适用条件 故需采用几何平均法计算 50 2020 4 22 思考 若上题中不是由五道连续作业的工序组成的流水生产线 而是五个独立作业的车间 且各车间的合格率同前 又假定各车间的产量相等均为100件 求该企业的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号