应用统计学第4章-数据分布特征的度量

上传人:龙*** 文档编号:476707 上传时间:2017-03-09 格式:PPT 页数:88 大小:2.70MB
返回 下载 相关 举报
应用统计学第4章-数据分布特征的度量_第1页
第1页 / 共88页
应用统计学第4章-数据分布特征的度量_第2页
第2页 / 共88页
应用统计学第4章-数据分布特征的度量_第3页
第3页 / 共88页
应用统计学第4章-数据分布特征的度量_第4页
第4页 / 共88页
应用统计学第4章-数据分布特征的度量_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《应用统计学第4章-数据分布特征的度量》由会员分享,可在线阅读,更多相关《应用统计学第4章-数据分布特征的度量(88页珍藏版)》请在金锄头文库上搜索。

1、第四章 数据分布特征的度量 1 本章学习目标 中趋势、离散趋势、偏斜程度和峰度。 点及其应用场合。 2 海之滨每日营业收入的次数分配直方图 3 471218116302468101214161820次数营业收入直方图2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0海之滨营业收入的次数分配图 4 3457112290510152025次数营业收入直方图2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0夏季 471218116302468101214161820次数营业收入直方图2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0春 季 本章要点 5 集中趋势

2、(位置 ) 偏态和峰态 (形状) 离中趋势 (分散程度 ) 集中趋势 众数 中位数 分位数 平均数 6 众数 ( 一组数据中出现次数最多的变量值 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和数值型数据 7 众数 (不惟一性 ) 8 无众数 原始数据 :10 5 9 12 6 8 一个众数 原始数据 :6 5 9 8 5 5 多于一个众数 原始数据 : 25 28 28 36 42 42 分类数据的众数 9 解:这里的变量为 “ 饮料品牌 ” , 这是个分类变量 , 不同类型的饮料就是变量值 所调查的 100人中 ,购买可口可乐的人数最多 , 为 35

3、人 , 占被调查总人数的 35%, 因此众数为 “ 可口可乐 ” 这一品牌 , 即 口可乐 不同饮料品牌的频数分布 饮料品牌 频数 汇源果汁 百事可乐 可口可乐 娃哈哈 15 20 35 30 合计 100 顺序数据的众数 10 解:这里的数据为顺序数据 。 变量为 “ 回答类别 ” 甲城市中对住房表示不满意的户数最多 , 为 108户 , 因此众数为 “ 不满意 ” 这一类别 , 即 满意 甲城市家庭对住房状况评价的频数分布 回答类别 甲城市 户数 (户 ) 百分比 (%) 非常不满意 不满意 一般 满意 非常满意 24 108 93 45 30 8 36 31 15 10 合计 300 值

4、型数据的众数 由众数的定义可知,在单项数列的情形求众数,只需通过观察,找出频数最多的变量值,则该变量值即为众数。 在组距数列的条件下,则要先确定众数所在组,然后按下面的近似公式计算。 11 112 d 数值型数据的众数 12 某企业职工月工资资料表 职工月工资(元) 职工人数(人) 800 1000 10 1000 1200 20 1200 1400 50 1400 1600 30 1600 1800 10 合计 120 解:确定众数组。 由于 12001400组频数最多,故该组即为众数组。 根据近似公式计算众数值。 101250 2012 00 20 0(50 20 ) (50 30 )30

5、12 00 20 0 13 20 ( )30 20M L d 元集中趋势 众数 中位数 分位数 平均数 13 中位数 ( 按大小排序后处于中间位置上的值 不受极端值的影响 主要用于顺序数据,也可用数值型数据,但不能用于分类数据 14 0% 50% 中位数 (位置和数值的确定 ) 15 位置确定 12n 中 位 数 位 置1212212x n 为 奇 数为 偶 数数值确定 顺序数据的中位数 16 解:中位数的位置为 (300+1)/2 累计频数看 ,中位数在 “ 一般 ” 这一组别中 中位数为 般 甲城市家庭对住房状况评价的频数分布 回答类别 甲城市 户数 (户 ) 累计频数 非常不满意 不满意

6、 一般 满意 非常满意 24 108 93 45 30 24 132 225 270 300 合计 300 数值型数据的中位数 17 【 例 】 9个家庭的人均月收入数据 原始数据 : 1500 750 780 1080 850 960 2000 1250 1630 排 序 : 750 780 850 960 1080 1250 1500 1630 2000 位 置 : 1 2 3 4 5 6 7 8 9 中位数 1080 1 9 1 522n 位 置数值型数据的中位数 18 【 例 】 : 10个家庭的人均月收入数据 排 序 : 660 750 780 850 960 1080 1250 1

7、500 1630 2000 位 置 : 1 2 3 4 5 6 7 8 9 10 1 1 0 1 5 位 置9 6 0 1 0 8 0 10202中 位 数数值型数据的中位数 (分组数据 ) 19 人数(人) 某班级学生身高资料表 身高( 人数(人) 人数累积 向上累积 向下累积 160 165 170 175 180 185 2 4 5 6 3 1 2 6 11 17 20 21 21 19 15 10 4 1 合计 21 解:确定中位数位次: 确定中位数组: 按人数向上累积(或向下累积)知,中位数在第三组。 确定中位数: 中位数组只有唯一的变量值 170它就是所求的中位数。 1 2 1 1

8、 1122f 数值型数据的中位数 (组距数列 ) 在组距数列的情况下,确定中位数组后,由于这时中位数组是一区间,可用下面的近似公式计算中位数: 20 12 数值型数据的中位数 (分组数据 ) 21 某企业职工月工资资料 职工月工资(元) 职工人数(人) 向上累积 800 1000 10 10 1000 1200 20 30 1200 1400 50 80 1400 1600 30 110 1600 1800 10 120 合计 120 确定中位数位次。 确定中位数组。 从向上累积栏中,找出首个大于等于中位数位次 60的组,该组即为中位数组,因此中位数组为12001400元。 按近似公式计算中位

9、数值。 120 6022f 121203021 2 0 0 2 0 0501 3 2 0 ( ) 元集中趋势 众数 中位数 分位数 平均数 22 四分位数 ( 排序后处于 25%和 75%位置上的值 不受极端值的影响 主要用于顺序数据,也可用于数值型数据,但不能用于分类数据 23 2 5% 25% 25% 25% 四分位数 (位置的确定及计算 ) 24 1 的位次 = 425 解: (300)/4 =75 =(3 300)/4 =225 从累计频数看 , 不满意 ” 这一组别中; 一般 ” 这一组别中 四分位数为 不满意 一般 甲城市家庭对住房状况评价的频数分布 回答类别 甲城市 户数 (户

10、) 累计频数 非常不满意 不满意 一般 满意 非常满意 24 108 93 45 30 24 132 225 270 300 合计 300 数值型数据的四分位数 26 【 例 】 9个家庭的人均月收入数据 原始数据 : 1500 750 780 1080 850 960 2000 1250 1630 排 序 : 750 780 850 960 1080 1250 1500 1630 2000 位 置 : 1 2 3 4 5 6 7 8 9 1 3 位置的确定及计算 ) 27 1 4先计算 = n/4。 2. 若为整数,则取第个与第 +1个数的平均值。 3. 若不是整数,则取小数进位为整数的那一

11、个数值。 数值型数据的四分位数 28 【 例 】 9个家庭的人均月收入数据 原始数据 : 1500 750 780 1080 850 960 2000 1250 1630 排 序 : 750 780 850 960 1080 1250 1500 1630 2000 位 置 : 1 2 3 4 5 6 7 8 9 1 3 Q 15003 假设某公司经理想比较业务员小朱与小钟最近8个星期股票交易的手续费收入,看看哪一个表现较佳。已知两者的手续费如下 : 29 小钟 30 63 66 78 82 96 106 270 小朱 64 82 88 90 96 108 128 166 两人的最小值、 中位數、 最大值、下四分位数、上四分位数 , 分别为多少 ? 小朱与小钟的业绩 小钟 : 最小值 =30 、 中位数 =80、 最大值=270、下四分位数 =四分位数 =101 小朱 :最小值 =64、 中位数 =93、 最大值 =166、下四分位数 =85、上四分位数 =118 30 小钟 30 63 66 78 82 96 106 270 小朱 64 82 88 90 96 108 128 166 盒须图分析法 (5数综合) 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号