数据特征的描述

上传人:mg****85 文档编号:49705519 上传时间:2018-08-01 格式:PPT 页数:79 大小:2.53MB
返回 下载 相关 举报
数据特征的描述_第1页
第1页 / 共79页
数据特征的描述_第2页
第2页 / 共79页
数据特征的描述_第3页
第3页 / 共79页
数据特征的描述_第4页
第4页 / 共79页
数据特征的描述_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《数据特征的描述》由会员分享,可在线阅读,更多相关《数据特征的描述(79页珍藏版)》请在金锄头文库上搜索。

1、4 - 1第第 4 4 章章 数据分布特征的测度数据分布特征的测度4.14.1 集中趋势的测度集中趋势的测度 4.2 4.2 离散程度的测度离散程度的测度 4.3 4.3 偏态与峰态的测度偏态与峰态的测度4 - 2学习目标学习目标1.1. 集中趋势各测度值的计算方法集中趋势各测度值的计算方法 2.2. 集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合 3.3. 离散程度各测度值的计算方法离散程度各测度值的计算方法 4.4. 离散程度各测度值的特点及应用场合离散程度各测度值的特点及应用场合 5.5. 偏态与峰态的测度方法偏态与峰态的测度方法 6.6. 用用ExcelExcel计算

2、描述统计量并进行分析计算描述统计量并进行分析4 - 3数据分布的特征数据分布的特征集中趋势集中趋势 ( (位置位置) )偏态和峰态偏态和峰态(形状)(形状)离中趋势离中趋势( (分散程度分散程度) )4 - 4数据分布特征的测度数据分布特征的测度数据特征的测度分布的形状集中趋势离散程度众众 数数 中位数中位数均均 值值离散系数离散系数方差和标准差方差和标准差峰峰 态态四分位差四分位差异众比率异众比率偏偏 态态4 - 54.1 4.1 集中趋势的测度集中趋势的测度一一. . 分类数据:众数分类数据:众数 二二. . 顺序数据:中位数和分位数顺序数据:中位数和分位数 三三. . 数值型数据:均值数

3、值型数据:均值 四四. . 众数、中位数和均值的比较众数、中位数和均值的比较4 - 6数据分布特征的和测度数据分布特征的和测度 ( (本节位置本节位置) )数据的特征和测度分布的形状集中趋势离散程度众众 数数 中位数中位数均均 值值离散系数离散系数方差和标准差方差和标准差峰峰 态态四分位差四分位差异众比率异众比率偏偏 态态4 - 7集中趋势集中趋势 (Central tendency)(Central tendency)1.1. 一一组组数据向其中心数据向其中心值值靠靠拢拢的的倾倾向和程度向和程度2.2. 测测度集中度集中趋势趋势 就是就是寻寻找数据水平的代表找数据水平的代表值值或中心或中心值

4、值3.3. 不同不同类类型的数据用不同的集中型的数据用不同的集中趋势测趋势测 度度值值4 - 8众数众数 ( (modemode) )1.1.出出现现次数最多的次数最多的变变量量值值2.2.不受极端不受极端值值的影响的影响3.3.一一组组数据可能没有众数或有几个众数数据可能没有众数或有几个众数4.4.主要用于分主要用于分类类数据,也可用于数据,也可用于顺顺序数据和数序数据和数值值 型数据型数据4 - 9众数众数 ( (不唯一性不唯一性) )无众数无众数 原始数据原始数据: 10 5 9 12 6: 10 5 9 12 6 8 8一个众数一个众数 原始数据原始数据: 6 : 6 5 5 9 8

5、9 8 5 55 5多于一个众数多于一个众数 原始数据原始数据: 25 : 25 28 28 2828 36 36 42 42 42424 - 10分类数据的众数分类数据的众数( (例题分析例题分析) )不同品牌不同品牌饮饮饮饮料的料的频频频频数分布数分布 饮饮料品牌频频数比例百分比 (%)可口可乐乐旭日升冰茶百事可乐乐汇汇源果汁露露15 11 9 6 90.30 0.22 0.18 0.12 0.1830 22 18 12 18合计计501100解解:这这里的里的变变量量为为“ “饮饮料品料品 牌牌” ”,这这是个分是个分类变类变 量,不量,不 同同类类型的型的饮饮料就是料就是变变量量值值在

6、所在所调查调查 的的5050人中,人中,购购 买买可口可可口可乐乐的人数最多,的人数最多, 为为1515人,占人,占总总被被调查调查 人数人数 的的30%30%,因此众数,因此众数为为“ “可口可口 可可乐乐” ”这这一品牌,即一品牌,即 MMo o可口可可口可乐乐乐乐4 - 11顺序数据的众数顺序数据的众数( (例题分析例题分析) )解:解:这这里的数据里的数据为顺为顺 序数据。序数据。变变量量为为“ “回答回答 类别类别 ” ”甲城市中甲城市中对对住房表住房表 示不示不满满意的意的户户数最多数最多 ,为为108108户户,因此众数,因此众数 为为“ “不不满满意意” ”这这一一类别类别 ,

7、 即即 MMo o不不满满满满意意甲城市家庭甲城市家庭对对对对住房状况住房状况评评评评价的价的频频频频数分布数分布 回答类别类别甲城市户户数 (户户)百分比 (%)非常不满满意不满满意一般满满意非常满满意24 108 93 45 308 36 31 15 10合计计300100.04 - 12中位数中位数 ( (medianmedian) )1.1.排序后排序后处处于中于中间间位置上的位置上的值值MMe e50%50%50%50%2.2. 不受极端不受极端值值的影响的影响3.3. 主要用于主要用于顺顺序数据,也可用数序数据,也可用数值值型数据,但不能用于分型数据,但不能用于分 类类数据数据4.

8、4. 各各变变量量值值与中位数的离差与中位数的离差绝对值绝对值 之和最小,即之和最小,即4 - 13顺序数据的中位数顺序数据的中位数( (例题分析例题分析) )解:解:中位数的位置中位数的位置为为 301/2301/2150.5150.5从累从累计频计频 数看,中位数看,中位 数在数在“ “一般一般” ”这这一一组别组别 中中 。因此。因此MMe e= =一般一般甲城市家庭甲城市家庭对对对对住房状况住房状况评评评评价的价的频频频频数分布数分布 回答类别类别甲城市户户数 (户户)累计频计频 数非常不满满意不满满意一般满满意非常满满意24 108 93 45 3024 132 225 270 30

9、0合计计3004 - 14数值型数据的中位数数值型数据的中位数(9 9个数据的算例)个数据的算例)【例例】:9 9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据: : 1500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 1250 1630 排排 序序: : 750 780 850 960 750 780 850 960 10801080 1250 1500 1630 2000 1250 1500 1630 2000位位 置置: : 1 2 3 4 1 2 3 4 5 5 6 7 8 9 6

10、7 8 9中位数中位数 108010804 - 15数值型数据的中位数数值型数据的中位数(10(10个数据的算例个数据的算例) )【例例】:1010个家庭的人均月收入数据个家庭的人均月收入数据排排 序序: : 660660750 780 850 750 780 850 960 1080960 1080 1250 1500 1630 2000 1250 1500 1630 2000位位 置置: : 1 2 3 4 1 2 3 4 5 5 6 6 7 8 9 10 7 8 9 10 4 - 16四分位数四分位数 ( (quartilequartile) )1.1.排序后排序后处处于于25%25%和

11、和75%75%位置上的位置上的值值2.2. 不受极端不受极端值值的影响的影响3.3. 主要用于主要用于顺顺序数据,也可用于数序数据,也可用于数值值型数据,但型数据,但 不能用于分不能用于分类类数据数据QQL LQQMMQQU U25%25%25%25%25%25%25%25%4 - 17四分位数四分位数 ( (位置的确定位置的确定) )顺序数据:顺序数据:4 - 18顺序数据的四分位数顺序数据的四分位数( (例题分析例题分析) )解:解:QQL L位置位置= =(300)/4=75(300)/4=75Q QU U位置位置=(3300)/4=225=(3300)/4=225从累从累计频计频 数看

12、,数看,QQL L在在“ “不不满满意意” ” 这这一一组别组别 中;中;QQU U在在“ “一般一般” ”这这一一 组别组别 中。因此中。因此QQL L= = 不不满满满满意意QQU U= = 一般一般甲城市家庭甲城市家庭对对对对住房状况住房状况评评评评价的价的频频频频数分布数分布 回答类别类别甲城市户户数 (户户)累计频计频 数非常不满满 意不满满意一般满满意非常满满意24 108 93 45 3024 132 225 270 300合计计3004 - 19数值型数据的四分位数数值型数据的四分位数(9(9个数据的算例个数据的算例) )【例例】:9 9个家庭的人均月收入数据个家庭的人均月收入

13、数据原始数据原始数据: : 1500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 1250 1630 排排 序序: : 750 780 850 960 1080 1250 1500 1630 2000750 780 850 960 1080 1250 1500 1630 2000位位 置置: : 1 1 2 32 3 4 4 5 5 6 6 7 7 8 8 9 9 4 - 20均值均值 ( (meanmean) )1.1.集中集中趋势趋势 的最常用的最常用测测度度值值2.2.一一组组数据的均衡点所在数据的均

14、衡点所在3.3.体体现现了数据的必然性特征了数据的必然性特征4.4.易受极端易受极端值值的影响的影响5.5.用于数用于数值值型数据,不能用于分型数据,不能用于分类类数据和数据和顺顺序数据序数据4 - 21简单均值与加权均值简单均值与加权均值 (simple mean / weighted mean)(simple mean / weighted mean)设一组数据为:设一组数据为: x x1 1 ,x x2 2 , ,x xn n各组的组中值为:各组的组中值为:MM1 1 ,MM2 2 , ,MMk k 相应的频数为:相应的频数为: f f1 1 , f f2 2 , ,f fk k简单均值简单均值加权均值加权均值4 - 22已改至此!已改至此!某某电脑电脑电脑电脑 公司公司销销销销售量数据分售量数据分

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号