ch03数据分布特征的描述

上传人:宝路 文档编号:48109540 上传时间:2018-07-10 格式:PPT 页数:92 大小:4MB
返回 下载 相关 举报
ch03数据分布特征的描述_第1页
第1页 / 共92页
ch03数据分布特征的描述_第2页
第2页 / 共92页
ch03数据分布特征的描述_第3页
第3页 / 共92页
ch03数据分布特征的描述_第4页
第4页 / 共92页
ch03数据分布特征的描述_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《ch03数据分布特征的描述》由会员分享,可在线阅读,更多相关《ch03数据分布特征的描述(92页珍藏版)》请在金锄头文库上搜索。

1、1 1第三章第三章 数据分布特征的描述数据分布特征的描述n n第一节第一节 集中趋势的测定集中趋势的测定 n n第二节第二节 离散程度的测定离散程度的测定n n第三节第三节 偏态与峰度的测定偏态与峰度的测定2 2数据分布的特征数据分布的特征集中趋势集中趋势 ( (位置位置) )离中趋势离中趋势( (分散程度分散程度) )偏态和峰度偏态和峰度(形状)(形状)3 3数据分布的特征和测度数据分布的特征和测度峰峰 度度偏偏 态态数据的特征和测度分布的形状集中趋势离散程度众众 数数中位数中位数离散系数离散系数方差和标准差方差和标准差四分位差四分位差异众比率异众比率位置位置 平均数平均数数值数值 平均数平

2、均数算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数4 4第一节第一节 集中趋势的测定集中趋势的测定一一. . 定类数据:众数定类数据:众数 二二. . 定序数据:中位数和分位数定序数据:中位数和分位数 三三. . 定距和定比数据:数值平均数定距和定比数据:数值平均数 四四. . 众数、中位数和算术平均数的比较众数、中位数和算术平均数的比较5 5数据分布的特征和测度数据分布的特征和测度 (本节位置)(本节位置)数据的特征和测度分布的形状集中趋势离散程度众众 数数中位数中位数离散系数离散系数方差和标准差方差和标准差四分位差四分位差异众比率异众比率位置位置 平均数平均数数值数值 平均数

3、平均数算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数峰峰 度度偏偏 态态6 6集中趋势集中趋势 ( (Central tendency)Central tendency) 1. 1. 一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度2. 2. 测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值3. 3. 不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4. 4. 低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据, 反过来,高层次数据的集中趋势

4、测度值并不适用于低层次反过来,高层次数据的集中趋势测度值并不适用于低层次 的测量数据的测量数据5. 5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握选用哪一个测度值来反映数据的集中趋势,要根据所掌握 的数据的类型来确定的数据的类型来确定7 7众众 数数8 8众数众数( (modemode) )( (概念要点概念要点) )1. 1. 集中趋势的测度值之一集中趋势的测度值之一2. 2. 出现次数最多的变量值出现次数最多的变量值3. 3. 不受极端值的影响不受极端值的影响4. 4. 可能没有众数或有几个众数可能没有众数或有几个众数5. 5. 主要用于定类数据,也可用于定序数据主要用于定类数据

5、,也可用于定序数据 和数值型数据和数值型数据9 9众数众数( (modemode) )( (众数的不唯一性众数的不唯一性) )n n无众数无众数 原始数据原始数据: 10 5 9 12 6 8: 10 5 9 12 6 8一个众数一个众数 原始数据原始数据: 6 : 6 5 5 9 8 9 8 5 55 5多于一个众数多于一个众数 原始数据原始数据: 25 : 25 28 2828 28 36 36 42 4242 421010定类数据的众数定类数据的众数 ( (算例算例) )表3-1 某城市居民关注广告类型的频数分布 广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘

6、广告其他广告112 51 9 16 10 20.560 0.255 0.045 0.080 0.050 0.01056.0 25.5 4.5 8.0 5.0 1.0合计2001100【例例】根据表根据表3-13-1中的数据,计算众数中的数据,计算众数解解:这里的变量为这里的变量为“ “广告类型广告类型” ” ,这是个定类变量,不同类型,这是个定类变量,不同类型 的广告就是变量值。我们看到的广告就是变量值。我们看到 ,在所调查的,在所调查的200200人当中,关人当中,关 注商品广告的人数最多,为注商品广告的人数最多,为 112112人,占总被调查人数的人,占总被调查人数的 56%56%,因此众

7、数为,因此众数为“ “商品广告商品广告” ” 这一类别,即这一类别,即 MMo o商品广告商品广告1111定序数据的众数定序数据的众数 ( (算例算例) )【例例】根据表根据表3-23-2中的数据,计算众数中的数据,计算众数解:解:这里的数据为定这里的数据为定 序数据。变量为序数据。变量为“ “回回 答类别答类别” ”。甲城市中。甲城市中 对住房表示不满意的对住房表示不满意的 户数最多,为户数最多,为108108户户 ,因此众数为,因此众数为“ “不满不满 意意” ”这一类别,即这一类别,即MMo o不满意不满意表3-2 甲城市家庭对住房状况评价的频数分布 回答类别甲城市 户数 (户)百分比

8、(%)非常不满意不满意一般满意非常满意24 108 93 45 308 36 31 15 10合计300100.01212数值型分组数据的众数数值型分组数据的众数 ( (要点及计算公式要点及计算公式) )1. 1. 众数的值与相邻两组频数的分布有关众数的值与相邻两组频数的分布有关4.4. 该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布2. 2. 相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值 即为众数即为众数MMo o3. 3. 相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下 列近似公式计算列近似公式计算MMo

9、oMMo o1313数值型分组数据的众数数值型分组数据的众数 ( (算例算例) )表3-3 某车间50名工人日加工零件数分组表 按零件数分组频数(人)累积频数105110 110115 115120 120125 125130 130135 1351403 5 8 14 10 6 43 8 16 30 40 46 50合计50【例例3 3.1 .1】 根据表根据表3-3-3 3 中的数据中的数据 ,计算,计算5050 名工人日名工人日 加工零件加工零件 数的众数数的众数1414中位数和分位数中位数和分位数1515中位数中位数( (medianmedian) ) ( (概念要点概念要点) )1.

10、 1. 集中趋势的测度值之一集中趋势的测度值之一 2. 2. 排序后处于中间位置上的值排序后处于中间位置上的值MMe e50%50%50%50%3.3. 不受极端值的影响不受极端值的影响4.4. 主要用于定序数据,也可用数值型数据,但不能用于定主要用于定序数据,也可用数值型数据,但不能用于定 类数据类数据5.5. 各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即1616中位数中位数( (medianmedian) ) ( (位置的确定位置的确定) )未分组数据:未分组数据:组距分组数据:组距分组数据:2f=中位数位置N N为奇数为奇数N N为偶数为偶数1717未

11、分组数据的中位数未分组数据的中位数 ( (计算公式计算公式) )1818定序数据的中位数定序数据的中位数 ( (算例算例) )【例例3 3.2 .2】根据表根据表3-23-2中的数据,计中的数据,计 算甲城市家庭对住房满意状况评价算甲城市家庭对住房满意状况评价 的中位数的中位数解:解:中位数的位置为:中位数的位置为:300/2300/2150150从累计频数看,中位数从累计频数看,中位数 的在的在“ “一般一般” ”这一组别中这一组别中 。因此。因此MMe e一般一般表3-2 甲城市家庭对住房状况评价的频数分布 回答类别甲城市 户数 (户)累计频数非常不满意不满意一般满意非常满意24 108

12、93 45 3024 132 225 270 300合计3001919数值型未分组数据的中位数数值型未分组数据的中位数(5(5个数据的算例个数据的算例) )n n原始数据原始数据: : 24 22 21 26 2024 22 21 26 20n n排排 序序: : 20 21 22 24 26 20 21 22 24 26n n位位 置置: : 1 2 1 2 3 3 4 5 4 5中位数中位数 22222020数值型未分组数据的中位数数值型未分组数据的中位数(6(6个数据的算例个数据的算例) )n n原始数据原始数据: : 10 510 5 9 12 6 8 9 12 6 8n n排排 序序

13、: : 5 6 8 9 10 12 5 6 8 9 10 12n n位位 置置: : 1 2 1 2 3 3 4 4 5 65 6位置位置N+N+1 12 26+16+12 23.53.5中位数中位数 8 + 98 + 92 28.58.521211.1.根据位置公式确定中位数所在的组根据位置公式确定中位数所在的组2.2.采用下列近似公式计算采用下列近似公式计算:该公式假定中位数组的频数在该组内均匀分布该公式假定中位数组的频数在该组内均匀分布数值型分组数据的中位数数值型分组数据的中位数 ( (要点及计算公式要点及计算公式) )ifSfLMmme- +=-12&2222数值型分组数据的中位数数值

14、型分组数据的中位数 ( (算例算例) )表3-3 某车间50名工人日加工零件数分组表 按零件数分组频数(人)累积频数105110 110115 115120 120125 125130 130135 1351403 5 8 14 10 6 43 8 16 30 40 46 50合计50【例例3 3.3 .3】 根据第三根据第三 章表章表3-3-3 3中中 的数据,的数据, 计算计算50 50 名名 工人日加工人日加 工零件数工零件数 的中位数的中位数2323四分位数四分位数( (quartilequartile) ) ( (概念要点概念要点) )n n1. 1. 集中趋势的测度值之一集中趋势的测度值之一n n2. 2. 排序后处于排序后处于25%25%和和75%75%位置上的值位置上的值n n3. 3. 不受极端值的影响不受极端值的影响n n4. 4. 主要用于定序数据,也可用于数值型数主要用于定序数据,也可用于数值型数 据,但不能用于定类数据据,但不能用于定类数据QQL LQQMMQQU U25%25%25%25%25%25%25%25%2424四分位数四分位数( (quartilequartile) ) ( (位置的确定位置的确定) )未分组数据:未

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号