直方图和其他频率分布图(histogram and other frequency distributions)

上传人:zhuli****0000 文档编号:13742140 上传时间:2017-10-25 格式:DOC 页数:7 大小:936.50KB
返回 下载 相关 举报
直方图和其他频率分布图(histogram and other frequency distributions)_第1页
第1页 / 共7页
直方图和其他频率分布图(histogram and other frequency distributions)_第2页
第2页 / 共7页
直方图和其他频率分布图(histogram and other frequency distributions)_第3页
第3页 / 共7页
直方图和其他频率分布图(histogram and other frequency distributions)_第4页
第4页 / 共7页
直方图和其他频率分布图(histogram and other frequency distributions)_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《直方图和其他频率分布图(histogram and other frequency distributions)》由会员分享,可在线阅读,更多相关《直方图和其他频率分布图(histogram and other frequency distributions)(7页珍藏版)》请在金锄头文库上搜索。

1、直方图和其他频率分布图(histogram and other frequency distributions)直方图和其他频率分布图(histogram and other frequency distributior.s包括多边形图、茎叶图、点图、分位图、CDF 图、累积多边形图。 概述频率分布表明了一组数据不同数值出现的频数。直方图是最常用的频率分布图,与条形图很相似,但是两者之问有些重要的区别。这部分也包含了其他的频率分布图。多边形图和直方图的形状一样,但是用线而不是条柱连接频率值;茎叶图通过运用单个数值作为数据点的标识来保存单个数值:点图是在一条垂线上用小圆圈表示每个数据点;分位图和

2、累积点线图表示有多少测量值(或测量值的百分比)小于或等于每个值。 适用场合数据是数值型时;想弄清楚数据分布的形状;确定一个过程的输出是否近乎符合正态分布;分析一个过程是否满足顾客的要求;分析供应商的过程输出的分布情况;检查两个时间段内过程是否发生交化;确定两个或多个过程输出是否不同;将分布情况快速简单地表示出来。决策树(图表 5. 68)有助于确定最适合于表示不同的数据和目的的图形。 实施步骤构建1从一个过程中搜集至少 50 个连续的数据点。如果没有那么多数据,就使用点图。2用直方图计算表(参阅图表 5.81)建立直方图。通过填写计算表确定组数,组距和组边界值。计算完步骤 2 的组距(W)后,

3、判断并将其调整到一个方便计算的数比如,你可以将 0.9调整到 1.0。W 的小数位不能比图中数的小数位多。3在图纸上画 x 轴和 y 轴。y 轴表示数据出现的个数。用计算表中计算得到的 L 值在 x轴标刻度。这些数值之差是组距。条柱间不要留空隙。4对于每个数据,准确找出其落入的组,并在该组上增加一个 x 或涂上一段条柱。如果数据刚好落在组限处,则将该数据记入其右侧的一组内。分析1在从直方图得到任何结论之前,保证所研究的时段内过程稳定。如果在直方图表示的时段内有任何异常情况发生,那么所分析的直方图的形状可能无效。2分析直方图形状表示的意义。参阅一些典型形状及其意义的注意事项部分。过程名称: 计算

4、人员: 数据日期: 制表日期:步骤 1确定组数确定数据分组数。下面是一些经验估计,供参考。数据个数 组数(B)50 789100 10 B 11150 1213200 14步骤 2确定组距数据范围R最大值最小值 组距WRB 组距便于调整,组距不宜有太多小数位W 步骤 3计算组限选择一个方便计算的 L1 作为第一个组的下边界,并且这个数要比数据中的最小值略小。第二个组的下边界是 L1+W,其余组的下边界依次加 W:L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L11 L12 L13 L14 图表 5.81 直方图计算表 示例公牛犬保龄球队想提高他们在团队中的声望。队员决定研究一下

5、他们上个月的成绩。55 个保龄球成绩如下:103 107 111 115 115 118 119 121 122 124 124125 126 127 127 129 134 135 137 138 139 141142 144 145 146 147 148 148 149 150 151 152153 153 154 155 155 155 156 157 159 160 161163 163 165 165 167 170 172 176 177 183 198使用直方图计算表,估计 B 值为 7。最大值为 198,最小值为 103,所以值的范围是:R最大值最小值19810395组距是:

6、 W =RB =957=13. 6保龄球分数没有小数点,所以组距也没有小数部分。13.6 近似为 14。因为 14 在计算时不方便,所以调整为 15。选择第一个组的下边界为100,所以其他组的边界为:100+15 =115115+15=130,依此类推图表 5. 82 是他们画的直方图。从图上看是双峰分布:一部分队员的成绩是在 100 分左右,另一部分队员的成绩在 150 分左右。要提高整个球队的水平,球员可以努力提高每个人的成绩使整个直方图向右移动,或者集中精力提高成绩偏低的队员的水平,减少分布范围,使团队整体具有一致性。 注意事项以下是几种典型的直方图形状及其意义:正态:一种最常见的形如钟

7、形的正态分布(图表 5. 83)。正态分布平均值左右两边的点发生的概率相等。但是要注意其他分布看起来和正态分布相似,我们可以用统计计算方法来证明正态分布,如正态概率图或拟合优度检测。然而如果直方图的形状不一样,就可以证明分布不是正态的。不要让“正态”这个叫法迷惑你。很多过程的输出(或许很大一部分)不服从正态分布,但这并不意味着过程出错。例如,很多过程一侧都有限制条件,就导致偏态分布。即便这些分布不被称为正态,但我们可以称这些过程是正态的(意味着典型的) 。偏态:偏态分布(图表 5. 84)偏向一侧是因为限制条件阻止了平均值另一侧的结果。分布的峰由于限制条件而偏离中心,一段尾部延伸。比如,一项纯

8、度比较高的产品的纯度分布肯定是偏态的,因为产品的纯度不可能超过 100%。其他例子如:洞的直径不可能小于钻头的直径,打电话的时间不可能小于零。这些分布按尾部的方向而被称为右偏或左偏。图表 5 84 属于右偏。双峰:双峰分布(图表 5. 85)的形状像双峰骆驼的后背,是不同分布的两个过程结果合并在一起得到的。比如,从两班操作中得到的生产数据如果每班生产服从不同的正态分布,则结果可能是双峰图。分层就是为了检查这个问题。平顶:平顶分布(图表 5.86)也叫多峰分布。由若干正态分布组合而成。因为图形有许多峰,顶点的分布看起来像平顶。边峰:边峰分布(矧表 5. 87)除了一端尾部有一个高峰以外很像正态分

9、布。一般这种情况由于构建直方图出错造成,比如把几个组合并到一起成为一个组,注明“大于” 。梳状:梳状分布(图表 5. 88)的柱高低交错。这类分布常常是由于对数据四舍五人或构建直方图不正确造成的。比如,温度数据近似成 0.2 度而其直方图的组距是 0.1 度,此时直方图的形状就是梳状型。截尾或切心:截尾或切心分布(图表 5.89)是一个正态分布去掉了尾部。供方生产的材料可能服从正态分布,但依靠检验将符合与不符合标准的产品分开。最后装货给顾客的符合标准的部分就成为切心。残尾:残尾分布(图表 5.90)是缺少均值附近的部分。如果顾客接受了这种分布,那么肯定有人接受了切心部分。尽管顾客接受的部分在规

10、定范围内产品分成两组:一组靠近上规定限,另一组靠近下规定限,但这些变异常常会导致顾客过程的变异。当数据是数值型时适合用直方图。如果数据是分类的(示值或序数的)则用条形图。条形图中条柱间可有空隙,直方图的条柱间相连也说明了数值刻度是连续的。依照根据陈旧数据作的直方图采取措施时要谨慎,因为数据收集后过程可能已经发生了变化。如果数据点很少,解释直方图要小心,任何少于 50 个数据得到的直方图都应经过严格推敲。对直方图形状的解释都只是理论上的,必须经过对过程直接观察的确认。直方图不能明确判断一个分布是正态分布,还有其他分布和正态分布形状相似。详情参阅“正态概率图” 。如果过程稳定,直方图可以用来预测未

11、来的情况。如果过程不稳定,直方图仅仅体现过去的情况。如果在直方图表示的时段内有任何异常情况发生,那么所分析的直方图只适用于那个时段。另外一种工具,盒形图可作为直方图的替代,用来描述一组数据最重要的特性,尤其当没有足够的数据作直方图时。参阅“盒形图” 。有关构造清晰、实用的图的详情参阅“图形方法” 。 多边形图【polygon chart) 概述多边形图和直方图相似。不同的是:不是用条柱而是用点表示个数,用线连拉这些点,结果分布形状的轮廓是多边形。有时多边形图也被称为直方图,尤其当数据很多以致线条变得平滑时。 实施步骤除步骤 4 外,其他的和直方图的实施步骤相同:4在 x 轴上每个区间的中点上方

12、画一点,此点与 y 轴上代表适当个数的值相对应,在相邻点之间画直线,最外层的点与 x 轴上的上、下限点用直线连接。 示例图表 5. 9l 是公牛犬队保龄球分数的多边形图。 茎叶图( stem-and-leaf display) 概述茎叶图是直方图的一种,显示单个数据值。它使用数据中最不显著的数字作为象征表示该数据在图中的情况。 实施步骤1确定数据中变化的数字,从一组序列数据中左起选择 23 个最重要的数,最右边的位即为叶,左边的 1 或 2 位是茎。2 在纸上画一条垂直的线,线的左边按从小到大的顺序写上茎的值。3线的右边与茎相对应的位置写上这个数的叶的值,叶右边的数字不再使用。4 在图表中写明

13、图例以方便看图。 示例图表 5. 92 是公牛犬保龄球队分数的茎叶图。分数中只有右边两个数字在变化,但公牛队选择把左边数字写成两位(也可以是 0) ,以便将来使用,并且他们认为所有的数字都是重要的。右边叶子是3、7 等个位数,而其余的 10,1l,12 等两位数字(十位和百位)则作为茎。第一行:103 7 代表数值 103 和 107。虽然间距不样,但茎叶图也呈现出我们在直方图中看到的双峰状。 点图( point graph) 概述点图用于表示数据点不多时的分布情况。每个分布用一条垂线上的小圆圈表示,当圆圈太多不能分辨有多少个圆圈重叠在一起时点图就失效了。这种情况下就要用直方图。 实施步骤1在

14、一条线上标刻度来表示数据的数值范围,可以是水平线或者垂直线,标上测量单位。2在平行于刻度线的一条线上画小圆圈,表示每个数据点。如果有两个等值的点要轻微区分开以便能看得出。3如果比较几组数据集则分别在不同的平行线上为为每组数画圈。 示例图表 5.93 是比较两个分布的点图,改进后所需的发票处理时间和改造前相比效果是明显的。 分位点图(percentile graph)又名:分位数图(quantile graph) 概述分位点图显示观察值小于或等于每个值的比例。沿着 x 轴从左到右的比例累计,图的最右边描的值是 100 分位点。有时也把分位点标在 y轴上,数值标在 x 轴上。 适用场合比起每个值的

15、个数而言,对数据落在或小于每个值的比例更感兴趣时。 实施步骤1 将数据集的所有值按从小到大的顺序排列,从最小 1 到最大依次标明序号。如果一共 n 个数,每个数的分位点是:分位点(序号0.5)/n100。当几个数相等时,用最大的序号数来计算这个值的分位点。2画轴线,标记刻度,y 轴是数据集的数值范围,x 轴分位点范围是 0l00。3 在图上 y 轴的值与 x 轴上相对应的分位点处标点。 示例为简便计算,示例只选 10 个数。这种方法在处理大量数据时很有用。10 个孩子身高分别是 62,57,55,56,57,53,58,60,57,55(单位为英寸) ,按从小到大的顺序排列这些数,写山序号并计算分位点。分位点计算结果如图表 5.94 所不,从图上就可以回答诸如:“四分之三孩子的高度低于什么值?”第 75 个百分位点对应 58 英寸,所以四分之三孩子的高度低于 58 英寸。中间数据比较接近,两端数据相互分离。这说明只有几个孩子比其他孩子高

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号