直方图和其他频率分布图histogramandotherfrequencydistributions.doc

上传人:m**** 文档编号:556199740 上传时间:2023-04-13 格式:DOC 页数:7 大小:366KB
返回 下载 相关 举报
直方图和其他频率分布图histogramandotherfrequencydistributions.doc_第1页
第1页 / 共7页
直方图和其他频率分布图histogramandotherfrequencydistributions.doc_第2页
第2页 / 共7页
直方图和其他频率分布图histogramandotherfrequencydistributions.doc_第3页
第3页 / 共7页
直方图和其他频率分布图histogramandotherfrequencydistributions.doc_第4页
第4页 / 共7页
直方图和其他频率分布图histogramandotherfrequencydistributions.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《直方图和其他频率分布图histogramandotherfrequencydistributions.doc》由会员分享,可在线阅读,更多相关《直方图和其他频率分布图histogramandotherfrequencydistributions.doc(7页珍藏版)》请在金锄头文库上搜索。

1、直方图和其余频次散布图(histogramandotherfrequencydistributions)直方图和其余频次散布图(histogramandotherfrequencydistributior.s包含多边形图、茎叶图、点图、分位图、CDF图、积累多边形图。概括频次散布表示了一组数据不同数值出现的频数。直方图是最常用的频次散布图,与条形图很相像,可是二者之问有些重要的差别。这部分也包含了其余的频次散布图。多边形图和直方图的形状同样,可是用线而不是条柱连结频次值;茎叶图经过运用单个数值作为数据点的表记来保留单个数值:点图是在一条垂线上用小圆圈表示每个数据点;分位图和积累点线图表示有多少

2、丈量值(或丈量值的百分比)小于或等于每个值。合用处合数据是数值型时;想弄清楚数据散布的形状;确立一个过程的输出能否近乎切合正态散布;剖析一个过程能否知足顾客的要求;剖析供给商的过程输出的散布状况;检查两个时间段内过程能否发生交化;确立两个或多个过程输出能否不同;将散布状况迅速简单地表示出来。决议树(图表5.68)有助于确立最合适于表示不同的数据和目的的图形。实行步骤建立1从一个过程中采集起码50个连续的数据点。假如没有那么多半据,就使用点图。2用直方图计算表(参阅图表5.81)成立直方图。经过填写计算表确立组数,组距和组边界值。计算完步骤2的组距(W)后,判断并将其调整到一个方便计算的数比方,

3、你能够将0.9调整到1.0。W的小数位不可以比图中数的小数位多。3在图纸上画x轴和y轴。y轴表示数据出现的个数。用计算表上当算获得的L值在x轴标刻度。这些数值之差是组距。条柱间不要留缝隙。4关于每个数据,正确找出其落入的组,并在该组上增添一个x或涂上一段条柱。假如数据恰好落在组限处,则将该数据记入其右边的一组内。剖析1在从直方图获得任何结论以前,保证所研究的时段内过程稳固。假如在直方图表示的时段内有任何异样状况发生,那么所剖析的直方图的形状可能无效。2剖析直方图形状表示的意义。参阅一些典型形状及其意义的注意事项部分。过程名称:计算人员:数据日期:制表日期:步骤1确立组数确立数据分组数。下面是一

4、些经验预计,供参照。数据个数组数(B)5078910010B11150121320014步骤2确立组距数据范围R最大值最小值组距WRB组距便于调整,组距不宜有太多小数位W步骤3计算组限选择一个方便计算的L1作为第一个组的下界限,而且这个数要比数据中的最小值略小。第二个组的下界限是L1+W,其余组的下界限挨次加W:L1L2L3L4L5L6L7L8L9L10L11L12L13L14图表5.81直方图计算表示例公牛犬保龄球队想提升他们在团队中的名誉。队员决定研究一下他们上个月的成绩。55个保龄球成绩以下:103107111115115118119121122124124125126127127129

5、134135137138139141142144145146147148148149150151152153153154155155155156157159160161163163165165167170172176177183198使用直方图计算表,预计B值为7。最大值为198,最小值为103,因此值的范围是:R最大值最小值19810395组距是:W=RB=957=13.6保龄球分数没有小数点,因此组距也没有小数部分。13.6近似为14。因为14在计算时不方便,因此调整为15。选择第一个组的下界限为100,因此其余组的界限为:100+15=115115+15=130,依此类推图表5.82是他

6、们画的直方图。从图上看是双峰散布:一部分队员的成绩是在100分左右,另一部分队员的成绩在150分左右。要提升整个球队的水平,球员能够努力提升每一个人的成绩使整个直方图向右挪动,或许集中精力提高成绩偏低的队员的水平,减少散布范围,使团队整体拥有一致性。注意事项以下是几种典型的直方图形状及其意义:正态:一种最常有的形如钟形的正态散布(图表5.83)。正态散布均匀值左右两边的点发生的概率相等。可是要注意其余散布看起来和正态散布相像,我们能够用统计计算方法来证明正态散布,如正态概率图或拟合优度检测。但是假如直方图的形状不同样,就能够证明散布不是正态的。不要让“正态”这个叫法诱惑你。好多过程的输出(也许

7、很大一部分)不听从正态散布,但这其实不意味着过程犯错。比如,好多过程一侧都有限制条件,就致使偏态散布。即使这些散布不被称为正态,但我们能够称这些过程是正态的(意味着典型的)。偏态:偏态散布(图表5.84)倾向一侧是因为限制条件阻挡了均匀值另一侧的结果。散布的峰因为限制条件而偏离中心,一段尾部延长。比方,一项纯度比较高的产品的纯度散布一定是偏态的,因为产品的纯度不行能超出100%。其余例子如:洞的直径不行能小于钻头的直径,打电话的时间不行能小于零。这些散布按尾部的方向而被称为右偏或左偏。图表584属于右偏。双峰:双峰散布(图表5.85)的形状像双峰骆驼的后背,是不同散布的两个过程结果归并在一同获

8、得的。比方,从两班操作中获得的生产数据假如每班生产听从不同的正态散布,则结果可能是双峰图。分层就是为了检查这个问题。平顶:平顶散布(图表5.86)也叫多峰散布。由若干正态散布组合而成。因为图形有很多峰,极点的散布看起来像平顶。边峰:边峰散布(矧表5.87)除了一端尾部有一个顶峰之外很像正态散布。一般这种状况因为建立直方图犯错造成,比方把几个组归并到一同成为一个组,注明“大于”。梳状:梳状散布(图表5.88)的柱高低交织。这种散布经常是因为对数据四舍五人或建立直方图不正确造成的。比方,温度数据近似成0.2度而其直方图的组距是0.1度,此时直方图的形状就是梳状型。截尾或切心:截尾或切心散布(图表5

9、.89)是一个正态散布去掉了尾部。供方生产的资料可能听从正态散布,但依赖查验将切合与不切合标准的产品分开。最后装货给顾客的切合标准的部分就成为切心。残尾:残尾散布(图表5.90)是缺乏均值邻近的部分。假如顾客接受了这种散布,那么一定有人接受了切心部分。只管顾客接受的部分在规定范围内产品分红两组:一组凑近上规定限,另一组凑近下规定限,但这些变异经常会致使顾客过程的变异。当数据是数值型时合适用直方图。假如数据是分类的(示值或序数的)则用条形图。条形图中条柱间可有缝隙,直方图的条柱间相连也说了然数值刻度是连续的。依据依据陈腐数据作的直方图采纳举措时要慎重,因为数据采集后过程可能已经发生了变化。假如数

10、据点极少,解说直方图要当心,任何少于50个数据获得的直方图都应经过严格推敲。对直方图形状的解说都不过理论上的,一定经过对过程直接察看确实认。直方图不可以明确判断一个散布是正态散布,还有其余散布和正态散布形状相像。详情参阅“正态概率图”。假如过程稳固,直方图能够用来展望未来的状况。假如过程不稳固,直方图不过表现过去的状况。假如在直方图表示的时段内有任何异样状况发生,那么所剖析的直方图只合用于那个时段。此外一种工具,盒形图可作为直方图的代替,用来描绘一组数据最重要的特征,特别当没有足够的数据作直方图时。参阅“盒形图”。相关结构清楚、适用的图的详情参阅“图形方法”。多边形图【polygonchart

11、)概括多边形图和直方图相像。不同的是:不是用条柱而是用点表示个数,用线连拉这些点,结果散布形状的轮廓是多边形。有时多边形图也被称为直方图,特别当数据好多致使线条变得光滑时。实行步骤除步骤4外,其余的和直方图的实行步骤同样:4在x轴上每个区间的中点上方画一点,此点与y轴上代表合适个数的值相对应,在相邻点之间画直线,最外层的点与x轴上的上、下限点用直线连结。示例图表5.9l是公牛犬队保龄球分数的多边形图。茎叶图(stem-and-leafdisplay)概括茎叶图是直方图的一种,显示单个数据值。它使用数据中最不明显的数字作为象征表示该数据在图中的状况。实行步骤1确立数据中变化的数字,从一组序列数据

12、中左起选择23个最重要的数,最右边的位即为叶,左侧的1或2位是茎。2在纸上画一条垂直的线,线的左侧按从小到大的次序写上茎的值。3线的右边与茎相对应的地点写上这个数的叶的值,叶右边的数字不再使用。4 在图表中写明图例以方便看图。示例图表5.92是公牛犬保龄球队分数的茎叶图。分数中只有右边两个数字在变化,但公牛队选择把左侧数字写成两位(也能够是0),以便未来使用,而且他们以为全部的数字都是重要的。右边叶子是3、7等个位数,而其余的10,1l,12等两位数字(十位和百位)则作为茎。第一行:1037代表数值103和107。固然间距不样,但茎叶图也表现出我们在直方图中看到的双峰状。点图(pointgra

13、ph)概括点图用于表示数据点不多时的散布状况。每个散布用一条垂线上的小圆圈表示,当圆圈太多不可以分辨有多少个圆圈重叠在一同时点图就无效了。这种状况下就要用直方图。实行步骤1在一条线上标刻度来表示数据的数值范围,能够是水平线或许垂直线,标上丈量单位。2在平行于刻度线的一条线上画小圆圈,表示每个数据点。假如有两个等值的点要稍微划分开以便能看得出。3假如比较几组数据集则分别在不同的平行线上为为每组数画圈。示例图表5.93是比较两个散布的点图,改良后所需的发票办理时间和改造前对比成效是显然的。分位点图(percentilegraph)别名:分位数图(quantilegraph)概括分位点图显示察看值小于或等于每个值的比率。沿着x轴从左到右的比率累计,图的最右边描的值是100分位点。有时也把分位点标在y轴上,数值标在x轴上。合用处合比起每个值的个数而言,对数据落在或小于每个值的比率更感兴趣时。实行步骤1 将数据集的全部值按从小到大的次序排列,从最小1到最大挨次注明序号。假如一共n个数,每个数的分位点

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号