《从数据中寻找规律——直方图》由会员分享,可在线阅读,更多相关《从数据中寻找规律——直方图(20页珍藏版)》请在金锄头文库上搜索。
1、从数据中寻找规律直方图一个实例:n某工厂接收了一批外协厂制造的青铜轴承用于生产一种重要的仪器。但该厂不能信任生产这些轴承厂家的工作,决定对供应商提供的轴承进行分析。n这些轴承的关键特性是它们的内径,其规格为1.3760.010英寸。n现抽取了100个青铜轴承,对它们的内径进行仔细的测量,并记录了测量结果。100个青铜轴承内径的测量值如下表:数据会告诉您什么呢?回答n数据列表不能表达出任何有实际意义的 东西(Virtually Nothing)!n必须对数据进行进一步分析。n图形可以帮助我们将数据转换成信息。数据 列表能否接受这批产品?n与目标值相比较:平均值:1.3773n与规格界限相比较:极
2、差(最大值-最小值)=1.383-1.370=0.013n数据分布的更进一步的信息:数据分成10组后,落在每个区间内的数据个数:数据量分组数50-1006-10100-2507-12250个以 上10-251.376 0.010制作频数分布表绘制直方图LSLUSL分析直方图n与规格限1.3661.386进行比较,所有的测量值都在其范围内(而且在+/-3S的范围内)。n分布基本上是对称的,有一点点向右偏斜,但不严重。n所以该厂决定接收这批青铜轴承。建议:轴承的加工中心应该左移;建立一个直方图n收集整理数据n定组数 Nn算极差 Rn定组距 In确定组的中心点和各组界限n制作频数分布表n绘制直方图n
3、分析数据量分组数50-1006-10100-2507-12250个以 上10-25直方图告诉我们n数据分布的中心位置(Average)在哪里?n数据分散程度(Spread)如何?n数据分布的形状(Shape)怎样?经验之谈: 对大多数工业用的分析来说,50个数值具备足够 的可靠性。 但单个测量值的费用比较低时,或是当需要准确 分析时,可以采用100个或更多的数据。N ( , 2)-: 总体平均值,描述数据的集中位置 。 :总体标准差,描述数据的分散程度 。x N(,2)理想情况:正态曲线n不同(均值)n不同(标准差 )正态曲线的特征n曲线关于对称;n当x=时取到最大值;nX离越远,f(x)的值越小;正态曲线68%68% 95%95% 99.7%99.7%现实状况:一些异常 双峰 峭壁分析直方图举例:USLLSLAA图LSLUSLLSLUSLLSLUSL直方图的峰度和对称度对称度(Skewness):直方图数据分布的对称性;峰度(Kurtosis):直方图数据分布的陡峭度;直方图为对称分布的,则s=0;直方图为正态分布的,则s=0,k=0。直方图的作用n显示数据的分布特征n指出采取措施的必要n观察采取措施后的效果n比较和评估设备、供应商、物料等n评估过程的能力课 程 内 容 回 顾