六西格玛教材40-7(unit-2定义 2.4 基本统计)

上传人:小** 文档编号:87414792 上传时间:2019-04-05 格式:PPT 页数:62 大小:3.65MB
返回 下载 相关 举报
六西格玛教材40-7(unit-2定义 2.4 基本统计)_第1页
第1页 / 共62页
六西格玛教材40-7(unit-2定义 2.4 基本统计)_第2页
第2页 / 共62页
六西格玛教材40-7(unit-2定义 2.4 基本统计)_第3页
第3页 / 共62页
六西格玛教材40-7(unit-2定义 2.4 基本统计)_第4页
第4页 / 共62页
六西格玛教材40-7(unit-2定义 2.4 基本统计)_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《六西格玛教材40-7(unit-2定义 2.4 基本统计)》由会员分享,可在线阅读,更多相关《六西格玛教材40-7(unit-2定义 2.4 基本统计)(62页珍藏版)》请在金锄头文库上搜索。

1、基本统计 (Basic Statistics),Define,Measure,Analyze,Improve,Control,Step 4- 确定项目Ys,Step 5- 确认Y的现水准,Step 6-发掘潜在的原因 变量(X),基础统计学 Minitab简介 测量系统分析 Y的表现水平 及目标 确定改进目标,路径位置,使用统计的目的,确定工程是否稳定 如果工程不稳定,鉴别并祛除不稳定的要因 确定工程的平均值的位置 - 它在目标线上吗? 如果不在,确定影响平均值的变量,并决定最优的设置以达到 目标值 估计总散布的幅度 - 与顾客的要求(规格限)比起来,是可接受的吗? 如果不是, 确定散布源,而

2、后消除或减少他们对工程的影响。 我们现在就将回顾统计学以帮助我们的工程,Data的种类 统计的基础 流程的散布 Graphical Presentation 正态分布 统计量的陈述方法 Data Mining,目录,Data的种类,记数型数据( Attribute Data ) (定性的) 种类 好 / 坏 机器1, 机器2, 机器3 班次 记数事件 (如文件中的错误数, 装船的部品数,等) 计量型数据( Variable Data ) (定量的) - 连续的数据 (有意义的小数) 时间(秒) 压力 (psi) 传送带速度 (ft/min) Rate (inches) 等等.,Categori

3、cal Data (分类数据),Measurement Data (测量数据),Nominal (定性数据),Ordinal (顺序数据),Continuous (连续数据),Counting (计数数据),Discrete Data (离散数据),Data的种类,问题 判断下面的情况是计数型还是计量型?,1) 不同地区顾客的平均消费,电话待机时间 2) Zip drive 中发生的 S/W 故障次数 3) 雇员 - Tom, Nancy, Howard. 4) 顾客别商品保证金 5) 没有误差发生的支出 6) 输入预定支出完了所用时间,Data的种类,Data的种类,记数型,计量型,计量型,

4、记数型,输出,输入,Chi-square,散布分析,判别式分析 Logistic regression,相关分析 多重回归,统计分析路径图,统计的基础,同样制作这样代表值是非常重要的.,本课程观察统计学者研究出的代表值.,在统计调查中可以基于概率论知识,通过观察被调查对象的一部分的结果对总体作以统计性的推测. 我们不可能对所有事件(或现象)都进行调查,而且这样会消耗很多时间和费用.所以我们可以从母集团选择sample,并通过求出sample的代表值来推测母集团.,概率的了解,通过投骰子游戏了解概率 想象投两个骰子的实验. 如果每次投两个骰子其和为 311时其结果 “满足” 的话 预测投骰子出现

5、缺陷的概率?,统计的基础,概率的了解(投骰子),两个股子的和出现2的组合有多少?两个股子的和为12的组合是? 总组合数是?,统计的基础,概率的了解,即, 出现缺陷的可能性是 %?,统计的基础,概率的了解,用dice 1和2投500次,统计的基础,规格下限,规格上限,概率的了解,统计的基础,概率的了解,概率的了解 概率代表可能性, 以个数 或分布开始计算. 概率分布的定义 这样的概率的累积叫概率分布. 问 : 前页的histogram图是计数型数据的概率分布图 那么如果采用计量型数据的话其图形将会是什么形态?,统计的基础,Data的中心值测定,平均: 一组数据的算术平均 反映所有数据的影响 受极

6、端值影响很大 中心值: 反映50%等级 - 把一组数据由小到大排列后位于中央的值 在计算中不必要包括所有的数值 对极端数值很“稳定”,在工程改进的工作中,为什么我们使用平均值,而不使用中值 ?,统计的基础,平均值可否经常作为代表值? ex) BMW和 SM3 价格平均不能代表所有车辆的价格. - 正态分布 平均, - 向一侧倾斜的分布 - median,统计的基础,Data的扩展性测定,范围: 一组数据中极限值间的距离(最高-最低) 方差( ):每个数值点到平均值的平均偏差的平方 标准偏差 ( ): 散布的平方根 和散布相比,范围对逃逸点“outlier”更敏感,对散布最常见且最有用的度量是标

7、准偏差-为什么?,统计的基础,统计量 预测(推测) 参数(母集团),s,= 样本的标准偏差,X,= 样本平均,母集团和样本统计量关系,统计的基础,计算公式,N : 总体数 n : 样本数,总体平均,样本平均,总体标准偏差,样本标准偏差,统计的基础,流程的散布,流程的稳定性 (Stability) - 在制造中可预测是很重要的.但前提是工程要稳定. 图A:平均值不随时间的变化而变化, 是可以预测散布的稳定的流程. (可以说是在“管理限以内”) 图B:发生管理异常点,不可预测的不稳定的流程. -散布的大小直接影响工程的稳定性(Stability),A,B,散布(Variation)的种类,所有工序

8、都有散布.有的工序体现正常的管理散布,有的工序体现非正常的管理散布. 正常的管理散布 (Controlled Variation : Noise) - 随着时间的推移显示稳定的正常散布. - 当这种散布与一般原因(Common causes)有关联时,为减少这样的散布,需要对工序进行根本性的改进. 例) 原材料,设备,作业标准等在允许范围内变动. 非正常的管理散布 (Uncontrolled Variation : Signal) -随着时间的推移散布发生变化,且不可测定. - 与异常要因 (Special causes)相关联,这需要通过工序管理, monitoring 等进行及时的改善.

9、例) 工程本身的问题即机械磨损,设备故障,原材不良,没有作业标准等原因导致的散步,必须加以消除.,流程的散布,分散(Variance)的 要素,一个工程输出变量的总的变化 (方差) 可以分割成各工程输入的变化,流程的散布,工程中散布的允许水准 (Variability),Cost,LSL,USL,Nom,USL,可以容忍的水准,Cost,LSL,USL,Nom,老的观点,新的观点,旧的观点 : 下面的情况可以容忍. - 工序的平均值位于目标值,与规格相比总散布要小,工序随时间的变化呈现稳定状态. 新的观点 : - 即便是在管理规格内,随着远离目标所发生的费用将与远离目标的距离的平方成比例增长(

10、Taguchi loss function),流程的散布,Cost,LSL,USL,Nom,Cost,LSL,USL,Nom,在目标线上; 最小的散布,在目标线上; 几乎不可接受的散布,流程的散布,Cost,LSL,USL,Nom,Cost,LSL,USL,Nom,脱离目标; 最小的散布,脱离目标; 几乎不可接受的散布,流程的散布,Graphical Presentation 图表介绍,为了说明工序或系统的运营状态, 需要记录同一变量的很多数据. - 按不同的时间段测定数据 - 对所有产品测定数据 - 对不同设备测定数据. 这样数据的累积可以认为是测定值的分布. 这样的分布可用以下几种图表示

11、- Histograms - Dot plot - Box plot,Graphical Presentation,柱状图,观察油漆比率 (Rate) 打开PUMPING.MPJ RATE 转换为变量.,Graphical Presentation 图表介绍,现在设想同样的数据,用次数分成 “间隔”,每一个速率数点落在给定的间隔内,决定间隔条的高度。,Minitab 结果,Graphical Presentation 图表介绍,产生具有正态曲线的柱状图,Graphical Presentation 图表介绍,正态 分布的 直方图,最后,我们把数据分布连成光滑的曲线。在这个例子中使用了“正态分布

12、”的假设 (我们将稍后讨论),如果我们收集了一组无限多的数据点,它将提供一个近似的数据分析结果 。,Graphical Presentation 图表介绍,观察油漆比率 (Rate) 打开PUMPING.MPJ 文件 RATE 作为变量.,点图,Graphical Presentation 图表介绍,Minitab 结果,设想一个泵的运转,按设计被用来以 21 加仑/分 供应 溶剂。 分150次测定了实际的泵抽速,作图如上。每一个点代表一个具有给定值输出的“事件”。随着点的积累,泵运转的实际表现的特性可被看作一个抽速数值的“分布”。,Graphical Presentation 图表介绍,箱线

13、图,是各分布差异容易把握的数据调查方法.,让我们看一下上漆的速率 打开文件 PUMPING.MPJ 用列RATE 作为变量,Graphical Presentation 图表介绍,Minitab 结果,箱线图可以体现数据扩散性及中心. 注意 ! 箱线图中的中心线不是 平均 而是 中央值.,Graphical Presentation 图表介绍,正态分布,正态分布是有一贯性的数据的分布. 1700年开始统计学者研究通过平均和标准偏差两个值来把握全部母集团的概念. 收集这样的数据对理解重要的工序特性很有用. 可以假设自然的或人为的工序大多呈正态分布,但完整的正态分布是不可能的 .,分布曲线 1,分

14、布曲线 2,分布曲线 3,这三个正态分布的差异是什么?,属性 1: 通过下面两个值可以得出正态分布: 数据平均, 标准偏差,正态分布,4,3,2,1,0,-,1,-,2,-,3,-,4,40%,30%,20%,10%,0%,95%,标准值得概率,到平均的距离内可容纳的标准偏差的个数,99.73%,68%,两个值之间可以得到的累积概率,属性2: 通过曲线下面的宽度可以推测发生某种 “事件” 的概率.,正态分布,为标准偏差的经验规则 前面的累计概率的规则即使在数据不是完美的正态分布时也适用 让我们比较数值的理论正态分布(完美的)和经验正态分布(现实的) 即, 是否正态分布的 6075%的数据在1西

15、格玛内.,标准偏差数,理论正态分布,经验正态分布,正态分布,正态概率图,利用正态概率图的数据样式可以判定是否符合“正态分布” 分布曲线接近曲线时 正态概率图 将接近直线. Minitab 使 正态概率图 使用方便. 利用Distskew.mtw 数据做练习.,正态分布,画 Normal Probability Plots,正态分布, 参考事项 - 数据点如果分布在直线周围,则符合正态分布. - Goodness of Fit (AD)值越小,说明数据越符合指定的概率分布. - P值大于0.05,则可以认为是正态分布.,此为增添图线,正态分布,打开文件 DISTRIBUTIONS.MPJ 用前三列数据各作一个正态概率图 - 哪个看上去象正态的 然后各作一个直方图 - 这显示了什么? 给你5分钟,正态概率图练习-1,正态分布,正态分布,打开DISTRIBUTIONS.MPJ 文件 . 用C4中的神秘变量作正态概率图 你的结论是什么?它是正态分布吗?,画正态概率图练习(续),象这样有两个正态分布的例子 - 供应商提供两种品质的材料时,正态分布,正态分布,统计量的陈述方法,Descriptive statisti

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号