6σ统计学基本概念ppt课件

上传人:资****亨 文档编号:137927082 上传时间:2020-07-12 格式:PPT 页数:48 大小:1.65MB
返回 下载 相关 举报
6σ统计学基本概念ppt课件_第1页
第1页 / 共48页
6σ统计学基本概念ppt课件_第2页
第2页 / 共48页
6σ统计学基本概念ppt课件_第3页
第3页 / 共48页
6σ统计学基本概念ppt课件_第4页
第4页 / 共48页
6σ统计学基本概念ppt课件_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《6σ统计学基本概念ppt课件》由会员分享,可在线阅读,更多相关《6σ统计学基本概念ppt课件(48页珍藏版)》请在金锄头文库上搜索。

1、(6导论),(ZTE-PGB103-V1.5),6统计学 基本概念,主 要 内 容,1. 波动(偏差)。 2. 连续变量和离散变量。 3. 平均值,中位数,众数,极差, 方差,标准偏差。 4. 正态曲线及中心极限定理。 5. 简单图表分析。 6. 样本容量与置信度及置信 区间的关系。,波动的型式与原因,任何过程都包含随机波动(由于一般或普遍原因造成的)和非随机波动(由于特殊原因造成的)。,时 间,不合格产品率,非随机波动,历史水平(0),最佳水平(1),在 0 (30) 范围内的随机波动,在 1 (31) 范围内的随机波动,普遍原因: 过程波动随时间推移是稳定的,可预测的。 处于控制状态。 原

2、因: 固有的或是自然的。,例如: 垂直向上空(先把硬币夹垂直) 抛掷一枚硬币, 统计硬币落地后每一面向上的次数。当抛掷次数很多时,每面向上的次数大约各占一半,只有微小差异。,普遍原因: 差异的原因:有风,每次抛掷动作有微小差异,地面不平整,等等。,随 机 波 动,特殊原因: 过程波动无法预测。 处于失控状态。 原因: 机器调整不当,原材料不合格,操作者本身。 目标: 检测和消除特殊原因。,特殊原因:,例如: 同样是抛硬币,抛1000次,AB两面 各自向上的次数却相差400多次。,原因: 操作者每次抛掷时,总时将硬币 平放,且总是将正面朝上,然后抛出。,非 随 机 波 动,数据的两种类型,连续(

3、可变)数据:使用一种度量单位,比如英寸或小时。 连续(可变)数据的例子:电压、电流、 功率、时间、距离、重量、速度。 离散(逻辑)数据:是类别信息,比如“合格” 或“不合格”。,连续数据,离散数据,统计领域用下列方法处理波动(偏差):,描述型统计用图表或总结性的数字 ( 均值,方差, 标准偏差)来描述一系列数据。 统 计 推 断当结果差异可能因为随机偏差或不能归 属为随机偏差时所作的决定(假设检验)。 试 验 设 计收集并分析数据估计过程改变效果。,数理统计的作用,总体和样本,总体(母体): 它是提供数据的原始集团,是所要研究分析的对象的全部。总体可以是一批产品(由于一批产品的数量是有限的,故

4、称为有限总体),也可以是一道工序所生产的所有产品(由于其源源不断的运行,甚至也包含今后的产品,故称为无限总体) 样本(子样,抽样,试样): 从总体中抽出一部分个体,总体中的这一部分个体称之为样本。它是直接被检测并提供数据的诸个体。,连续数据的测量,如何描述数据的统计特性: measures of location (central tendency居中程度) measures of dispersion (variation离散程度),描述数据的居中程度,Mean均值 Median中位数 Mode众数 Quartiles四分位数,均 值 (中心值),均值 总体或样本的平均值。 总体的中心值用

5、表示。 样本的中心值用x 表示。 样本均值的计算公式如下: The mean is the most common measure of location or center of the data.,中 位 数,中位数 反应样本数据中间50%的数值,一系列数据 由低到高排列后所得到的中间数。,偶数,奇数,众数-在一个数据集中最频繁出现的值。,众 数,The mode is the observation that occurs most frequently in the sample. The mode may be unique, or there may be more than 1

6、mode. Sometimes, the mode may not exist.,Range极差 Variance方差 Standard Deviation标准偏差 Inter Quartile Range内四分位极差,描述数据的离散程度,离散程度的测量,用来判定一个数据 集合离散程度或宽度的恒量尺度,极 差 - 在一个样本中最大值与最小值的差值。 极差 = 最大值 - 最小值 即:R= x(max) x(min) 方 差 与中心值间距的平方和的平均值。 总体的方差用 表示 样本的方差用 s2 表示 标准偏差 是方差的平方根。 总体标准偏差由 表示 样本标准偏差由 s 表示,大多数(但不是所有

7、)数据是正态分布或钟形曲线,正 态 分 布,在许多实际问题中, 我们遇到的随机变量都受到为数众多的相互独立的随机因素的影响, 而每一个因素的影响都是微小的, 且这些影响是可以叠加的。 例如, 电灯在指定条件下的耐用时间受到原料,工艺,保管等条件的影响,而且每一种因素在正常情形下都是可以叠加的。具有上述特点的随机变量一般都可以认为是具有正态分布的随机变量。 在现实生产生活中, 我们所遇到实际问题大多数都属于具有正态分布的随机变量, 因此在此我们重点讨论研究此类分布。,正 态 分 布 简 介,正态分布的特点: 1. 形态如钟; 2. 左右对称; 3. 于平均值处分布的频数最多。此外,越远离平均值,

8、分布的频 数也越少。,正态分布的要素: 1.平 均 值:决定正态分布曲线的中心位置; 2.标准偏差:决定正态分布曲线的 “宽窄”.,为何要研究正态分布? 1.它是自然界的一种最基本的最普遍的法则,反应了事物内在的变化规律; 2.它使我们得以将许多复杂的事物简化处理; 3.它使我们得以通过少量抽样来把握全体,从而节省大量人力,物力,财 力和时间。,正 态 分 布 简 介,正态检验为什么有用? 许多统计检验(均值和方差的检验)都假定数据是正态分布的,正态检验用来判定该假定是否有效。 何时用正态检验? 当你分析数据并要计算基本统计值如Z值或假定正态性的统计检验如T-检验或方差分析(ANOVA)时。,

9、分布的正态性检验,如何做正态性检验?,采用Minitab公司的专业统计软件MINITAB:,如何做正态性检验?,方法1:从Minitab的菜单选项里, 选择: Stat Basic Statistics Normality Test,打开数据文件: DOT-BOX-HISTOGRAM . MTV,如何做正态性检验?,从Minitab的菜单选项里, 选择 Stat Basic Statistics Normality Test. 我们可以看到下图的对话框。,变量:选择一列数据用于X轴。 正态检验: 有3种类型,通常用Anderson-Darling test. 标题: 用你自拟的题目取代默认的。

10、 单击 OK. 图形输出如下图。,正态概率图:,如何做正态性检验?,如何做正态性检验?,方法2:从Minitab的菜单选项里, 选择: Stat Basic Statistics Display Descriptive Statistics,打开数据文件: DOT-BOX-HISTOGRAM . MTV,如何做正态性检验?,从Minitab的菜单选项里, 选择: Stat Basic Statistics Display Descriptive Statistics 我们可以看到下图的对话框。,如何做正态性检验?,结果显示:,P-Value大于0.05,判定数据的分布为正态分布。 (冒险概率=

11、0.05),如何做正态性检验?,显示在图上的总结包括添加了分布曲线的直方图和Anderson Darling正态检验的P值 (显示在右上角)。 正态检验的通常规则当P值小于或等于0.05则认为样本数据的分布不同于标准的正态分布。相反,当P值 大于0.05,则认为样本数据的分布与正态没有显著差异。 进一步解释:正态性检验属于根据样本来检验关于总体分布的检验方法,属于数学中的非参数检验方法。对于正态检验, 原 假 设 为: H0:总体的分布与正态分布无显著差异; 对立假设为: H1:总体的分布与正态分布有显著差异。 其中P值代表判断总体数据分布和正态分布没有显著差异的可能性。上图表现了数据分布的直

12、方图及分布曲线,从图中我们可以看出此图不是正态分布。,结果说明:,概率论基本概念: 1.随机变量根据试验结果对随机试验取什么值的变量。 2. 随机事件的频率 设随机事件A在n次试验中出现了r次, 则称比值r/n为这n次试验中事件A出现的频率,记作W(A) 即: W(A)= r/n 3. 概率的统计定义随着试验次数n的增大,事件出现的频 率r/n在区间0,1上的某个数字p附近摆动,那么定义事件的 概率为: P(A)= p 根据贝努里大数定理,在实际应用中,当试验次数很大时,便可以用事 件出现的频率来代替事件发生的概率。,中心极限定理,中心极限定理,在实际问题中,有许多随机变量,它们是由大量的相互

13、独立的随机因素 的综合影响所形成的,即可以表示成独立随机因素之和,这种随机变量 往往近似地服从正态分布,这就是中心极限定理的客观背景。 独立同分布的中心极限定理指出:设独立随机变量序列X1, X2, , Xn,服从同一分布,并具有有限的数学期望和方差,则只要n充分大,不管Xi 服从什么分布, 近似地服从正态分布 德莫佛拉普拉斯定理指出:当n很大时,在n次独立重复试验中事件A发生地次数近似服从正态分布。从而服从二项分布的随机变量近似服从正态分布N(np, np(1-p)。 (附:在不合格率为 p 的一大批产品中任取 n 件产品,那么取得不合格品 的件数 服从二项分布)。,例1 “总销售量”是许多

14、许多经销商销售的总和,一个销售商可能不是正态分布,但总的销售量大致是正态分布的。,例2 即使单一产品高度不是正态分布,但是许多产品的堆积高度大致是正态分布,,注意:不是所有数据服从正态分布, 如何检验正态性,及数据 非正态时如何办?,中心极限定理,举例说明:,Visual interpretation the data set. Common graphical tools to illustrate a data set: Dot Plot 散点图 Box Plot 盒子图 Histogram 直方图,图形工具描述,散点图 ( Dot Plot ),The dot plot is usefu

15、l for displaying a small body of data. 散点图更易分析样本容量较少的参数特性。 The location or central tendency in the data set and its spread or dispersion are easily identified. 散点图对单个样本数据的居中程度和离散程度都很容易看出来。 It can also be used in comparing two or more data sets. 散点图还可用于定性地比较两组样本或多组样本的数据之间有无显著差异。,案例:某器件AM5003特性参数电流增量(

16、 mA ): 批次A:4.5,7.3,4.8,6.2,8.7,5.1,3.5,5.4,4.6,3.8 批次B:4.5,7.3,4.8,6.2,8.7,5.1,11,13,9.7,10.5,Minitab: Graph Dotplot,散点图 ( Dot Plot ),打开数据文件: DOT-BOX-HISTOGRAM . MTV,结论:散点图 结果显示:批次A的电流增量比较集中,均值小,因此批次A的 质量比较稳定;而批次B的电流增量比较分散,均值较大,性能较差。,图形结果显示:,散点图 ( Dot Plot ),批次A,批次B,盒子图 ( Box Plot ),Not to be used when sample size is less than 10 units. 注意:当样本容量小

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号