六西格玛统计(密)

上传人:j****9 文档编号:47803265 上传时间:2018-07-05 格式:PDF 页数:222 大小:11.80MB
返回 下载 相关 举报
六西格玛统计(密)_第1页
第1页 / 共222页
六西格玛统计(密)_第2页
第2页 / 共222页
六西格玛统计(密)_第3页
第3页 / 共222页
六西格玛统计(密)_第4页
第4页 / 共222页
六西格玛统计(密)_第5页
第5页 / 共222页
点击查看更多>>
资源描述

《六西格玛统计(密)》由会员分享,可在线阅读,更多相关《六西格玛统计(密)(222页珍藏版)》请在金锄头文库上搜索。

1、12011年年六西格玛黑带认证培训教师六西格玛黑带认证培训教师六西格玛黑带认证培训教师六西格玛黑带认证培训教师 统计技术高级研修班统计技术高级研修班1天津大学 马逢时 2011.04.11上海第五章 测量过分析文档5.1 过程分析及文档5.2 概率统计基础5.3 数据的收集和整理2天津大学 马逢时5.4 测量系统分析5.5 过程能力分析25.2.2 随机变量及分布1. 离散型分布的分布律x12345P0.10.20.30.30.10 . 3 00 . 2 5S c a t t e r p l o t o f P v s X3天津大学 马逢时XP543210 . 2 00 . 1 50 . 1

2、05.2.2 随机变量及分布2 连续型分布的分布密度2. 连续型分布的分布密度4天津大学 马逢时图图5-14 概率密度函数所围成的面积等于135.2.2 随机变量及分布bdbXP)()(= adxxpbXaP)()(区间a, b上的概率,可由概率密度函数在该区间上的求积分 得到,如图5-15阴影部分所示密度函数有量纲 1/X。5天津大学 马逢时图图5-15 区间a, b上的概率5.2.2 随机变量及分布?中国成年男子身高抽样分布图(n=1215)200150100频率频率均值168.1 标准差5.439 N1213成年男子身高分布图成年男子身高分布图 正态 6天津大学 马逢时192186180

3、174168162156150500身高身高直方图高度受样本量影响, 受区间分割方法(分组方式)影响45.2.2 随机变量及分布?分布密度图不受样本量及采样间隔区间划分影响。但横轴单位不?分布密度图不受样本量及采样间隔区间划分影响。但横轴单位不 相同时, 高度是不同的。(高度有量纲:1/X)0.080.070.060.050.04密密度度分布图分布图 正态, 均值=168, 标准差=5.687654密度密度分布图分布图 正态, 均值=1.68, 标准差=0.0557天津大学 马逢时1901801701601500.030.020.010.00X X密密1.851.801.751.701.651

4、.601.551.503210X X5.2.5 正态分布正态分布一般正态分布用记号表示)(2NX),(2NX性质: 设则X特别, 称 N(0,1) 为标准正态分布.般正态分布用记号表示),(NX 2其中, 为均值, 为方差8天津大学 马逢时则) 1 , 0( NXZ=Z 值的含义要能深入理解。考试的“标准分”, 身高、体重的 Z 值代表在整个分布中的位置。5一般正态分布与标准正态分布)(2NY如果有如果有令令则则=yz) 10( Nz),(NY如果有如果有,令令则则=z) 1 , 0( Nz93 2 1123444 3 2 1 0 1 2 3 4 zyzy累积分布函数概念概念:Cumulati

5、ve Function F(x) :概念:Cumulative Function F(x) :当 x 给定后,F(x)代表 x 左方面积, 即随机变量X小于 x 的概率。 (显然,随x的增大,F(x)也增大;直到x无限增大, F(x)最后达到1)F(x)代表这块面积代表这块面积10Xxx6分位数(Quantile)概念当 p 给定后,XP代表 左方面积为p时, 横坐标 的位置。 显然,随p的增大, XP 也增大;直到随p增大到1, XP 也增大至于无限。 对于年分布,如果右侧概率为 1/T,则其分位数称为T年一遇值。p代表这块面积代表这块面积例如, X0.99 为百年一遇值; X0.95 为廿

6、年一遇值; X0.90 为十年一遇值。11XxxP对应Z值的理解?某高校硕士生在期末考试实际成绩为72分,但折某高校硕士生在期末考试实际成绩为72分,但折 算为z值时得到 z = -2。这说明什么? z值有什么 用? 因为 z = -2,说明大约只有2.28%的学生成绩比他 低。此学生成绩在班内比较差。z值作为描述其在 分布中的位置位置非常有用。?某位满周岁婴儿其身高z值为1 3其体重z值为12?某位满周岁婴儿,其身高z值为1.3,其体重z值为 0.7。这是什么意思?说明此婴儿发育状况如何??大约有90%的同龄婴儿比他矮,大约有76%的同 龄婴儿比他轻。他的总发育状况很好,但仍不够均 衡,在偏

7、高的婴儿中他仍有些偏瘦。75.2 概率统计概念要点均匀分布例1:均匀分布例1:X113天津大学 马逢时X为上的均匀分布)2 , 0(=其它,0,21)(xxf =其它,020,21)(xxfX为上的均匀分布),(5.2 概率统计概念要点均匀分布例2均匀分布例2:?计算过程中舍入误差(四舍五入)的分布为:=其它, 05 . 05 . 0, 1)(xxf14天津大学 马逢时-0.50.518指数分布与元器件寿命规律?一般失效规律复杂呈浴盆曲线(Bathpool Curve):?般失效规律复杂,呈浴盆曲线(Bathpool Curve):)(t 早 期 失 效早 期 失 效偶 然 失 效偶 然 失

8、效耗 损 失 效耗 损 失 效15天津大学 马逢时交付使用点更新点时间t指数分布其分布密度及分布图形为P(t) ?其分布密度及分布图形为:称此时刻尚在作此时刻尚在作个时刻失效的概率个时刻失效的概率为瞬时失效率瞬时失效率t1为耗 损失效分布; k=1为指数分布。b为尺度参数。f(t)=W(k,b)即Weibull分布1)(=kAtt对数正态分布?在可靠性分析中常常遇到下列情况?在可靠性分析中,常常遇到下列情况。?元器件的寿命X明显不对称,不是正态,右面尾 巴拖得很长,即有很多元器件寿命很长。?如果将X取对数之后为正态分布,即LnX为均值 是,方差是的正态分布,则我们称X为对数正 态分布。记为XL

9、nN(, )。2220天津大学 马逢时?注意:,正确公式为eEX 2exp2+=EX11二项分布?定义:在独立试验中,若每次出现“成功”的?定义:在独立试验中,若每次出现成功的 概率固定为 p,则若记 n 次独立试验中出现 “成功”的总次数为X,则称 X 的分布为二项 分布,记为 X B ( n, p ).?若 X B ( n, p ),则 X的均值是 =np , 方差 = np(1-p).2本车间生产的二极管中不良率为0.2,每盒装100支二极管,21天津大学 马逢时则每盒中的不良二极管数为二项分布B(100, 0.2)。京津高速公路上日流量为10000辆,每辆车出事故的可能性都 是0.00

10、03,则每日发生事故数分布为B(10000, 0.0003)。泊松(Poisson)分布?稀有事件出现次数的分布常常为Poisson分布。?例如, 福州市每年遭受台风侵袭的次数; 一匹布内的 暇疵点数;某道口每年发生车祸次数;每个电镀零 件上的斑点数;午餐店在营业时间内每分钟顾客到 来的人数;等等。?Poisson分布只要一个“平均值”参数就可以完全 确定, Poisson分布记为P()。 例如已知M快餐店中午每分钟平均到来5名顾客22天津大学 马逢时?例如,已知M快餐店中午每分钟平均到来5名顾客, 则顾客到来人数X为Poisson分布P(5),记为X P(5)。?如果平均值较大,可以分成更小

11、单位(例如将每分 钟分为6个10秒的间隔)计数。12Poisson分布性质?Poisson分布的均值及方差: P()的均值及方差都是。?概率分布很多种,只有Poisson分布的均值及方差是相等 的。注意:均值的量纲为,方差量纲为,因而 Poisson分布一定是无量纲的,否则二者不可能相等。?Poisson分布的均值可分性. ?每块芯片上的暇疵点的分布为P(2),集成电路中含4块 同样的芯片,则集成电路中总暇疵点数的分布为P(8)。x?例如若“周事故次数”X的分布为 P(4)则“天事故次2x23?例如:若周事故次数X的分布为 P(4),则天事故次 数” Y 的分布为 P(4/7).?例如:若10

12、00平米瑕疵米均值为3.5个,问100平米瑕疵米为 什么分布?二项分布计算1当n较大p中等(0 1 m28天津大学 马逢时m15偏度与峰度?一般地说,对于分布的描述用位置状况、散布状况就够。?如果还需要对分布的形状作更细致描述的话,那就要用到偏度和峰 度了。以下为了解释偏度和峰度说起来方便,假定几个分布的均值 和方差全相同。?偏度(Skewness)是描述对称性的。 sk0(正偏)29天津大学 马逢时偏度与峰度?峰度峰度( Kurtosis)是描述分布高峰处及尾部所占的比重的是描述分布高峰处及尾部所占的比重的。?峰度峰度( Kurtosis)是描述分布高峰处及尾部所占的比重的是描述分布高峰处及

13、尾部所占的比重的。?规定正态分布的峰度为正态分布的峰度为0。假定两个分布均值和标准差全相 同。则峰度为正时图形特征是:顶峰处更高,两端尾部更 大,也即更慢地趋于0。则峰度为负则相反。正态分布正态分布 峰度为峰度为峰度为正: 顶峰更高峰度为正: 顶峰更高 两尾更重两尾更重峰度为负: 顶峰更矮 两尾更轻峰度为负: 顶峰更矮 两尾更轻30天津大学 马逢时峰度为峰度为0两尾更重两尾更重165.2.7统计量与抽样分布?设.,.,1),(2niNXi=?则?可以化为),(2nNX)1 ,0( NnXZ=) 1(=ntnsXT还有,31天津大学 马逢时n这里, t (n) 是自由度为n 的 student

14、T-分布.T分布与标准正态分布形状相同,只是更分散。5.2.6 中心极限定理中心极限定理中心极限定理中心极限定理:?不论原始分布为何种分布,当样本量无限增大时, 样本均值的分布都趋向于正态分布。?当原始分布对称时, n =5,近似已很好。?当原始分布不对称时,n=30,近似已很好。 样本均值性质:32天津大学 马逢时样本均值性质:nx=175.3 数据的收集和整理5.3.1.数据的类型: 4类测量尺度.5.3.1.数据的类型: 4类测量尺度. 5.3.2 收集数据的方法: 5.3.3 抽样方法: 强调代表性.?关键是:抽样要具有代表性抽样要具有代表性,否则结论无意义。例如,美 国总统1948年

15、Truman与Dewey竞选;意大利非亲生子女 14%;二战中飞机弹着点分布;发病率调查;某现象出现 率问卷调查、网上调查等。33天津大学 马逢时5.3.4 描述性统计方法 5.3.5 数据的图示方法:直方图, 茎叶图,箱线图, 链 图(游程图), 正态概率图.5.3.1 测量和测量等级?测量:按照某种规则赋予每个被观测的对象一?测量:按照某种规则赋予每个被观测的对象 个值。此值可以是数值,也可以是符号。?测量可以划分为四个等级: 离散型:名称尺度等级(Nominal Scale) 顺序尺度等级 (Ordinal Scale) 连续型:间距尺度等级(Interval Scale)34天津大学 马逢时比率尺度等级 ( Ratio Scale)?自上而下,测量级别越来越高,测量的精度、 困难程度、以及数据所含的信息也越来越高。185.3.1.1 名称尺度等级?每个观测值只是对象所属类别的名字或代码?每个观测值只是对象所属类别的名字或代码.?名称尺度是最低的级别:不具有顺序的性质,更不具 有距离的性质。?名称尺度测量只能根据每个特性区别不同对象的类 别。例如,产品的型号、编码、类别、形式等。?对于名称数据,基本的数据整理工作是计数,数出 某个名称值出现的次数35天津大学 马逢时某个名称值出现的次数;?即使名称数据是代码数值,比较大小与加减乘除运

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号