基础统计相关知识简介

上传人:luobi****88888 文档编号:94068096 上传时间:2019-08-01 格式:PPT 页数:44 大小:561KB
返回 下载 相关 举报
基础统计相关知识简介_第1页
第1页 / 共44页
基础统计相关知识简介_第2页
第2页 / 共44页
基础统计相关知识简介_第3页
第3页 / 共44页
基础统计相关知识简介_第4页
第4页 / 共44页
基础统计相关知识简介_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《基础统计相关知识简介》由会员分享,可在线阅读,更多相关《基础统计相关知识简介(44页珍藏版)》请在金锄头文库上搜索。

1、1,基础统计,2,教育目标,订立进行6-SIGMA必要的基础统计的概念 理解离散概率分布及连续概率分布的概念 基础统计的内容与6-SIGMA Metrics联贯理解 熟知Minitap的基础使用方法 基础统计与Minitap联贯理解 收集的数据利用Minitap分析,3,统计学,统计学的概念在日常生活中经常接触,且每天都在使用 - 为预测棒球比赛的胜负,调查各个Team的过去胜率 - 用收集的气象资料预测天气 统计学 为了对不确实的未来的预测提供必要的情报收集,分类,分析资料 及以此为基础提示结论的学问,4,母集团的标本,作为关心对象的所有个体的集合称母集团,在母集团中作为调查对象采纳的一部分

2、称为标本,母集团,标本,母集团的特性:母数 平均 分散 2 标准偏差 ,标本的特性:统计量 平均 分散 S2 标本偏差 S,如果能够正确计算母集团的母数时没有问题,但如果很难知道的情况下,用标本计算出的统计量推定母数。,5,母集团,标本及资料,母集团(Population)和种类 1)有限母集团:形成母集团的元素的个数为有限 例)出荷LOT内制品的数 2)无限母集团:形成母集团的元素的个数为无限 例)工程中生产的制品数, 标本(Sample) 取出的重要性 -标本取出时应尽可能没有偏差 例)尝一锅汤的味道时,如不用勺子搅匀,而只尝上面部分会怎样? - 标本取出方法:单纯随机取出,层别取出,群集

3、取出,体系的取出, 资料(Data)的种类 1)量的变量:大小和量可以用数字表现的变量 -离散型变量:可数的,如不良品数,缺点数等计数值数据 -连续型变量:是连续的值,拉力,长度等计量值数据 2)质的变量:无法表示大小或量的变量:性别,宗教,职业等,6,分布的特性,统计分析是找出资料分布具有的特性用数字表示的作业。 分布的特性 集中化倾向(算术平均,中央值,最频数) - 显示资料集中在什么位置 分散度(范围,分散,标准偏差) - 资料以算术平均为中心扩散的程度 非对称度 - 资料倾向于哪一侧?,7,集中化倾向, 最频数(Mode) 最频数是资料分布中出现频率最多的数 中央值(Median) 数

4、值按大小排序观察其位置 1)资料为单数时:中间的资料 2)资料为偶数时:(中间两个资料的和)/2 算术平均 母集团的平均 标本的平均, = =,X = =,8,分散度, 范围 资料的集团中最大的数值和最小数值的差异 分散和标本偏差 母集团的分散 母集团的标准偏差 标本的分散 标本的标准偏差 算术平均为一次元的值,分散是二次元,因此求分散的开方标准偏差。标本统计量失去一个自由度,因此标本时具有n-1的自由度,9,特性值 母数 统计量 集团数 N n 平均 X 分散 2 s2 标准偏差 s 相关系数 r 回归系数 , a, b 误差 e,母数和统计量的符号比较,10,概率理论, 概率的定义:对所有

5、具有发生可能性,特定事件发生的可能性 标本空间:发生的可能性相同的全部情况的数 思 想:属于事件A的情况的数 概率变量:从测定值可得到的所有集合称为标本空间,对标本空间的各各值付 予实数的函数称为概率变量。如(H,1/2)集合的概论 概率分布:对概率变量可取的所有值,将其取值的概率用图或表显示的称为概 率分布 离散概率分布:对应于可数的概率变量如不良数或缺点数的概率分布 连续概率分布:具有不可数的连续值如制品的重量或尺寸的概率分布,11,概率理论, 概率密度函数 (Probability Density Function) 对应于概率变量的概率的关系表示为函数的称为概率密度函数 概率密度函数总

6、是+值,全体的和为1。, 6-Sigma使用的概率密度函数 1)离散概率密度函数 超几何分布 二项分布 帕松分布 2)连续型概率密度函数 正态分布 t-分布 F-分布 2-分布,12,超几何分布(Hyper-geometric distribution),超几何分布是以非复元取出,每次成功概率不一定时适用的分布,每次实行独立时为二项分布,从属时超几何分布。,超几何分布的概率模型 :大小为 N的母集团中,N1中 X1个, N2中 X2个 取出的概率,超几何分布的密度函数,P(N1中x1, N2中x2 ) =,N1Cx1*N2Cx2 (N1+N2)C (x1+x2),N,N1,N2,X,x2,x1

7、,13,超几何分布例题,由20个制品构成的LOT中有5个不良品。此时抽取4个制品时,有2个不良品的概率是多少? 正确答案是0.217(请实际计算后比较),不良品是4个,良品是6个的制品集团中随机抽取3个制品,选择的3个制品全部为良品的概率是多少? 正确答案是0.618(请实际计算后比较),14,二项分布(Binomial distribution),贝鲁诺实验的条件 -例)掷铜钱 1) 实验的结果一个事件成功(S),别一事件为失败(F)区分为相互排斥的两个事件 2) 各个实验中成功出现的概率为 p=P(S), 失败出现的概率为 q=P(F)=1-p 因此成功与失败出现的概率和为 p+q=1.

8、3) 各个实验是相互独立的,一个实验结果对另外实验结果无任何影响.,二项分布是反复进行贝鲁诺实验后显示的分布,二项分布的概率密度函数 P(X=x)=nCxpx(1-p)n-x nCx = ( ) =,n,x,排列与组合! 还记得吗?,15,0,1,2,3,4,P(X),x,0.1,0.2,0.3,n=4, p=1/2的二项分布,n=9, p=1/3的二项分布,5,6,7,8,9,二项分布的形状 1) n即使小 p=0.5时概率分布总是对称 2) 即使不是p=0.5, n越大越接近于对称,二项分布的期望值,标准偏差,分散 期望值: = E(X) = np 分 散 : 2 = Var(X) = n

9、p(1-p) = npq 标准偏差: = np(1-p) = npq,二项分布的形态,16,超几何分布与二项分布的比较说明,如下图有三个白球,七个蓝球的箱子中取出2个球时,取出白球的概率分为非复元取出和复元取出的情况分析.,非复元取出的情况: 1次取出时取出白球的概率 = 3/10 2次取出时取出白球的概率= 2/9 即,2次实行的概率受1次实行结果的影响.,超几何分布,复元取出的情况: 1次取出时取出白球的概率= 3/10 2次取出时取出白球的概率= 3/10 即,1次实行的结果并不影响2次实行的概率.,二项分布,17,帕松分布(Poisson distribution),用于定义单位时间或

10、单位空间里特定事件的发生次数 -钢板,织物等的连续体有平均m个瑕疵,随机抽取一定单位调查瑕疵时,瑕疵出现x个的 概率遵守帕松分布. -单位时间内到银行的顾客的数,某一地域内一天交通事故数.,帕松分布的密度函数,帕松分布的特性 -二项分布中 p5时,变成正态分布,18,帕松分布和 RTY的关系,帕松分布 观察帕松分布的概念,与Unit内Defect分布是同一概念,即 可以如下开展 事件的平均发生次数 m成为 dpu. RTY是最终工程无缺点的概率,帕松分布中 x=0的情况. 因此在帕松分布的分布式中代入上面的结果,成立下面等式. RTY = e-dpu dpu = -ln(RTY),19,正态分

11、布(Normal distribution),正态分布是最自然的分布 可以取任何一定范围内的所有实数值的概率分布,是连续概率分布中最具代表性的分布., 正态分布的特点 1) 正态分布的形状与位置由分布的平均和标准偏差决定 2) 正态分布的概率密度函数以平均()为中心相对称的钟形. 3) 正态曲线不接触X轴,因此X取值的范围是 - X +. (但观察值的 99.7%在 3内) 4) 分布的平均()和标准偏差()无论取什么值,正态曲线与X轴的全部面积为1., 正态分布的密度函数,f(X) =,- X +,:3.142(元周率) e:2.7183 :分布的平均 :分布的标准偏差,20,正态曲线(No

12、rmal curve),1,2,1 = 1,1,2,1,2,1,2,2,1, 与 决定的正态分布形状 ,1 2 , 1 = 2,1 = 2 , 1 2,1 2 , 1 2,应熟知教材后部分收录的标准正态分布的读法,21,标准正态分布,标准正态分布是把正态分布标准化为 平均=0,标准偏差=1. 某一观察值X的值,从其分布的平均的距离是标准偏差的多少倍,如下用标准化的概率变数Z表示,表示为 N(0,12) X - Z = ,0,Z=0到 Z=1.5之间概率变数存在的概率,P(0 Z 1.5) = 0.4332,0,Z=0到 45%相应的 Z值,Z = 1.6449,0,比Z=-2小或比 Z=2大的

13、范围内存在概率变量的概率,-2,2,P(-2 Z, Z 2) = 0.0456,P=0.0228,P=0.0228,22,对正态分布的说明,影响制造工程的平均值或分散的要因分为1)偶然原因和 2)异常原因。偶然原因是如作业环境的温度变化等不可避免的要因,异常原因是指设备异常,作业者的失误等要因 不介入异常要因,只有偶然要因作业时取出的数据必然遵守正态分布。教育时可感觉到,在利用连续型概率变量进行统计分析时首先应考虑分布是否是正态分布。 今后要学的t-分布,F-分布,2-分布是人们人为作出来的概率密度函数,但正态分布是说明自然现象的自然分布。最自然的不就是最美的吗? 每个铜钱掷10次掷100个时

14、每个铜钱正面出现的次数与反面出现的次数画在直线上时是否取正态分布?,23,练习题,1. XN(10,4)的正态分布中 X在 8X12范围的概率是?,= 0.5, 此时概率是 0.6915,10,12,8,= - 0.5此时概率是( 1 - 0.6915),因此 0.6915 - 0.3085 = 0.3829,24, n,平均标本分布, 标本分布? 在母集团中按一定大小把能够取出的标本全部取出后, 各标本的特性值(统计量)的概率分布, 平均的标本分布? 在特定的母集团按一定大小把能够取出的标本全部取出后 计算各个标本的平均时其平均的概率分布。,x =,_, 平均标本分布的分散, 平均标本分布的

15、标准偏差, 平均标本分布的平均, = ,25,中心极限定理 (Central Limit Theorem),平均为,分散为 2的无限母集团中随机抽取大小为 n的样品时 n充分大时与母集团的分布状态无关,标本平均近似地遵守N(, 2/n)。 即, 的分布近似为N(0,1)。,母集团遵守正态分布时标本的平均必然遵守正态分布,但此时标本平均的分散 分为标本的大小(n) ,因此变小。 如果母集团不是正态分布的任意分布时,标本大小充分大时标本的平均分布也遵守 正态分布 但此时标本平均的分散分为标本的大小(n) ,也变小。,26,t - 分布 : 互不相同的两个集团的平均的统计验证,从正态分布概率标本不大,且标准偏差()未知时 遵守自由度 n-1的 t-分布。.,0,S2=,(xi - x) n-1,X = xi,1 n,t =,X - S/n,正态分布,=7,=3,=1,T-分布的特点 t分布比正态

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号