统计思想及其应用chenyuntao

上传人:101****457 文档编号:88694025 上传时间:2019-05-07 格式:PPT 页数:77 大小:548.50KB
返回 下载 相关 举报
统计思想及其应用chenyuntao_第1页
第1页 / 共77页
统计思想及其应用chenyuntao_第2页
第2页 / 共77页
统计思想及其应用chenyuntao_第3页
第3页 / 共77页
统计思想及其应用chenyuntao_第4页
第4页 / 共77页
统计思想及其应用chenyuntao_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《统计思想及其应用chenyuntao》由会员分享,可在线阅读,更多相关《统计思想及其应用chenyuntao(77页珍藏版)》请在金锄头文库上搜索。

1、2019/5/7,1,第10章 统计思想及其应用,一、 统计基础 二、 统计思想与变异理论 三、 常用统计技术和方法 四、 抽样技术与抽样检验 五、 过程能力 六、 控制图,2019/5/7,陈运涛 chenyy_,2,统计思想及其应用,统计是一门关于收集、组织、分析、解释和展现数据的科学。 在质量管理实践中,测量和分析过程产生了各种各样的数据。统计的技术和方法为人们提供了一种从数据中获取信息,以形成决策和采取行动的有效途径。统计的技术和方法为我们了解的现状,分析过程的变异,监控过程状态,建立控制标准和实施控制措施,保证过程输出满足要求的产品和服务,提供了有效的方法,其中SPC变是这方面的知识

2、体系。,2019/5/7,陈运涛 chenyy_,3,一、 统计基础,了解统计的基本知识,是学习和应用统计技术和方法的前提。相关的统计的知识有数据的类型、定性数据量表、样本与总体、统计特征数、随机变量与概率分布等。,2019/5/7,陈运涛 chenyy_,4,(一)质量数据的类型,所谓数据即对象的观测值。质量数据即质量特性的观测值。 1计量数据凡是可以连续取值的,或者说可以用测量工具具体测量出小数点以下数值的这类数据,就叫做计量数据。 2计数数据凡是不能连续取值的,或者说即使用测量工具也得不到小数点以下的数据,而只能得到0或者1,2,3等自然数的这类数据,就叫做计数数据。相应地,取计数数据的

3、变量或非连续数值的变量,为离散变量。 计数数据还可以细分为计件数据和计点数据。,2019/5/7,陈运涛 chenyy_,5,(二)总体和样本,1总体在某一次统计分析中研究对象的全体,有时又叫“母体”。总体是提供统计数据的大本营,是源源不断地供给数据的原始数据库。它是一个完全数据集或感兴趣的对象的集合。 总体可以是有限的,也可以是无限的。 组成总体的每个单元(产品)叫做个体。总体中所含的个体数叫做总体容量(总体大小),常用符号N表示总体。 2样本样本也叫“子样”。它是从总体中随机抽取出来并且要对它进行详细研究分析的一部分个体(样品)。 样本中所含的样品数目,一般叫样本大小或样本量,常用符号n表

4、示。 被抽出的样本中的每一个产品叫做样品。样本是由1个或若干个样品或个体组成的。,2019/5/7,陈运涛 chenyy_,6,(三)概率与随机变量,在一定条件下,并不总是出现相同结果的现象称为随机现象。 为了研究随机试验结果,揭示客观存在的统计规律,人们引入了随机变量这个概念来表示随机事件。 认识随机现象的首要问题是罗列出它的一切可能发生的基本结果,即样本点,随机现象的所有的可能的样本点称为样本空间。 随机现象的某些样本点的集合称为随机事件。 一个随机现象的两个随机事件之间存在3种可能的关系:包含、互不相容和相等。 随机事件的发生与否是带有偶然性的。随机事件发生的可能性有大小之别,是可以度量

5、的。,2019/5/7,陈运涛 chenyy_,7,1. 概率,概率一个随机事件A发生可能性的大小称为这个事件的概率,通常用P(A)表示,概率是介于0到1之间的数。概率越大,事件发生的可能性越大;概率越小,事件发生的可能性也越小。不可能事件的概率为0,即P()=0。必然发生的事件的概率为1,即P()=1。 在统计意义上,如果与事件A相关的随机现象是可以大量重复试验的,如果在n次重复试验中,事件A发生k次,则事件A发生的频率为:n(A) = k/n 。这里频率n(A)能反映事件A发生的可能性大小。频率n(A)将会随着重复试验次数的增加而趋于稳定,这个频率的稳定值即为事件A的概率。在实际中,人们无

6、法把一个试验无限次地重复下去,只能用重复试验次数n较大时的频率去近似概率。 基于概率的性质和随机事件的特点,可以具体计算事件发生的概率。,2019/5/7,陈运涛 chenyy_,8,2随机变量,表示随机现象结果的变量称为随机变量。常用大写字母X,Y,Z等表示随机变量,它们的取值 用相应的小写字母x,y,Z等表示. 假如一个随机变量仅取数轴上有限个点或可列个点,则称此随机变量为离散随机变量,或离散型随机变量。 假如一个随机变量的所有可能取值充满数轴上一个区间(a,b),则称此随机变量为连续随机变量,或连续型随机变量,其中a可以是-,也可以是+。,2019/5/7,陈运涛 chenyy_,9,3

7、随机变量的分布,随机变量的取值是随机的,但还是有内在规律的。这个规律可以用分布来描述。 分布的含义是:X可能取哪些值?或在哪个区间上取值?X取这些值的概率是多少?或在任一区间上取值的概率是多少(概率分布)? 概率分布是指随机变量在总体中(样本空间中)的取值与其发生概率二者关系的数据模型/函数。 它是表示一个随机变量的相对频率的理论模型。这个模型或称概率分布函数完整地描述了随机变量的统计规律性。,2019/5/7,陈运涛 chenyy_,10,离散随机变量的分布,离散随机变量的分布可以用分布列来表示,比如随机X取n值:x1,x2,xn,X取x1的概率为p1, X取x2的概率为p2,X取xn的概率

8、为pn。 这用一个式子表示:P(X= xi)= pi i=1,2,n 作为一个分布,pi 满足以下两个条件: pi0, p1+p2 + +pn =1 满足这两个条件的分布称为离散分布,这一组pi 称为分布的概率函数。 这些可以用一张表表示:,2019/5/7,陈运涛 chenyy_,11,连续随机变量的分布,连续随机变量的分布可用概率密度函数p(x) 表示,也记为f(x)。 它是一种表示质量特性X随机取值内在统计规律性的函数。 概率密度函数p(x)有多种形式,它在以X发生概率为纵轴,X取值为横轴的平面坐标系上,概率密度(即单位长度上的概率或频率)曲线不同的位置、散布程度、分布形状,反映了质量特

9、性的差别。 随机变量X的分布(概率密度函数)有几个重要的特征数,分别期望来表示分布的集中位置(中心位置)和用方差表示散布程度大小。,2019/5/7,陈运涛 chenyy_,12,连续随机变量概率的计算,X在区间(a,b)上取值的概率P(aXb)为概率密度曲线以下区间(a,b)上的面积。 概率密度曲线一定位于x轴上方(p(x)0),并且与x轴所夹的面积恰好为1。,P c1 xc2 =F(c1 xc2) =,2019/5/7,陈运涛 chenyy_,13,4常用随机变量的分布,常用的离散随机变量的分布有二项分布、泊松公布和超几何分布。 常用的连续随机变量的分布的均匀分布、正态分布、对数正态分布等

10、。 最常见的是正态分布。,正态分布,如果一个随机变量x的概率分布呈正态分布,则其概率密度函数可以表示如图所示 正态分布通常记为, 其中 为随机变量x的均值 为x的标准偏差 e = 2.71828,为自然对数体系中的底数 = 3.14159,为圆周率,2019/5/7,陈运涛 chenyy_,15,正态分布随机变量变量,正态分布描述了许多质量特性X随机取值的规律性。 特别是,根据中心极限定理,无论总体服从什么分布,只要样本量足够大,来自这个总体的随机样本的均值呈近似正态分布。,2019/5/7,陈运涛 chenyy_,16,正态分布的特点,正态分布概率密度函数曲线是对称的、单峰的钟形曲线。 任何

11、一个正态分布仅由均值和标准偏差这两个参数完全确定;确定中心位置,称为位置参数,决定分布曲线的形状,称为形状参数;越小,曲线越陡,数据离散程度越小,越大,曲线越扁平,数据离散程度越大。随机变量的均值=0,且标准偏差=1,则称为这时的正态分布为标准正态分布。 正态分布曲线下面的面积,是随机变量在相应区间取值的概率,或者说总体中有多大比例的数值落在相应的区间范围内。 总体中有68.26%的个体落于1范围内;总体中有95.44%的个体落于2范围内;总体中有99.73%的个体落于3范围内总体中有99.9999998%的个体落于6范围内。,2019/5/7,陈运涛 chenyy_,17,(四)常用统计参数

12、,样本来自总体,因此,样本中包含了有关总体的丰富信息,但未经加工的信息是零散的,为了将零散的信息综合起来反映总体和特征,需要对样本进行加工。 图表是加工信息的一种方法,另一种方法是构造样本函数,不同的函数反映总体的不同特征。其中不含未知参数的样本函数称为统计参数,也称为统计特征数或统计参数。 统计参数有两类: 一类是表示数据总体状态和集中位置的,如均值、中位数; 另一类是表示数据散布范围或离散程度的,如极差,标准偏差。,2019/5/7,陈运涛 chenyy_,18,二、 统计思想与变异理论,(一)变异(Variation)及其来源 (二)变异的类型 (三)关于变异的观点 (四)两类管理错误

13、(五)统计变异思想在管理中运用的领域,2019/5/7,陈运涛 chenyy_,19,(一)变异(Variation)及其来源,变异是指在过程运行中,任何与目标或规范要求不一致的变化,有时也称为波动。 变异是客观存在的,它存在于任何事物中,变异可以是非常小的,甚至没有高精度的测量仪器就无法感觉到。变异也可以很大并且容易发现。 世界上没有两个对象具有相同的特性测量值;如果两个对象有相同的特性测量值,常常是由于测量手段的限制造成的。 根据产生引起变异因素的性质,可以分为一般原因变异(common cause varitation )和特殊原因变异两类。 (special cause varitat

14、ion ),2019/5/7,陈运涛 chenyy_,20,(二)变异的类型,现代质量控制专家休哈特从变异的角度将过程分为两类: (1)伴有“不可避免的随机变异”的稳定过程; (2)伴有“可确定原因引起的变异”的不稳定过程。 如果过程变异的范围落在顾客容许的范围(规范限)内,则生产和发运的产品可以确保顾客满意,如果过程变异的范围恰好与顾客容许的范围相等,那么就必须对过程进行严格监控,当有必要时还需调整过程,以便使输出最大限度地使顾客满意,如果过程变异的范围超出了顾客容许的范围,就需要对输出进行检验,以确定其是否满足顾客的要求。 当过程的变异量能够以一定的置信度进行预测时,就称过程处于统计控制状

15、态。尽管很难确切预测每一个具体的值,但我们可以预测它将落人某个范围。类似地,我们还可以预测长期平均值。 对于不稳定的过程,无法预测有多少产品落人顾客的容差限内,生产让顾客满意的产品所必需的成本也无从得知,因为组织被迫生产了大量备用库存,并在制定工作预算时,也必须包括备用库存因素。 戴明认同休哈特的变异的来源,并称产生过程变异的原因分别为一般原因和特殊原因。,2019/5/7,陈运涛 chenyy_,21,1一般原因变异,一般原因是一个过程中始终存在的、非人力可控的、而成为过程的固有的组成部分的变异因素。在生产过程中,一般原因产生的变异通常占全部所观察到的变异的80-95%。一般原因是由于系统设计导致的,当然,系统是由管理人员设计的。 变异的一般原因持续存在,并引起可控的变异或一般原因变异。仅有一般原因支配的系统称为稳定系统;当一个过程仅受到一般原因影响时,则称该过程为受控过程。 一般原因变异与诸如供应商的选择、输入的质量、人员聘用和培训状况、设备选择。机器维修和工作条件等有密切的联系。如果过程变异过大,必须改变过程。,2019/5/7,陈运涛 chenyy_,22,2特殊原因变异,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号