{品质管理抽样检验}统计学抽样推断分析法

上传人:冯** 文档编号:139841871 上传时间:2020-07-24 格式:PPTX 页数:119 大小:882.28KB
返回 下载 相关 举报
{品质管理抽样检验}统计学抽样推断分析法_第1页
第1页 / 共119页
{品质管理抽样检验}统计学抽样推断分析法_第2页
第2页 / 共119页
{品质管理抽样检验}统计学抽样推断分析法_第3页
第3页 / 共119页
{品质管理抽样检验}统计学抽样推断分析法_第4页
第4页 / 共119页
{品质管理抽样检验}统计学抽样推断分析法_第5页
第5页 / 共119页
点击查看更多>>
资源描述

《{品质管理抽样检验}统计学抽样推断分析法》由会员分享,可在线阅读,更多相关《{品质管理抽样检验}统计学抽样推断分析法(119页珍藏版)》请在金锄头文库上搜索。

1、第八章 抽样推断分析法,第八章 抽样推断分析法,8.1 抽样方法概述 8.2 概率与概率分布 8.3 抽样分布 8.4 抽样估计的方法与应用 8.5 抽样推断误差的控制,第一节 抽样方法概述,一、抽样的概念和特点 抽样 根据随机原则从总体中抽取一部分单位作为样本,并根据样本数量特征对总体数量特征做出具有一定可靠程度的估计与推断。 特点 按随机原则抽取样本单位 用部分信息推断总体数量特征 抽样推断具有一定的概率保证程度 抽样误差可以事先计算并控制,抽样的应用 对不可能进行全面调查的社会现象 对不必要进行全面调查的社会现象 对普查资料进行必要的修正,二、有关抽样的几个基本概念 样本 从总体抽取出的

2、、用以代表和推断总体的部分单位的集合体。 注意 1样本的单位必须取自总体; 2由一个总体可以抽取许多样本; 3样本的抽取必须排除主观因素的影响,以确保其客观性与代表性。,样本容量和样本个数 样本容量:一个样本中所包含的个体单位数,一般用n表示。 样本个数:一个抽样方案中所有的可能被抽取的样本的总数量,即可能的样本个数 。,第二节 概率与概率分布,一、样本空间及简单随机抽样方式 试验 从总体中随机抽取一个单位并把结果记录下来称为一次试验。 样本(点) 连续n次试验的结果构成一个样本(点)。 样本空间 以全部样本点为元素组成的集合称为样本空间。,简单随机抽样的两种方式,重复抽样,每次从N个单位的总

3、体中随机抽取1个单位,登记后放回总体参加下一次的抽取,连续进行n次。,1、n个单位的样本由n次连续试验构成。 2、每次试验的结果相互独立。 3、每次试验都在相同条件下进行,每个单位被选中的机会(概率)在各次是相同的。,特点:,简单随机抽样的两种方式,不重复抽样,每次从N个单位的总体中随机抽取1个单位,登记后不放回原总体,下次从总体中余下的单位里抽取,连续进行n次。,1、n个单位的样本由n次连续试验构成,由于每次抽出后不放回,所以相当于从总体中同时抽取n个样本单位。 2、每次试验的结果不独立。 3、每抽一次总体的单位数少一个,每个单位被选中的机会(概率)在各次是不等的。,特点:,简单随机抽样的样

4、本个数,重复抽样,如果考虑顺序,可能的样本个数是 。,不重复抽样,如果考虑顺序,可能的样本个数为 ; 如果不考虑顺序,可能的样本个数为 。,二、事件及其概率,事件,样本空间中满足给定性质的样本点组成事件。,对应样本空间中一个样本点的事件,是不可再分事件(基本事件)。,由若干个简单事件结合成的事件。,必然事件,不可能事件,每次实验中必定发生,是样本空间本身。,在任何实验中都不发生,是空集。,实验中发生该事件的可能性大小。,若样本空间中各样本点出现的可能性大小相同,可用样本空间中属于该事件的样本点个数与样本空间中全部样本点个数之比来计算。,事件A、B之和A+B表示事件A或事件B发生。 A+B= A

5、B,事件发生的概率,事件的和,事件的积,复合事件的概率是简单事件的概率通过代数运算得到的。,事件A、B之积AB表示事件A和事件B同时发生。 AB = AB,两种常用的复合事件的概率,互不相容事件的和的概率,A、B互不相容表示AB=,若事件A与事件B互不相容,则:P(A+B)=P(A)+P(B)。,概率的加法定理:几个互不相容事件中至少一个发生的概率等于这几个事件各自发生的概率之和。,推论 设 表示A的对立事件,则: P( )=1-P(A),两种常用的复合事件的概率,互相独立事件的积的概率,A、B互相独立表示事件B发生与否对事件A没有影响。,若事件A与事件B互相独立,则:P(AB)=P(A)P(

6、B)。,概率的乘法定理:几个互相独立事件同时发生的概率等于这几个事件各自发生的概率之积。,推论 设A、B互相独立,则: P(A+B)=P(A)+P(B)-P(A)P(B),随机变量,三、离散型随机变量的概率分布,概率分布表,将离散型随机变量的所有可能取值及相应的概率按顺序列成表。,(i=1,2, ),离散型随机变量的概率分布也可以用等式表述为:,离散型随机变量的概率分布的性质:,(i=1,2, );,例:连续抛两次硬币,正面向上的次数的概率分布为:,离散型随机变量的概率分布还可以用概率分布函数来表示。,例:连续抛两次硬币,正面向上的次数的概率分布用分布函数表示为:,一次试验只有两种结果:事件A

7、发生或 A不发生,贝努里试验,n重贝努里试验中事件A出现的次数k服从二项分布。,k,四、连续型随机变量的概率分布,连续型随机变量的概率分布只能用概率分布函数来表示。,其中f(x)是分布函数F(x)的导数,称为密度函数。,连续型随机变量的密度函数的性质:,1、f(x)0 2、 3、,f(x),五、随机变量的数值特征,常用的有:数学期望、方差,离散型随机变量的数学期望,(一)随机变量的数学期望,连续型随机变量的数学期望,数学期望的两个重要性质:,连续型随机变量的方差,(二)随机变量的方差,离散型随机变量的方差,方差的两个重要性质:,六、正态分布 最重要的连续型随机变量分布,正态分布的密度函数,称随

8、机变量X服从均值为,方差为2 的正态分布,记为XN(, 2 )。,f(x),正态分布的密度函数曲线,是该分布的中心,是标准差,反映分布的离散程度,越大,分布曲线越平缓,离散程度越大;越小,分布曲线越陡峭,分布越集中。,正态分布的分布函数,利用正态分布函数可计算正态分布随机变量X落在任意区间的概率:,对于不同的和2都要计算上述积分很麻烦。,标准正态分布,=0,=1的正态分布称为标准正态分布,相应的随机变量称为标准正态随机变量,用Z表示,即ZN(0,1) 。,标准正态分布的密度函数,标准正态分布的分布函数,书中把z在03.49的取值及其相应的概率编成正态分布面积表,通过查表可求出Z落在任意区间的概

9、率。,正态分布函数的标准化,设XN(, 2 ),令Z=,即:ZN(0,1) 。,把一般正态分布化成标准正态分布后,通过查正态分布概率表即可求出一般正态分布随机变量落在任意区间的概率。,例1:设XN(,2 ),求X落在区间(-a,+a )的概率。,解:令Z= ,,X落在区间(-a,+a ),等价于Z落在区间 。,查正态分布表可得其概率为 ,,此即为X落在区间(-a,+a )的概率。,例2:设部队战士的身高服从正态分布XN(175,42 ),军服厂要制100000套军服,问身高在171179的应制多少套?,解:令Z= ,,X落在区间(171,179 )等价于Z落在区间(-1,1 )。,查正态分布表

10、可得1-21-F(1)=0.6827,,所以军服厂应制68270套身高在171179的军服。,第三节 抽样分布,一、基本概念,总体参数,总体分布的数量特征。,样本统计量,定义在样本空间上的一个函数,也称样本指标。本身也是随机变量。,抽样分布,样本统计量的概率分布。,本节主要讨论简单随机抽样的抽样分布。,抽样分布的形成过程,总体,计算样本统计量 如:样本均值、成数、方差,样本,二、重复抽样分布,样本平均数的分布,例:某班组有5个工人,他们的单位工时工资分别是4、6、8、10、12元,现用重复抽样方式从5个工人中抽出2人,求样本平均工时工资的抽样分布。,解:先计算总体工时工资的平均数和方差:,样本

11、工时平均工资 (单位:元),样本工时平均工资分布,计算样本平均工时工资的平均数和标准差:,从理论上推导样本平均数的分布:,结论:在重复抽样的情况下,,样本成数的分布,成数是01分布的变量的平均数,设总体成数为 ,总体方差为,结论:在重复抽样的情况下,,例:某产品的一级品率为80%,现采用重复抽样方式从中抽取100件,求样本一级品率的抽样平均误差。 解:样本一级品率的抽样平均误差为:,三、不重复抽样分布,样本平均数的分布,例:某班组有5个工人,他们的单位工时工资分别是4、6、8、10、12元,现用不重复抽样方式从5个工人中抽出2人,求样本平均工时工资的抽样分布。,解:先计算总体工时工资的平均数和

12、方差:,样本工时平均工资 (单位:元),样本工时平均工资分布,计算样本平均工时工资的平均数和标准差:,结论:在不重复抽样的情况下,,注意:当N较大时, ,这个系数称为不重复抽样的修正系数,当N远大于n时,修正系数近似于1,即可用重复抽样的误差公式代替不重复抽样的误差公式。,样本成数的分布,结论:在不重复抽样的情况下,,注意:当总体成数P未知时,可用样本成数p 代替总体成数P计算抽样平均误差 。,例:要估计某地区10000名适龄儿童的入学率,现采用不重复抽样方式从中抽取400名儿童, 检查有320名儿童入学,求样本入学率的抽样平均误差。 解:样本入学率的抽样平均误差为:,四、大数定理与中心极限定

13、理,大数定理,独立同分布的随机变量: , 设它们的平均数为 ,方差为 ,即 , ,(i=1,2,)。则对任意的正数,有:,设m是n次试验中事件A发生的次数,p是事件A发生的概率,则对于任意小的正数,有,大数定理应用于成数指标:,中心极限定理,正态分布的再生定理:,从服从正态分布的总体中抽出一个容量是n 的样本,则样本平均数 也服从正态分布。如果总体的平均数是 ,标准差是 ,则样本平均数所服从的正态分布的中心仍是 ,标准差是抽样平均误差 。,独立同分布的随机变量: , 设它们的平均数为 ,方差为 ,即 , ,(i=1,2,)。则当n趋于无穷大时,算术平均数 的分布趋近于正态分布 。,中心极限定理

14、:,如果总体变量X的期望和方差有限: , ,(i=1,2,)。从该总体中抽出一个容量是n 的样本,则样本平均数 的分布随着n的增大而趋近于平均数是 ,标准差是抽样平均误差 的正态分布。,由中心极限定理得:,中心极限定理应用于成数:,从任一总体成数为P,方差为P(1-P)的(0,1)分布总体中,抽取容量为n 的样本,其样本成数p的分布随着n的增大而趋近于正态分布 。,注意:一般认为,样本单位数不少于30的样本为大样本 ,抽样分布就接近于正态分布。,例1:某高校考生入学成绩平均分为550分,标准差为250分。从考生中随机抽100名,问这100名考生平均成绩在540580分之间的概率。,解:这100

15、名考生平均成绩 近似服从,即:这100名考生平均成绩在540580分之间的概率为54.04%。,例2:某县粮食平均亩产为760公斤,标准差为380公斤。从中随机抽400亩,求样本平均亩产在800公斤以上的概率。,解:样本平均亩产 近似服从,即:样本平均亩产在800公斤以上的概率为1.785%。,比较:上例中,如果该县粮食亩产服从正态分布,求亩产在800公斤以上所占的比例。,解:该县粮食亩产X服从,因此,亩产在800公斤以上的概率为:,即:该县粮食亩产在800公斤以上所占的比例为46%。,例3:某厂零件加工的不合格品率为6%,现从加工件中随机抽取100件,求样本不合格品率在4%以下的概率。,样本

16、不合格品率p近似服从,即:样本不合格品率在4%以下的概率为20.3%。,解:总体成数为P=6%,方差为P(1-P)=0.0564,第四节 抽样估计的方法与应用,一、总体参数估计概述,总体参数估计,用样本统计量来估计总体参数,有点估计和区间估计两种。,科学的抽样估计方法应具备的三个基本条件:,二、总体参数的点估计,点估计,直接以样本统计量的取值作为相应总体参数的估计值,又称定值估计。,优点:,能提供总体参数的具体估计值,可作为决策的数量依据。,缺点:,不能提供估计的准确度和可靠性信息。,评价估计量优良性的三个标准:,1、无偏性:,样本统计量的期望值等于被估计的总体参数。,设 表示总体的待估参数, 是估计 的样本统计量,无偏估计指的是 满足:,如:由于 ,所以样本平均数是总体平均数的无偏估计量。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号