统计学(抽样估计)

上传人:aa****6 文档编号:57661525 上传时间:2018-10-23 格式:PPT 页数:55 大小:436KB
返回 下载 相关 举报
统计学(抽样估计)_第1页
第1页 / 共55页
统计学(抽样估计)_第2页
第2页 / 共55页
统计学(抽样估计)_第3页
第3页 / 共55页
统计学(抽样估计)_第4页
第4页 / 共55页
统计学(抽样估计)_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《统计学(抽样估计)》由会员分享,可在线阅读,更多相关《统计学(抽样估计)(55页珍藏版)》请在金锄头文库上搜索。

1、1,统 计 学 原 理 抽样推断,2,第四章第一节,第一节 抽样调查的意义 一、抽样调查的概念 广义抽样调查:凡是抽取一部分单位进行观察,并根据观察结果来推断全体的都是抽样调查,可分为随机抽样和非随机抽样两种。 狭义的抽样调查:仅指根据大数定律和概率论的要求,随机抽样,保证总体中各个单位都有同样的机会被抽中。 概念:按照随机抽样的原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。,3,第四章第一节,二、抽样调查的特点 按随机原则抽取调查单位; 要抽取足够多的调查单位; 可从数量上推断总体 要运用概率估计的方法 抽样调查中

2、所产生的抽样误差可以事先计算并加以控制。,基本原则,基本目的及任务,科学性体现,4,第四章第一节,三、抽样调查的使用范围 有些事情在测量或实验时有破坏性,不可能进行全面调查 有些总体从理论上讲可以进行全面调查,但是实际上办不到 和全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活 在有些情况下,抽样调查的结果比全面调查要准确 用抽样调查的资料修正和补充全面调查资料 抽样调查方法可以用于工业生产过程中的质量控制 利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍,5,第四章第一节,四、抽样估计的一般步骤 1、设计抽样方案 2、抽取样本单位 3、搜集样本

3、资料 4、整理样本资料 5、推断总体指标,6,第四章第二节,第二节 调样调查的基本概念及理论依据一、全及总体和抽样总体(教材没有)全及总体简称总体(N):研究对象的全体 (唯一确定)变量总体 :各单位可用数量标志计量 A 有限总体:变量值有限 B 无限总体:变量值无限,分为可列或连续 属性总体 :各单位用品质标志描述,7,第四章第二节,抽样总体,简称样本(n) :将从总体中抽取的部分单位称为样本 大样本:样本数达到或超过30 小样本:样本数在30以下 注意:对于全及总体单位数N来说,样本n是一个很小的数,它可以是N的几十分之一,几百分之一、几千分之一、几万分之一。,8,第四章第二节,二、全及指

4、标和抽样指标 全及指标(总体指标) 定义:根据全及总体各个单位的标志值或标志特征计算的,反映总体某种属性的综合指标,称为全及指标(总体指标)。,9,第四章第二节,全及指标的运用及计算 变量总体的平均数: 属性总体:计算结构相对指标,即总体成数,用P表示,表明总体中具有某一属性的单位数占总体单位数的比重。设总体中有N个单位,有N1个单位具有某种属性,N0个单位不具有某种属性,N1+N0=N,P为总体中具有某种属性的单位数所占的比重,Q为不具有某种属性的单位数所占的比重,则总体成数为:,10,第四章 第二节,属性总体的平均数成数属性总体的平均数,11,第四章第二节,变量总体标准差和总体方差,它们都

5、是测量总体标志值分散程度的指标 注意:总体的统计量是一个确定的值,12,第四章第二节,属性总体的方差和标准差注意:总体的统计量是一个确定的值,13,第四章第二节,抽样指标 样本统计量 定义:由抽样总体各个标志值或标志特征计算的综合指标称为抽样指标 抽样指标的运用及计算 变量总体 : 属性总体:设样本中有n个单位,有n1个单位具有某种属性,n0个单位不具有某种属性,n1+n0=n,p为总体中具有某种属性的单位数所占的比重,q为不具有某种属性的单位数所占的比重,则抽样成数为 :,14,第四章 第二节,属性样本的平均数成数属性样本的平均数,15,第四章第二节,样本标准差 和样本方差 ,它们都是测量样

6、本标志值分散程度的指标注意:样本统计量不含未知参数,它是随样本不同而不同的随机变量(见教材34页),16,第四章第二节,属性样本的方差和标准差注意:样本统计量不含未知参数,它是随样本不同而不同的随机变量,17,第四章第二节,统计抽样过程根据样本的平均数、成数(也称比率)来推断总体的平均数,成数或所在的范围,只要总体的平均数或成数掌握了,那么总体的标志总量也就可以推断出来。,总体N,样本n,(抽取方式方法),计 算 抽 样 指 标,推 断 总 量 指 标,(抽样估计),(计算抽样误差),18,第四章第二节,三、抽样方法和样本的可能数目样本的容量(n) 样本的可能数目抽样的方法取样方式:重复、不重

7、复 抽样的方法对样本的要求:考虑顺序、不考 虑顺序,19,第四章第二节,考虑顺序的不重复抽样数目考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的重复抽样数目,20,第四章第二节,四、抽样调查的理论依据 大数法则:随着抽样单位数n的增加,抽样平均数有接近总体平均数的趋势,几乎具有实际的必然性。 中心极限定理:如果总体变量存在有限的平均数和方差,则不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋于正态分布。,21,五、抽样分布(教材98页) 概念由样本n个观察值计算的统计量的概率分布。抽样分布的形式 样本比率的抽样分布 样本方差的抽样分布,22,样本统计量,样本

8、均值,样本比率p,样本方差s2,正态总体或非 正态总体大 样本,非正态总体 (小样本),正态分布,t分布,大样本,正态分布,分布,23,第四章第三节,第三节 抽样平均误差(样本平均数的方差与标准差) 一、抽样误差的概念 是指样本指标和总体指标之间数量上的差别。,统 计 调 查 误 差,登记性误差,代表性误差,系统误差(偏差),随机性误差,24,第四章第三节,(指一个样本指标与总体指标之间的差别),(指所有可能出现的样本指标的标准差,即所有实际误差的平均值),25,第四章第三节,二、抽样平均误差的意义 抽样误差是一个随机变量; 抽样误差是反映抽样指标对全及指标代表性程度; 不能用一次抽样得到的抽

9、样误差来衡量抽样指标对于全及指标的代表性大小; 抽样平均误差概括地反映了所有可能抽样指标与全及指标之间的误差的一般水平。 因此:抽样平均误差是实际可以运用于衡量抽样指标对于全及指标代表性程度的一个尺度;也是计算抽样指标与全及指标之间变异范围的一个根据。,26,第四章第三节,三、抽样平均误差的计算( p103) 1、原理公式:2、运用公式 A平均数的抽样平均误差B成数的抽样平均误差,27,第四章第三节,注意:在上述公式中, 或 总体标准差,但是实际中这两个数据却是未知的。计算抽样平均误差时通常采用以下替代方法。 1、用样本标准差替代总体标准差。大样本情况下,可以直接用样本标准差S代表代表总体标准

10、差;在小样本的情况下,则采用样本修正标准差 来代替。2、用以前(近期)的总体标准差或同类地区的总体标准差来代表所研究的标准差。若同时有多个可供参考的数值时,应选择其中最大者。对于成数P,应选最接近0.5的比率。,28,第四章第三节,四、影响抽样平均误差的因素 1、全及总体标志的变动程度 全及总体标志变动程度越大,抽样平均误差就越大;反之,全及总体标志变动程度越小,则抽样平均误差越小。两者成正比关系的变化。 2、抽样单位数的多少 在其他条件不变的情况下,抽取的单位数越多,抽样平均误差越小;样本单位数越少,抽样平均误差越大。抽样平均误差的大小和样本单位数成相反关系的变化。 4、抽样方法(重复或者不

11、重复) 3、抽样的组织方式,29,第四章第三节,例题:某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200只,分别计算抽样平均误差。该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平均误差。,30,第五章第三节,例题:某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,所得资料如下表:按照质量规定,电灯泡使用寿命在1000小时以上的为合格品,计算灯泡使用时间抽样平均误差和灯泡合格率的抽样平均误差?,31,第四章第四节,第四节参数估计(全及指标的推断P123) 一、估计量与估计值 参数估计:用样本统计量去估计总体参数,即用样本

12、均值去估计总体均值,用样本方差去估计总体方差,用样本比率去估计总体比率。 用 概括表示所有总体参数,参数估计就是考虑如何用样本统计量估计总体参数 。 在参数估计中,用来估计总体参数的统计量,称为估计量用 来表示,估计量的具体数值称为估价值。,32,第四章第四节,二、评价估计量的标准(教材126页) 1、无偏性 2、一致性 3、有效性,33,第四章第四节,三、参数估计的方法(P123) (一)点估计 也叫定值估计(或直接估计),就是把样本平均数或样本成数直接作为总体平均数或总体成数的估计值。 (二)区间估计 1、区间估计的意义 在一定概率的保证下,用样本指标去推断总体指标,在考虑抽样误差的前提下

13、,使得总体指标落到某一范围之内,即根据抽样指标定出置信区间和置信度。,34,第四章第四节,2、抽样极限误差 概念:抽样极限误差是指总体指标和抽样指标之间误差的可能范围。 (1)抽样平均数的抽样极限误差(2)抽样成数的抽样极限误差,35,第四章第四节,总体范围的估计 若有了抽样极限误差,则总体平均数和总体成数的可能范围可以用下式估计: (1)抽样平均数的范围(2)抽样成数的极限误差,36,第四章第四节,例:要估计一批产品的合格率,从1000件产品中抽取200件,其中有10件不合格品,如果确定抽样极限误差的范围为2%,试估计产品合格率的范围。 样本成数p=190/200=95% 总体成数下限=95

14、%-2%=93% 总体成数上限=95+2%=97% 即该产品合格率在93%97%之间。,37,第四章第四节,抽样极限误差与抽样平均误差的关系 抽样极限误差通常用抽样平均误差的倍数表示,即t称为概率度。,或,或,38,第五章第四节,3、可信程度 可信程度是表示估计的可靠程度 如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。 而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t决定的。因而可靠程度与t之间有一定正比关系。 概率度t与概率保证程度(可靠程度)之间的关系见下表。例:若概率为0.95,查表得t=1.96,39,40,第四章第四节,三、抽样推断(区

15、间估计) 抽样推断(区间估计)的步骤如下: 计算抽样平均误差 给定概率保证程度,查表得概率度t 计算抽样极限误差估计总体指标区间,41,第四章第四节,接前面灯泡例题: 灯泡样本平均使用时间 为1057小时,合格率为91.5%,重复抽样下,灯泡的使用时间抽样平均误差为 小时,合格率的平均误差为 ,计算在不同概率保证下,平均数和成数的抽样极限误差? 当t=1? 当t=2? 当t=3?,42,第四章第五节,第五节 抽样方案设计(P96) 一、抽样方案设计的基本原则 保证实现抽样随机性的原则 (保证消除代表性误差中的偏差) 保证实现最大的抽样效果原则,43,注意: 调查费用取决很多因素,其中最重要的是

16、抽样单位数目,要确定适当的抽样单位数目,取决于抽样的精度和可靠性的要求; 精度是指希望估计区间的长度越短越好,可靠性是指估计区间包含参数的概率越大越好; 在样本容量确定的条件下二者是矛盾的,因此抽样设计的原则是在一定的误差和可靠性的要求下选择费用最少的样本设计。,第四章第五节,44,第四章第五节,二、简单随机抽样(既不分组也不排队) 简单随机抽样又称纯随机抽样,是按照随机的原则直接从N个总体单位中抽取n个单位作为样本。注意:简单随机抽样最符合随机原则 直接抽选法 抽签法 随机数码表法,45,第四章第五节,三、类型抽样 (分层抽样) 类型抽样又称分类抽样或分层抽样,是先对总体各单位按一定标志加以分类,然后再从各类中按随机原则抽取样本,由各类内的样本组成一个总样本。 将总体N分成N1、N2、Nm,从N1中抽取n1个单位、N2中抽取n2个单位、Nm中抽取nm个单位组成样本。 总体单位数N=N1+N2+Nm样本单位数n=n1+n2+nm 注意:在类型抽样的情况下,因为从各类型组都抽取了样本单位,所以,对各类型组来说是全面调查,因此,组间方差是可以不考虑的。影响抽样误差的总方差是组内方差。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号