统计学第4章抽样调查

上传人:kms****20 文档编号:56770077 上传时间:2018-10-15 格式:PPT 页数:73 大小:664KB
返回 下载 相关 举报
统计学第4章抽样调查_第1页
第1页 / 共73页
统计学第4章抽样调查_第2页
第2页 / 共73页
统计学第4章抽样调查_第3页
第3页 / 共73页
统计学第4章抽样调查_第4页
第4页 / 共73页
统计学第4章抽样调查_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《统计学第4章抽样调查》由会员分享,可在线阅读,更多相关《统计学第4章抽样调查(73页珍藏版)》请在金锄头文库上搜索。

1、第四章 抽样调查,重点与难点:重点:抽样调查的意义抽样平均误差的意义及计算总体参数的点估计与区间估计的方法难点:抽样平均误差的计算总体参数的区间估计,学习内容:一、抽样调查的基本问题二、抽样误差三、参数估计四、抽样调查的组织形式,第一节 抽样调查的基本问题,一、抽样调查的意义,一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。,1.按随机原则抽选调查单位;2.用样本推断总体;3.在调查之前可以计算和控制抽样误差。,抽样调查的特点:,抽样推断:即根据样本统计量推断

2、总体参数的过程。也叫抽样估计。 抽样调查的特点之一:由部分推断总体,统计推断,全及总体指标:参数(未知量),样本总体指标:统计量(已知量),抽样调查(抽样推断)的概念,随机样本:与总体分布特征相同,非随机样本:与总体分布特征不同,并非所有的抽样估计都按随机原则抽取样本。也有非随机抽样。,特点之二:按随机原则抽取样本,特点之三:存在估计误差,并可加以控制。,抽样推断误差,登记误差,代表性误差,用设计、培训、管理等方法消除,用抽样方法、样本容量等手段控制,抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。,二、抽样调查的适用范围,1.总体

3、范围较广,不需要了解每一个别单位的情况;,2.对破坏性或消耗性产品的质量进行检验;,3.对普查或全面调查的统计资料进行检查和修正。,一般适用于以下范围:,三、抽样调查的几个基本概念,(一) 总体和样本,总体:所要调查观察的全部事物。总体单位数用N表示。总体可以分为有限总体和无限总体。,样本:从总体中抽取出来那部分单位所组成的集合体。样本是总体的一个缩影。抽样总体的单位数,即样本容量,用n表示。n 30 大样本n 30 小样本,(二) 参数和统计量,参数:描述总体特征的指标。 统计量:描述样本特征的指标。 抽样推断的目的就是要通过对样本的平均数、成数的标准差(或方差)的测量来推断总体的相应特征值

4、。,主要统计特征数及符号,(三) 抽样方法,重置抽样:即有放回抽样。不重置抽样:即无放回抽样,每个总体只能有一次被抽中的机会。,样本单位的抽选方法,在组织抽样调查时,根据样本单位是否重复抽取,分别有重复抽样和不重复抽样两种方法。,1、重复抽样,重复抽样是指每次从总体中抽取一个单位进行观察后,再把这个单位重新放回总体,使之继续参加下次抽选。这种抽选法也称为回置抽样或重置抽样。,重复抽样法由于前一次抽中的单位又被放回总体中,不会影响后面的抽选,所以总体中每个单位被抽中的机会均等连续抽选各单位都是独立进行的的。,2、不重复抽样,不重复抽样是指每次从总体中抽取一个单位进行观察后不再把这个单位重新放回总

5、体,这个总体单位不再继续参加下次抽选。这种抽选法也称为不回置抽样或不重置抽样。,不重复抽样法由于每次抽中的单位不再放回总体中,每抽选一次,总体中的单位就减少一个,使连续抽选的各个单位不相互独立。但是总体中各单位被抽中的机会仍然是均等的!,不重复抽样按是否考虑抽选样本单位的顺序,又可分为有顺序不重复抽样和无顺序不重复抽样两种。有顺序不重复抽样即通常所说的不重复排列。按这种抽样方法只要有一个单位不同,就算不同的样本。,抽样框 是指包含有全部总体单位及其主要指标特征的一个框架或列表。,(四)抽样框,以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没

6、有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。,抽样框 的形式一般有两种:,(四)抽样框,一览表:表中列出所有总体单位。,地图:在地图上将调查单位分布在各个地区,然后根据地区进行抽样。,样本可能数目又称样本个数,是指从一个有N个单位的总体中抽取容量为n的样本时,有可能出现的所有样本的个数。,(五)样本可能数目,抽样调查的理论基础,概率论,大数定律,中心极限定理,大数定律 大数定律是指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。其原因是,在大量的观察试验中,个别的、偶然的因素影响而产生的差异将会相互抵消,从而使现象的必然规律性

7、显示出来。 例如,观察个别或少数家庭的婴儿出生情况,发现有的生男,有的生女,没有一定的规律性,但是通过大量的观察就会发现,男婴和女婴占婴儿总数的比重均会趋于50%。,中心极限定理(P97) 大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。而中心极限定理说明的是在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。,论证了: 1、如果总体很大,而且服从正态分布,样本平均数的分布也同样服从正态分布。 2、如果总体很大,但不服从正态分布,只要样本容量足够大,样本平均数的分布趋近于正态分布。 3、样本平均数的的平均数,等于总体平均数。,第二节 抽样误差,一、抽样误差的概念

8、,抽样误差是指在抽样调查中,由于随机抽样的偶然性因素,使样本的结构不足以代表总体的结构,而引起的样本指标与总体指标之间的绝对离差。 即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。,抽样误差的影响因素:,1. 总体标志变异程度。正方向变化关系 2. 抽样单位数目的多少,即样本容量。反方向变化关系 3. 不同的抽样方法。 4. 不同的抽样组织形式。,抽样误差的作用:,1. 在于说明样本指标的代表性大小。误差大,则样本指标代表性低;误差小,则样本指标代表性高;误差等于0,则样本指标和总体指标一样大。,2. 说明样本指标和总体指标相差的一般范围。,抽样误差的意义:,指所有可能样本的指标(所

9、有的统计量)与总体指标(参数)的平均离差,反映抽样误差的一般水平。,二、抽样平均误差,抽样平均误差指所有可能样本(统计量)的指标与总体指标(参数)的平均离差。通常用表示。其定义为:,三、抽样平均误差的计算,(一) 总体平均数的抽样平均误差,1.重置抽样,抽样平均数的平均误差例题:,某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平资料如下:,计算样本平均数和抽样平均误差。,解:先列表,计算平均数即平均工资:,2.不重置抽样:,(二) 总体成数的抽样平均误差,1.重置抽样,2.不重置抽样:,抽样成数的平均误差例题:,某钢铁厂生产某种钢管,现从该厂某月生产的50

10、0根产品中抽取一个容量为100根的样本。已知一级品率为60%,试求样本一级品率的抽样平均误差。,解:已知p=60% 、n=100、N=500,四、抽样极限误差,样本指标围绕总体指标左右两侧波动形成的一定范围。把可允许的误差范围叫做抽样极限误差,即,其中 、 分别表示抽样平均数和抽样成数的极限误差。,五、抽样估计的可靠程度,抽样极限误差通常要以抽样平均误差为尺度来度量,也就是说,抽样极限误差的大小相当于几个抽样平均误差,能有多大的概率保证误差不超过此范围。,当t=1时,F(t)=0.6827; 当t=1.5时,F(t)=0.8664; 当t=2时,F(t)=0.9545; 当t=3时,F(t)=

11、0.9973.这就表明,抽样误差范围与可靠程度之间的数量关系。当抽样误差范围扩大时,就可以提高抽样推断的可靠程度;反之,缩小抽样误差范围,推断的可靠程度就降低。,第三节 参数估计,一、点估计和区间估计,只要在样本代表性大,且对全及指标精确性要求不高的情况下,可采用点估计法。如能满足下列三个准则:,无偏性,一致性,有效性,就会得到合理的估计。,(一)点估计,(二)区间估计,是根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。,根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定

12、的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下:抽样极限误差=t,(t为概率度),可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。,抽样误差范围的实际意义是要求被估计的 全及指标 或P落在抽样指标一定范围内,即 落在,或,的范围内。,二、全及平均数和全及成数的推断,某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。 则:,某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为

13、一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。 则:抽样一级品率:,三、样本容量的确定,(一)影响样本容量的因素,总体的变异程度,抽样的误差范围,抽样估计的置信度,不同的抽样组织形式对抽样误差有影响, 所以也影响了样本容量的确定。,(一) 简单随机抽样,二、简单随机抽样的样本容量的确定,(二) 类型抽样,重复抽样:,不重复抽样:,建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料=1.5,求样本数应是多少?,某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90%,现在要求误差范围在

14、2%之内,可靠程度达95.45%,问必须抽取多少单位数?,某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小型抽样检验,结果知道标准差是18天与20天,试问在抽样平均误差不超过1天(概率为0.9011)的要求下,至少应抽查多少双鞋子?,第四节 抽样调查的组织形式,通常有以下四种组织形式:,一、简单随机抽样(纯随机抽样),即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。,随机抽选可有各种不同的具体做法,如: 1.直接抽选法; 2.抽签法; 3.随机数码表法;,二、机械抽样(等距抽样),先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。,机械抽样,实际上是一种

15、特殊的类型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。,排列次序用的标志有两种:,1. 选择标志与抽样调查所研究内容无关, 称无关标志排队。,2. 选择标志与抽样调查所研究的内容有关, 称有关标志排队。,机械抽样按样本单位抽选的方法不同,可分为三种:,1.随机起点等距抽样,2.半距起点等距抽样,k k k,k,(k为抽取间隔),示意图:,3.对称等距抽样,示意图:,k k k,2k-a 2k+a 4k-a 4k+a,a,k,(k为抽取间隔),机械抽样的好处:,1. 可以使抽样过程大大简化,减轻抽样的工作量;,2. 如果用

16、有关标志排队,还可以缩小抽样误差,提高抽样推断效果。,三、类型抽样(分层抽样),先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。,类型的划分:,一是必须有清楚的划类界限;二是必须知道各类中的单位数目和比例;三是分类型的数目不宜太多。,类型抽样的好处是:,样本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。,两种类型:,1.等比例类型抽样(类型比例抽样);,2.不等比例类型抽样(类型适宜抽样)。,四、整群抽样,整群抽样即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。,整群抽样的好处:组织工作比较简单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号