统计基础教学课件05抽样技术

举报
资源描述
项目五 抽 样 技 术学习目标 掌握抽样调查的概念和特点,了解抽样调查的作用;掌握单纯随机抽样条件下的抽样实际误差、抽样平均误差、抽样极限误差的概念,掌握影响抽样误差的因素,理解抽样平均误差的计算;理解点估计与区间估计的概念和原理,理解参数估计量的评选标准;明确影响样本容量的因素,掌握样本容量的计算方法。一项目导入项目导入结束了一天的课业后,小李回到家中,恰逢在调查公司工作的王叔叔前来做客。小李便与王叔叔进行沟通交流,王叔叔说公司的调查统计工作已经进行到收尾阶段,正准备对调查结果进行验证。爱学习的小李问:“进行验证,需要用到哪些方法呢?”看到小李如此热爱学习,王叔叔热心地向小李介绍了抽样技术,说:“抽样技术是个好东西,但要运用得当。如果用得不好,所做抽样不够科学,那么得到的数据会离真实较远;如果用得好,所做抽样也许没有用到很多样本,但采取的方法一定是科学的,那么得到的数据会接近事实。”目录/Contents02030405模块二 抽样误差模块三 参数估计模块四 样本容量实践模块 Excel在抽样技术中的应用01模块一 抽样调查01模块一 抽 样 调 查01(一)抽样调查的概念实际完成数目:820万回款数:640万计划完成:56一、抽样调查的概念与特点抽样调查是指按照随机性原则,从研究对象中抽取一部分进行观察,并根据所得到的观察数据,对研究对象的数量特征做出具有一定可靠程度的估计和推断,以达到认识总体的一种统计方法。例如,检验某项产品的质量,只需从中抽取一小部分产品进行检查,用计算出的合格率来推测全部产品的合格率,或是根据合格率的变化来判断生产线是否出现了异常。由此可见,抽样调查不仅是一种科学的收集资料的方法,也是一种科学的估计和推断的方法。011.以部分推断总体抽样调查是一种非全面调查,它作为一种进一步推断的手段,目的是认识总体的数量特征。抽样推断科学地论证了样本指标与相应的总体参数之间存在内在的联系,并提供一套利用抽样调查的部分信息来推断总体数量特征的方法。这大大提高了统计分析的认识能力,为信息的采集和开发开辟了新的道路。(二)抽样调查的特点一、抽样调查的概念与特点012.按照随机原则从总体中抽取样本单位抽样调查遵循随机原则,首先,在选取调查单位时完全不受研究者个人主观意志的影响,保证了样本变量是随机变量,使抽出的样本对总体具有足够的代表性;其次,采取随机原则才能对抽样误差进行计算,从而达到推断总体的目的。(二)抽样调查的特点一、抽样调查的概念与特点013.运用的方法是概率估计抽样调查在数学上运用概率估计法,而不是运用确定的数学分析法。因为样本数据和总体参数之间并不存在严格对应的自变量和因变量的关系,所以不能利用一定的函数关系来推算总体参数。那么,用这样的样本指标值来代表相应的总体指标值,其可靠程度究竟有多大,这就是概率估计所要解决的问题。(二)抽样调查的特点一、抽样调查的概念与特点014.事先计算抽样误差并加以控制在抽样推断中,不可避免地会出现抽样误差,但这种误差可以事先通过一定的资料加以计算,并在抽样过程中采取一定的措施进行控制,从而保证抽样推断的结果达到一定的可靠程度,这是任何其他估算方法都办不到的。需要指出的是,抽样误差是不可能完全消除的。(二)抽样调查的特点一、抽样调查的概念与特点01抽样技术具有时效强、费用低、准确度高、应用范围广等优点,所以其在各个领域中得到了广泛应用。抽样调查具有以下几方面的作用:(1)用于那些无法进行全面调查,但又需要掌握其全面情况的现象。(2)用于理论上存在全面调查的可能,但实际中却无法进行或没必要进行的现象。(3)用于对全面调查的结果进行评价和修正。全面调查涉及范围广、调查单位多、工作量大、参加人员多,因而发生登记性和计算性的误差就多。(4)用于工业生产过程中的质量检验。(5)用于对某些总体的假设进行检验,判断假设的真伪,为决策提供依据。二、抽样调查的作用某集团准备在某地新建一家零售商店,命令企划部经理王先生做好商店选址的准备工作。王先生明白,经过该地的行人数量是要重点考虑的对象。于是,他委托相关人员进行了两个星期的观察,得到每天经过该地的人数。具体如下:544,468,399,759,526,212,256,456,553,259,469,366,197,178如果设立商店要求的最低行人数量为520人,则根据上述观察数据,能否支持设店的决策呢?将14天经过该地的行人数量作为样本,商店开张后经过该地的行人数量作为总体。显然,这是个抽样推断的问题。根据样本数据,可计算出样本均值为403人,样本标准差为168.48人。设置信度为95,则可估计出平均每天经过此地的人数为306500人。这就意味着,如果观察100天,则有95天的行人数位于上述区间。那么如果设立商店要求行人数不得低于520人的话,显然在这一地点设立商店是不明智的。商店选址课外补充课外补充01非概率抽样是用主观(非随机的)方法从总体中抽选单元进行调查,它是一种快速、简便且节省费用的抽选样本的方法。但是,非概率抽样具有很大风险,因为主观选定的样本很难肯定其对总体是否具有代表性。三、抽样调查的种类(一)非概率抽样1.非概率抽样的用途(1)用来形成一种想法。(2)为设计开发概率抽样调查方案做准备工作,如初步确定出某一总体方差等。(3)在后续步骤中帮助理解概率抽样调查结果。01三、抽样调查的种类(一)非概率抽样2.非概率抽样的类型非概率抽样主要有随意抽样、志愿者抽样、判断抽样和配额抽样。(1)随意抽样。随意抽样是指单元的抽选以无目的、随意的方式进行,几乎没有或完全没有计划。(2)志愿者抽样。使用志愿者抽样时,被调查者都是志愿者。(3)判断抽样。判断抽样是指选择一些很了解总体的专家来决定总体中哪些单元入样。(4)配额抽样。配额抽样是最常见的一种非概率抽样。01概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单元来避免这种偏差,因而对总体的推断更具代表性。但是,随机不意味着随意,特别是访问员不能随意选择被调查者;否则,样本将受个人意愿的影响。三、抽样调查的种类(二)概率抽样1.概率抽样的基本原则概率抽样有两条基本原则:一是单元是随机抽取的;二是调查总体中的每个单元都有一个非零的入样概率。01三、抽样调查的种类2.概率抽样方法的类型(1)简单随机抽样。简单随机抽样是一种一步抽样法,它要求在调查总体中不加任何分组、划类、排队等,完全随机抽取n个调查单位作为样本。(2)系统随机抽样。系统随机抽样也称机械随机抽样或等距随机抽样,它是先将总体中各单位按一定的标志排队,然后每隔一定的距离抽取一个单位构成样本。(3)分层随机抽样。分层随机抽样又称类型随机抽样或分类随机抽样,它是按照某一标志先将总体分成若干组(类),其中每一组(类)称为一层,再在层内按简单随机抽样方法进行抽样。(二)概率抽样01三、抽样调查的种类2.概率抽样方法的类型(4)整群随机抽样。整群随机抽样是先将总体按某一标志分成若干组,其中每个组称为一个群,以群为单位进行简单随机抽样,然后对抽到的群内的每个单位都进行调查。(5)多阶随机抽样。多阶随机抽样是用两个或更多个连续的阶段抽取样本的过程。第一阶段抽取的单元称为初级或一级抽样单元,第二阶段抽取的单元称为次级或二级抽样单元,以此类推。(6)比例随机抽样。比例随机抽样是一种使用辅助信息从而使入样概率不相等的抽样技术。(二)概率抽样重复抽样又称重置抽样,是指在逐个抽取样本单位时,被抽中的总体单位经登记、观察后,再放回总体中,接着继续抽取下一个样本单位的抽样方法。这种抽样方法使每个单位都有重复被抽中的可能,每个单位的中选概率在各次抽选中是相同的。不重复抽样又称不重置抽样,是指在逐个抽取样本单位时,被抽中的总体单位经登记、观察后,不再放回总体中去参加下一次抽选的抽样方法。这样,每进行一次抽选,总体中的单位数就减少一个,每次抽取的结果都影响到下一次的抽取。在这种抽样方法下,虽然每个单位都有可能被选中,但中选概率在各次抽选中是不同的。重复抽样和不重复抽样课外补充课外补充011.总体总体也称全及总体,指所要研究对象的全体。总体单位数通常是很大的,甚至是无限的,这样才有必要组织抽样调查。总体单位数一般用英文大写字母N来表示。四、抽样调查常用的基本概念(一)总体和样本2.样本样本又称抽样总体或子样,它是从总体中随机抽取出来的,作为代表总体的那部分单位组成的集合体。样本单位数总是有限的,相对来说它的数目较小,一般用英文小写字母n来表示。不同的样本单位可以组成不同的样本,在抽样时可能出现的样本有很多个。阉割版的可能数目M是指在总体单位数N、样本单位数n、抽样方法一定的情况下,可能出现的样本的总量。如果考虑样本单位出现的顺序,在重复抽样和不重复抽样条件下,样本数目M的计算方法如下。重复抽样条件下:M=Nn不重复抽样条件下:M=N!/(N-n)!样本的可能数目课外补充课外补充011.参数参数是指总体指标值,是确定的、唯一的。对于总体中的数量标志,常用的总体参数有总体平均数和总体方差(总体标准差)。设总体变量X为X1,X2,X3,XN,则有:四、抽样调查常用的基本概念(二)参数和统计量01对于总体中的品质标志,由于各单位标志不能用数量来表示,因此总体参数常以样本成数p来表示总体中具有某种性质的单位数在总体全部单位数中所占的比重,以Q表示总体中不具有某种性质的单位数在总体中所占的比重。设总体N个单位中,有N1个单位具有某种性质,有N0个单位不具有某种性质,N1N0N,则有:四、抽样调查常用的基本概念(二)参数和统计量01如果品质标志表现只有是非两种,那么这种标志可以称作是非标志。例如,产品质量标志表现为合格品和不合格品,性别标志表现为男性和女性。如果把“是”的标志表示为1,而“非”的标志表示为0,那么样本成数p就可以视为(0,1)分布的平均数,并可以求相应的方差和标准差。四、抽样调查常用的基本概念(二)参数和统计量很明显:012.统计量统计量是指样本指标值,即根据样本各单位标志值或标志属性计算出的综合指标。由于统计量是用来估计参数的,因此与常用的总体参数相对应,常用的样本指标有样本平均数、样本成数等。设样本变量x为x1,x2,x3,xn,则有:四、抽样调查常用的基本概念(二)参数和统计量02模块二 抽 样 误 差误差是测量测得的量值减去参考量值。测得的量值简称测得值,代表测量结果的量值。所谓参考量值,一般由量的真值或约定量值来表示。对于测量而言,人们往往把一个量在被观测时,其本身所具有的真实大小认为是被测量的真值。实际上,它是一个理想的概念。因为只有“当某量被完善地确定并能排除所有测量上的缺陷时,通过测量所得到的量值”才是量的真值。从测量的角度来说,难以做到这一点。因此,一般说来,真值不可能确切获知。什么是误差课外补充课外补充02一、抽样误差的概念与种类在抽样推断中,样本指标和总体指标间必然存在某种程度的离差,统计学上将这种离差定义为抽样误差。在统计学中,抽样误差是不可避免的,按照产生的原因,可将抽样误差分为登记性误差和代表性误差。02一、抽样误差的概念与种类1.登记性误差登记性误差是指在调查过程中,由于观察、测量、登记、计算上的差错所引起的工作误差。这种误差是人为因素造成的,可以通过提高技术人员的素质,严格执行统计法规来尽量避免或缩小。02一、抽样误差的概念与种类2.代表性误差(1)系统误差。系统误差是指在抽样过程中,由于破坏了随机原则而产生的误差。(2)随机误差。随机误差是指严格遵守随机原则的情况下,由于偶然因素的影响所产生的样本不足以代表总体的误差。02所谓抽样实际误差,就是指在一次具体的抽样调查中,由偶然因素引起的样本指标与总体指标之间的绝对离差。例如,样本平均数与总体平均数之间的绝对离差,样本成数与总体成数之间的绝对离差。然而,在抽样中,总体指标数值是未知的,因此抽样实际误差是无法计算的。同时,抽样实际误差仅仅是一系列可能出现的误差数值之一,因此它不能概括所有可能产生的抽样误差。二、抽样误差的表现形式(一)抽样实际误差021.抽样平均误
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关搜索

当前位置:首页 > 高等教育 > 大学课件


电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号