抽样的逻辑课件

上传人:我*** 文档编号:147904177 上传时间:2020-10-14 格式:PPT 页数:29 大小:1.23MB
返回 下载 相关 举报
抽样的逻辑课件_第1页
第1页 / 共29页
抽样的逻辑课件_第2页
第2页 / 共29页
抽样的逻辑课件_第3页
第3页 / 共29页
抽样的逻辑课件_第4页
第4页 / 共29页
抽样的逻辑课件_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《抽样的逻辑课件》由会员分享,可在线阅读,更多相关《抽样的逻辑课件(29页珍藏版)》请在金锄头文库上搜索。

1、第三讲抽样的逻辑,讲解: 李素梅,总体与抽样框,概率抽样的应用,提纲,概率抽样的实际操作,抽样:从总体中选出具有代表性样本的过程。以便通过对样本的研究,取得能说明总体的足够可靠的资料,准确地推断总体的情况,从而认识总体的特征或规律性。,抽样知识回顾,抽样原则:样本具有代表性,即所选取的样本能再现总体的结构。,回顾几个概念吧,抽样框与总体的关系:经过正确抽样所得的样本信息,只适合于描述构成抽样框的要素组成的总体,是否能扩展需要分析。 例:对纽约以及新泽西48个社区中68个药房药物的销售情况进行25年的调查(方法:“调查邻近药房的方式”)-能推断整个美国药房销售的情况吗?或是否能推论纽约和新泽西的

2、药房的情况?,总体与抽样框,理想的抽样框:所有的抽样单位必须覆盖总体,抽样框要求每个总体单位都应该对应着一个抽样单位,抽样单位必须相互独立,互不重叠。如以北京的所有街道的名单为一阶抽样中的抽样框,其必须覆盖北京所有的街道。,总体与抽样框,抽样框表现形式-例:电话号码簿、邮政编码簿、车主名单、纳税人名单、领有营业执照的人员名单;大学、学术期刊、报纸、工会等名单,当你用电话簿或名册作为抽样框时,有没有注意它是否包含了总体所有单位呢?,抽样框误差来源于:1. 不能覆盖总体单位; 2 . 包含了非总体单位; 3 . 复合联接; 4 . 抽样框老化。,总体与抽样框,非概率抽样方法 就近法、目标式抽样、

3、配額抽样、滾雪球抽样,确定合适的样本量,执行抽样设计,界定总体,决定抽样框,确定抽样步骤,抽样的设计,概率抽样方法 简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样,概率抽样(Probability Sampling),概率抽样:按照概率论和数理统计的原理,根据随机原则从 调查研究的总体中抽选样本,使每个要素以已知非零的机会进 入样本的方法。 特点:1、按随机原则抽选样本;2、总体中每一个单位被 抽中的概率已知非零,样本具有代表性;3、可以估计可能出 现的误差并加以控制。,简单随机抽样(Simple Random Sampling),总体各单元不经过任何排队或分类, 从总体N个单位中任意

4、抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式,是其他概率抽样方法的基础。,方法:抛硬币、掷骰子、抽签、查随机数表等。,随机数表法例:(例:K=100,n=10) 1. 给每个要素编码; 2. 从随机表中随机选取10个数字: 确定所选择的随机数的位数; 随意从随机数表中任何一区的任何一个数目开始,依 次向各个方向顺序连续选取数字。,评价:概率抽样的理想类型,没有偏见,简单易行。但当总体所含个体数目太多时,费时、费力,费用高;而且在总体异质性很高时,误差较大。 因此,名册齐全的话,一般会用系统抽样法而不是简单随机抽样法。,黑人白人机会均等,步骤: (1)将总体的所有单位按一

5、定顺序排列起来。 (2)计算抽样间距: k=总体大小(N)样本大小(n) 。 (3)随机确定一个起点a (1ak) 作为第一个样本单位。 (4)每隔k个单位抽取1个,即由a,a+k,a+2k.a+(n-1)k组成容量为n的样本。,2. 系统抽样( Systematic Sampling ),亦称等距抽样或机械抽样,系统化地选择完整名单中每第K个要素组成样本的概率抽样方法。,1 2 3 4 5 6 7 8 9 10,31 32 33 34 35 36 37 38 39 40,21 22 23 24 25 26 27 28 29 30,11 12 13 14 15 16 17 18 19 20,N

6、=40 n=8 k=5,我的fans多得不得了呢.,优点 比简单随机抽样方便简单 样本在总体中的分布比较均匀 局限性 是以总体单位的无规律排列为前提的,如果总体的排列出现规律性,特别是周期性时,就可能会使抽样出现系统偏差。,如果在一栋公寓楼里选选择公寓样本,如上图样本间距是8,那么所选样本的每个要素可能全是西北角上房间,这样样本就可能会缺乏代表性. 如果有周期性,可以采取在每个间隔内随机抽取等方法解决。,3. 分层抽样(Stratified Sampling),先将总体按照一种或几种特征将总体的N个单位分成互不交叉、互不重复的若干个组(层);然后从每层中独立、随机地抽取一个子样本,将子样本合在

7、一起,即为总体的样本。,腌菜缸厂家想了解各类腌菜的长度,于是.,变量的选择: 1. 研究涉及到的主要变量或相关的变量; 2. 保证各层内部同质性强的变量; 3. 有明显分层区分的变量; 如:某厂职工购买书籍的情况”文化程度”; 某高校宿舍使用电脑情况“本科生、研究生”等 常用指标:行政区划、地理位置、海拔高度、行业、经济发达程度、企业规模、家庭收入水平、性别、年龄、民族等,分层应遵循原则:尽可能层内样本的变异小,层间变异大。,优点:1. 样本同质性高,样本分布均匀,样本结构与总体结构接近;2. 也可对各子层的参数进行推断; 3. 组织实施比较方便。 应用上最为普遍。尤其是 总体数目较大,内部结

8、构复杂时常能取得比较好的效果;注意:要求调查者对总体及各层有一定的了解,否则无法作出科学的分类。,步骤:1. 变量的选择。可按一种或几种特征对总体进行分层。如调查某年高考生的语文成绩,可根据科目分类,如文科 、理科、艺术、体育、外语等层次来进行简单随机抽样;男性白人、女性白人、男性黑人、女性黑人; 2. 确定在各层中抽取样本单位的数量。可采取等比例和不等比例抽取两种不同的方法。,a. 等比例抽样,要求各层之间的抽样比例相等。 方法1:先分成不同的层,然后采取系统抽样或者随机抽样按照比例抽取。,占总体之60%,占总体之40%,女生 N2=400,总体 (N=1000),男生 N1=600,方法2

9、. 分类,再把不同类别的要素放到一个连续性的列表中,然后再对整个列表进行随机开始的系统抽样。(误差将会在1-2个以内,如果在此步采取简单随机抽样将会使分层的效应被抵消),b. 不等比例抽样,加权,即各层之间的抽样比例不等: 有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行比较研究。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。,例:N=120 n=60 各层人数 不等比例样本 样本概率值 加权重 本科生 60 20 1/3 3 硕士生 40 20 1/2

10、 2 博士生 20 20 1 1,基本上一个样本成员的权重,应该是其获选为样本概率值的倒数。 加权:由于各种误差因素的存在,常导致样本的人口统计数据有别于普查数据。为了减小这种误差,在数据处理时,我们要算出各个样本的权值,使样本结构与普查数据一致,这种数据处理方法就是加权。,4. 整群抽样(Cluster Sampling),整群抽样又称聚类抽样,一种以群而非个体为抽样单位的抽样方式。先将总体划分为若干能代表总体的子群体,从中随机抽取一些子群体,抽取的群里所有要素共同组成样本的方法。,例:对北京市小学生的视力状况进行抽样调查,以学校作为群,抽出部分学校,再对抽中的所有学校的学生统一调查。,群的

11、划分标准:按行政或地域形成的群体,如学校、企业或街道等。 自行划分群时原则:尽可能群间差异小,群内差异大,让每个群更具有代表性。,优点:1.转换抽样单位,编制抽样框得以简化;2. 群通常由那些地理位置邻近,或隶属于同一系统的单元构成, 调查方便;可了解每个子群的情况(如省-市,亦可了解市的情况); 局限性:当样本集中于少数群时,引起抽样误差大于其他方法。,图1:分层抽样,图2:整群抽样,5.多阶段抽样(Multi Stage Sampling),亦称多级抽样,在上述整群抽样中,当子群或子群内部个体数目较多,彼此间的差异不太大时,常常采用更加经济的方法,即不将样本子群中的所有个体作为样本,而是从

12、中再抽取样本,因最终样本的获得经过两次抽样,我们称其为二阶段抽样。同样可进行三阶段、四阶段等多阶段抽样。 如:我们若要调查北京市小学生的视力状况,可采用三阶段抽样的方法:先以学校为抽样单位,抽出若干所小学,然后再以班级为抽样单位抽出若干班级,最后以学生个人为单位从抽中的班级中抽取最终样本。,多阶段抽样,例:在一项某市居民对香皂颜色喜好的调查中,设计者打算采用入户调查的方式,为节省差旅费,希望样本能够集中,因此准备采用整群抽样。方案设计者手头有份该市街道名单。以街道作为群,工作量太大,以居委会为群,编制抽样框来不及,因此,他决定,三阶段抽样,抽取部分居委会对所有家庭调查,二级整群抽样,抽除部分家

13、庭,最后一阶抽群,最后一阶 抽要素,多阶段抽样,多级整群抽样,抽取部分居委会,抽取100个居委会,每个居委会抽取2个人?,抽10个居委会, 每个抽取20个人?,按照增加样本容量的原则,通过同质性解决,自然群如居委会群内差异较小,需要大量的群才能充分代表所有群之间的差异,尽量多地选择群,而减少每个群中要素的数量,上例:N=200,建议:在多阶段抽样中,增加开头阶段的样本数,同时适当地减少最后阶段的样本数。,多阶段抽样中如何处理样本量的平衡问题?,优点:效率较高 局限性:每一阶段都会有误差。 适用范围:跨地区的研究,不可能或不方便编制一个完整的名单形成目标总体时;或者是在总体层次比较多或层次内单位

14、数目比较多时,更加经济实用。,辅助方法:对于群体规模不等的多阶段抽样,通常使用概率比例抽样,即pps抽样。就是根据每一群的规模分配样本容量的方法,以确保每一元素具有相等的被选取的概率。,运用什么原理,如何操作?,要点,概率抽样: 1 样本较具代表性;2概率理论能够让我们估计样本的精确度和代表性。3. 尤其适用于从大的、已知总体中抽取样本;4. 适用于需要对总体给出很准确的估计的情况,例如要估计市场占有率、整个市场的销售量、估计某个地区的电视收视率等。还有全国性的市场跟踪研究(提供有关产品分类和品牌使用率等信息的研究),以及人口分布的研究等。但在概率抽样时要特别注意控制调查过程中的非抽样误差。,謝謝大家.,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号