第8章抽样设计说课材料

上传人:yulij****0329 文档编号:252190999 上传时间:2022-02-10 格式:PPT 页数:52 大小:1.52MB
返回 下载 相关 举报
第8章抽样设计说课材料_第1页
第1页 / 共52页
第8章抽样设计说课材料_第2页
第2页 / 共52页
第8章抽样设计说课材料_第3页
第3页 / 共52页
第8章抽样设计说课材料_第4页
第4页 / 共52页
第8章抽样设计说课材料_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《第8章抽样设计说课材料》由会员分享,可在线阅读,更多相关《第8章抽样设计说课材料(52页珍藏版)》请在金锄头文库上搜索。

1、第8章 抽样设计8.1 抽样调查 与抽样设计8.2 制定抽样框架8.3 抽样方法18.1 抽样调查 与抽样设计开篇案例:防弹钢板应该焊在哪里?文学摘要的厄运2抽样可:电话号码薄和汽车登记册问卷回收率较低为什么选择 抽样调查 ?1、相对优势(1)适合大总体(2)调查费用低(3)时效更好(4)特殊要求,如人员、仪器或破坏性测试3抽样设计 的程序5程序1:定义目标总 体(注意跟调查总 体的区别)定义义目标总标总 体的四个因素:总体中个体的类型。个人、家庭还是企业单位;个体的特征。包括人口统计特征、行为甚至心理特征;个体地理位置。即区域范围;调查的标准时点或时期。6程序2:制定抽样框架对目标总体定义后

2、,需要决定辨别和接触总体中个体的手段或途径。抽样框架提供抽取样本的工具或名单,提供了辨别和联系调查总 体中个体的有效途径。7程序3:选择 抽样方法放回抽样样(重复抽样样)与非放回抽样样(非重复抽样样)概率抽样样与非概率抽样样抽样误差与抽样方法、样本量相对总体的大小等相关8程序4:确定样本量样本量指包含在样本中的个体数目。确定样本量需要考虑一系列定性和定量的因素定性因素:决策重要性、研究性质、变量数目、分析的性质、发生率、完成率及资源约束定量因素:概率抽样方法9程序5:执行抽样过程抽样过程的执行要求详细指定关于总体、抽样框架、抽样单位、抽样方法及样本量的抽样设计 决策如何履行。比如抽样单位是家庭

3、,就需要对家庭有一个操作化定义。108.2 制定抽样框架抽样框:供抽样使用的所有调查单 位的名单。这份名单为调查 者提供了辨别和联系调查总 体中个体的有效途径。识别资 料:帮助我们识别 抽样框中个体的项目,如姓名、家庭住址、身份证号码等;联系资料:用来确定个体所在位置的项目,如通讯地址或电话 号码;分类资 料:维护资 料:连接资料:识别资 料和联系资料必不可少。11不是必不可少,有助于提高抽样效率抽样框的类型1.名录框一份涵盖所有总体中个体的实际的或概念的名录清单。概念名录框:某天早上8点-9点之间进入某购物中心停车场的所有车辆名录,是临时性的。实际名录框:各级政府或特定机构因各自的管理需要都

4、保存一些名录,是对抽样框进行维护的最有效资料来源。如生命统计等登记、商业注册、地址邮政编码册、电话号码薄。122.区域框个体由地理区域构造的一种特殊名录框,调查总体则由这些地理区域组成。适用于两种情况:1)调查本质是地理性质的;2)不能获得一个适当的名录框。区域框中个体可以分为不同层次,上一级个体可以细分为许多下一级个体,如多阶段抽样。133.多重抽样框当没有一个抽样框能全部覆盖总体时,就需要两个或两个以上的抽样框的组合,如名录框和区域框的组合,或者两个或以上的名录框的组合。优点:对总体覆盖更好。缺点:可能导致同一个体在几个抽样框中重复出现,从而导致有偏估计。14抽样框的评估1.抽样框的可能缺

5、陷不完全覆盖(如新注册成立的公司)过涵盖(如破产注销的公司)重复分类错误152.合格抽样框的标准关联性:抽样框与目标总体对应的程度和据此与目标总体的个体接触难易程度的一种度量。精确性:涵盖误差、分类误差、联系资料。时效性:抽样框的更新日期与调查标 准日期的接近程度来计量。费用大小:衡量建立抽样框花费的总费用;并与本次调查的总费用进行比较。163.建立合格抽样框的建议与措施调查设计阶 段,评估质量和适应性;尽量避免使用多重抽样框;对同一目标多次调查时 ,使用同一抽样框;消除抽样框重复、增加新生、去成消亡个体;严格训练 工作人员;实地考察或其他地图核对区域框;判定和监控涵盖范围;记录 目标总 体、

6、调查总 体、抽样框、涵盖范围等。178.3 抽样方法抽样方法分类及特点概率法则:任意为非立意按是否严格遵循概率法则,分为概率抽样和非概率抽样概率抽样最大特点是:可确定样本估计值的精度,计算置信区间,对总体进行合理推断;非概率抽样的特点是:操作简便、时效快、成本低,可以推断总体但无法确定精度。18抽样方法分类19概率抽样方法1.简单 随机抽样2.系统抽样3.分层抽样4.整群抽样5.与个体成大小比例的概率抽样6.其他概率抽样方法201.简单 随机抽样(SRS)按照随机原则,从总体中不加任何分组、分类、排序等先行工作,直接地抽取样本,适合于均匀总体。重复抽样非重复抽样21简单 随机抽样随机数表法 P

7、366附录B-11. 将总体进行编号,并确定样本量;2. 确定使用随机数的哪几位数字作为样本编号;3. 随机选择选样的起点、方向,抽取样本;4.对于符合要求的单位作为一个样本,对于重复的单位只取一个后补充增加。22简单 随机抽样的优点和不足优点:简单、典型、易于理解;抽样框不需要其他信息就能进行抽样;理论成熟,样本推断总体比较可靠;不足:构建抽样框可能较困难;样本可能很大、地理可能很分散,增加了时间 和成本;精度较低;样本不一定具有很好的代表性。232.系统抽样(SYS)又叫等距抽样或机械抽样,指将调查总体单位按照一定标志进行顺序排列,然后根据总体单位数和样本单位数计算抽样间距( ),并从抽样

8、框中每隔 个单位抽选一个个体,组成样本。24总体单位:50000样本量:500抽样间距:50000/500=100在1100中随机确定一个初始单位如36,则可以确定其他样本序号四舍五入系统抽样中,总体单位的排列顺序决定了按抽样间距所抽取样本的代表性。1)排序指标与需要研究特征无关,则与简单随机抽样类似;2)排序指标与需要研究的特征有关,增加代表性;3)如果总体排序呈现循环特征,抽样间距如与循环周期相同则降低代表性。25系统抽样的优点和不足优点:没有抽样框时,可以代替简单随机抽样;不需要抽样辅助信息;与简单随机抽样相比,系统抽样样本分布较好成熟的理论,估值容易;简单、成本低、容易实现。p不足:周

9、期性;抽样效率不高;263.分层抽样又叫分类随机抽样,指将调查总 体中的所有单位按照一定的属性或特征分为不相重叠的若干层次(或类别),然后每一个层次中进行简单随机抽样或等距抽样。对总体分层的标志为总体的某种重要属性或特征。分层的目的是使样本在各层、类中分布均匀,具有更好代表性,因此层间要差别明显,层内应保持一致性。27分层抽样分层比例抽样纽曼分层抽样德明分层抽样多次分层抽样1)分层比例抽样分层比例抽样法就是按照每个层次单位的数量占总体单位数的比重,等比例地分配各层的样本单位数。计算公式:28N 总体单位数;Ni 第i层总单位数;n 样本总数;ni 第i层抽取样本单位数。例子292)纽曼分层抽样

10、不是简单按照各层单位数占总体单位数的比例分配样本数量,而是结合考虑其他因素调整各层的样本单位数,如重要性、差异性等。理由:照顾比例小的层或类;增加异质性较大的层或类的单位数;增加重要的层或类的样本单位。30Si第i层的标准差例子31由于标准差较大,比等比例抽样样本数(20)调整增加。3)德明分层抽样又叫最低成本抽样,根据抽样费用支出的高低来调整各层应抽取样本数量使得调查费用最低的一种分层抽样方法。32Ci 第i层每个样本单元调查费用的估计值4)多次分层抽样指对调查总 体进行初次分层后,再对某些层进行第二次甚至第三次分层,以便可以在每层内按照简单随机抽样方法抽取样本。33分层随机抽样的优点缺点优

11、点:提高估计精度,效率也更高;更高的代表性,避免产生“差的”样本;操作和管理简便;在不同层可以采用不同抽样框和抽样方法。缺点:抽样框单元辅助信息;费用高,复杂;如果调查变 量与分层变 量不相关,统计 效率可能比简单随机抽样更低;估计值计 算比简单 随机抽样和系统抽样稍复杂。344.整群抽样指首先将调查总 体区分为若干群,然后采用简单随机抽样方法抽出一部分群作为样本,最后对这些样本群进行全面调查调查。整群抽样与分层抽样的区别:l1)分层标 准是与调查 主题内容密切相关的总体属性或特征,整群抽样标 准则是调查总 体的外部标志(区域)l2)分层抽样层 内差异小,整群抽样群间差异小,都可以采取简单 随

12、机抽样l3)适用性不同35分群抽样与分层抽样的比较36aaaaaaaaaaabbbbbbc c c ccccccccc分层抽样的各层abcdabaacbcb abacac a c bbbcacbbacbac分群抽样的各群层内差异小层间 差异大群内差异大群间差异小层1层2层3群1群2群3整群抽样的优缺点优点:大大减低调查费 用;总体单位自然聚合时,按外观或地域标准创建群组比简单随机抽样或系统抽样更容易;群内单元差异大、群间差异小,效率更高。缺点:如群内调查单 元趋同(群内差异小),则效率较低;无法明确调查样 本数目;组织较为 复杂。方差估计可能较简单 随机抽样复杂。375.与个体成大小比例的概率

13、抽样(PPS)PPS(Probability Proportionate to Size Sampling)抽样是一种使用辅助信息从而使入样概率不相等(每个单位按其规模大小成比例的被抽中概率 )的抽样技术。PPS抽样可以如同大海捞针一样发现极少量的大额错报(不适合测试低估),原因在于它通过将少量的大额实物单元拆成数量众多、金额很小的货币单元,从而赋予大额项目更大的机会被选入样本。38PPS抽样的优点缺点优点:使用辅助信息提高统计 效率,减少抽样误 差。PPS抽样的样本规模不需考虑被审计项 目的预计变 异性(标准差),项目被选取的概率与其大小度量成比例,因而生成的样本自动分层。缺点:抽样单 元需

14、要辅助信息;创建抽样框比简单 随机抽样和系统抽样成本更高,更复杂;使用范围有限;若调查变 量与大小变量无关,则统计 效率很低;方差的估计更复杂;大小度量不准确或不稳定时,PPS抽样不再适用。3940注册会计师的审计PPS抽样例子6.其他概率抽样方法1)多阶段抽样两个或以上连续阶 段抽取样本的过程。第一阶段抽取的单位成为初级单 位,第二阶段抽取的单位称为次级抽样单 位,以此类推。例如:第一阶段:地理区域,第二阶段:小区内住所;例如:第一阶段:时间单 位,第二阶段:乘客;若更复杂杂则则第二阶阶段:达到的客机,第三级单级单 位:飞飞机上实际实际 座位。41多阶段抽样的优缺点优点:群变量同质时 ,多阶

15、段抽样比整群抽样效率高;样本分布比简单 随机抽样集中,所需时间 和费用低;不需要整个总体的抽样框。缺点:比简单 随机抽样效率低;不能提前知道多阶段抽样的样本量;调查组织 更复杂;估计值 和方差计算更复杂。422)多相抽样又叫多重抽样,先抽取一有很多单位的大样本,收集基本信息,然后在这个大样本中抽一个子样本,收集更详细的信息。第一相收集的数据能够够用于分层层及筛筛选选信息,同时时也可以用来提高估计计的效率。适用于抽样框缺乏辅助信息,而想对总体进行分层或筛选部分总体的情况。如:养牛场信息调查。适用于预算不足,或工作量太大,或调查内容中项目数据收集成本差异太大。如:健康调查。43非概率抽样方法指抽样

16、时 不遵循随机原则,而是调查 者根据调查 目的和要求,主观设 立某个标准从总体中抽选样 本的抽样方式。1.便利抽样2.判断抽样3.配额抽样4.滚雪球抽样441.便利抽样又叫任意抽样,依据方便的原则抽取样本,对抽样单位的选择主要是由调查人员主观决定的,通常被访者由于碰巧的时间出现在适当的地点而被选中。优点是成本低、耗时少,易于操作。缺点是样本代表性不好,难以进行总体推断,适用探索性调查。如在街头、公园、商店等公共场所,调查者根据自己判断拦住行人或顾客进行访问,也叫“街头拦截式调查”。452.判断抽样立意抽样或目的抽样,按照调研设计者的主观判断选取调查单 位组成样本的一种抽样方法。前提是调调研设设计计者必须须已对调查总对调查总 体的有关特征相当了解,或者可以依靠专专家判断来决定样样本。简便易行,但主观偏差可能较大,抽样误差无法准确计算。抽样的代表性完全取决于调查者本身的知识、经验和判断能力。第一种情况:选择“多数型”或“平均型”;第二种情况:选择异常个体。463.配额抽样指首先将总体单位按照一定的属性或者特征分为若干类,然后在每类中按照方便抽样或者判断抽样的方法选取样本单位。配额抽样是非随

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号