社会调查抽样

上传人:飞*** 文档编号:51723201 上传时间:2018-08-16 格式:PPT 页数:51 大小:287.50KB
返回 下载 相关 举报
社会调查抽样_第1页
第1页 / 共51页
社会调查抽样_第2页
第2页 / 共51页
社会调查抽样_第3页
第3页 / 共51页
社会调查抽样_第4页
第4页 / 共51页
社会调查抽样_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《社会调查抽样》由会员分享,可在线阅读,更多相关《社会调查抽样(51页珍藏版)》请在金锄头文库上搜索。

1、社会调查理论与方法第五章 抽样(2学时)【目的与要求】了解概率抽样与非概率抽样方法的类型,掌握每种方法的具体操作程序、使用范围及优点、缺点。【重点与难点】重点掌握概率抽样的几种方法,能够根据研究总体的特点选择抽样规模。【教学方法】课堂讲授与具体操作相结合。本章内容:一、抽样的历史二、抽样的概念三、抽样的作用四、抽样的一般程序五、抽样的方法六、样本的规模和误差一、抽样的历史文学文摘是一本1890-1938年间在美国发行颇为流 行的新闻杂志。 1920、1924、1928、1932,文摘连续四次通过邮 寄明信片的方式正确预测了美国总统的大选结果。 1936年,文学文摘进行了一次最具雄心的民意测验活

2、 动:选票被寄给了从电话薄与车牌登记名单中挑选出 来的1000万人。最后收到了200万人以上的回应;结 果显示有57%的人支持共和党候选人兰登,而当时的 在任总统罗斯福的支持率为43%。两个星期以后的投票结果显示:罗斯福以历史上最 大的优势,61%的得票率,获得第二届任期。相较 于罗斯福的523张选举人票,兰登仅得到8张。为什么?原因之一:该次民意测验的回收率只有22%;原因之二:抽样框存在问题。即以电话用户和汽车 用户作为其抽样框。而在1936年,这种设计只选择 了不成比例的富人样本,尤其是当时美国还处在最 严重的经济萧条后期。这个样本排出了穷人,而几 乎所有的穷人都支持罗斯福新经济政策。就

3、是说, 文摘的调查绝对没有反映全民的投票意愿。 1936年的总统大选,同时造就了另一位几乎与民意这个词同义的年轻的调查者。与文摘正相反,盖洛普准确地预测了罗斯福将会击败兰登。1936年盖洛普的成功,应归因于他采用了配额抽样。配额抽样:非概率抽样的方法。即根据预先了解的总体特征来选择样本方法。这可以保证样本的特征分布和所要研究的总体一样。1948年的预测失败原因有二:其一:民意测验停止后,杜鲁门的支持率还在上升 ;其二,民意测验的所依据的资料时1940年的人口普 查资料,然而,二战促成了大量农村人口涌入城市 ,改变了1940年的人口特征。因为城市市民更支持 民主党。注意:配额抽样技术要求研究者必

4、须对总体情况比 较了解。配额抽样是以对抽样总体特征的把握为基础:比如 男性占了多少比例,女性占了多少比例;以及不同 的收入、年龄等等的人有各占多少比例。根据总体 的这些特征来选择各类人:比如说选择多少富人、 多少黑人、多少都市女性,诸如此类。盖洛普和美国民意测验中心利用配额抽样的方法在 1936、1940与1944年,成功地预测了当年的总统当 选人。但在1948年,盖洛普错误地预测了杜威能击 败杜鲁门而当选总统。二、抽样的概念抽样调查:就是运用一定方法在调查对象总体中抽取一部分对象作为样本,并以对样本调查的结 论来推断总体的方法。总体样本抽样单位抽样框抽样总体:指研究元素的集合。样本:就是总体

5、的一个子集。样本不是总体,但它应代表总体。抽样单位:指收集信息的基本单位,常用的抽样单位有:个人、群体、组织、社区等。抽样框:指所有抽样单位的名单。如花名册、电话号码簿、户口登记册等。抽样:就是从研究总体中选取一部分代表性样本的方法。参数值:也称总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。统计中常见的总体值是某一变量的平均值。统计值:也称样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。三、抽样的作用可以提供一种实现“由部分认识总体”这一目标的途径和手段。可以节省调查人力、物力、时间及经费。可以十分迅速地获得

6、资料数据。可以比较详细地收集信息,获得内容丰富的资料。应用范围十分广泛。准确性高。 实例:w 1984年,里根以59%比41%的优势当选为美国总统。选举前一些民意测验机构就已根据抽样的结果预言了里根的胜利。w 尽管各种民意测验的结果互不相同,但却正确地预言了里根将在大选中获胜。w 请问:在将近1亿的美国选民中,他们究竟调查了多少人就得到这种结果呢?1984年美国总统选举预测与实际结果比较(%)里根蒙代尔 时时代/扬扬基拉维齐维齐 6436 今日美国/黑蛇发发女怪6337 哥伦伦比亚亚广播公司/纽约时纽约时 代周刊 6139盖洛普民意测验测验 /新闻闻周刊5941 实际实际 投票结结果5941

7、盖洛普民意测验测验 /新闻闻周刊5941 美国广播公司/华华盛顿邮报顿邮报 5743 哈里斯民意测验测验5644 罗罗珀民意测验测验5545四、抽样的一般程序界定调查总体选择抽样方法编制抽样框抽取调查样本评估样本质量五、抽样的方法简单随机抽样系统抽样概率抽样 分层抽样整群抽样 抽样方法 多段抽样偶遇抽样非概率抽样 判断抽样定额抽样雪球抽样(一)概率抽样方法按照概率原理进行的,要求样本抽取具有随 机性。就是总体中的每一个成员都具有同等的 被抽中的可能性。常用的方法有:1、简单随机抽样2、系统抽样3、分层抽样4、整群抽样5、多段抽样1、简单随机抽样(1)概念:设一个总体的个体数为N如果通过 逐个抽

8、取的方法从中抽取一个样本,且每次抽取时 各个个体被抽到的概率相等,就称这样的抽样为简 单随机抽样(2)特点:要求被抽取样本的总体的个体数有限;是从总体中逐个进行抽取;是一种不放回抽样;是一种等概率抽样。(3)简单随机抽样优点:在抽样过程中完全排除了主观因素的干扰,简单,易行,只要有总体各单位名单就行。(4)简单随机抽样缺点:只适应总体单位数量不大的调查,如果总体单位多,则编制抽样框的工作量太大;抽样误差大;样本可能比较分散或过分集中,会给调查带来困难。(5)简单随机抽样的方法:A、抽签方法或抓阄方法将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可

9、以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。B、随机数表法先取得一分总体所有元素的名单(即抽样框);将总体中所有元素按顺序编号;根据总体规模的位数来确定从随机数表中选几位 数码;以总体的规模为标准,对随机数表中的数码逐一 进行衡量并决定取舍;根据样本规模的要求,选出足够的数码个数;依据从随机数表中选出的数码,到抽样框中去找 出它所对应的元素。例如:从40件产品中抽取10件进行检查,利用随机数表抽样,步骤如下 :第一,先将40件产品编号,可以编为00,01,0

10、238,39。第二,在随机数表中任选一个数作为开始,下面是随机数表的一部分:16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 0

11、7 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28 18 18 07 92 45 44 17 16 58 09 79 83 86 19 62第三,随机选取数码59,由于5939,将它去掉;继续向右读,得到16 ,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位 数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到 34。至此,10个样本号码已经取满,于是,所要抽取的样本号码是

12、:16 19 10 12 07 39 38 33 21 342、系统抽样系统抽样:又称机械随机抽样或等距离抽样,就是先编制抽样框,将各抽样单位按一定标志排列编号;然后,用总体单位数除以样本单位数求得抽样间隔,并在第一抽样间隔内随机抽取一个号码作为第一个样本;最后,按抽样间隔等距抽样,直到抽取最后一个样本为止。优点:样本在总体中分布比较均匀,具有较高代表性,抽样误差小于简单随机抽样,而且比较简单易行,只要抽取了第一个样本,整个样本就都确定了。缺点:调查总体单位不能太多,而且要有完整的登记册,否则就难以进行。使用这种方法要注意避免抽样间隔与调查对象的周期性节奏相重合。注意:系统抽样每次抽样时,总体

13、中各个个体被抽取的概率也是相等的。第一种:整数抽样。当N是n的整数倍,即抽样间距是整数,可使用直线等距抽样。第二种: 非整数抽样。当N不是n的整数倍,即抽样间距不是整数时,可采用循环等距抽样方法。 二者的区别在于总体规模N是否为样本规模n的整倍数。 步骤:采取随机方式将总体中的个体编号;将整个的编号均衡地分段,确定分段间隔k;第一段用简单随机抽样确定起始号码l;按照规则抽取样本:l;lk;l2k;lnk。3、分层抽样(类型抽样)类型随机抽样:又称分层随机抽样,就是先将总体各单位按一定标准分成若干类型(或层次);然后,根据各类型(或层次)所包含的抽样单位数与总体单位数的比例,确定从各类型中抽取样

14、本单位的数量;最后,按照简单随机抽样或等距随机抽样方法从各类型(或层次)中抽取样本。优点:它适用于总体单位数量较多、单位之间差异较大的调查对象,而且抽样误差较小或所需样本数量较少。与简单随机抽样和等距随机抽样相比较,在样本数量相同时,它的抽样误差较小;在抽样误差要求相同时,它所需的样本数量较少。缺点:必须对总体各单位的情况有较多的了解,否则就无法科学分类,而这一点在实际调查之前又往往难以做到。分层抽样适用于总体由差异明显的几部分组成的情况。方法:(1)先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。(2)先以分层变量将总体划分为若干层,再将各 层中的元素按分层的顺序整齐排

15、列,最后用系统抽样的方法抽取样本。分层抽样是把异质性较强的总体分成一个个同质 性较强的子总体,再抽取不同的子总体中的样本分 别代表该子总体,所有的样本进而代表总体。分层标准:以调查所要分析和研究的主要变量或相关的变量作为分层的标准。以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。以那些有明显分层区分的变量作为分层变量。分层的比例问题:按比例分层抽样:根据各种类型或层次中的单 位数目占总体单位数目的比重来抽取子样本的方法 。不按比例分层抽样:有的层次在总体中的比重 太小,其样本量就会非常少,此时采用该方法,主 要是便于对不同层次的子总体进行专门研究或进行 相互比较。

16、如果要用样本资料推断总体时,则需要 先对各层的数据资料进行加权处理,调整样本中各 层的比例,使数据恢复到总体中各层实际的比例结 构。三种抽样方法比较:4、整群随机抽样整群随机抽样:又称聚类随机抽样或集体随 机抽样,就是先将总体各单位按一定标准分成许 多群体,并将每一个群体看做一个抽样单位; 然后,按照随机原则从这些群体中抽出若干群体 作为样本;最后,对样本群体中的每一个单位 逐个进行调查。优点:样本单位比较集中,调查工作比较方便,可节省人财物力和时间。缺点:样本分布不均匀、代表性较差,与上述几种抽样方法相比较,在样本数量相同的情况下抽样误差较大。整群抽样的单位不是单个的个体,而是成群的个体。例如,假如某大学共有100个班,每班有30名学生,总共3000名学生。要抽

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号