管理第四讲抽样设计课件

举报
资源描述
第四讲 抽样设计数字化时代的我们?买火柴的故事?普查抽样一个好的抽样调查胜过一次蹩脚的普查一个好的抽样调查胜过一次蹩脚的普查.候选人候选人 预测结果预测结果(%)选举结果选举结果(%)兰顿兰顿5738罗斯福罗斯福4362 在在1936年美国总统选举前,一份颇有名气的杂志年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿的工作人员做了一次民意测验,调查兰顿 和罗斯福中和罗斯福中谁将当选下一届总统。为了了解公众意向,调查者通谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查过电话簿和车辆登记簿上的名单给一大批人发了调查表(表(在在1936年电话和汽车只有少数富人拥有年电话和汽车只有少数富人拥有),通过),通过分析收回的调查表,显示兰顿非常受欢迎。于是此杂分析收回的调查表,显示兰顿非常受欢迎。于是此杂志预测兰顿将在选举中获胜。志预测兰顿将在选举中获胜。实际选举结果正好相反,最后罗斯福在选举中获实际选举结果正好相反,最后罗斯福在选举中获胜。其数据如下:胜。其数据如下:简简 单单 随随 机机 抽抽 样样思 考问题:为什么调查失败?问题:为什么调查失败?如何科学地如何科学地抽取样本?抽取样本?使得样本能比较准确地反映总体使得样本能比较准确地反映总体搅拌搅拌均匀均匀使得使得每个个体每个个体被抽取的被抽取的机会均等机会均等合理、公平合理、公平 简简 单单 随随 机机 抽抽 样样 在高考阅卷过程中,为了统计每一道试在高考阅卷过程中,为了统计每一道试题的得分情况,如平均得分、得分分布情况题的得分情况,如平均得分、得分分布情况等,如果将所有考生的每题的得分情况都统等,如果将所有考生的每题的得分情况都统计出来,再进行计算,结果是非常准确的,计出来,再进行计算,结果是非常准确的,但也是十分烦琐的,那么如何了解各题的得但也是十分烦琐的,那么如何了解各题的得分情况呢?分情况呢?通常,在考生有这么多的情况下,我们只从中抽通常,在考生有这么多的情况下,我们只从中抽取部分考生取部分考生(比如说比如说1000名名),统计他们的得分情况,统计他们的得分情况,用他们的得分情况去估计所有考生的得分情况。用他们的得分情况去估计所有考生的得分情况。联联系系生生活活样本样本 总体总体估计估计思思 考:样本一定能准确地反应总体吗?考:样本一定能准确地反应总体吗?抽抽 样样统计学统计学:统计的基本思想统计的基本思想:用样本估计总体用样本估计总体,即即当总体容量很大或检当总体容量很大或检测过程具有一定的破坏性时,测过程具有一定的破坏性时,通常不直接去研通常不直接去研究总体,而是通过从总体中抽取一个样本,根究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况据样本的情况去估计总体的相应情况。是研究如何搜集、整理、归纳和分析是研究如何搜集、整理、归纳和分析数据的数据的学科,它可以为人们制定决策提供学科,它可以为人们制定决策提供依据。依据。抽抽 样样一、基本概念和术语1.1.抽抽样样调调查查:从从研研究究对对象象的的总总体体中中选选择择一一部部分分代代表表加加以以调调查查研研究究,然然后后用用所所得得的的结结果果推推论论和和说说明明总总体体特特征征,这这种种由由总总体体中中选选取取一一部部分分代代表表的的过过程程就就是是抽抽样样,所所选选取取的这一部分代表就称为样本的这一部分代表就称为样本.选取样本的方法分为两大类选取样本的方法分为两大类:一一类类是是依依据据研研究究任任务务的的要要求求和和对对调调查查对对象象的的分分析析,主主观观地地,有有意意识识地地在在研研究究对对象象的的总总体体中中进进行行选选择择.叫叫非概率抽样,主要用于案例研究非概率抽样,主要用于案例研究.另另一一类类是是依依据据概概率率理理论论,按按照照随随机机原原则则选选择择样样本本,完完全全不不带带调调查查者者的的主主观观意意识识,称称为为概概率率抽抽样样,主主要要用用于于以调查为基础的研究以调查为基础的研究.抽样调查的特点抽样调查的特点与普查相比具有如下特点与普查相比具有如下特点:1.1.调查费用较低调查费用较低.2.2.速度快速度快 3.3.应用范围广应用范围广 4.4.可获得内容丰富的资料可获得内容丰富的资料 5.5.准确性高准确性高2.2.总体总体(population)(population)总总体体通通常常与与构构成成它它的的元元素素(element)(element)共共同同定定义义;总总体体是是构构成成它它的的所所有有元元素素的的集集合合,而而元元素素则则是是构构成成总总体体的的最最基基本本单单位位.总总体体中中所所包包含含元元素素的的数目通常用大写字母数目通常用大写字母 N N 表示表示.3.3.样本样本(Sample)(Sample)样本就是从总体中按一定方式抽取出的一样本就是从总体中按一定方式抽取出的一部分元素的集合部分元素的集合如从某省总数为如从某省总数为12.812.8万的大学生万的大学生总体中总体中,按一定方式抽取出按一定方式抽取出10001000名大学生进行调查名大学生进行调查,这这10001000名大学生就构成该总体的一个样本名大学生就构成该总体的一个样本.样本中样本中的元素数目通常用小写字母的元素数目通常用小写字母 n n 表示表示.4.4.抽样框抽样框(Sampling Frame)(Sampling Frame)抽样框也叫抽样范围,是指一次抽样时抽样框也叫抽样范围,是指一次抽样时总体中所有个案(元素)的完整清单总体中所有个案(元素)的完整清单.5.5.参数值参数值(Parameter)(Parameter)也称总体值也称总体值,它是关于总体中某一变量的它是关于总体中某一变量的综合描述综合描述,或者说是总体中所有元素的某种特征的或者说是总体中所有元素的某种特征的综合数量表现综合数量表现.在统计中最常见的参数值是总体某在统计中最常见的参数值是总体某一变量的平均数一变量的平均数,需要注意的是需要注意的是,参数值只有对总参数值只有对总体中的每一个元素都进行调查或测量才能得到体中的每一个元素都进行调查或测量才能得到.6.6.统计值统计值(Statistic(Statistic)统统计计值值也也称称为为样样本本值值,它它是是关关于于样样本本中中某某一一变变量量的的综综合合描描述述.或或者者说说是是样样本本中中所所有有元元素素的的某某种种特特征征的的综综合合数数量量表表现现.统统计计值值是是从从样样本本中中计计算算出出来来的的,它它是是相相应应的的参参数数值值的的估估计计量量,比比如如样样本本平平均均数数就就是总体平均数的估计量。是总体平均数的估计量。参参数数值值和和统统计计值值的的区区别别是是:参参数数值值是是固固定定不不变变的的,唯唯一一的的,通通常常是是未未知知的的,而而统统计计值值是是变变化化的的,即即,对对于于同同一一个个总总体体来来说说,不不同同样样本本的的统统计计值值是是有有差差别别的的,对对于于任任一一特特定定样样本本来来说说统统计计值值是是已已知知的的,可可计计算算的的,从从统统计计值值推推论论参参数数值值,正正是是社社会会调调查查的的一一项项重重要要内内容。容。7.7.置信度置信度(Confidence level)(Confidence level)与与 置信区间置信区间(Confidence (Confidence Interval)Interval)置置信信度度也也称称为为置置信信水水平平,它它是是指指总总体体参参数数值值落落在在样样本本统统计计值值某某一一区区间间内内的的概概率率,或或者者说说是是总总体体参参数数值值落落在在样样本本统统计计值值某一区间中的把握性程度某一区间中的把握性程度.它反映的是抽样的可靠性程度它反映的是抽样的可靠性程度.置置信信区区间间指指的的是是样样本本统统计计值值与与总总体体参参数数值值之之间间的的误误差差范围范围,置信区间反映的是抽样的精确性程度置信区间反映的是抽样的精确性程度,比比如如,从从某某一一机机关关一一万万名名干干部部中中抽抽取取200200人人为为样样本本,调调查查其其平平均均工工资资,若若样样本本的的平平均均工工资资为为100100元元,那那么么总总体体平平均均工工资资落落在在95-10595-105元元这这一一区区间间的的概概率率可可能能为为96%(96%(误误差差为为55元元),),落落在在90-11090-110元元这这一一区区间间的的概概率率可可能能为为99%(99%(误误差差为为1010元元)可可见见,置置信信区区间间越越大大,即即,误误差差范范围围越越大大,置置信信水水平平越越高高,抽抽样样的的精精确确性性程程度度就就越越低低,反反之之,置置信信区区间间越越小小,误误差差范范围围越越小小,抽样的精确性程度就越高抽样的精确性程度就越高.二、抽样的程序抽样的程序抽样的程序 在在总总体体中中抽抽取取一一个个样样本本时时,总总要要尽尽可可能能地地使使样样本本具具有有代代表表性性.如如果果样样本本的的统统计计值值近近似似总总体体的的参参数数值值,则则 这这 个个 样样 本本 可可 以以 称称 为为 一一 个个 代代 表表 性性 样样 本本.(representative.(representative sample).sample).问问题题是是怎怎样样做做才才可可以以减减少少抽抽样样的的误误差差,求求得得一一个个有有代代表表性性的的样样本本呢呢?这就要依据下面的四个步骤这就要依据下面的四个步骤:二、抽样的程序1 1 界定总体界定总体根根据据调调查查的的目目的的要要求求,确确定定调调查查对对象象的的范范围围,包包括括时间时间,地点和人物地点和人物,例例如如我我们们要要研研究究北北师师大大大大学学生生生生活活态态度度,可可以以界界定定总总体体的的范范围围如如下下,2011,2011年年北北京京师师范范大大学学大大一一至至大大四四的的在在校校本本科科大大学学生生.总总体体的的定定义义越越清清楚楚越越好好,由由样样本本所所得得的的研研究究结结果果,原原则则上上只只能能推推论论到到这这个个所所界界定定的总体范围的总体范围.二、抽样的程序2 2 确定抽样框确定抽样框在应用之前必须审核其完整性和准确性在应用之前必须审核其完整性和准确性,例例如如,有有无无遗遗漏漏,有有无无列列于于名名单单上上但但实实际际上上不不存存在在的的个个案案,有有没没有有重重复复或或不不属属于于研研究究范范围的等等围的等等.二、抽样的程序3 3 设计和选取样本设计和选取样本确确定定样样本本的的数数量量.决决定定样样本本的的大大小小时时,必必须须同同时时考考虑虑抽抽样样误误差差和和研研究究代代价价.如如,抽抽样样框框中中有有三三万万大大学学生生,不不可可能能全全部部调调查查,要要抽抽取取多多少少个个案案来来进进行行研研究究呢呢?在在正正常常的的情情况况下下,样样本本越越大大就就越越有有代代表表性性,但但是样本越大是样本越大,所需的研究代价就越大所需的研究代价就越大.选选择择抽抽样样的的具具体体方方法法 抽抽样样方方法法有有许许多多种种,不不同同的的方法产生的样本代表性是不同的方法产生的样本代表性是不同的.二、抽样的程序4 4 样本评估样本评估 在在样样本本抽抽出出后后,需需采采用用各各种种调调查查方方法法对对样样本本进进行行实实际际调调查查以以收收集集资资料料,最最后后对对收收集集到到的的资资料料进行计算并将结果推论和说明总体进行计算并将结果推论和说明总体.在在开开始始调调查查之之前前要要对对样样本本进进行行评评估估,评评估估的的目目的的是是初初步步检检查查样样本本的的代代表表性性,以以免免由由于于前前面面步骤中的失误使样本偏差太大步骤中的失误使样本偏差太大,评评估估样样本本:收收集集若若干干容容易易得得到到的的资资料料以以进进行总体和样本之间的比较行总体和样本之间的比较.如如果果样样本本与与总总体体的的情情况况相相似似,这这样样的的样样本本就就有有代代表表性性,如如
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关搜索

当前位置:首页 > 办公文档 > 教学/培训


电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号