抽样设计培训

上传人:夏** 文档编号:569523676 上传时间:2024-07-30 格式:PPT 页数:43 大小:301.50KB
返回 下载 相关 举报
抽样设计培训_第1页
第1页 / 共43页
抽样设计培训_第2页
第2页 / 共43页
抽样设计培训_第3页
第3页 / 共43页
抽样设计培训_第4页
第4页 / 共43页
抽样设计培训_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《抽样设计培训》由会员分享,可在线阅读,更多相关《抽样设计培训(43页珍藏版)》请在金锄头文库上搜索。

1、 第第11章章 抽样设计抽样设计 SAMPLING DESIGN内容提要内容提要1) 抽样的基本步骤抽样的基本步骤 2) 非概率样本设计非概率样本设计 3) 概率样本设计概率样本设计 4) 样本量的的确定样本量的的确定 5) 回答率问题回答率问题一、抽样的基本概念一、抽样的基本概念抽样抽样(sampling)是根据一定的规则和程是根据一定的规则和程序,从研究总体中抽取其中的一部分样序,从研究总体中抽取其中的一部分样本的过程。本的过程。样本设计过程样本设计过程1、定义总体、定义总体2、确定抽样框、确定抽样框3、确定抽样方法与技术、确定抽样方法与技术4、确定样本量、确定样本量5、实施抽样过程、实施

2、抽样过程总体与总体单位总体与总体单位目标总体目标总体(target population)或总体或总体按照内容、范围按照内容、范围(extent)和时间三重标准定义的全部个和时间三重标准定义的全部个体的集合。体的集合。 总体单位总体单位(element)构成目标总体的每一个单元。构成目标总体的每一个单元。抽样单位抽样单位进行抽样调查的单位,与总体单位可能相同或不同。进行抽样调查的单位,与总体单位可能相同或不同。例例1:百货商场顾客惠顾调查的总体、总体单位与:百货商场顾客惠顾调查的总体、总体单位与调查单位(调查单位(P237)例例2:古龙香水的目标总体是什么?:古龙香水的目标总体是什么?抽样框架

3、抽样框架抽样框架抽样框架(sampling frame)是目标总体的可是目标总体的可操作的定义。总体单位的名单或名录。操作的定义。总体单位的名单或名录。抽样框误差抽样框误差:由抽样框与目标总体的差异造成由抽样框与目标总体的差异造成 遗漏遗漏部分样本单位;遗漏遗漏部分样本单位; 聚堆缺乏个体样本单位信息;聚堆缺乏个体样本单位信息; 重复同一样本单位重复出现;重复同一样本单位重复出现; 混杂抽样框架中包括部分非样本总体成员。混杂抽样框架中包括部分非样本总体成员。 例:调查广州市所有的西饼店,用黄页的工商例:调查广州市所有的西饼店,用黄页的工商业名单作抽样框业名单作抽样框过滤问题过滤问题为了确定某一

4、个体是否属于抽样总体,为了确定某一个体是否属于抽样总体,常有必要使用过滤问题。常有必要使用过滤问题。 除了某项研究的特殊要求以外,营销研除了某项研究的特殊要求以外,营销研究通常要求研究对象:究通常要求研究对象: 过去过去3个月内没有接受任何产品或广告调查;个月内没有接受任何产品或广告调查; 本人及家庭成员不在有关的公司工作。本人及家庭成员不在有关的公司工作。 样本样本样本样本(a sample)是从总体中抽取的、加是从总体中抽取的、加以研究和度量的部分个体的集合。以研究和度量的部分个体的集合。 样本单位样本单位(a sampling unit)为抽样总体为抽样总体中的基本成员单位。中的基本成员

5、单位。 统计指标统计指标(statistics)是总体参数的样本是总体参数的样本估计值。估计值。 例:当代商城顾客满意度研究例:当代商城顾客满意度研究SamplingTechniquesClassificationofSamplingTechniquesFig.11.2Fig.11.2NonprobabilitySamplingTechniquesConvenienceSamplingProbabilitySamplingTechniquesJudgmentalSamplingQuotaSamplingSnowballSamplingSystematicSamplingStratifiedSa

6、mplingClusterSamplingOthersamplingTechniquesSimplerandomSampling二、非概率样本设计二、非概率样本设计非概率样本设计非概率样本设计(nonprobability sample design)事先并不确定每个样本事先并不确定每个样本单位被抽中的概率。这种样本设计往往单位被抽中的概率。这种样本设计往往无法排除研究人员偏好对抽样的影响,无法排除研究人员偏好对抽样的影响,也无法估算样本估计值的抽样误差。也无法估算样本估计值的抽样误差。 讨论:网上消费者调查的样本设计讨论:网上消费者调查的样本设计非概率样本的应用非概率样本的应用该方法通常用于

7、下列情况:该方法通常用于下列情况: 样本量规模很小时;样本量规模很小时; 探索性研究或研究的初始阶段;探索性研究或研究的初始阶段; 目标总体成员很少或很难寻找;目标总体成员很少或很难寻找; 无法采用概率样本时。无法采用概率样本时。 例:百事可乐的免费品尝促销例:百事可乐的免费品尝促销 非概率样本的种类非概率样本的种类方便样本方便样本(convenience sample)选择容易选择容易接触的个体作为调查研究对象;接触的个体作为调查研究对象; 判断样本判断样本(judgmental sample)根据研究根据研究者的判断,选择者的判断,选择有代表性有代表性或或典型性典型性的样本的样本单位;单位

8、; 定额样本定额样本(quota sample)将总体分层并确将总体分层并确定每层应抽取的样本量,让调查员根据定额抽定每层应抽取的样本量,让调查员根据定额抽样;样; 滚雪球样本滚雪球样本(snowball sample)先抽取少量先抽取少量的样本,然后通过滚雪球的方式扩大。的样本,然后通过滚雪球的方式扩大。方便抽样(任意抽样)方便抽样(任意抽样)例例在入户调查中,调查员选择家中有人的住户;在入户调查中,调查员选择家中有人的住户;没有认定被调查者身份的拦截式访问;没有认定被调查者身份的拦截式访问;利用客户的名单进行调查;利用客户的名单进行调查;将问卷登在宣传媒体上,被调查者自填后寄回。将问卷登在

9、宣传媒体上,被调查者自填后寄回。特点特点方便选样方便选样样本的信息不适用于总体参数的推断。样本的信息不适用于总体参数的推断。判断抽样判断抽样调研者(通常是该领域的专家)根据主观经验调研者(通常是该领域的专家)根据主观经验和判断,从总体中选择和判断,从总体中选择“平均平均”的或认为有代的或认为有代表性的同时又容易取得的个体作为样本。表性的同时又容易取得的个体作为样本。当总体变差较大,而样本容量又不可能大时,当总体变差较大,而样本容量又不可能大时,判断抽样有可能比概率抽样提供更为准确的估判断抽样有可能比概率抽样提供更为准确的估计。计。判断抽样的精度主要取决于抽样者的经验,与判断抽样的精度主要取决于

10、抽样者的经验,与样本量关系不大。样本量关系不大。缺点是不能获得估计值的精度。缺点是不能获得估计值的精度。定额抽样定额抽样第一阶段,给调查员指定不同类型的定额第一阶段,给调查员指定不同类型的定额例按性别、年龄、职业、收入等指标确定每类中的例按性别、年龄、职业、收入等指标确定每类中的被调查者定额。被调查者定额。第二阶段,调查员按方便抽样或判断抽样选取第二阶段,调查员按方便抽样或判断抽样选取样本单位。样本单位。优点:不用抽样框,以费用较低费用获得与总优点:不用抽样框,以费用较低费用获得与总体特征分布相似的样本。体特征分布相似的样本。缺点:不能获得估计的精度。缺点:不能获得估计的精度。滚雪球抽样滚雪球

11、抽样先选择一些调查对象,访问这些调查者之后,先选择一些调查对象,访问这些调查者之后,再请他们提供另外一些属于所研究的目标总体再请他们提供另外一些属于所研究的目标总体的调查对象,对这些调查对象调查后,再由他的调查对象,对这些调查对象调查后,再由他们按相同的要求提供新的调查对象,将这种过们按相同的要求提供新的调查对象,将这种过程不断继续下去,直到完成规定的样本容量为程不断继续下去,直到完成规定的样本容量为止。止。适用于对稀少群体的调查(如私人汽车拥有者)适用于对稀少群体的调查(如私人汽车拥有者)优点:能有效地找到符合要求的被调查者。优点:能有效地找到符合要求的被调查者。例:某市的市民评议例:某市的

12、市民评议某市政府为了让市民对各政府部门工作某市政府为了让市民对各政府部门工作给予评估,决定在地方报纸上刊登调查给予评估,决定在地方报纸上刊登调查表表, 然后根据寄回的调查表对各部门的工然后根据寄回的调查表对各部门的工作进行排名。作进行排名。 请问这种做法可能带来哪些问题?请问这种做法可能带来哪些问题?三、概率样本设计三、概率样本设计概率样本设计概率样本设计(probability sample design)采取随机的办法,排除研究人员采取随机的办法,排除研究人员主观因素的干扰,使样本总体中的每一主观因素的干扰,使样本总体中的每一个成员都有一个事先确定好抽中概率。个成员都有一个事先确定好抽中概

13、率。 简单随机抽样简单随机抽样 系统抽样系统抽样 分层抽样分层抽样 整群抽样整群抽样简单随机抽样简单随机抽样简单随机抽样简单随机抽样(simple random sampling) 是最基本的概率抽样方法。是最基本的概率抽样方法。该抽样方法保证每一抽样单位都有相同该抽样方法保证每一抽样单位都有相同的非零抽中概率,并给出总体参数的自的非零抽中概率,并给出总体参数的自加权估计值。加权估计值。 若总体为若总体为N,样本量为,样本量为n,则每一抽样单,则每一抽样单位的抽中概率:位的抽中概率: p = n/N系统抽样系统抽样系统抽样系统抽样(systematic sampling)是随是随机抽取第一个样

14、本单位,然后每隔机抽取第一个样本单位,然后每隔k个单个单位抽取一个。位抽取一个。 系统抽样时每个样本单位抽中的概率相系统抽样时每个样本单位抽中的概率相同,为同,为1/k,通过系统抽样也可获得总体,通过系统抽样也可获得总体参数的自加权估计值。参数的自加权估计值。 讨论:什么时候应避免采用系统抽样?讨论:什么时候应避免采用系统抽样?分层抽样分层抽样分层抽样分层抽样(stratified sampling)时将总体时将总体按某些重要特征分为数个层,各层之间既按某些重要特征分为数个层,各层之间既不能有重复也不能有遗漏,然后用简单随不能有重复也不能有遗漏,然后用简单随机抽样或系统抽样的办法从每层中抽取一

15、机抽样或系统抽样的办法从每层中抽取一定数量的样本。定数量的样本。 比例分层抽样比例分层抽样 非比例分层抽样非比例分层抽样 讨论讨论如果某校有如果某校有1000名本科生,名本科生,200名普通名普通硕士生和硕士生和300名名MBA学生,若要比较不学生,若要比较不同学生之间的平均可支配收入,应采用同学生之间的平均可支配收入,应采用哪种抽样方法?其总的平均收入应如何哪种抽样方法?其总的平均收入应如何计算计算?整群抽样整群抽样整群抽样整群抽样(cluster sampling)是将总体分为是将总体分为不同的群组,然后随机抽取一定数量的群组不同的群组,然后随机抽取一定数量的群组作为样本。整群抽样可分为:

16、作为样本。整群抽样可分为: 一级整群抽样在抽中群组中抽取所有个体;一级整群抽样在抽中群组中抽取所有个体; 二级整群抽样在抽中群组中抽取部分个体。二级整群抽样在抽中群组中抽取部分个体。 多级抽样将总体分为多级群组,逐级抽样。多级抽样将总体分为多级群组,逐级抽样。样本设计的选择样本设计的选择影响样本设计的因素主要有:影响样本设计的因素主要有: 研究所处的阶段和数据的用途;研究所处的阶段和数据的用途; 总体内部的同质性;总体内部的同质性; 时间、经费和人力;时间、经费和人力; 数据收集的方法;数据收集的方法; 其它实际考虑。其它实际考虑。 四、确定样本量的经验方法四、确定样本量的经验方法最简单的方法

17、是根据研究的类型和经验,最简单的方法是根据研究的类型和经验,以及以下因素确定样本量:以及以下因素确定样本量: 决策的重要性;决策的重要性; 研究的性质;研究的性质; 单位成本;单位成本; 发生率和完成率;发生率和完成率; 其它。其它。可支配预算法可支配预算法根据进行某项研究可支配的预算,在扣除其他根据进行某项研究可支配的预算,在扣除其他支出后,按单位样本的成本决定样本量。支出后,按单位样本的成本决定样本量。 例:进行某项研究的总预算是例:进行某项研究的总预算是50,000元,研元,研究设计、人员培训、问卷测试和数据分析等其究设计、人员培训、问卷测试和数据分析等其它费用共需它费用共需10,000

18、元,完成每份调查问卷元,完成每份调查问卷(含数据录入)的平均费用是(含数据录入)的平均费用是50元,请问可以元,请问可以抽取多大的样本?抽取多大的样本?SampleSizesUsedinMarketingResearchStudiesTable11.2Table11.2确定样本量的统计学方法确定样本量的统计学方法对于概率样本可用统计公式计算所需样对于概率样本可用统计公式计算所需样本。这时样本量与下列因素有关:本。这时样本量与下列因素有关: 样本设计类型;样本设计类型; 要求的精度;要求的精度; 总体内部的同质性;总体内部的同质性; 分组的详细程度。分组的详细程度。估计均值时样本量的确定估计均值

19、时样本量的确定对于简单随机抽样:对于简单随机抽样: 1. 确定允许误差确定允许误差D, d = $5.00 2. 确定置信水平确定置信水平CL, CL = 95% 3. 确定与置信水平相应的确定与置信水平相应的z值,值, z = 1.96 4. 确定总体的标准差确定总体的标准差s, s = 55 5. 计算所需样本量计算所需样本量n, n = s2z2/d2 = 465 6. 当样本量超过总体的当样本量超过总体的5%时,时, nc = nN/(N+n-1)估计比例时样本量的确定估计比例时样本量的确定对于简单随机抽样:1.确定允许误差D,d=.052.确定置信水平CL,CL=95%3.确定与置信

20、水平相应的z值,z=1.964.估计总体的发生率P,P=0.64?5.计算所需样本量n,n=P(1-P)z2/d2=3556.当样本量超过总体的5%时,nc=nN/(N+n-1)估计比例时的样本量与抽样误差样本量抽样误差2206%4005%6004%11003%23002%88001%市场研究多数预测比例,很少预测均值。五、不回答问题五、不回答问题非抽样误差非抽样误差由于拒答、度量误差、数据处理误差等因素,常常由于拒答、度量误差、数据处理误差等因素,常常产生非抽样误差。在研究中除了抽样误差以外,还产生非抽样误差。在研究中除了抽样误差以外,还应注意尽量减少非抽样误差。应注意尽量减少非抽样误差。P

21、104不回答误差不回答误差由于回答者与不回答者在人口特征、心理、个性、由于回答者与不回答者在人口特征、心理、个性、动机、态度与行为方面的差异而产生的误差。动机、态度与行为方面的差异而产生的误差。不回答误差的检验不回答误差的检验对不回答误差对不回答误差增加回答率增加回答率对调查结果进行修正对调查结果进行修正MethodsofImprovingResponseRatesImprovingResponseRatesFig.12.2Fig.12.2ReducingRefusalsReducingNot-at-HomesPriorNotificationMotivatingRespondentsInce

22、ntives QuestionnaireDesignandAdministrationFollow-Up OtherFacilitatorsCallbacksUseofTrendAnalysisinAdjustingforNon-responseTable12.4Table12.4课堂讨论课堂讨论1. 如果联想电脑公司委托你开展一项笔记本电如果联想电脑公司委托你开展一项笔记本电脑顾客满意度调查,请确定:脑顾客满意度调查,请确定: a. 目标总体和总体单位?目标总体和总体单位? b. 抽样单位和抽样框架?抽样单位和抽样框架? d. 抽样方法及注意事项?抽样方法及注意事项? 2. 假如估计满意的顾

23、客比率可能为假如估计满意的顾客比率可能为70%,回,回答率大约为答率大约为70%,要求有,要求有95%的把握保证满的把握保证满意率的误差不超过意率的误差不超过5个百分点,个百分点, 请计算需要抽请计算需要抽取的样本量。取的样本量。 小结小结抽样的基本步骤抽样的基本步骤 总体总体?抽样框架抽样框架?抽样方法抽样方法?样本量样本量?抽样抽样 非概率样本设计非概率样本设计 偶遇样本;主观样本;定额样本;滚雪球样本偶遇样本;主观样本;定额样本;滚雪球样本 概率样本设计概率样本设计 简单随机;系统;分层;整群简单随机;系统;分层;整群 样本量的的确定样本量的的确定 经验法;统计法经验法;统计法 回答率问

24、题回答率问题 趋势分析趋势分析Sampling (review)Two major concerns1. CostSample sizeMethod of data collection (phone, mail, personal interview)2. Information accuracySample representativenessRespondent errorAdministrative errorBasic questionsWhat kind of sample?How large should it be?Which is more important?Samplin

25、g ProblemChina Light considered offering customer consulting service in which the company would help to make homes more energy efficient. To decide how much customers would like this service, they mailed questionnaires to all of their 500,000 home customers together with February bill. About 25,000

26、households responded. The returned responses indicated a very high level of interest in the service. So China Light hired many service workers for heavy demand. However, actual demand turned out to be low. What happened?兔年春晚好还是不好?从这份数据看,形势一片大好,但如果再看一份微博的满意度调查结果,恐怕很难让人乐观。兔年春晚期间的5个小时内,新浪微博网友共发出了823万条春

27、晚相关的微博。在1万多人参与的新浪微博小秘书发起的调查中,对兔年春晚表示“满意”的只有6%,认为“一般”的有25%,还有59%的人表示“失望”,10%的人“没看”。兔年春晚好还是不好?对于这两份迥然的满意度调查,马东说,网友不是春晚的收视主体,而网友则反驳“超过四亿的网友还不能代表中国人?”,官方与民间的收视率数据,哪一份更能代表观众对于春晚的真实感受,很难做出评判。兔年春晚好还是不好?对于这两份迥然的满意度调查,马东说,网友不是春晚的收视主体,而网友则反驳“超过四亿的网友还不能代表中国人?”,官方与民间的收视率数据,哪一份更能代表观众对于春晚的真实感受,很难做出评判。摘自“春晚钉子户”拔还是

28、不拔?”2011-02-1309:23南方日报中国的学术界到底有多腐败?中国的学术界到底有多腐败? “在在2003年底到互联网上用年底到互联网上用GOOGLE检索检索 “学术腐败学术腐败” 四个字,总共有四个字,总共有17200个中文网个中文网页含有这个词条,其中页含有这个词条,其中87%是简体中文网页,是简体中文网页,说明它们绝大多数与中国大陆有关。这些数字说明它们绝大多数与中国大陆有关。这些数字当然不能说明中国的学术腐败比政治腐败和经当然不能说明中国的学术腐败比政治腐败和经济腐败更严重,危害更大,但至少能够说明它济腐败更严重,危害更大,但至少能够说明它的普遍程度,它的影响。的普遍程度,它的影响。”网友评论网友评论阁下用中文搜索阁下用中文搜索“学术腐败学术腐败”,用中文,用中文的人绝大多数在中国大陆,有文章当的人绝大多数在中国大陆,有文章当然是用简体中文发表了,其中当然大多然是用简体中文发表了,其中当然大多数是简体中文了。这个论据也太过搞笑数是简体中文了。这个论据也太过搞笑吧。吧。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > 金融/商业/投资

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号