《样本设计PPT课件教材讲义》由会员分享,可在线阅读,更多相关《样本设计PPT课件教材讲义(39页珍藏版)》请在金锄头文库上搜索。
1、 样本设计 SAMPLE DESIGN内容提要n1) 抽样的基本步骤 n2) 非概率样本设计 n3) 概率样本设计 n4) 样本量的的确定 n5) 回答率问题小案例 下表是某学院教师所生子女的性别分布情况,请问男、女教师子女的性别构成有何差异? - 子女性别 父母性别 - 男 女 合计 性别比 - 男 8 4 12 2.00 女 4 6 10 0.33 合计 12 10 22 1.20 -一、抽样的基本概念n抽样(sampling)是根据一定的规则和程序,从研究总体中抽取其中的一部分样本的过程。样本设计过程1、定义总体2、确定抽样框3、确定抽样方法与技术4、确定样本量5、实施抽样过程总体n总体
2、(population)是按照内容、范围和时间三重标准定义的全部个体的集合。 n目标总体(target population)是按照内容、范围和时间三重标准定义的全部个体的集合。 n抽样总体(sampling population)从中实际抽取样本的所有个体的集合。 n讨论:广州地铁顾客满意度研究的目标总体与抽样总体?抽样框架n抽样框架(sampling frame)是抽样总体的可操作性定义。在编制抽样框架时常见的问题如下: n遗漏遗漏部分样本单位; n聚堆缺乏个体样本单位信息; n重复同一样本单位重复出现; n混杂抽样框架中包括部分非样本总体成员。 n例:调查广州市所有的西饼店,用黄页的工商
3、业名单作抽样框过滤问题n为了确定某一个体是否属于抽样总体,常有必要使用过滤问题。 n除了某项研究的特殊要求以外,营销研究通常要求研究对象: n过去3个月内没有接受任何产品或广告调查; n本人及家庭成员不在有关的公司工作。 n例:(当代市场调研)表12-2,p240。样本n样本(a sample)是从总体中抽取的、加以研究和度量的部分个体的集合。 n样本单位(a sampling unit)为抽样总体中的基本成员单位。 n统计指标(statistics)是总体参数的样本估计值。 n例:当代商城顾客满意度研究二、非概率样本设计n非概率样本设计(nonprobability sample desig
4、n)事先并不确定每个样本单位被抽中的概率。这种样本设计往往无法排除研究人员偏好对抽样的影响,也无法估算样本估计值的抽样误差。 n讨论:网上消费者调查的样本设计非概率样本的应用n该方法通常用于下列情况: n样本量规模很小时; n探索性研究或研究的初始阶段; n目标总体成员很少或很难寻找; n无法采用概率样本时。 n例:百事可乐的免费品尝促销 非概率样本的种类n方便样本(convenience sample)选择容易接触的个体作为调查研究对象; n判断样本(judgmental sample)根据研究者的判断,选择有代表性或典型性的样本单位; n定额样本(quota sample)将总体分层并确定
5、每层应抽取的样本量,让调查员根据定额抽样; n滚雪球样本(snowball sample)先抽取少量的样本,然后通过滚雪球的方式扩大。方便抽样(任意抽样)n例n在入户调查中,调查员选择家中有人的住户;n没有认定被调查者身份的拦截式访问;n利用客户的名单进行调查;n将问卷登在宣传媒体上,被调查者自填后寄回。n特点n方便选样n样本的信息不适用于总体参数的推断。判断抽样n调研者(通常是该领域的专家)根据主观经验和判断,从总体中选择“平均”的或认为有代表性的同时又容易取得的个体作为样本。n当总体变差较大,而样本容量又不可能大时,判断抽样有可能比概率抽样提供更为准确的估计。n判断抽样的精度主要取决于抽样
6、者的经验,与样本量关系不大。n缺点是不能获得估计值的精度。定额抽样n第一阶段,给调查员指定不同类型的定额n例按性别、年龄、职业、收入等指标确定每类中的被调查者定额。n第二阶段,调查员按方便抽样或判断抽样选取样本单位。n优点:不用抽样框,以费用较低费用获得与总体特征分布相似的样本。n缺点:不能获得估计的精度。滚雪球抽样n先选择一些调查对象,访问这些调查者之后,再请他们提供另外一些属于所研究的目标总体的调查对象,对这些调查对象调查后,再由他们按相同的要求提供新的调查对象,将这种过程不断继续下去,直到完成规定的样本容量为止。n适用于对稀少群体的调查(如私人汽车拥有者)n优点:能有效地找到符合要求的被
7、调查者。例:某市的市民评议n某市政府为了让市民对各政府部门工作给予评估,决定在地方报纸上刊登调查表, 然后根据寄回的调查表对各部门进行排名。 n请问这种做法可能带来哪些问题?三、概率样本设计n概率样本设计(probability sample design)采取随机的办法,排除研究人员主观因素的干扰,使样本总体中的每一个成员都有一个事先确定好抽中概率。 n简单随机抽样 n系统抽样 n分层抽样 n整群抽样简单随机抽样n简单随机抽样(simple random sampling) 是最基本的概率抽样方法。该抽样方法保证每一抽样单位都有相同的非零抽中概率,并给出总体参数的自加权估计值。 n若总体为N
8、,样本量为n,则每一抽样单位的抽中概率: np = n/N系统抽样n系统抽样(systematic sampling)是随机抽取第一个样本单位,然后每隔k个单位抽取一个。 n系统抽样时每个样本单位抽中的概率相同,为1/k,通过系统抽样也可获得总体参数的自加权估计值。 n讨论:什么时候应避免采用系统抽样?分层抽样n分层抽样(stratified sampling)时将总体按某些重要特征分为数个层,各层之间既不能有重复也不能有遗漏,然后用简单随机抽样或系统抽样的办法从每层中抽取一定数量的样本。 n比例分层抽样 n非比例分层抽样 讨论n如果某校有1000名本科生,200名普通硕士生和300名MBA学
9、生,若要比较不同学生之间的平均可支配收入,应采用哪种抽样方法?其总的平均收入应如何计算?整群抽样n整群抽样(cluster sampling)是将总体分为不同的群组,然后随机抽取一定数量的群组作为样本。整群抽样可分为: n一级整群抽样在抽中群组中抽取所有个体; n二级整群抽样在抽中群组中抽取部分个体。 n多级抽样将总体分为多级群组,逐级抽样。样本设计的选择n影响样本设计的因素主要有: n研究所处的阶段和数据的用途; n总体内部的同质性; n时间、经费和人力; n数据收集的方法; n其它实际考虑。 四、确定样本量的经验方法n最简单的方法是根据研究的类型和经验,以及以下因素确定样本量: n决策的重
10、要性; n研究的性质; n单位成本; n发生率和完成率; n其它。可支配预算法n根据进行某项研究可支配的预算,在扣除其他支出后,按单位样本的成本决定样本量。 n例:进行某项研究的总预算是50,000元,研究设计、人员培训、问卷测试和数据分析等其它费用共需10,000元,完成每份调查问卷(含数据录入)的平均费用是50元,请问可以抽取多大的样本?确定样本量的统计学方法n对于概率样本可用统计公式计算所需样本。这时样本量与下列因素有关: n样本设计类型; n要求的精度; n总体内部的同质性; n分组的详细程度。估计均值时样本量的确定n对于简单随机抽样: n1. 确定允许误差D, d = $5.00 n
11、2. 确定置信水平CL, CL = 95% n3. 确定与置信水平相应的z值, z = 1.96 n4. 确定总体的标准差s, s = 55 n5. 计算所需样本量n, n = s2z2/d2 = 465 n6. 当样本量超过总体的5%时, nc = nN/(N+n-1)估计比例时样本量的确定n对于简单随机抽样: n1. 确定允许误差D, d = .05 n2. 确定置信水平CL, CL = 95% n3. 确定与置信水平相应的z值, z = 1.96 n4. 估计总体的发生率P, P = 0.64? n5. 计算所需样本量n, n = P(1-P) z2/d2 = 355 n6. 当样本量超
12、过总体的5%时, nc = nN/(N+n-1)五、不回答问题n由于拒答、度量误差、数据处理误差等因素,常常产生非抽样误差。在研究中除了抽样误差以外,还应注意尽量减少非抽样误差。课堂讨论n1. 如果联想电脑公司委托你开展一项笔记本电脑顾客满意度调查,请确定: na. 目标总体和抽样总体? nb. 抽样单位和抽样框架? nd. 抽样方法及注意事项? n2. 假如估计满意的顾客比率可能为70%,回答率大约为70%,要求有95%的把握保证满意率的误差不超过5个百分点, 请计算需要抽取的样本量。 小结n抽样的基本步骤 n总体?抽样框架?抽样方法?样本量?抽样 n非概率样本设计 n偶遇样本;主观样本;定
13、额样本;滚雪球样本 n概率样本设计 n简单随机;系统;分层;整群 n样本量的的确定 n经验法;统计法 n回答率问题 n趋势分析Sampling (review)nTwo major concernsn1. CostnSample sizenMethod of data collection (phone, mail, personalninterview)n2. Information accuracynSample representativenessnRespondent errornAdministrative errornBasic questionsnWhat kind of sam
14、ple?nHow large should it be?Sampling ProblemnChina Light considered offering customer consulting service in which the company would help to make homes more energy efficient. To decide how much customers would like this service, they mailed questionnaires to all of their 500,000 home customers togeth
15、er with February bill. About 25,000 households responded. The returned responses indicated a very high level of interest in the service. So China Light hired many service workers for heavy demand. However, actual demand turned out to be low. What happened?参考文献n1. 麦克丹尼尔、盖兹著,范秀成等译:当代市场调, 原书第4版, 第12-13章,2000,机械工业出版社。 n2. Malhotra, N. K. 1996. Marketing Research: An Applied Orientation, Chapters 1112, pp.358-414. Upper Saddle River, NJ: Prentice Hall International, Inc. n3. Kish, L. 1965. Survey Sampling. New York: John Wiley & Sons. n4. 袁方、王汉生,1997:社会研究方法教程第七章,北京大学出版社。