医学抽样讲座概念操作样本量误差加权公安lihui

上传人:cn****1 文档编号:569345224 上传时间:2024-07-28 格式:PPT 页数:34 大小:1.41MB
返回 下载 相关 举报
医学抽样讲座概念操作样本量误差加权公安lihui_第1页
第1页 / 共34页
医学抽样讲座概念操作样本量误差加权公安lihui_第2页
第2页 / 共34页
医学抽样讲座概念操作样本量误差加权公安lihui_第3页
第3页 / 共34页
医学抽样讲座概念操作样本量误差加权公安lihui_第4页
第4页 / 共34页
医学抽样讲座概念操作样本量误差加权公安lihui_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《医学抽样讲座概念操作样本量误差加权公安lihui》由会员分享,可在线阅读,更多相关《医学抽样讲座概念操作样本量误差加权公安lihui(34页珍藏版)》请在金锄头文库上搜索。

1、抽样及其控制 定量研究的第一步speaker: 朱永明1v抽样设计过程v抽样方法v样本量计算v抽样误差计算与控制(抽样加权控制)v访问信度计算与控制目 录2抽 样 方 法(sampling method)F非随机抽样(Nonprobability sampling)F随机抽样(probability sampling)3抽样设计过程定义抽样总体决定抽样框选择抽样技术决定抽样规模执行抽样过程4非随机抽样非随机抽样Nonprobability Sampling TechniqueConvenienceSamplingJudgmentalSamplingQuotaSamplingSnowballSa

2、mpling5ProportionateDisproportionateMultistageSamplingOne-stageSamplingTwo-stageSamplingSimple ClusterSamplingProbabilityProportionateto SizeSampling随机抽样随机抽样Probability Sampling TechniquesSimple Random SamplingSystematicSamplingStratifiedSamplingClusterSampling Other Sampling6在12个居委中,共有6000户,分布情况为:1

3、23456789101112420 180 120 600 240 36070 50 720 18601140240将12个居委在16000内编号,然后抽选居委的方法为:一、随机抽选两个数,如696和1812,则选出居委3和4二、计算间距K=6000/2,然后在1k之间选取一个随机数R,最终抽选的号码为R, R+K。如R=705,选样号码为:705,705+3000=3705,则第3、10居委中选。PPS抽样的一个例子7 项目中抽样工作流程项目中抽样工作流程项目中抽样工作流程项目中抽样工作流程定义抽样总体决定抽样框定义抽样总体决定抽样框确定抽样方法确定抽样方法确定样本量确定样本量抽样实施抽样实

4、施89抽样实施入户访问入户访问拦截访问拦截访问 电话访问电话访问10入入 户户 访访 问问按人口比例确定各行政区的样本居委会数量确定每一个居委会样本户数量确定样本居委会数量一个居委会的成功样本不能超过执行样本量的3抽取样本居委会及样本户11 递递 补补 原原 则则按居委会抽样按居委会抽样:递补时访问样本户右手递补时访问样本户右手 边的下一户边的下一户划地块抽样划地块抽样:递补时按原有抽样原则继续抽样,递补时按原有抽样原则继续抽样, 即采用一定的抽样间距从最后即采用一定的抽样间距从最后 一个样本户开始继续抽样。一个样本户开始继续抽样。12确定调查区域租赁确定调查区域租赁访问地点访问地点确定样本量

5、确定样本量采用方便抽样选采用方便抽样选取样本取样本遴选合格受访者带遴选合格受访者带至访问地点进行访至访问地点进行访问问街头定点访问街头定点访问13电电 话话 访访 问问 确定抽样框确定抽样框确定抽样方法确定抽样方法抽取样本抽取样本访问时的控制访问时的控制14如何确定样本量要求推断的置信程度要求推断的置信程度研究研究类型、研究的性型、研究的性质样本的本的变动程度程度调查精度精度抽抽样方法方法研究目的研究目的费用、用、时间与可行性与可行性分分析析要要求求同同类项目目经验15t2 s22=nn nn n 样本规模样本规模n nt t 概率度(一般置信度概率度(一般置信度 95% 95% 时,时, t

6、=1.96 t=1.96 ,如置信度为,如置信度为 99% 99% , t=2.6 t=2.6 )n n 极限统计误差极限统计误差n np p 为总体比例为总体比例n ns s 总体元素分布标准差总体元素分布标准差简单随机样本量的计算公式简单随机样本量的计算公式t2 p ( 1 p )=n216其它抽样样本量的修正计算公式其它抽样样本量的修正计算公式一个二阶段等规模抽样的例子:VAR(Y2s) = ( 1 a/A ) (Sa2 / a) + a/A(1-b/B)Sb2/ab其中,Sa2=1/(a-1)* (Y Y)2 Sb2 = 1/(a(b-1) (Y Y )2) =1a= =1 a b 1

7、7比例抽样案例计算 在广州进行一项抽样调查以了解某种新服务方式的接受度,根据厂家反映,接受度为30 ,厂家要求在95 的置信度下统计误差范围不超过正负4 ,因此简单随机抽样的样本量为:1.96 1.96 30 ( 1 30 )/(4 4 ) 50418标准差标准差=差、方、均(差、方、均(Root-Mean-Square) 如:20,10,15,15的标准差为: 平均值=( 20+10+15+15)/4 = 15 标准差= (20-15)2+(-5)2+02+02均值抽样案例计算均值抽样案例计算19例如:要了解某城市的居民收入,假定 我们知道该市居民收入的标准差 为1500元,要求的调查误差不

8、超 过100元,则在95%的置信水平下, 所需的样本量为: 2 * 15002 / 1002 = 864均值抽样案例计算均值抽样案例计算20分析要求 全国性的还是分城市的或者是分区的 城市内是否要进一步按职业或企业类型等 变量细分,分析是否详尽(三层至四层) 是否用高级统计分析方法 80% 以上的细胞中不少于 30 个样本量 是否要做预测 是否使用模型21同类项目经验研究研究类型型最小最小规模模典型典型规模模问题识别研究(如市场潜力)500 1000 2500问题解决研究(如产品定价)200 300 500产品测试研究 200 300 500广告效果研究 150 200 300产品市场跟踪研究

9、 10 个商店 10 20 个商店集体访谈(Focus Group) 2组 412组22样本量的误区有人回答不准确,所以样本量再大也没有用电视上只调查几十个人就够了,我们也可以样本量越大越好这么大的城市,怎么也要好几千人才行大城市多抽,小城市少抽上次调查这么多人,这次也这么多吧能省钱就省钱,先这么着吧,估计差不多吧我们做了这么大量的问卷,结果肯定准确23 抽样误差(也叫系统误差或代表性误差主要由抽样总体、抽样方法、抽样数量的确定等方面造成) 非抽样误差(也叫调查误差,主要由问卷的设计、实地访问、问卷的数据录入等方面造成)市场调查误差种类24简单随机抽样标准误差的计算t * s= n25参数估计

10、点估计:点估计: 例1. 抽样调查的使用率为25% 例2. 使用寿命 万字 区间估计:区间估计:例1. 21%到29%的区间是95%的误差 置信区间 例2. 真实的平均使用寿命在万到 万之 间的概率为95%26抽样误差的控制 总体的确定 抽样方法的确定 样本量的确定 保证样本均匀性 加权控制 保证样本随机性27抽样加权-增加抽样代表性的方法公式:抽样比例公式:抽样比例 * 权重权重= 实际比例实际比例 * 1例如:抽样 300 样本,男性 120 个,女性 180 个, 则抽样比例为男性 40% ,女性 60% 。 而普查实际情况是男性占 70% ,女性占 30% 。 因此,代入加权公式: 男

11、性:40%*male_weight=70%*1 女性:60%*female_weight=30%*1得到男女的加权数为: 28抽样加权-增加抽样代表性的方法SPSS中实现加权方法: 1. 加权数据可以直接对应填写 或者使用Compute For 命令 2. 加权时要选取:Data / Weight Case29访问信度的概念 在复核完成后,剔除作废/作弊问卷,只保留有效 复核问卷。 将复核问卷题目统计结果与原问卷相应 题目统计 结果对照,从而获得一个差异比值,我们称这个 比值为该题目的访问信度。 通过全部可计算信度的题目,进而推断该项目问 卷的访问信度。30 调查题目访问信度的计算公式 其中: Yi 为原问卷调查题目的第 i 个选项统计频数 Fi 为复核问卷调查题目的第 i 个选项统计频数 n 为调查题目的选项总数31统计计算结果信度计算:信度计算:总体 96.3% 广州 97.3% 武汉 93.0% 厦门 92.3%32提高访问信度的途径问卷设计的科学性访问文件的完备性访问员的选取与培训加强实地督导复核的有效性数据录入的准确性3334

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号