敏感问题simmons 模型的( 分层) 整群抽样研

上传人:mg****85 文档编号:44595682 上传时间:2018-06-14 格式:PDF 页数:5 大小:170.88KB
返回 下载 相关 举报
敏感问题simmons 模型的( 分层) 整群抽样研_第1页
第1页 / 共5页
敏感问题simmons 模型的( 分层) 整群抽样研_第2页
第2页 / 共5页
敏感问题simmons 模型的( 分层) 整群抽样研_第3页
第3页 / 共5页
敏感问题simmons 模型的( 分层) 整群抽样研_第4页
第4页 / 共5页
敏感问题simmons 模型的( 分层) 整群抽样研_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《敏感问题simmons 模型的( 分层) 整群抽样研》由会员分享,可在线阅读,更多相关《敏感问题simmons 模型的( 分层) 整群抽样研(5页珍藏版)》请在金锄头文库上搜索。

1、* 国家自然科学基金资助项目( 编号 30571620)敏感问题 Simmons 模型的( 分层) 整群抽样研究*苏州大学公共卫生学院卫生统计与流行病学教研室( 215123) 高 歌 范玉波=提 要 目的 为敏感性问题提供科学的较复杂抽样调查方法及其统计量的计算公式。方法 Cochran W. G. 的 抽样理论及给出的抽样研究结果, 随机应答技术的 Simmons模型, 全概率公式, 方差的基本性质等理论与方法被利用。结 果 推导出二分类敏感问题随机应答技术 Simmons 模型在整群抽样、 分层整群抽样下总体比例的估计量及其估计方差的 计算公式, 并对相应的调查方法与技术进行了科学的设计

2、。结论 本文提供的敏感问题 Simmons 模型下整群抽样、 分层 整群抽样的方法信度较高, 值得推广应用。 =关键词 敏感问题 Simmons模型 分层整群抽样 总体比例的估计 估计方差所谓敏感性问题是指高度私人机密性或大多数人认为不便在公开场合表态及陈述的问题, 例如吸毒、 赌 博、 卖淫、 酒后驾驶、 个人收入、 逃税、 婚前性行为、 性病、 艾滋病、 同性恋倾向等。敏感性问题按总体的特征可分为属性特征的敏感性问题和数量特征的敏感性问 题两类, 属性特征的敏感性问题又可进一步分为二项选择( 两分类) 敏感性问题和多项选择( 多分类) 敏感性问题。对于敏感性问题的调查, 若采用直接提问的方

3、式, 被调查者为了保护自己的隐私或出于其他目的, 往往会拒绝回答或故意说谎, 使调查结果产生偏倚。为了防止偏倚, 随机应答技术( randomized response tech -nique, 简记为 RRT ) 被认为是最能有效保护被调查者 隐私, 提高其真实回答率的一种方法112。目前国内外对敏感问题RRT 的抽样调查设计研究, 只局限于简单随机抽样, 实际应用也主要局限于小范围特殊人群小 样本的简单随机抽样, 或将敏感问题RRT 的复杂抽样方法调查资料误用 RRT 简单随机抽样调查的有关公式来统计分析, 而且也极少对敏感问题RRT 抽样调查的信度与效度进行评价。 本文对二分类敏感问题随

4、机应答技术 Simmons模型下较复杂的整群抽样、 分层整群抽样调查方法进行了设计; 推导出二分类敏感问题随机应答技术 Sim - mons 模型在整群抽样、 分层整群抽样下总体比例的估计量及其估计方差的计算公式; 并结合苏州大学学生婚前性行为的调查实例, 对二分类敏感问题随机应答技术 Simmons模型的整群抽样、 分层整群抽样取得了 成功的应用效果。调查方法11Simmons模型的随机应答技术Simmons 模型是 1967 年由学者 Simmons 等提出122。该模型需设计一随机化装置, 例如: 一口袋中放置若干个大小、 重量、 触感完全相同的红球和白球。 在没有旁人在场时, 每个被抽

5、中的人有放回地从袋中随机抽出一球; 抽到红球时, 针对敏感性问题 A:/ 你具有特性 A 吗?0, 回答/ 是0或/ 否0; 抽到白球时, 针对非 敏感性问题 B: / 你具有特性 B 吗?0,回答/ 是0或/ 否0。该模型中设计了两个无关联问题 A 和 B, 故又称两个无关联问题的 RRT 模型。21Simmons模型的整群抽样方法 整群抽样的优点是抽样框要求简单, 调查单位比较集中, 调查工作的组织和进行比较方便, 调查每个基本单元的费用降低, 使得同样的费用可调查更多的基本单元; 一般认为其缺点是调查单位在总体中的分布 不均匀, 抽样误差较大。作为一种经济实用、 实施方便的抽样方法, 在

6、医学调查中被广泛应用。Simmons 模型的整群抽样可分为三个步骤: 第一步将总体划分为 群( 一级单元) , 各群由二级单元组成; 第二步以群为抽样单元, 从总体中随机抽取一部分群; 第三步对抽中群的全部二级单元采用 Simmons 模型的随机应答技术进行二分类敏感问题的调查。 31Simmons模型的分层整群抽样方法分层抽样的主要优点是减少抽样误差。Simmons模型的分层整群抽样可分为四个步骤: 第一步将总体 根据某项或某几项特征划分成若干层; 第二步将各层划分为群( 一级单元) , 各群由二级单元组成; 第三步以群为抽样单元, 分别从各层随机抽取一部分群; 第四步对抽中群的全部个体采用

7、 Simmons 模型的随机应答 技术进行二分类敏感问题的调查。公式推导11Simmons模型的整群抽样( 1) 总体比例的估计量及其估计方差假定总体划分成 N 个群, 第 i 个群包含Mi个二级单元。 随机抽取 n 个群, 调查得第 i 个群有ai个二级单#562# 中国卫生统计 2008 年 12 月第 25 卷第6 期元具有特性 A 。 假设第 i( i = 1, 2, , n) 个群具有特性 A 的比例为 Pi, 总体比例为 P 。 当群的大小相等时当各群包含的二级单元数均等于 M 时, CochranW. G. 给出整群抽样总体比例 P的估计量为132:P=1 nMEni= 1ai=

8、1 nEni= 1ai M=1 nEni= 1Pi(1)统计量 P的方差的估计量是13 2:v( P) =1- f n( n- 1)Eni= 1( Pi- P)2(2)其中 f = nM/ ( NM) = n/ N 是抽样比。 当群的大小不相等时当各群包含的二级单元数不等时, Cochran W. G.给出整群抽样总体比例 P的估计量为13 2:P=Eni= 1aiEni= 1Mi(3)统计量 P的估计方差为132:v( P) =1- f nM2Eni= 1a2i- 2PEni= 1aiMi+ P2Eni= 1M2in - 1(4)其中 M =Eni= 1Mi/ n 是样本中每群包含的平均二级

9、单元数, f =Eni= 1MiENi= 1Mi是抽样比。在实际场合可使用下面较简单的均方误差13 2:MSE( P) =1- f nM2Eni = 1M2i( Pi- P)2n - 1(5)(2) Pi、 ai的计算公式事先设置要回答敏感问题的红球所占的比例假定 为 P, 第 i 群具有无关非敏感问题B 的个体所占的比 例Ri已知或通过专门调查获得。 用 Ki表示第i 群调查 对象回答/ 是0 的比例, Pi表示第 i 群调查对象中敏感问题A 的发生比例。 根据全概率公式可得142:Ki=Pi# P + (1- P) Ri则有: Pi=Ki- (1- P) Ri P(6)于是: ai= Mi

10、Pi21Simmons模型的分层整群抽样假定总体划分成 L 层, 第 h 层包含Nh个群( 一级单元), h 层第i 群包含Mih个二级单元, 总体共包含N个二级单元。 从h 层随机抽取nh个群, 调查得第 i 个群有 aih个二级单元具有特性A 。(1) h 层内各群的大小相等时 h 层总体比例的估计及其估计方差假定 h 层各群的大小均等于Mh(各层间群的大小可不相等) , 按式( 1) h 层整群抽样总体比例 Ph的估计量为:P h=1 nhEnhi = 1Pih(7)由(2) 式得 h 层 P h的方差的估计量:v( P h) =1- fh nh( nh- 1)Enhi = 1( Pih

11、- P h)2(8)fh是h 层的抽样比。 总体比例的估计及估计方差总体比例的估计量为132:P=ELh= 1NhMhP hN=ELi= 1WhP h(9)其中 Wh= NhMh/ N 是按二级单元计算的h 层的相对大小。 因各层的样本是独立的, 对( 9) 式根据方差的基本性质有152:v( P) =ELh= 1W2hv ( P h), 又因此种情况下 v( P h) 的估计量为(8) 式, 则得估计方差:v( P) =ELh= 1W2hv( P h)=ELh= 1W2h1- fn nh( nh- 1)Enhi = 1( Pih- P h)2(10) Pih的计算公式h 层第i 群具有无关非

12、敏感问题B 的二级单元所 占的比例Rih已知或通过专门调查获得。 用 Kih表示h 层第i 群调查对象回答/ 是0的比例, Pih表示h层第i 群 调查对象中敏感问题的发生比例。 根据全概率公式可 得142( h = 1, 2, , L; i = 1, 2, , nh) :Pih=Kih- ( 1- P) Rih P(11)(2) 各层各群的大小不相等时 h 层总体比例的估计量及其估计方差 当各层各群的大小不相等时, 由(3) 式得 h 层总 体比例的估计量为:P h=Enhi= 1aihEnhi= 1Mih(12)由(4) 式得 h 层 P h的估计方差为:v( P h) =1- fh nh

13、M2hEnhi= 1a2ih- 2P hEnhi= 1aihMih+ P2 hEnhi= 1M2ihnh- 1(13)由(5) 式得 h 层 P h的较简单形式的估计方差:#563#Chinese Journal of Health Statistics, Dec 2008, Vol. 25, No. 6MSE( P h) =1- fh nhM2hEnhi= 1M2ih( Pih- P2h)nh- 1(14) 总体比例的估计量及其估计方差按(9) 式总体比例的估计量为:P=ELh= 1ENhi= 1MihP hN=ELh= 1W2hP h(15)其中 Wh=ENhi= 1Mih/ N 是按二级

14、单位计算的h 层的相对大小。因各层的样本是独立的, 对(15) 式根据方差的基本性质有152:v( P) =ELh= 1W2hv( P h) , 又因 v( P h) 的估计量为(13) 式, 则得估计方差:v( P) =ELh= 1W2h1- fh nhM2hEnhi= 1a2ih- 2P hEnhi= 1aihMih+ P2 hEnhi= 1M2ihnh- 1(16)若代入形式较简单的 P h的均方误差, 有:v( P) =ELi= 1W2h1- fh nhM2hEnhi = 1Mih( Pih- P h)2nh- 1(17) Pih、 aih的计算公式Pih按(11) 式计算, h 层第

15、i 群具有特性A 的二级单元数 aih= MihPih。应用实例以 2007 年苏州大学新校区全体在校学生为调查总体, 划分为本科生( 1 层) 、 研究生( 2 层) 两个层, 本科生共 9689 人, 研究生共 1890 人, 得 W1= 9689/ ( 9689+ 1890) = 0184, W2= 0116。以班为群, 使用大班拆小班、 小班并大班的做法, 使各层内各班学生数近似相等。采用 Simmons模型的分层整群抽样( 各层内即为 整群抽样) , 分别随机抽取本科班 20 个共 1080 人、 研究生班 18 个共 818 人, 总计 38 个班 1898 人。设置一随机化装置:

16、 一口袋中放置大小、 重量、 触感完全相同的6 个红球和 4 个白球。在没有旁人在场时, 每个被 抽中的学生有放回地从袋中随机抽出一球; 抽到红球时, 回答敏感问题: / 你是否有过婚前性行为?0, 抽到白球时, 回答非敏感问题: / 你是男生吗?0, 只需回答/ 是0或/ 否0, 每人重复调查 2 次, 总计调查 3796 人次。各层各班男生的比例 Rih在调查时由调查员清点获得。本次调查问卷回收率达 100%, 无漏填项目, 回收问卷 的合格率达 100% 。用 Excel 2003 建立数据库录入数据, 对所有资料进行手工及计算机纠错, 数据分析通过SAS 9113 完成。11 各班婚前性行为发生率的调查计算结果Simmons 模型分层整群抽样重复 2 次调查苏州大学新校区 38 个班学生婚前性行为数据, 按( 11) 式计算 得:20 个本科班第一次调查的婚前性行为发生率Pi1( i = 1, 2, , 20) 及第二次调查的婚前性行

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号