应用抽样技术李金昌课件

上传人:桔**** 文档编号:570093712 上传时间:2024-08-01 格式:PPT 页数:102 大小:896.50KB
返回 下载 相关 举报
应用抽样技术李金昌课件_第1页
第1页 / 共102页
应用抽样技术李金昌课件_第2页
第2页 / 共102页
应用抽样技术李金昌课件_第3页
第3页 / 共102页
应用抽样技术李金昌课件_第4页
第4页 / 共102页
应用抽样技术李金昌课件_第5页
第5页 / 共102页
点击查看更多>>
资源描述

《应用抽样技术李金昌课件》由会员分享,可在线阅读,更多相关《应用抽样技术李金昌课件(102页珍藏版)》请在金锄头文库上搜索。

1、抽样理论与方法抽样理论与方法统计学本科统计学本科专业必修课专业必修课3学分学分主讲教师:刘爱芹主讲教师:刘爱芹8/1/20241统计学专业必修课3学分目目 录录n第一、二章第一、二章 概述概述n第三章第三章 简单随机抽样简单随机抽样n第四章第四章 分层随机抽样分层随机抽样n第五章第五章 比率与回归估计比率与回归估计n第六章第六章 不等概抽样不等概抽样n第七章第七章 整群抽样整群抽样n第八章第八章 系统抽样系统抽样n第九章第九章 多阶段抽样多阶段抽样n第十章第十章 二重抽样二重抽样n第十一章第十一章 非抽样误差非抽样误差8/1/20242统计学专业必修课3学分CH1-2 抽样基础知识介绍抽样基础

2、知识介绍4课时课时8/1/20243统计学专业必修课3学分内容体系内容体系n学习目的:在学习具体的抽样技术之前,对抽样理论与学习目的:在学习具体的抽样技术之前,对抽样理论与方法涉及的基础问题有大致的了解和认识方法涉及的基础问题有大致的了解和认识1 抽样技术基本问题介绍,介绍抽样技术抽样技术基本问题介绍,介绍抽样技术/抽样的概念、抽样的概念、作用作用n重点:区分概率抽样和非概率抽样,了解非概率抽样的重点:区分概率抽样和非概率抽样,了解非概率抽样的基本方法,把握抽样调查的基本程序基本方法,把握抽样调查的基本程序2 抽样技术的基本概念抽样技术的基本概念n重点:抽样框、估计量方差、偏倚与均方误差、抽样

3、误重点:抽样框、估计量方差、偏倚与均方误差、抽样误差与非抽样误差差与非抽样误差3 样本设计样本设计n重点:掌握样本设计的内容、设计原则和设计效果测定重点:掌握样本设计的内容、设计原则和设计效果测定方法方法8/1/20244统计学专业必修课3学分1 抽样技术抽样技术(CH1-1)l抽样技术就是抽样推断采用的技术,包括抽样、调抽样技术就是抽样推断采用的技术,包括抽样、调查和推断三个环节的技术。查和推断三个环节的技术。l抽样技术、抽样推断、抽样调查等概念经常混用抽样技术、抽样推断、抽样调查等概念经常混用一、抽样技术的含义一、抽样技术的含义(一)概率抽样(一)概率抽样(二)非概率抽样(二)非概率抽样重

4、点:重点:n掌握概率抽样的含义和特点,与非概率抽样的区分掌握概率抽样的含义和特点,与非概率抽样的区分n了解几种非概率抽样方法了解几种非概率抽样方法二、抽样调查的基本程序二、抽样调查的基本程序三、抽样技术的作用三、抽样技术的作用8/1/20245统计学专业必修课3学分一、抽样技术一、抽样技术/抽样调查的含义抽样调查的含义8/1/20246统计学专业必修课3学分统计学原理:统计学原理: 抽样推断的含义和特点抽样推断的含义和特点Nn样本统计量样本统计量均值均值方差方差参数估计参数估计抽样平抽样平均误差均误差抽样极抽样极限误差限误差按随机原则抽样按随机原则抽样推断总体的推断总体的数量特征数量特征抽样误

5、差可以计算抽样误差可以计算并加以控制并加以控制8/1/20249统计学专业必修课3学分抽样调查抽样调查(Survey Sampling)n运用抽样技术进行的调查即抽样调查运用抽样技术进行的调查即抽样调查n抽样调查分广义和狭义两个范畴抽样调查分广义和狭义两个范畴n广义的含义:广义的含义:n一切一切非全面非全面的统计调查都是抽样调查,即从研究对象的全的统计调查都是抽样调查,即从研究对象的全体体(总体总体)中中抽取部分单位抽取部分单位作为样本,根据对所抽取的样本作为样本,根据对所抽取的样本进行调查,获得有关进行调查,获得有关总体目标量的了解总体目标量的了解n顾客买米,召开座谈会了解情况等顾客买米,召

6、开座谈会了解情况等n狭义的含义:狭义的含义:n即概率抽样即概率抽样n从总体抽取样本的方法看,抽样可分为:从总体抽取样本的方法看,抽样可分为:非概率抽样非概率抽样(nonprobability sampling)概率抽样概率抽样(probability sampling)必须正确区必须正确区分这对概念分这对概念8/1/202410统计学专业必修课3学分简单随机抽样简单随机抽样分层抽样分层抽样整群抽样整群抽样系统抽样系统抽样多阶段抽样多阶段抽样概率抽样概率抽样方便抽样方便抽样判断抽样判断抽样自愿样本自愿样本滚雪球抽样滚雪球抽样配额抽样配额抽样非概率抽样非概率抽样抽样方式抽样方式不等概抽样不等概抽样

7、8/1/202411统计学专业必修课3学分(一一)非概率抽样非概率抽样(non-probability sampling) 非随机抽样非随机抽样/有目的抽样有目的抽样/判断抽样判断抽样1、含义与基本方法、含义与基本方法n非概率抽样与概率抽样相对应,无严格定义。主要非概率抽样与概率抽样相对应,无严格定义。主要特征是:抽样时并不依据随机原则,各单位被抽中特征是:抽样时并不依据随机原则,各单位被抽中的概率事先未知或难以确定的概率事先未知或难以确定n如我国所谓的典型调查和重点调查,西方国家称为如我国所谓的典型调查和重点调查,西方国家称为有目的抽样有目的抽样(purposive s)或判断抽样或判断抽样

8、(judgment s)或或有代表性抽样有代表性抽样(representative s)n市场调查中通常采用的配额抽样市场调查中通常采用的配额抽样(quota sampling)、方便抽样方便抽样(convenience sampling)n社会调查中的滚雪球抽样、网上进行调查时的自愿社会调查中的滚雪球抽样、网上进行调查时的自愿样本等样本等8/1/202412统计学专业必修课3学分(1)随意随意/任意任意/方便抽样方便抽样n抽样者遵循抽样者遵循简便性原则随意地、任意地或按其方便性简便性原则随意地、任意地或按其方便性从总体中抽取样本,比如从总体中抽取样本,比如n实验人员从笼子里抓取最靠近笼门的小

9、白鼠做实验实验人员从笼子里抓取最靠近笼门的小白鼠做实验n节目主持人从放在玻璃缸里的众多观众来信中随手节目主持人从放在玻璃缸里的众多观众来信中随手抽出几封来宣读内容或颁奖抽出几封来宣读内容或颁奖n每年每年“3.15”前后,中央电视台、中国消费者协会前后,中央电视台、中国消费者协会和国家技术监督局组织国家新闻单位开展和国家技术监督局组织国家新闻单位开展“质量万质量万里行里行”活动,到全国各地了解市场商品质量,打击活动,到全国各地了解市场商品质量,打击假冒伪劣商品,其中很多都是在街头向行人假冒伪劣商品,其中很多都是在街头向行人了解了解对对商品质量的反映商品质量的反映n简便易行成本低简便易行成本低n但

10、样本偏差往往较大,调查或推断的结论不具有一般但样本偏差往往较大,调查或推断的结论不具有一般意义意义8/1/202413统计学专业必修课3学分(2)判断判断/有目的有目的/有代表性抽样有代表性抽样n抽样者抽样者根据自己的知识、经验和判断根据自己的知识、经验和判断从从N中挑选出中挑选出“典典型的型的”或或“有代表性的有代表性的”单位来组成样本单位来组成样本n常用于企业管理水平调查、市场商品消费结构调查、常用于企业管理水平调查、市场商品消费结构调查、居民家庭收入调查等,比如居民家庭收入调查等,比如n调查企业管理水平,可以按经验分别选取管理水平高、调查企业管理水平,可以按经验分别选取管理水平高、管理水

11、平一般、管理水平较差等不同类型作为调查样本,管理水平一般、管理水平较差等不同类型作为调查样本,以调查结果为依据,综合评价企业管理工作中的经验和以调查结果为依据,综合评价企业管理工作中的经验和问题问题划类选典式划类选典式n编制市场物价指数时,常采用判断抽样法选取商品目录编制市场物价指数时,常采用判断抽样法选取商品目录和地区样本和地区样本n优缺点:优缺点:n可以充分发挥主观能动性和利用已有信息可以充分发挥主观能动性和利用已有信息n但样本单位的但样本单位的“代表性代表性”很有限,且无法衡量很有限,且无法衡量8/1/202414统计学专业必修课3学分(3)定额定额/配额配额/计划抽样计划抽样n美国盖洛

12、普公司发明使用的,美国盖洛普公司发明使用的,目的是目的是增进判断抽样的增进判断抽样的样本代表性样本代表性n做法:做法:抽样者按照规定的定额获得一个在某些特征上抽样者按照规定的定额获得一个在某些特征上与总体结构大致成比例的样本与总体结构大致成比例的样本n单变量配额,即独立控制配额单变量配额,即独立控制配额n多变量配额,即交叉控制配额多变量配额,即交叉控制配额n这种抽样具有一定的科学性,因而在市场调查、民意这种抽样具有一定的科学性,因而在市场调查、民意测验等方面有较广泛的应用测验等方面有较广泛的应用n但判断抽样的缺点它同样难以克服但判断抽样的缺点它同样难以克服8/1/202415统计学专业必修课3

13、学分(4)流动总体抽样流动总体抽样/捕获再捕获抽样捕获再捕获抽样(sampling of mobile population)/(capture-tag-recapture)n一般用于流动总体的总体总量的推算一般用于流动总体的总体总量的推算n做法做法:n抽样者先从总体抽样者先从总体(比如水库中的鱼比如水库中的鱼)中获取部分单位中获取部分单位(如如300尾鱼尾鱼),加以标记后再放回总体,过段时间,加以标记后再放回总体,过段时间再获取部分单位再获取部分单位(如如1000尾鱼尾鱼),然后根据再获取,然后根据再获取单位中有标记单位的比例来推算总体的数量单位中有标记单位的比例来推算总体的数量n适用性适用

14、性:n这种抽样适用于事先对总体缺乏认识而调查单位又这种抽样适用于事先对总体缺乏认识而调查单位又处于流动状态的研究对象处于流动状态的研究对象8/1/202416统计学专业必修课3学分2、非概率抽样的特点及优缺点、非概率抽样的特点及优缺点n样本的抽选样本的抽选不是按照随机原则不是按照随机原则,而是,而是根据主观判断根据主观判断,有目的、有意识或根据方便的原则有目的、有意识或根据方便的原则进行进行优点:可充分利用已知信息,优点:可充分利用已知信息,人为地选择人为地选择较为典型的较为典型的样本,从而可以缩小抽样范围,节约调查时间、人员样本,从而可以缩小抽样范围,节约调查时间、人员和经费和经费缺点:采用

15、非概率抽样方法获得的数据缺点:采用非概率抽样方法获得的数据不能计算抽样不能计算抽样误差误差,也,也不能从概率的意义上控制误差并保证推断的不能从概率的意义上控制误差并保证推断的可靠性可靠性。所以,它虽然重视样本与总体的关系,即也。所以,它虽然重视样本与总体的关系,即也可以从样本特征推断总体特征,但这种推论缺乏理论可以从样本特征推断总体特征,但这种推论缺乏理论上的科学依据,上的科学依据, 其效果的好坏在很大程度上依赖于抽其效果的好坏在很大程度上依赖于抽样者的主观判断能力和经验,因此其可靠程度也只能样者的主观判断能力和经验,因此其可靠程度也只能由调查人员主观评定,而不能客观衡量由调查人员主观评定,而

16、不能客观衡量8/1/202417统计学专业必修课3学分3、适用性、适用性n为了快速得到总体一般性质方面的信息为了快速得到总体一般性质方面的信息n对某突发事件的现场调查对某突发事件的现场调查n为进一步深入调查研究而作的为进一步深入调查研究而作的前期预备性实验性调前期预备性实验性调查查等等n非概率抽样法在市场调查中得到了广泛的应用非概率抽样法在市场调查中得到了广泛的应用8/1/202418统计学专业必修课3学分(二二)概率抽样概率抽样/随机抽样随机抽样本课程内容本课程内容 (probability sampling)/(random sampling)n概率抽样是严格意义上的抽样调查,即概率抽样是

17、严格意义上的抽样调查,即“狭义的狭义的”抽样调抽样调查查n按照随机原则抽取样本,使总体中每个单位都有一个按照随机原则抽取样本,使总体中每个单位都有一个事先事先已知已知的的非零概率非零概率被抽中被抽中n总体各单位被抽中的概率可以通过样本设计总体各单位被抽中的概率可以通过样本设计(sample design)来规定,并通过某种随机化来规定,并通过某种随机化(randomization)操作操作来实现来实现n常用的概率抽样的方式:常用的概率抽样的方式:n简单随机抽样简单随机抽样(srs: simple random sampling)n分层抽样分层抽样(st: stratified sampling

18、)n系统抽样系统抽样(sy: systematic sampling)n整群抽样整群抽样(cl: cluster sampling)n多阶段抽样多阶段抽样(ms: multi-stage sampling)8/1/202419统计学专业必修课3学分概率抽样的特点概率抽样的特点(重点掌握重点掌握)(1)样本的抽取遵循样本的抽取遵循随机原则随机原则u按随机原则取样按随机原则取样 抽取样本时抽取样本时排除主观排除主观上有意识地抽取,某个单位上有意识地抽取,某个单位是否被抽中完全是否被抽中完全由客观的随机化程序由客观的随机化程序来决定来决定随机化程序随机化程序即抽样组织方式,体现了统计学家即抽样组织方

19、式,体现了统计学家的抽样技术研究成果的抽样技术研究成果主观只能决定选择哪种随机化程序,即决定怎样抽,主观只能决定选择哪种随机化程序,即决定怎样抽,而不能决定抽哪个而不能决定抽哪个u每个单位都按照一定的、事先已知或可以计算出的每个单位都按照一定的、事先已知或可以计算出的概率被抽中概率被抽中两个核两个核心点心点8/1/202420统计学专业必修课3学分对对“随机随机”的理解的理解n可将按随机原则取样的过程看成是进行一次随机试验可将按随机原则取样的过程看成是进行一次随机试验的过程,随机化程序给出了随机取样的实现过程的过程,随机化程序给出了随机取样的实现过程n随机试验的特点包括:随机试验的特点包括:n

20、试验可以重复进行试验可以重复进行n可能结果不止一个,但可以列示可能结果不止一个,但可以列示n每次试验取到哪个结果不知道每次试验取到哪个结果不知道n咬文嚼字:咬文嚼字:n“随随”,包含有,包含有“随从随从”、“因应变化因应变化”之意之意n“机机”,包含有,包含有”机遇机遇”、”机会机会”、“可能可能”、“说不清说不清的因由的因由”之意之意n“随机随机”的意思是指:结果任由天定,过程中要避免任何可的意思是指:结果任由天定,过程中要避免任何可能带来系统性或趋势性影响的人为干预,具有不确定性和难能带来系统性或趋势性影响的人为干预,具有不确定性和难以预测性以预测性n所以,随机抽样就是以一定的概率抽取样本

21、的一种方所以,随机抽样就是以一定的概率抽取样本的一种方法,这种方法法,这种方法“各种结果的可能性都不能排除,人们各种结果的可能性都不能排除,人们事先不能确知结果事先不能确知结果”8/1/202421统计学专业必修课3学分理解:每个单元被抽中的概率是已知理解:每个单元被抽中的概率是已知的,或是可以计算出来的的,或是可以计算出来的比如,简单随机抽样比如,简单随机抽样srs,1000个单元中抽个单元中抽100个个比如,分层随机抽样比如,分层随机抽样str100501000100100005001/21/101/20Nhnh大型企业大型企业中型企业中型企业小型企业小型企业被抽中的概率被抽中的概率又如,

22、又如,PPS抽样,抽样,2个企业中取个企业中取1个个1000万元万元 500万元万元2/31/3净利润净利润入样概率入样概率甲甲乙乙扩展扩展入样概率入样概率8/1/202422统计学专业必修课3学分关于关于“入样概率入样概率”的注意事项的注意事项n“入样概率入样概率”必须是必须是“非非0概率概率”n估计量的形式与入样概率有关,即,用样本资料估计总体估计量的形式与入样概率有关,即,用样本资料估计总体目标量时,要考虑该样本目标量时,要考虑该样本(或每个样本单元或每个样本单元)被抽中的概率,被抽中的概率,也就是说,估计量不仅与样本单元的观测值有关,也与其也就是说,估计量不仅与样本单元的观测值有关,也

23、与其入样概率有关入样概率有关n如果各单元入样概率均相等如果各单元入样概率均相等 简单估计简单估计 比如比如srs及其他复杂抽样的特殊情况及其他复杂抽样的特殊情况n如果入样概率不等如果入样概率不等 加权估计加权估计 比如比如str、pps等等8/1/202423统计学专业必修课3学分2、可运用概率估计的方法推断总体的、可运用概率估计的方法推断总体的数量特征数量特征n大数定律和中心极限定理通过抽样分布规律描述了样大数定律和中心极限定理通过抽样分布规律描述了样本和总体的内在联系本和总体的内在联系n根据这种内在联系,运用概率估计的方法,就可以对根据这种内在联系,运用概率估计的方法,就可以对总体数量特征

24、做出具有一定概率保证程度的推断总体数量特征做出具有一定概率保证程度的推断8/1/202424统计学专业必修课3学分3、抽样误差可以计算并加以控制、抽样误差可以计算并加以控制n抽样调查是非全面调查,比如存在误差抽样调查是非全面调查,比如存在误差n抽样误差是由样本抽取的随机性所引起的抽样误差是由样本抽取的随机性所引起的n抽样误差的大小反映了抽样推断的效果抽样误差的大小反映了抽样推断的效果n抽样分布规律给出了计算和控制抽样误差的依据抽样分布规律给出了计算和控制抽样误差的依据8/1/202425统计学专业必修课3学分注意:注意:n注意区分:注意区分:n概率抽样与非概率抽样概率抽样与非概率抽样n等概率抽

25、样与不等概率抽样等概率抽样与不等概率抽样n问题:问题:n概率抽样是等概率抽样吗?概率抽样是等概率抽样吗?n非概率抽样是不等概率抽样吗?非概率抽样是不等概率抽样吗?n解答关键点:解答关键点:n概率抽样既有等概率抽样,也有不等概率抽样概率抽样既有等概率抽样,也有不等概率抽样n非概率抽样中没有入样概率这一概念,也就谈不上抽样是等非概率抽样中没有入样概率这一概念,也就谈不上抽样是等概率还是不等概率概率还是不等概率8/1/202426统计学专业必修课3学分二、抽样调查的基本程序二、抽样调查的基本程序n首先要确定调研问题、明确研究对象等首先要确定调研问题、明确研究对象等n1、设计抽样方案、设计抽样方案n2

26、、编制抽样框和设计调查表、编制抽样框和设计调查表n3、试抽样调查、试抽样调查n4、正式抽样调查、正式抽样调查n5、数据处理、数据处理n6、推断分析、推断分析n7、总结评估、总结评估8/1/202427统计学专业必修课3学分抽样调查基本程序抽样调查基本程序确定调研问题确定调研问题抽样否抽样否否否抽样方案设计抽样方案设计问卷问卷/调查表调查表设计设计实施抽样实施抽样实施调查实施调查数据整理数据整理分析分析撰写调研报告撰写调研报告研究环节研究环节实施环节实施环节如何抽样如何抽样抽多少抽多少数据怎样搜集数据怎样搜集试试/预调查预调查正式调查正式调查8/1/202428统计学专业必修课3学分确定调研问题

27、确定调研问题n确定调研问题即确定调查目的确定调研问题即确定调查目的n调查目的决定了调查的内容和方法,体现了调查目的决定了调查的内容和方法,体现了科学性和可行性科学性和可行性的结合的结合n确定调研问题的关键:确定调研问题的关键:n关键是关键是明确定义问题明确定义问题,包括对整个问题的叙述以及确定研究,包括对整个问题的叙述以及确定研究问题的具体组成部分问题的具体组成部分n回答回答“要做什么样的调查研究要做什么样的调查研究”以及以及“为什么要做这项调查为什么要做这项调查研究研究”n调研人员需要做的工作:调研人员需要做的工作:n考虑考虑研究的目的研究的目的,相关的,相关的背景资料背景资料,所需,所需信

28、息信息,以及这些信,以及这些信息进行分析时息进行分析时如何使用如何使用n需要与有关部门的决策者进行需要与有关部门的决策者进行反复多轮次反复多轮次的认真讨论,访问的认真讨论,访问有关行业专家,分析二手资料,必要时还需要进行如座谈会有关行业专家,分析二手资料,必要时还需要进行如座谈会那样的定性调查那样的定性调查8/1/202429统计学专业必修课3学分例例1:1994年某市居民住宅消费调查年某市居民住宅消费调查n总研究目的的表述:总研究目的的表述:n“通过对某市部分居民的收入水平、住房现状、住宅消费与通过对某市部分居民的收入水平、住房现状、住宅消费与购房意向、存贷款观念等方面的实地调查,分析金融机

29、构开购房意向、存贷款观念等方面的实地调查,分析金融机构开展住宅储蓄以及购房抵押贷款业务的市场需求与潜力,为展住宅储蓄以及购房抵押贷款业务的市场需求与潜力,为银行在这两项业务上推出新举措提供客观可靠的参考依据银行在这两项业务上推出新举措提供客观可靠的参考依据”n总研究目的的具体化:总研究目的的具体化:n被调查者及其家庭的基本情况被调查者及其家庭的基本情况n被调查者家庭的住房现状及改善意向被调查者家庭的住房现状及改善意向n被调查者的储蓄观念被调查者的储蓄观念n被调查者对住宅存、贷款业务的看法被调查者对住宅存、贷款业务的看法n部分企事业单位对其职员住房问题的计划等部分企事业单位对其职员住房问题的计划

30、等8/1/202430统计学专业必修课3学分例例2:五次人口普查:五次人口普查n第一次,第一次,1953年年7月月1日日0时。目的:配合召开全国人大,时。目的:配合召开全国人大,确定选民及人大代表名额的需要,并为国家制定一五计划确定选民及人大代表名额的需要,并为国家制定一五计划提供确实的人口数字,所以调查项目有:姓名、与户主关提供确实的人口数字,所以调查项目有:姓名、与户主关系、年龄、性别、民族、本户住址等系、年龄、性别、民族、本户住址等6个项目个项目n第二次,第二次,1964年年7月月1日日0时。在第一次基础上增加了:时。在第一次基础上增加了:本人成分、文化程度、职业等本人成分、文化程度、职

31、业等n第三次,第三次,1982年年7月月1日日0时。目的:为配合社会主义现时。目的:为配合社会主义现代化建设,统筹安排人民的物质和文化生活,为制定人口代化建设,统筹安排人民的物质和文化生活,为制定人口政策和规划,提供准确的人口数字资料,所以搞了政策和规划,提供准确的人口数字资料,所以搞了13项项人记录项目,人记录项目,6项户记录项目项户记录项目n第四次,第四次,1990年年7月月1日日0时。目的:为研究近五年改革时。目的:为研究近五年改革开放后的人口流动和迁移状况,所以在开放后的人口流动和迁移状况,所以在1982年的基础上年的基础上又增加了又增加了2项人记录项目项人记录项目n第五次,第五次,2

32、000年年11月月1日日0时,普查项目比时,普查项目比90年增加了年增加了一倍多,且首次增加了住房内容一倍多,且首次增加了住房内容8/1/202431统计学专业必修课3学分1、设计抽样方案、设计抽样方案 (重点掌握框架重点掌握框架)n明确规定调查目的及目标总体,确定所要估计的目标量明确规定调查目的及目标总体,确定所要估计的目标量n确定搜集哪些资料以及搜集的方法确定搜集哪些资料以及搜集的方法n确定抽样组织方式,即确定抽样组织方式,即如何抽样如何抽样,兼顾科学性和可行性,兼顾科学性和可行性n编制编制抽样框抽样框,要根据抽样方法和数据收集方法的不同来,要根据抽样方法和数据收集方法的不同来编制编制n规

33、定要达到的精度、规定要达到的精度、确定确定n、经费核算等问题、经费核算等问题n给出与抽样设计相匹配的总体参数的给出与抽样设计相匹配的总体参数的估计量,并考察估估计量,并考察估计量的性质计量的性质n对非抽样误差的预防和控制办法,比如对拒访等的处理对非抽样误差的预防和控制办法,比如对拒访等的处理方法方法8/1/202432统计学专业必修课3学分2、调查表、调查表/问卷设计问卷设计n对调查项目的要求对调查项目的要求n问卷的项目应当有确切的含义和统一的解释问卷的项目应当有确切的含义和统一的解释n应该列入能取得确切资料的项目应该列入能取得确切资料的项目n问题间要具有逻辑关系问题间要具有逻辑关系n形式形式

34、n易填易答,便于计算机处理。一个形式繁琐的问卷会使被访易填易答,便于计算机处理。一个形式繁琐的问卷会使被访者难以忍受,从而易出现错答、拒答或不完全回答、随意回者难以忍受,从而易出现错答、拒答或不完全回答、随意回答的情况答的情况n提问技巧提问技巧n问卷开头的设计问卷开头的设计n各种问题的提问技巧各种问题的提问技巧n答案设计技巧答案设计技巧n监控手段的使用监控手段的使用8/1/202433统计学专业必修课3学分Nielsen电视收视率调查中的有关定义电视收视率调查中的有关定义n是否拥有汽车:私家车是否拥有汽车:私家车n家庭成员数:家庭成员数:n一周内有五天或以上吃住于该家庭住址内的所有成一周内有五

35、天或以上吃住于该家庭住址内的所有成员员n家庭月总收入:家庭月总收入:n每个家庭成员每月的收入总和,包括汇款及其他任每个家庭成员每月的收入总和,包括汇款及其他任何形式的收入何形式的收入8/1/202434统计学专业必修课3学分问卷中敏感性问题不能太多问卷中敏感性问题不能太多n某高校关于考风考纪的调查某高校关于考风考纪的调查nn你在以往的历次期末考试中有没有作弊?你在以往的历次期末考试中有没有作弊?(有,没有,没有有)n如果你作弊了,作弊的门次数大约为如果你作弊了,作弊的门次数大约为(1次,次,2-3次,次,4-6次,次,6次以上次以上)n你主要在以下哪种性质的课程中作弊?你主要在以下哪种性质的课

36、程中作弊?(通识教育通识教育课、学科共同基础课、专业必修课、专业选修课课、学科共同基础课、专业必修课、专业选修课)n选学科共同基础课的同学请回答:你主要在以下哪选学科共同基础课的同学请回答:你主要在以下哪些课程中作弊了?些课程中作弊了?n8/1/202435统计学专业必修课3学分问卷的开头问卷的开头n_女士女士/小姐小姐/先生:先生:n 您好!我是中国人民大学调查技术研究所的访问员,您好!我是中国人民大学调查技术研究所的访问员,我们正在进行一项有关公众医疗保险意识的调查,目我们正在进行一项有关公众医疗保险意识的调查,目的是想了解人们对医疗保险的看法和意见。的是想了解人们对医疗保险的看法和意见。

37、您的回答您的回答无所谓对错无所谓对错,只要是您真实的情况和看法,都将有益,只要是您真实的情况和看法,都将有益于改善公众医疗保险方面的服务,我们都将十分珍视。于改善公众医疗保险方面的服务,我们都将十分珍视。同时我们再次郑重向您做出承诺:对您的回答和个人同时我们再次郑重向您做出承诺:对您的回答和个人情况将完全保密,既不泄露给第三者,也不会公开发情况将完全保密,既不泄露给第三者,也不会公开发表,除非您本人完全愿意。可能要耽误您表,除非您本人完全愿意。可能要耽误您15分钟左右分钟左右的时间,请您配合,谢谢您的支持!的时间,请您配合,谢谢您的支持!n 摘自摘自公众医疗保险意识调查问卷公众医疗保险意识调查

38、问卷8/1/202436统计学专业必修课3学分提问技术提问技术n问题问题1:你是否经常看电影?:你是否经常看电影?n改为:你上个月看了几次电影?改为:你上个月看了几次电影?n问题问题2:调查工人的劳动定额是否合理,如果直接向:调查工人的劳动定额是否合理,如果直接向每个工人提问:您觉得本公司的劳动定额制定的是否每个工人提问:您觉得本公司的劳动定额制定的是否合理?合理?n改为:您觉得对于大多数工人来说,劳动定额制定改为:您觉得对于大多数工人来说,劳动定额制定的是否合理?的是否合理?n这样的提问可能回获得较为客观的资料这样的提问可能回获得较为客观的资料8/1/202437统计学专业必修课3学分“撒胡

39、椒面撒胡椒面”的做法控制作弊的做法控制作弊n问卷上撒上一些检查用的问题,这些问题与问卷中的问卷上撒上一些检查用的问题,这些问题与问卷中的某些题是高度相关甚至是完全相同的,不注意就是出某些题是高度相关甚至是完全相同的,不注意就是出现矛盾现矛盾n固定接驳电视录影机与家庭录像机固定接驳电视录影机与家庭录像机n被访者名单上安插一些被访者名单上安插一些“检查员检查员”,可能是调查公司,可能是调查公司或委托客户公司中的工作人员或委托客户公司中的工作人员8/1/202438统计学专业必修课3学分3、实施调查过程、实施调查过程n关键:保证原始数据质量关键:保证原始数据质量n调查实施调查实施前前,需要对调查员进

40、行技术培训,使调查,需要对调查员进行技术培训,使调查员熟悉调查问卷,掌握访谈技巧,增强责任心员熟悉调查问卷,掌握访谈技巧,增强责任心n调查过程调查过程中中,加强质量检验,出现问题及时总结,加强质量检验,出现问题及时总结,及时补救。如果调查项目比较大,又是第一次进行,及时补救。如果调查项目比较大,又是第一次进行,或者对问卷设计的把握不够大,在正式调查实施前,或者对问卷设计的把握不够大,在正式调查实施前,还应当进行一次还应当进行一次预调查预调查(试调查试调查),以检验各方面的工,以检验各方面的工作是否完善作是否完善n调查调查后后,复查、验收调查员工作,复查、验收调查员工作8/1/202439统计学

41、专业必修课3学分专业调研公司的工作手册专业调研公司的工作手册n专业性调研公司对每一部分的工作一般都会制定详细专业性调研公司对每一部分的工作一般都会制定详细的工作手册或工作流程的工作手册或工作流程n调查员的基本条件调查员的基本条件n调查员的培训手册调查员的培训手册n督导员工作手册督导员工作手册n一审要求及问卷、二审要求及问卷一审要求及问卷、二审要求及问卷n复查规则复查规则n调查员评价标准等调查员评价标准等8/1/202440统计学专业必修课3学分4、数据处理分析、数据处理分析n首先要对经过调查获得的原始数据进行检查、核对首先要对经过调查获得的原始数据进行检查、核对n对验收合格的调查问卷进行编码和

42、录入对验收合格的调查问卷进行编码和录入n进行数据的进行数据的预处理预处理,为统计分析做好准备,为统计分析做好准备n录入数据的再编码,它是对原编码的补充和调整录入数据的再编码,它是对原编码的补充和调整n对缺失值进行插补,以构造出完整的数据集对缺失值进行插补,以构造出完整的数据集n变量的转换,比如标准化处理,使不同单位或不同变量的转换,比如标准化处理,使不同单位或不同量纲、不同量表的变量在分析中具有可比性量纲、不同量表的变量在分析中具有可比性n计算目标量的估计值、方差及变异系数的估计值等计算目标量的估计值、方差及变异系数的估计值等n必要时还需要结合研究目的进行深入的统计处理与必要时还需要结合研究目

43、的进行深入的统计处理与分析分析8/1/202441统计学专业必修课3学分数据的分析数据的分析n背景分析背景分析n原因分析原因分析n目标市场特征分析目标市场特征分析n途径分析等途径分析等分析的基础上来推断总体分析的基础上来推断总体不同抽样方法下推断方式不尽相同不同抽样方法下推断方式不尽相同8/1/202442统计学专业必修课3学分5、撰写调查报告、撰写调查报告/总结评估总结评估n(1)主题主题n(2)范围范围n(3)调查对象调查对象 n(4)资料收集方法资料收集方法n(5)调查期、参考期和报告期调查期、参考期和报告期 n(6)抽样设计和估计程序抽样设计和估计程序n(7)结论的描述结论的描述 n(

44、8)精确度精确度n(9)责任责任n(10)参考文献参考文献8/1/202443统计学专业必修课3学分三、抽样技术三、抽样技术/抽样调查的作用抽样调查的作用一般性掌握一般性掌握与与统计学原理统计学原理相关知识衔接相关知识衔接8/1/202444统计学专业必修课3学分(一)从研究对象的角度来说(一)从研究对象的角度来说1.对那些不可能进行全面观察或普查而又需要了解全面对那些不可能进行全面观察或普查而又需要了解全面情况的客观对象情况的客观对象(总体总体),只能抽样调查,只能抽样调查n所研究的总体是无限的所研究的总体是无限的n破坏性测试破坏性测试2.适用于大规模的社会经济调查和民意测验等适用于大规模的

45、社会经济调查和民意测验等n这类调查的总体虽然是有限的,理论上可以进行普这类调查的总体虽然是有限的,理论上可以进行普查,但实际难以操作。普查耗资巨大,而且也不必查,但实际难以操作。普查耗资巨大,而且也不必得到确切的结论。比如:得到确切的结论。比如:n对居民的家庭收支状况或消费情况调查对居民的家庭收支状况或消费情况调查n各类市场调查各类市场调查n居民电视节目的收视率调查等等居民电视节目的收视率调查等等8/1/202445统计学专业必修课3学分(二)有时全面调查、抽样调查都可用,(二)有时全面调查、抽样调查都可用,用抽样调查有以下优点用抽样调查有以下优点n1.节约费用,特别是当总体较大时节约费用,特

46、别是当总体较大时n2.时效性强时效性强n对时效性要求比较强的调查,都普遍采用抽样调查方对时效性要求比较强的调查,都普遍采用抽样调查方法及时取得信息法及时取得信息n重大事件新闻舆论调查重大事件新闻舆论调查n西方国家反映总统竞选过程的调查西方国家反映总统竞选过程的调查n大多数市场及消费行为调查大多数市场及消费行为调查n季节性农作物产量调查以准备组织调运季节性农作物产量调查以准备组织调运n3.有助于提高调查数据的质量有助于提高调查数据的质量8/1/202446统计学专业必修课3学分调查中的误差来源调查中的误差来源调查中的调查中的误差按产误差按产生的原因生的原因来分来分工作工作性误差性误差(登记登记性

47、误差性误差)代表性误差代表性误差偶然性的偶然性的代表性误差代表性误差系统性的系统性的代表性误差代表性误差是调查登记、汇是调查登记、汇总计算中的总计算中的差错差错无法计算,无法计算,可采可采取措施尽量避免取措施尽量避免抽样误差抽样误差。随机。随机抽样特有的,不抽样特有的,不是差错,不可避是差错,不可避免,但可以计算免,但可以计算并控制并控制违反随机原违反随机原则抽样导致则抽样导致的,可以尽的,可以尽可能地避免可能地避免样本不足以代样本不足以代表总体而产生表总体而产生的误差的误差非抽样非抽样误差误差8/1/202447统计学专业必修课3学分思考:思考:P17 1.11.6l注:注:l此类题目没有标

48、准答案,只有参考的思路此类题目没有标准答案,只有参考的思路l原因是:原因是:l不同时间、空间、背景下可能有差异不同时间、空间、背景下可能有差异1结束结束8/1/202448统计学专业必修课3学分2 基本概念基本概念(CH2-1/2/3)一、总体与样本一、总体与样本二、估计量与抽样分布二、估计量与抽样分布三、抽样误差与置信区间三、抽样误差与置信区间8/1/202449统计学专业必修课3学分一、总体与样本一、总体与样本n(一)总体:目标总体与调查总体(一)总体:目标总体与调查总体n(二)调查单位与抽样单位(二)调查单位与抽样单位n(三)抽样框(三)抽样框n(四)样本(四)样本n(五)总体指标与样本

49、指标(五)总体指标与样本指标8/1/202450统计学专业必修课3学分目标总体目标总体(target population)n简称为总体,简称为总体,即即研究对象的全体,研究对象的全体,由研究对象中由研究对象中所有性质所有性质相同的个体相同的个体组成组成n总体中包含的基本单元数用总体中包含的基本单元数用N表示表示n在一项调查中,要对目标总体的范围做出具体规定,目标在一项调查中,要对目标总体的范围做出具体规定,目标总体的划分有时容易,有时不太容易,要注意统计口径总体的划分有时容易,有时不太容易,要注意统计口径n比如,对山东财政学院的教工调查比如,对山东财政学院的教工调查n教师、教工、教职工、教职

50、员工教师、教工、教职工、教职员工n比如,家庭常住人口数比如,家庭常住人口数n有时,目标总体非常复杂,尤其在社会经济调查中,想得有时,目标总体非常复杂,尤其在社会经济调查中,想得到一个包括目标总体全部单位的框架往往很难,只能用一到一个包括目标总体全部单位的框架往往很难,只能用一个接近目标总体,且容易取得和便于操作的框架来代替个接近目标总体,且容易取得和便于操作的框架来代替 抽样框抽样框/抽样总体抽样总体/调查总体调查总体(sampled population)总体单元总体单元或单位或单位unit8/1/202451统计学专业必修课3学分调查总体调查总体/抽样总体抽样总体(sampled popu

51、lation)n是指从中抽取样本的总体,是抽样框包含的总体范围是指从中抽取样本的总体,是抽样框包含的总体范围n理论上,抽样总体应理论上,抽样总体应与目标总体完全一致与目标总体完全一致,否则就可能产,否则就可能产生偏差生偏差抽样框误差抽样框误差n但实践中两者不一致的情况却时常发生但实践中两者不一致的情况却时常发生n比如进行济南市个体商业调查,目标总体是济南市的所有个比如进行济南市个体商业调查,目标总体是济南市的所有个体商业经营单位,抽样总体是什么呢体商业经营单位,抽样总体是什么呢?n可以有多种选择,比如可以有多种选择,比如营业执照可能是不错的选择,即把济南市工商局个体商业的营业执照可能是不错的选

52、择,即把济南市工商局个体商业的营业执照注册记录作为抽样总体,从中抽取样本营业执照注册记录作为抽样总体,从中抽取样本但是,有些人虽持有营业执照,但早已不再从事商品交易活但是,有些人虽持有营业执照,但早已不再从事商品交易活动,他们已不属于目标总体范围,但却出现在抽样总体当中动,他们已不属于目标总体范围,但却出现在抽样总体当中还有一些人无照经营,他们应属于目标总体范围,却没有出还有一些人无照经营,他们应属于目标总体范围,却没有出现在抽样总体之中现在抽样总体之中n这表明,要保证抽样总体和目标总体完全一致,不是一件这表明,要保证抽样总体和目标总体完全一致,不是一件容易的事情容易的事情8/1/202452

53、统计学专业必修课3学分样本样本(sample)n样本样本从总体中按从总体中按一定程序一定程序抽出的部分单元的集合抽出的部分单元的集合n样本容量样本容量样本中包含的基本单元的个数,样本中包含的基本单元的个数,nn抽样比抽样比f (sampling fraction)n样本的抽取方式样本的抽取方式n重复抽样和不重复抽样之分重复抽样和不重复抽样之分n等概率抽样和不等概率抽样之分等概率抽样和不等概率抽样之分n可能的样本数目可能的样本数目m概率抽样中,就概率抽样中,就是随机化程序是随机化程序8/1/202453统计学专业必修课3学分抽样框抽样框/抽样总体抽样总体(sampling frame)1、含义、

54、含义(重点掌握重点掌握)n从中抽取样本的一个框架,是抽样总体的具体表现从中抽取样本的一个框架,是抽样总体的具体表现n其作用就是将无形的总体变成有形的事物,以便进行实际地其作用就是将无形的总体变成有形的事物,以便进行实际地抽取抽取n通常,抽样框是一份包含所有抽样单元的名单,给每一个抽通常,抽样框是一份包含所有抽样单元的名单,给每一个抽样单元编上一个号码,就可以按一定的随机化程序进行抽样样单元编上一个号码,就可以按一定的随机化程序进行抽样n抽样框的具体表现形式:名单、区域抽样框的具体表现形式:名单、区域/地图、时间等地图、时间等2、对抽样框的基本要求、对抽样框的基本要求(重点掌握重点掌握)n(1)

55、与目标总体尽可能保持一致与目标总体尽可能保持一致n(2)应尽可能地提供抽样单元的应尽可能地提供抽样单元的名称和地理位置、联系方式名称和地理位置、联系方式等等信息信息n(3)还应尽可能多地提供与研究的目标量有关的还应尽可能多地提供与研究的目标量有关的辅助信息辅助信息,以,以便调查人员利用这些辅助信息搞好抽样设计,提高抽样估计便调查人员利用这些辅助信息搞好抽样设计,提高抽样估计的效率的效率复杂抽样方式和复杂抽样方式和估计方法的条件估计方法的条件8/1/202454统计学专业必修课3学分抽样单元抽样单元(sampling unit)n是构成抽样框的基本要素是构成抽样框的基本要素n抽样单元与总体单元的

56、关系:抽样单元与总体单元的关系:1、抽样单元、抽样单元=总体单元总体单元 srs、str、sy在在N不大且比较集中,一般是从总体单元中不大且比较集中,一般是从总体单元中直接抽取直接抽取若若干单元形成样本,这时抽样单元与总体单元一致干单元形成样本,这时抽样单元与总体单元一致2、抽样单元、抽样单元=总体单元的集合总体单元的集合在在N很大,抽样比较复杂时,一般不直接从总体中抽取很大,抽样比较复杂时,一般不直接从总体中抽取单元单元通常的抽样方法有两种:通常的抽样方法有两种:抽取若干总体单元的集合抽取若干总体单元的集合(cl)通过几个阶段来抽取总体单元通过几个阶段来抽取总体单元(ms)n这时,抽样单元与

57、总体的基本单元往往是不一致的这时,抽样单元与总体的基本单元往往是不一致的n此时,抽样框就是抽样单元的名单此时,抽样框就是抽样单元的名单8/1/202455统计学专业必修课3学分 举例:多阶段抽样举例:多阶段抽样/多级抽样多级抽样(MS:Multi-stage sampling)n抽取抽取样本本单元的元的过程分两个或两个以上的程分两个或两个以上的阶段来完成段来完成n比如,我国城市比如,我国城市居民住居民住户调查采用三或四采用三或四阶段抽段抽样n第一第一阶段:抽段:抽选调查城市城市n抽抽样框即所有城市的名框即所有城市的名单n第二第二阶段:从抽中城市中抽段:从抽中城市中抽选居委会居委会(或抽街道(或

58、抽街道办事事处再抽居委会)再抽居委会)n抽抽样框即抽中城市的所有居委会(或街道框即抽中城市的所有居委会(或街道办事事处然后再居委会)的名然后再居委会)的名单n第三第三阶段:从抽中的基段:从抽中的基层单位中抽取位中抽取调查户n抽抽样框即所抽中居委会的所有居民框即所抽中居委会的所有居民户的名的名单8/1/202456统计学专业必修课3学分 调查单位调查单位n调查单位是位是调查项目的承担者,即我目的承担者,即我们想通想通过调查取得取得其其观测值的的单位位n通常是构成通常是构成总体的基本体的基本单位位n比如,城市居民住比如,城市居民住户调查的三的三/四四阶段抽段抽样中,尽中,尽管各管各阶段段抽抽样单位

59、位不同,第一不同,第一阶段抽城市,第二段抽城市,第二阶段抽街道段抽街道办事事处/居委会,第三居委会,第三阶段才抽段才抽调查户,但最但最终对抽中的居民抽中的居民户进行行调查8/1/202457统计学专业必修课3学分总体参数总体参数/总体指标总体指标n总体指标通常是总体指标通常是调查的目标量调查的目标量,是所要研究的总体中,是所要研究的总体中某种特征的数量表现某种特征的数量表现n这些指标值客观存在,人们很关心但又未知,抽样调这些指标值客观存在,人们很关心但又未知,抽样调查的目的就是获得对这些目标量的估计查的目的就是获得对这些目标量的估计n问题:为什么又称为总体参数?问题:为什么又称为总体参数?8/

60、1/202458统计学专业必修课3学分总体指标的类型总体指标的类型(P24:2.12.5)n设总体有设总体有N个基本单元,个基本单元,Y1,Y2,YN为各单元数值为各单元数值n根据根据数学处理方式的不同数学处理方式的不同,总体指标分为四种:,总体指标分为四种:1、总体总量、总体总量/总体总和总体总和(population total) 2、总体均值、总体均值/总体平均数总体平均数(population mean) 3、总体比例、总体比例(population proportion)4、总体方差、总体方差(population variance)5、总体比率、总体比率(population ra

61、tio)n问题问题:为什么将总体指标归结为这几种类型?:为什么将总体指标归结为这几种类型?8/1/202459统计学专业必修课3学分样本指标样本指标/样本统计量样本统计量(P25:2.62.10)n用样本中用样本中n个基本单元的数据构造的形式,作为对总个基本单元的数据构造的形式,作为对总体目标量的估计,也叫样本估计量体目标量的估计,也叫样本估计量n问题:为什么称为样本统计量而非参数?问题:为什么称为样本统计量而非参数? 它是样本的函数,随抽取样本的不同而不同,它是样本的函数,随抽取样本的不同而不同,其结果取决于抽样设计和每次抽样所选中的样本其结果取决于抽样设计和每次抽样所选中的样本 所以,样本

62、统计量是随机变量所以,样本统计量是随机变量n样本指标是构造总体指标估计量的基础和依据样本指标是构造总体指标估计量的基础和依据n研究研究统计量的数学期望和方差统计量的数学期望和方差,是抽样理论所讨论,是抽样理论所讨论的主要问题的主要问题8/1/202460统计学专业必修课3学分二、估计量与抽样分布二、估计量与抽样分布8/1/202461统计学专业必修课3学分估计量的优良标准估计量的优良标准 评价估计量的标准评价估计量的标准n所谓优良估计量,是从总体上来评价的所谓优良估计量,是从总体上来评价的n对于总体的同一参数,可以有不同的估计量。例如,对于总体的同一参数,可以有不同的估计量。例如,估计总体均值

63、,可以用样本均值,也可以用样本中位估计总体均值,可以用样本均值,也可以用样本中位数,用哪种估计量更好呢?数,用哪种估计量更好呢?n希望选择一个相对优良、估计效果更好的估计量。希望选择一个相对优良、估计效果更好的估计量。n什么样的估计量才算是一个好的估计量呢?什么样的估计量才算是一个好的估计量呢?n这就需要有一定的评价标准。统计学家给出了评价估这就需要有一定的评价标准。统计学家给出了评价估计量的一些标准计量的一些标准n一个优良估计量主要需要符合下面三个标准:无偏性、一个优良估计量主要需要符合下面三个标准:无偏性、有效性、一致性有效性、一致性8/1/202462统计学专业必修课3学分无偏性无偏性(

64、unbiasedness)n估计量估计量(随机变量随机变量)的数学期望等于被估计的总体参数的数学期望等于被估计的总体参数n中心极限定理证明了:样本平均数、样本成数都满足无偏性中心极限定理证明了:样本平均数、样本成数都满足无偏性 P P( ( ) )B BA A无偏无偏无偏无偏有偏有偏有偏有偏总体参数总体参数总体参数总体参数8/1/202463统计学专业必修课3学分有效性有效性(efficiency)l对对同同一一总总体体参参数数的的两两个个无无偏偏点点估估计计量量,有有更更小小标标准差的估计量更有效准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分

65、布的抽样分布P P( ( ) )样本平均样本平均样本平均样本平均数比中位数比中位数比中位数比中位数更有效数更有效数更有效数更有效8/1/202464统计学专业必修课3学分一致性一致性(consistency)n随着样本容量的增大,估计量的值越来越接近被估计随着样本容量的增大,估计量的值越来越接近被估计的总体参数的总体参数n大数定律已经证明了:大数定律已经证明了:样本平均数和样本成数都满足样本平均数和样本成数都满足一致性一致性 AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P( ( ) )8/1/202465统计学专业必修

66、课3学分复杂估计量有偏,但比简单估计量更有效复杂估计量有偏,但比简单估计量更有效P26n简单估计量简单估计量/直接估计量直接估计量n直接以调查变量的样本指标作为总体指标的估计量直接以调查变量的样本指标作为总体指标的估计量n是是线性线性估计量估计量(样本观测值的线性组合样本观测值的线性组合),也是,也是无偏无偏估计量估计量n复杂估计量复杂估计量/间接估计量间接估计量n在在调查变量调查变量的样本指标的基础上,再结合的样本指标的基础上,再结合辅助变量辅助变量构造一个新估计量,作为总体指标的估计量构造一个新估计量,作为总体指标的估计量n常用的:比率估计量常用的:比率估计量(ratio estimato

67、r),回归估,回归估计量计量(regression estimator)n是是有偏有偏的、的、非线性非线性的,但是通常的,但是通常更有效更有效(CH5)8/1/202466统计学专业必修课3学分估计量的分布估计量的分布抽样分布的意义抽样分布的意义 (sampling distribution)n样本是随机的样本是随机的 样本统计量是随机变量样本统计量是随机变量 不同的样本给出不同的估计值不同的样本给出不同的估计值n有必要讨论:不同估计值之间的差异有多大?各估计有必要讨论:不同估计值之间的差异有多大?各估计值出现的概率有多大?值出现的概率有多大? 估计量的概率分布,即抽样分布估计量的概率分布,即

68、抽样分布n研究抽样分布的目的就是为了通过探讨估计量的分布研究抽样分布的目的就是为了通过探讨估计量的分布规律,找到控制抽样误差的依据规律,找到控制抽样误差的依据8/1/202467统计学专业必修课3学分抽样分布的形式与特征抽样分布的形式与特征n抽样分布是估计量的概率分布,由估计量的可能取值抽样分布是估计量的概率分布,由估计量的可能取值与之对应的概率组成与之对应的概率组成n抽样分布的期望与方差反映了抽样分布的特征抽样分布的期望与方差反映了抽样分布的特征n研究研究统计量的数学期望和方差统计量的数学期望和方差,是抽样理论所讨论的,是抽样理论所讨论的主要问题主要问题估计量估计量的性质的性质8/1/202

69、468统计学专业必修课3学分估计量方差估计量方差V、偏差、偏差B、均方误差、均方误差MSE重点理解并掌握:三个概念的含义和基重点理解并掌握:三个概念的含义和基本关系本关系8/1/202469统计学专业必修课3学分估计量方差估计量方差(V:Variance) 抽样误差的测度指标抽样误差的测度指标n样本统计量作为目标量的估计量,是一个随机变量样本统计量作为目标量的估计量,是一个随机变量n某个某个样本的估计值与总体待估参数间存在着差异样本的估计值与总体待估参数间存在着差异离差,离差,这是个别样本的抽样误差这是个别样本的抽样误差n但是,个别样本的抽样误差不能代表某一个抽样方案的优但是,个别样本的抽样误

70、差不能代表某一个抽样方案的优劣劣n一个抽样方案的优劣要用一个抽样方案的优劣要用所有可能样本所有可能样本的平均离差来衡量,的平均离差来衡量,这就是抽样误差这就是抽样误差n在无偏估计量的前提下用估计量方差在无偏估计量的前提下用估计量方差来表征,它从平均意义上说明估计值与来表征,它从平均意义上说明估计值与待估参数的差异状况待估参数的差异状况8/1/202470统计学专业必修课3学分抽样方案选择抽样方案选择1无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏离散度相同离散度相同但但2是无偏估计是无偏估计8/1/202471统计学专业必修课3学分抽样方案选择抽样方案选择2都无偏都无偏但但1比比2离散度更小

71、离散度更小8/1/202472统计学专业必修课3学分抽样方案选择抽样方案选择32 2无偏但离无偏但离无偏但离无偏但离散度更大散度更大散度更大散度更大1 1有偏但有偏但有偏但有偏但更集中更集中更集中更集中8/1/202473统计学专业必修课3学分举例举例n将每个抽样方案的结果比喻成一次打靶的结果将每个抽样方案的结果比喻成一次打靶的结果n四个图分别表示四个射手的打靶情况,可以比四个图分别表示四个射手的打靶情况,可以比喻成四种抽样方案;红色靶心代表总体真值喻成四种抽样方案;红色靶心代表总体真值n每个点代表某抽样方案下某一个样本的估计值每个点代表某抽样方案下某一个样本的估计值8/1/202474统计学

72、专业必修课3学分n:着弹点均匀分布在靶心周围,而且比较密集:着弹点均匀分布在靶心周围,而且比较密集 无系统性偏差,而且抽样误差较小,是比较理想的抽样方案无系统性偏差,而且抽样误差较小,是比较理想的抽样方案n:着弹点均匀分布在靶心周围,但较分散:着弹点均匀分布在靶心周围,但较分散 虽然也没有系统性偏差,但比较分散说明抽样误差较大虽然也没有系统性偏差,但比较分散说明抽样误差较大n、:都偏向一侧;:都偏向一侧;的着弹点分布比较密集,而的着弹点分布比较密集,而着弹点分散着弹点分散 虽然有系统偏差,但抽样标准误还比较小;而虽然有系统偏差,但抽样标准误还比较小;而不仅有系统偏差,不仅有系统偏差,而且抽样标

73、准误较大而且抽样标准误较大n结论:纯粹从技术水平的角度讲,结论:纯粹从技术水平的角度讲,和和水平相当,水平相当,和和 水平相当;水平相当;但但、的枪或者眼睛出了问题,或者当时有偏于一侧的风向的枪或者眼睛出了问题,或者当时有偏于一侧的风向n问题:相互比较时,如何选择最佳方案呢?问题:相互比较时,如何选择最佳方案呢?n和和,和和 , 和和8/1/202475统计学专业必修课3学分偏差偏差(B:Bias)n按某一抽样方案进按某一抽样方案进行反复抽样,其行反复抽样,其所所有可能样本有可能样本估计值估计值 的均值的均值(即数学期即数学期望望)与总体真值与总体真值 之之间的离差即偏差间的离差即偏差即非抽即

74、非抽样误差样误差无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏8/1/202476统计学专业必修课3学分均方误差均方误差(MSE:Mean Square Error)n为了推断总体真值,在没有偏差的情况下,用样本统为了推断总体真值,在没有偏差的情况下,用样本统计量对目标量进行估计,要求估计量的抽样标准误越计量对目标量进行估计,要求估计量的抽样标准误越小越好,也就是估计量的方差越小越好小越好,也就是估计量的方差越小越好n如果存在偏差,单纯追求抽样误差越小越好就不合理如果存在偏差,单纯追求抽样误差越小越好就不合理了了n上例中的上例中的、号靶,号靶,没有偏差但抽样标准误比较没有偏差但抽样标准误比较

75、大,大,抽样标准误比较小但有偏差。究竟哪一个更好抽样标准误比较小但有偏差。究竟哪一个更好呢?呢?n所以,需要同时测量抽样误差和偏差。这就提出了所以,需要同时测量抽样误差和偏差。这就提出了“均方误差均方误差”这一概念这一概念8/1/202477统计学专业必修课3学分MSE的定义的定义nMSE指指所有可能所有可能样本样本的估计值的估计值 与总与总体真值体真值 之间离差平之间离差平方的均值方的均值MSE与估计量方差的形与估计量方差的形式有什么不同?式有什么不同?8/1/202478统计学专业必修课3学分MSE与抽样方差与抽样方差V和偏差和偏差B的关系的关系n结论:结论:MSE=V+B2交叉项为交叉项

76、为0n如果如果B为零,即估计量为无偏估计量,其均方误差即为零,即估计量为无偏估计量,其均方误差即估计量方差估计量方差 8/1/202479统计学专业必修课3学分MSE与与V和和B的关系的关系nMSE=V+B28/1/202480统计学专业必修课3学分偏差与抽样误差对应偏差与抽样误差对应所属的误差种类不同所属的误差种类不同n偏差是偏于某一方向的带有系统性的误差偏差是偏于某一方向的带有系统性的误差n而抽样误差是一种随机误差,是偶然性的代表性误而抽样误差是一种随机误差,是偶然性的代表性误差,没有系统性差,没有系统性误差大小与样本容量的关系不同误差大小与样本容量的关系不同n抽样误差随样本容量的增加而减

77、少抽样误差随样本容量的增加而减少n而大多数的偏差并不随着样本容量的增大而减小,而大多数的偏差并不随着样本容量的增大而减小,有时甚至随有时甚至随n增大而增大增大而增大8/1/202481统计学专业必修课3学分偏差产生的原因偏差产生的原因n(1)估计量本身有偏(系统性的代表性误差)估计量本身有偏(系统性的代表性误差)n这时,估计量的数学期望与总体参数不一致这时,估计量的数学期望与总体参数不一致n(2)非抽样误差因素的影响(工作性误差)非抽样误差因素的影响(工作性误差)n抽样框误差抽样框误差n无回答误差无回答误差n计量误差计量误差n所以,偏差即非抽样误差所以,偏差即非抽样误差8/1/202482统计

78、学专业必修课3学分抽样中的误差构成抽样中的误差构成重点理解重点理解8/1/202483统计学专业必修课3学分调查中的误差来源调查中的误差来源调查中的调查中的误差按产误差按产生的原因生的原因来分来分工作工作性误差性误差(登记登记性误差性误差)代表性误差代表性误差偶然性的偶然性的代表性误差代表性误差系统性的系统性的代表性误差代表性误差是调查登记、汇是调查登记、汇总计算中的总计算中的差错差错无法计算,无法计算,可采可采取措施尽量避免取措施尽量避免抽样误差抽样误差。随机。随机抽样特有的,不抽样特有的,不是差错,不可避是差错,不可避免,但可以计算免,但可以计算并控制并控制违反随机原违反随机原则抽样导致则

79、抽样导致的,可以尽的,可以尽可能地避免可能地避免样本不足以代样本不足以代表总体而产生表总体而产生的误差的误差非抽样非抽样误差误差8/1/202484统计学专业必修课3学分1、抽样误差、抽样误差n抽样的随机性抽样的随机性引起的,不可避免引起的,不可避免(无法消除无法消除),但是,但是可以计量并加以控制可以计量并加以控制n计量指标或表现形式有:估计量方差、抽样标准误计量指标或表现形式有:估计量方差、抽样标准误(抽样平均误差抽样平均误差)、抽样极限误差等、抽样极限误差等n主要的控制办法:主要的控制办法:增大样本容量增大样本容量n理由:抽样标准误差与样本容量的平方根大致呈理由:抽样标准误差与样本容量的

80、平方根大致呈反比关系反比关系8/1/202485统计学专业必修课3学分2非抽样误差非抽样误差n相对于抽样误差而言的,非抽样误差相对于抽样误差而言的,非抽样误差不是由于抽样的不是由于抽样的随机性随机性引起的引起的n按非抽样误差的来源划分为:抽样框误差、无回答误按非抽样误差的来源划分为:抽样框误差、无回答误差、计量误差等差、计量误差等n一般不能通过增大一般不能通过增大n的方式减少非抽样误差,有时增大的方式减少非抽样误差,有时增大n反而会增大非抽样误差反而会增大非抽样误差2结束结束8/1/202486统计学专业必修课3学分3 样本设计样本设计l一、样本设计的内容一、样本设计的内容l二、样本设计的原则

81、二、样本设计的原则l三、样本设计效果的测定三、样本设计效果的测定8/1/202487统计学专业必修课3学分一、样本设计的内容一、样本设计的内容n样本设计是样本设计是抽样方案设计的核心抽样方案设计的核心部分部分n样本设计是围绕抽样目的,对样本设计是围绕抽样目的,对抽样方式、方法抽样方式、方法和和估计估计量选择量选择所作的系统安排,即样本设计要规定:所作的系统安排,即样本设计要规定:n入样单元的产生方式和途径入样单元的产生方式和途径nn的大小的大小n围绕总体要做出怎样的估计等围绕总体要做出怎样的估计等n样本设计的内容:样本设计的内容:n如何选样如何选样n如何估计如何估计8/1/202488统计学专

82、业必修课3学分二、样本设计的原则二、样本设计的原则n1、保证抽样的、保证抽样的目的性目的性原则原则n2、保证实现抽样的、保证实现抽样的随机性随机性原则原则n3、保证实现抽样的、保证实现抽样的最大效果最大效果原则原则n4、保证实现抽样的、保证实现抽样的可计量性可计量性原则,即样本资料能够量原则,即样本资料能够量化,估计效果能够衡量化,估计效果能够衡量8/1/202489统计学专业必修课3学分最大效果原则最大效果原则n抽样的最大效果就是对总体做出最好的估计。怎样算抽样的最大效果就是对总体做出最好的估计。怎样算是最好?这要从抽样费用与估计精度的关系中来理解是最好?这要从抽样费用与估计精度的关系中来理

83、解n一个好的抽样方案应该兼顾精度和费用;同时,精度一个好的抽样方案应该兼顾精度和费用;同时,精度和费用也是评价一个抽样设计方案优劣的准则和费用也是评价一个抽样设计方案优劣的准则n所以,最优设计就是所以,最优设计就是:n在核定的总费用内达到最高的精度在核定的总费用内达到最高的精度n或者在达到精度要求的前提下使总费用最少或者在达到精度要求的前提下使总费用最少n或者在精度和费用之间找到一个可以接受的平衡点或者在精度和费用之间找到一个可以接受的平衡点n注意:精度并非越高越好,对不同的研究对象,精度注意:精度并非越高越好,对不同的研究对象,精度的要求也会有所不同的要求也会有所不同n比如,产品检验的抽样方

84、案的精度要求;调查电视比如,产品检验的抽样方案的精度要求;调查电视节目收视率的精度要求节目收视率的精度要求8/1/202490统计学专业必修课3学分图图 费用与精度关系示意图费用与精度关系示意图20%50%95%50%100%100%0精度精度费用费用8/1/202491统计学专业必修课3学分三、样本设计效果的测定三、样本设计效果的测定 Deff因子因子(Design effect)nLKish提出的提出的n目的:比较不同抽样方目的:比较不同抽样方案的效率案的效率n前提条件:前提条件:n相同相同的两个的两个抽样方案间的效率比较抽样方案间的效率比较n定义式:定义式:n扩展式:扩展式:n分母:分母

85、:worsrs简单估计简单估计量的方差量的方差n分子:某抽样设计同分子:某抽样设计同n条条件下的估计量方差件下的估计量方差8/1/202492统计学专业必修课3学分举例:举例:wrsrs不如不如worsrs抽样效率高抽样效率高=8/1/202493统计学专业必修课3学分Deff因子的作用因子的作用1、考察抽样效率、考察抽样效率n若若deff1,则设计方案比作为对比基准的方案抽样,则设计方案比作为对比基准的方案抽样效率低效率低2、确定复杂抽样方式的样本量、确定复杂抽样方式的样本量nSrs的的n比较容易获得,如果有复杂抽样的比较容易获得,如果有复杂抽样的deff因子因子的经验数据,则的经验数据,则

86、3结束结束8/1/202494统计学专业必修课3学分作业作业n思考并讨论思考并讨论P39,2.1-2.8n其他:其他:n1、如何来判断一个抽样方案是概率抽样还是非概率抽、如何来判断一个抽样方案是概率抽样还是非概率抽样?样?n2、怎样算是一个合理有效的抽样框?、怎样算是一个合理有效的抽样框?n3、对抽样调查程序各基本环节的理解。、对抽样调查程序各基本环节的理解。n4、什么是均方误差?它有什么作用?与估计量方差、什么是均方误差?它有什么作用?与估计量方差、偏差是什么关系?偏差是什么关系?n5、复习以往所学的各种抽样组织方式,比如分层抽样、复习以往所学的各种抽样组织方式,比如分层抽样、等距抽样、整群

87、抽样、多阶段抽样等等距抽样、整群抽样、多阶段抽样等n6、大数定律、中心极限定理、抽样分布定理的复习、大数定律、中心极限定理、抽样分布定理的复习CH1/2结束结束8/1/202495统计学专业必修课3学分参考内容参考内容几种基本抽样组织方式的做法及优缺点几种基本抽样组织方式的做法及优缺点8/1/202496统计学专业必修课3学分几种基本的抽样方法几种基本的抽样方法n简单随机抽样简单随机抽样(srs: simple random sampling)n分层抽样分层抽样(st: stratified sampling)n整群抽样整群抽样(cl: cluster sampling)n系统抽样系统抽样(s

88、y: systematic sampling)n多阶段抽样多阶段抽样(ms: multi-stage sampling)8/1/202497统计学专业必修课3学分简单随机抽样简单随机抽样/纯随机抽样纯随机抽样 (simple random sampling)1.从从总总体体N个个单单元元中中随随机机地地抽抽取取n个个构构成成样样本本,每每个个单单元元的的入样概率都是相等的入样概率都是相等的2.是最基本的抽样方法,也是其它抽样方法的基础是最基本的抽样方法,也是其它抽样方法的基础3.特点特点n适用于适用于均匀总体均匀总体n简单、直观,简单、直观,在抽样框完整时在抽样框完整时,可直接从中取样,可直接

89、从中取样n用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便4.局限性局限性n当当N很大时,不易构造抽样框很大时,不易构造抽样框n抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难n没有利用其它辅助信息以提高抽样、估计的效率没有利用其它辅助信息以提高抽样、估计的效率8/1/202498统计学专业必修课3学分分层抽样分层抽样/类型抽样类型抽样 (stratified sampling)1.将将抽抽样样单单元元按按某某种种特特征征或或某某种种规规则则划划分分为为不不同同的的层层,然然后后从从各各层层中中独独立立、随随机机地地抽抽取取样样本本单单元元2

90、.优点优点n能能保保证证样样本本的的结结构构与与总总体体的的结结构构比比较较相相近近,从而提高抽样估计的精度从而提高抽样估计的精度n方法灵活,组织便利方法灵活,组织便利n既既可可以以对对总总体体参参数数进进行行估估计计,也也可可以以对对各各层层的目标量进行估计的目标量进行估计子总体估计子总体估计8/1/202499统计学专业必修课3学分整群抽样整群抽样/集团抽样集团抽样 (cluster sampling)1.将将总总体体中中若若干干个个单单位位合合并并为为组组(群群),抽抽样样时时直直接接抽抽群,然后对中选群中所有单位全部实施调查群,然后对中选群中所有单位全部实施调查2.特点特点n抽样时只需

91、群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量n调调查查的的地地点点相相对对集集中中,节节省省调调查查费费用用,方方便便调调查的实施查的实施n对对于于某某些些特特殊殊结结构构的的群群体体效效果果较较好好,比比如如,对对性别比例、职称结构、职务构成等的调查性别比例、职称结构、职务构成等的调查n缺缺点点:估估计计的的精精度度较较差差(样样本本单单位位过过于于集集中中,抽样误差大抽样误差大)8/1/2024100统计学专业必修课3学分系统抽样系统抽样(systematic sampling)1.将将总总体体中中的的所所有有单单元元按按一一定定顺顺序序排排列列,在在规规定定的的范范围围内内

92、随随机机地地抽抽取取一一个个单单元元作作为为初初始始单单元元,然然后后按按事事先先规规定好的规则确定其它样本单位定好的规则确定其它样本单位n比比如如,等等距距抽抽样样(最最简简单单的的系系统统抽抽样样方方式式),先先从从数数字字1到到k之之间间随随机机抽抽取取一一个个数数字字r作作为为初初始始单单位位,以后依次取以后依次取r+k,r+2k等单位,等单位,k=N/n2.优优点点:操操作作简简便便,可可提提高高估估计计的的精精度度,所所以以在在抽抽样样调调查实践中有着广泛的用途查实践中有着广泛的用途3.缺点:对估计量方差的估计比较困难缺点:对估计量方差的估计比较困难8/1/2024101统计学专业

93、必修课3学分 多阶段抽样多阶段抽样/多级抽样多级抽样(Multi-stage sampling)n多多阶段抽段抽样指分两个或两个以上的指分两个或两个以上的阶段来完成抽取段来完成抽取样本本单位的位的过程程n比如,我国城市居民住比如,我国城市居民住户调查采用三或四采用三或四阶段抽段抽样n第一第一阶段:抽段:抽选调查城市城市n第二第二阶段:从抽中城市中抽段:从抽中城市中抽选居委会(或抽街道居委会(或抽街道办事事处再再抽居委会)抽居委会)n第三第三阶段:从抽中的基段:从抽中的基层单位中抽取位中抽取调查户n多多阶段抽段抽样可以根据需要和可能,将几种抽可以根据需要和可能,将几种抽样方式方式结合运用合运用n在在较大大规模的抽模的抽样调查中,多中,多阶段抽段抽样被被经常采用常采用8/1/2024102统计学专业必修课3学分

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号