Click to edit Master title style,,Click to edit Master text styles,,Second level,,Third level,,Fourth level,,Fifth level,,,,*,4.4,抽样市场调查,,4.4.1,抽样市场调查的特点,,是指调查者为了特定的调研目的,按照随机原则从调查总体中抽取一部分,,,(1),样本是按随机原则抽取的2),用样本数据推断总体的数量特征3),抽样误差不可避免,但可以计算和控制4.4.2,抽样市场调查的优缺点,,主要优点,:,,(1),调查方式的科学性误差可控、主观影响小2),调查费用的经济性调查工作量小、节省费用3),信息获取的时效性调查工作量小、节省时间4),调查结果的准确性科学的随机抽样能够保证推断的客观性主要缺点:抽样技术方案设计要求高,一般人员难以胜任如果抽样,,技术方案设计存在严重的缺陷,往往会导致抽样调查的失败1,,4.4.3,抽样市场调查的应用,,(1),不可能进行全面调查的现象,只能采用抽样调查如,,产品质量检验2),不必要进行全面调查的现象,采用抽样调查如消费,,者需求潜力测定等。
3),可作全面调查的现象,为调查费用,亦可采用抽样调,,查如企业员工满意度测评4),对全面调查资料的质量进行检查和修正5),对某些总体的假设进行抽样检验2,,4.4.4,抽样市场调查的基本范畴,1,.总体与样本,,总体是所要调查研究的现象的全体,它是由具有同质性和差异,,性的许多个别事物的集合体总体单位数通常用,N,表示样本是按,,随机原则从总体中抽出来的一部分单位的综合体,样本中包含的单,,位个数称为样本量,用,n,表示,,n,/,N,称为抽样比2,.参数与统计量,,参数是总体的数量特征,即总体指标参数在抽样时往往是未,,知的,是需要进行推断的参数通常有总体均值,.,总体标准,,差,.,总体比率,P,等统计量是样本的数量特征,即样本指标统计量随样本不同而,,不同,因而是一个随机变量统计量通常有样本均值,.,样本标准,,差,s,,样本比率,p,等3,,3,.抽样框与抽样单位,,抽样框是一个包括全部总体单位的框架,用来代表总体,以便从中抽取样,,本的一个框架抽样框可以是一览表(名单或名录),一本名册,一幅地图,,,一段时间等抽样单位是指样本抽取过程中的单位形式,亦即从抽样框中直接抽取的单,,位称为抽样单位,它可能是总体中的基本单位,也可能是总体中的基本单位的,,集合。
例如,欲调查某市大学的教学用品需求,则全市大学的集合为总体,抽样,,框是全市的大学名单总体单位是每一个大学,抽样单位可以是总体中的每一,,个大学,也可以是大学分类中的每一个大学4,.样本量与样本单位,,样本量是指样本的大小,即一个样本中包含的样本单位的多少样本量的,,大小,取决于抽样调查的精度要求,总体各单位的标志变异程度、抽样估计的,,可信程度,抽样方式方法等因素的制约样本单位是构成样本的基本单位、与总体单位的形式是一致的,样本单,,位可以直接从总体中抽取总体单位,亦可从抽样单位中产生4,,5,.总体分布、样本分布与抽样分布,,总体分布:总体各单位标志值的分布状况,又称总体结构;,,样本分布:样本中各样本单位标志值的分布状况,又称样本结,,构当样本量足够大时,样本分布趋于总体分布抽样分布:从总体中抽取的所有可能的样本的统计量构成的分,,布根据中心极限定量,当样本量足够大时,样本均值等统计量的,,分布趋近于正态分布,因而可用正态分布来作区间估计6,.重复抽样与不重复抽样,,从,N,个总体单位中抽取,n,个组成样本,有两种抽取方法1,)重复抽样,即每抽出一个单位进行登记后,放回去,混合,,均匀后,再抽下一个,直到抽满,n,个为止。
重复抽样有可能出现极,,大值或极小值组成的极端样本2,)不重复抽样,即每次抽出一个单位进行登记后,不再放回,,参加下一次抽取,依次下去,直到抽满,n,个为止不重复抽样可以,,避免极端样本出现,抽样误差比重复抽样小5,,7,.抽样误差与抽样标准误差,抽样误差是指在遵守随机原则条件下,样本指标与总体指标之间的差异,是,,一种偶然性的代表性误差,不包括系统性误差和非抽样误差抽样误差的大小通,,常受样本量大小、总体标准差、抽样方法、抽样方式四个因素的影响抽样误差的大小常用抽样标准误差来反映,而抽样标准误差是指所有可能的,,样本均值(或样本比率)与总体均值(或总体比率)的标准差,抽样标准误差的,,平方称为抽样方差依定义有:,,,,,,,,,,,,,,式中代表样本平均数的抽样标准误差,代表样本比率的抽样标准误差;,M,代表,,样本个数上述公式可用来解释抽样误差的实质,但不能实际应用,因为所有可,,能的样本个数太多,总体均值或总体比率是未知的,是需要推断的,同时,实际,,抽样时,往往只能抽取一个样本进行调查因此,抽样标准误差的计算需要寻求,,别的测定方法,将在以下各种抽样方式中介绍6,,8,.点估计与区间估计,,点估计也叫定值估计,当样本容量足够大时,可直接用样本均,,值代替总体均值,用样本比率代替总体比率,可据此计算有关总量,,指标,就是点估计。
区间估计是用一个取值区间及其出现的概率来估计总体参数,,,具体说,区间估计是用样本统计量和抽样标准误差来构造总体参数,,的取值范围,并用一定的概率来保证总体参数落在估计的区间内其概率称为置信概率,概率的保证程度称为可靠性或置信(,Z,),,,估计区间称为置信区间如,,总体均值:,,总体比率:,,其中:和又称为允许误差或极限误差,记作△,,称为估计的,,相对精度7,,,,9,.抽样方式与抽样方法,,(,1,)抽样方式是指抽样调查的组织方式,通常有简单随,,机抽样、分层抽样、系统抽样、整群抽样、目录抽样、多阶,,段抽样等等这些抽样调查的组织方式、抽样误差的计算和,,区间估计以下将分别介绍2,)抽样方法是指在抽样调查的组织方式既定的前提,,下,从总体的全部单位(个体)中抽取,n,个单位组成样本的方,,法通常有重复抽样与不重复抽样两种抽取方法,而重复抽,,样与不重复抽样的具体实施,又有不同的具体做法8,,4.4.5,抽样市场调查的组织方式,,1,简单随机抽样,,1,)简单随机抽样的概念,,是指从总体的全部单位中按随机原则直接抽取,n,个单位组成,,样本进行调查通常采用信手抽取法、抽签法、随机数表法、,,计算机随机函数法抽取样本。
简单随机抽样只适用于总体单位,,数不多,总体单位标志变异度较小的情形2,)简单随机抽样标准误差,,(,1,)样本平均数的抽样标准误差,,重复抽样,,不重复抽样,,(,2,)样本比率的抽样标准误差,,重复抽样,,不重复抽样,9,,,【,例,4.3】,某商场从某天的顾客中,不重复随机抽取,100,个顾客,,调查购买商品情况,其中有,5,个顾客未购买商品,(,未购率,5%),;顾客购,,买商品的样本平均数为,498,元,样本标准差为,144,元,要求用,95%,的概,,率(,Z=1.96,)估计顾客平均购买额和未购率的置信区间解:此题不知总体方差,因样本为大样本,可用样本方差代替顾客平均购买额的置信区间为,,498±1.96×14.4,即,[469.78, 526.22],元,,顾客未购率的置信区间为,,5%±1.96×2.2%,即,[0.69%,9.31%],10,,3,)简单随机抽样样本容量的确定,,一般来说,样本容量确定应考虑总体方差、抽样估计精度要求,,(允许误差的约束)和把握程度(置信概率)的大小、抽样方式方,,法、抽样调查费用约束等因素在不考虑抽样调查费用约束的条件,,下,样本容量的计算公式为:,,(,1,)总体均值估计所需的样本容量,,重复抽样,,不重复抽样,,(,2,)总体比率估计所需的样本容量,,重复抽样,,不重复抽样,11,,用以上公式计算样本容量时,应注意以下三点。
1,)抽样比例,n/N,较大时(大于,5%,)时,应采用不重复抽样公式计算必要的,,样本容量,否则无论采用重复抽样还是不重复抽样时,均可用重复抽样公式计算,,样本容量,n,,可简化计算,且误差很小2,)当总体方差,σ2,或总体比率,P,未知时,可用样本方差(或样本比率),或,,历史的类似的总体方差(或总体比率)代替计算总体比率所需的样本容量时,,,亦可直接用,P,(,1,-,P,)的最大值,0.25,代替3,)在同一抽样调查中,总体均值与总体比率推断要兼顾时,用以上公式计,,算的样本容量一般不相等,为了保证推断结果的精确度,应采用其中的较大的那,,个样本容量例,4.4】,某县某年城关镇共有居民家庭,1.86,万户,,,根据以往的资料,居民,,家庭人均可支配收入的标准差为,0.8,千元,,95%,的居民家庭拥有空调现采用抽样,,调查了解今年和明年居民家庭空调以旧换新的需求情况,,,若置信概率为,95%,,要,,求总体居民家庭今年人均可支配收入估计的抽样极限误差不超过,0.1,千元,空调,,拥有率估计的抽样极限误差不超过,3%,,求合适的样本容量解:,,,,,由于,n1,>,n2,,故合适的样本容量为,246,户。
12,,2,.分层抽样,,1,)分层抽样的意义,,是先将总体按有关的研究标志分组,然后在从每组中按随,,机原则抽取样本在每个组中抽取的调查单位的数目,可按,,相同的比例(,n/N,)抽取,也可按不同的比例抽取为了简便,,起见,通常都是按相同比例抽取,称做等比例分层抽样在分层抽样时,抽样误差只和层内方差有关,而与层间,,方差无关因此,只要能够扩大层间方差而缩小层内方差,,,就可以提高抽样效率2,) 分层抽样的抽样标准误差设 分别为样本各组的单位数、平均数、方差;,N,,为总体各组的单位数,在等比例分层抽样条件下,则有下列,,计算公式13,,总体平均数点估计,:,,,,层内方差平均数,,总体平均数的抽样标准误差,,重复抽样,:,,,,不重复抽样,:,,总体比率估计的抽样误差的计算只需用,( ),代替上述,,层内方差平均数公式中的 即可;而总体比率估计的公式为,14,,【,例,4.5】,某县某年共有乡镇,18,个,农民家庭,88,万户,按各乡镇收入高低可分,,为高收入乡镇、中收入乡镇、低收入三类,各类乡镇的农户数如表,4-2,,现从这,,三类中按等比例抽样,共抽取,500,户组成样本,样本各组的户均年收入、标准差,,等如表,4-2,,要求在,90%,的置信概率(,Z = 1.64,)下对全县户均年收入进行区间估,,计。
15,,【,例,4.6】,某广告公司从某市,310,万人中采用等比例分层抽样,,,调查居民收看某电视广告的收视率,有关资料整理如表,4—3,要求,,在,95%,的置信概率下,估计居民收看某电视广告的收视率的置信区,,间16,,,3,)分层抽样的样本容量,,采用等比例分层抽样时,样本容量,n,的确定与简单随机抽样样,,本容量的确定公式基本相同(只需用层内方差的平均值替换总体方,,差即可)样本容量,n,确定之后,各层应抽取的样本单位数,ni,可采,,用等比例法进行分配,计算公式为,,,,【,例,4.7】,以例,4.6,的某县农民家庭户均年收入估计为例,若要,,求明年总体户均年收入的抽样标准误差不超过,6,百元,/,户,概率保证,,程度,95%,,则等比例分层抽样的样本容量为,17,,3,.等距抽样,,1,)等距抽样的概念,,等距抽样是将总体各单位按一定顺序排列,然后每隔,N/n,个总,,体单位抽取一个样本单位组成样本进行调查等距抽样能使样本十,,分均匀地分布在总体中,从而能增加样本的代表性,减少抽样误,,差,提高抽样效率2,)等距抽样的排序方法1,)按无关标志排队即总体单位排列的顺序与所要研究的标,,志是无关的。
又称无序系统抽样抽样误差比简单随机抽样小2,)按有关标志排队即总体单位排列的顺序与所要研究的标,,志是有直接关系的又称有序系统抽样,抽样误差比分层抽样小3,)等距抽样的方法1,)随机起点等距抽样 第一段随机抽,然后等距抽2,)半距起点等距随机抽样中点法抽取样本3,)随机起点对称等距抽样高低搭配称等抽取样本单位4,)循环等距抽样构建循环圆形,然后等距抽18,,4,)等距抽样标准误差的测定,,(,1,)无序系统抽样:采用简单不重复随机抽样的公式计算抽,,样标准差例,4.8】,已知某街区共有居民家庭,8 860,户,按登记名册每,,隔,10,户抽取,1,户,共抽取了,886,户,调查他们是否收看了某电视广,,告,调查结果已收看的有,685,户要求在,95%,的置信概率下,求收看,,率的置信区间解:,N,=8 860,n,=886,19,,(,2,)有序系统抽样:采用事后分层,利用等比类型抽样标准,,误差公式计算抽样标准误差例,4.9】,某大型超市某年,2,月份有,360,个小时的营业时间,现,,按时间顺序每隔,9,小时抽取,1,个小时,以测定,2,月份(春市期间)购,,物的顾客流量,其抽出,40,小时,每小时的顾客流量整理如下,5,组,,,要求在,95%,的置信率下估计每小时顾客流量的置信区间,.,。
解:本例每组单位,,,故,:,)相等,故,20,,,,,,,,,,,,5,)等距抽样样本容量的确定,,(,1,)无序系统抽样的样本容量采用简单随机抽样中的样本容,,量公式确定样本容量,n,2,)有序系统抽样的样本容量采用分层抽样的样本容量公式,,确定样本容量,n,但计算所需的平均组内方差应根据以往的资料作,,出估计21,,4.,整群抽样,1,)整群抽样的概念,,整群抽样是将总体按某一标志分组后形成的每个群视为单位进,,行随机抽样,然后对抽中的每个群体进行全面调查整群抽样的特,,点是先分群,后抽群作为样本单位,在抽中的群内实行全面调查,,,不再从中抽样2,)整群抽样标准误差的测定,,由于整群抽样对群内的总体单位实行全面调查,因而群内方差,,并不引起抽样误差,因而计算整群抽样误差,只需以群间方差代替,,总体方差,当总体的群间方差未知时,可用样本群间方差代替设总体共分为,R,群,每群内有,M,个总体单位(每群,M,相等称为群抽,,样,不等则称为不等群抽样),样本容量为,r,群,各群平均数为,,为群间方差,则有下列计算公式22,,,,,,,,,,,,,,如果为等群抽样,,m,1=,m,2=,m,3…,,则以上公式中的,mi,可略去,有,,关公式的母项则为,r,。
23,,【,例,4.10】,某乡某年从,18,个行政村中,用整群抽样抽取,3,个,,村,调查农民家庭电风扇拥有量情况,调查资料如下,要求在,,95.4%,的概率下估计户均电风扇拥有量的置信区间(全乡共,5480,,户)24,,3,)整群抽样的样本容量确定由于整群抽样一般是不重复抽样,故应按不重复抽样计算必要,,的抽样群数,r,由整群抽样的极限误差 和抽样标准公式可导出,:,,,,其中 为群间方差,可根据以往的资料确定例,4.11】,某乡从,720,个行政村,拟抽取若干个行政村调查农,,民家庭彩电的普及率,根据以往的资料测算,农民家庭彩电普及率,,的群间方差为,6%,,要求抽样平均误差不超过,3.98%,,置信概率为,,95.44%,,求整群抽样样本容量,r,25,,5,.目录抽样,,1,)目录抽样的概念,,目录抽样通常用于企业调查,首先编制一份企业目录(抽样框),一般包,,括企业名称、从业人数、产值、产量、利润等以往的资料然后,考虑总体分,,布是否呈偏斜状态分布,如果呈极偏斜状态分布,则将其中的大型企业单列出,,来作全面调查,对剩余的为数众多的小型企业则实行抽样调查目录抽样是全面调查与抽样调查的有机结合。
这种方法,可以减少抽样误,,差,提高抽样估计的精确度2,)目录抽样的参数估计,,目录抽样的参数估计通常是对总体的某一总量指标作出推断,设,Y,为总体,,的总量指标,它可以分解为如下两部分Y,=,Y,1+,Y,2,,其中:,Y,1,是全面调查部分,可用汇总统计的方法求得其值Y,2,是抽样部,,分,是需要利用抽样资料估计的设,N,2,为抽样部分的单位数,,n,2,为样本容量,,,x,i,为各样本单位的观察值,则,,,,,在抽样部分中,其抽样标准误差的测定应视抽样方式而定26,,,【,例,4.12】,某市某年有,100,家工业企业,其中,10,家为大中型企,,业,,90,家为小型企业某月对,10,家大中型企业的工业增加值进行全,,面调查,汇总得,10,家企业的工业增加值为,9880,元,另从,90,家小型企,,业中简单随机抽取,12,家进行抽样调查,这,12,家企业的平均增加值为,,32,万元,标准差为,1.8,万元要求在,95%,的概率下估计该月全市的工,,业增加值解:全县工业增加值点估计:,9880+32×90=12760,(万元),,小企业增加值的抽样标准差:,=43.78,万元,,小企业增加值区间估计:,32×90±1.96×43.78,即,,[2794.2,2965.8],万元,,全县工业增加值区间估计:,[2 794.2+9 880,;,2 965.8+9,,880],,即在,95%,的把握程度下,全县工业增加值介于,12 674.2,万元,,至,12 845.8,万元之间,点估计为,12 760,万元。
27,,6,.二阶段抽样,,,1,) 二阶段抽样的概念,,二阶段抽样又称二级随机抽样,就是在抽取样本时分两个阶段,,来进行,第一阶段是从总体中用随机抽样的方法抽取若干个群体,,,称为初级单位然后在第二阶段从这些初级单位中又随机抽取若干,,个样本单位,称为基本单位或最终单位,最后根据所抽的基本单位,,组成的样本进行调查,用取得的样本资料来推断总体如果在二阶段抽样之后,又继续在被抽中的二阶单位中进行第,,三次、第四次随机抽样,就形成了三阶抽样、四阶抽样二阶和二,,阶以上的抽样都叫做多阶抽样例如,农产品产量调查中,由省抽,,县,由中选的县抽乡,由中选的乡抽村,由中选的村抽地块,就是,,采用多阶段抽样多阶段抽样有利于大规模大范围的抽样调查的组织与实施,能,,在一定程度上满足各级管理部门对调查资料的需求,有利于减少抽,,样误差,提高抽样估计的精确度因而,在实际工作中应用较多,,,如人口、农产品、城镇居民、农村住户等调查都可采用这一方法28,,2,)二阶段抽样标准误差的测定,,二阶段抽样误差的测定需要考虑两个部分的抽样误差,一部分,,是初级单位,(,群,),之间的差异 (群间方差)和抽取的初级单位的抽,,样数目,r,所决定的抽样误差;第二部分是第二阶段抽样的基本单位,,之间的平均群内方差 和全部基本单位,n,所决定的抽样误差。
由,,于一般采用不重复抽样,故二阶段抽样标准误差测定的基本公式为,,,,,其中:,R,为总体的群数,,r,为抽选的群数;,,,M,为总体各群相等的单位数,;,,,m,为中选群中抽选的单位数,(,假定亦相等,);,,,n,为全部基本单位,,n,=,rm,29,,【,例,4.13】,某省某年有,100,个县,每县有,200,个村,各村的大小,,基本相同现用两阶段抽样估计粮食平均亩产,第一阶段抽取了,,A,、,B,、,C,、,D,共,4,个县,第二阶段从中选县又抽取,5,个村(,1,,,2,,,3,,,,4,,,5,),一共为,20,个样本村调查资料整理如表,12-5,,要求在,95%,,的置信概率下估计全省粮食平均亩产量及置信区间,30,,,,,,,,,需要指出的是,以上抽样平均误差的测定是假定各群、各单位规模大小相,,同,但在实际抽样中,各群和各单位的规模大小是不相同的,因此,总体均值的,,估计、各阶段抽样方差的估计、以及抽样标准误差的计算等均应考虑用以加权的,,方法进行计算计算公式如下,:,31,,【,例,4.14】,某县某年有,200,个村,,16.2,万个农户,各村农户数目不同,现采,,用二阶段抽样估计全县农户生猪的存栏量。
第一阶段从,200,个村中抽取了,A,、,,B,、,C,、,D,、,E,共,5,个村,第二阶段又从中选村按农户(,Mi,)的多少再抽取,10%,作为,,抽样单位(,mi,)有关资料整理如表,12-6,,要求在,95%,的置信概率下估计全县,,农户平均生猪存栏量和生猪总存栏量32,,33,,。