《四章节抽样分布与参数估计》由会员分享,可在线阅读,更多相关《四章节抽样分布与参数估计(98页珍藏版)》请在金锄头文库上搜索。
1、第四章第四章 抽样分布与参数估计抽样分布与参数估计n第一节第一节 频率、概率与概率分布频率、概率与概率分布n第二节第二节 抽样分布抽样分布n第三节第三节 总体参数估计总体参数估计n第四节第四节 抽样设计抽样设计1第一节第一节 频率、概率与概率分布频率、概率与概率分布n一、随机事件与概率一、随机事件与概率n(一)随机试验与事件(一)随机试验与事件n随机现象的特点是:在条件不变的情况下,一系列随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。对随机现象的试验测前不能预见何种结果将出现。对随
2、机现象的试验或观测称为随机试验,它必须满足以下的性质:或观测称为随机试验,它必须满足以下的性质:n(1)每次试验的可能结果不是唯一的;)每次试验的可能结果不是唯一的;n(2)每次试验之前不能确定何种结果会出现;)每次试验之前不能确定何种结果会出现;n(3)试验可在相同条件下重复进行。)试验可在相同条件下重复进行。2n在随机试验中,可能出现也可能不出现的结在随机试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。试验的结果,称之为随机事件,简称事件。试验的结果可能是一个简单事件,也可能是一个复杂果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件,事件。简单事件就
3、是不可以再分解的事件,又称为基本事件。复杂事件是由简单事件组又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点,合而成的事件。基本事件还可称为样本点,设试验有设试验有n个基本事件,分别记为个基本事件,分别记为 (i=1,2,,n)。集合。集合=1 ,2 , ,n称称为样本空间,为样本空间,中的元素就是样本点。中的元素就是样本点。3n例:投掷一粒均匀的六面体骰子,出现的点例:投掷一粒均匀的六面体骰子,出现的点数有可能是数有可能是1、2、3、4、5、6共六种。这六共六种。这六种结果是基本结果,不可以再分解成更简单种结果是基本结果,不可以再分解成更简单的结果了,所以的结果了,
4、所以=1,2,3,4,5,6为该为该试验的样本空间。试验的样本空间。“出现点数是奇数出现点数是奇数”这一这一事件就不是简单事件,它是由基本事件事件就不是简单事件,它是由基本事件1,3和和5组合而成的。我们通常用大写字母组合而成的。我们通常用大写字母A,B,C,来表示随机事件,例如,设来表示随机事件,例如,设A表表示示“出现点数是奇数出现点数是奇数”,则,则A=1,3,5;设;设B表示表示“出现点数是偶数出现点数是偶数”,则,则B=2,4,6。4n(二)概率(二)概率n1. 概率的定义概率的定义n概率就是指随机事件发生的可能性,或称为机率,概率就是指随机事件发生的可能性,或称为机率,是对随机事件
5、发生可能性的度量。是对随机事件发生可能性的度量。 进行进行n次重复试次重复试验,随机事件验,随机事件A发生的次数是发生的次数是m次,发生的频率是次,发生的频率是m/n,当试验的次数,当试验的次数n很大时,如果频率在某一数值很大时,如果频率在某一数值p附近摆动,而且随着试验次数附近摆动,而且随着试验次数n的不断增加,频率的不断增加,频率的摆动幅度越来越小,则称的摆动幅度越来越小,则称p为事件为事件A发生的概率,发生的概率,记为:记为:P(A)=p。在古典概型场合。在古典概型场合, 即基本事件发生即基本事件发生的概率都一样的场合的概率都一样的场合:5n例:设一个袋子中装有白球例:设一个袋子中装有白
6、球2个,黑球个,黑球3个。个。(1) 从中随机摸出从中随机摸出1只球,问刚好是白球的概只球,问刚好是白球的概率有多大?率有多大? (2) 从中随机摸出从中随机摸出2只球,一问只球,一问2只球都是白球的概率有多大只球都是白球的概率有多大? 二问二问2只球一白只球一白一黑的概率有多大一黑的概率有多大? 三问三问2只球都是黑球的概只球都是黑球的概率有多大率有多大? n 解:解:(1) 由于摸出的任何由于摸出的任何1只球都形成一个基只球都形成一个基本事件,所以样本点总数为本事件,所以样本点总数为n=5。用。用A表示摸表示摸出的是白球事件,则出的是白球事件,则A由两个基本点组成,即由两个基本点组成,即A
7、=白球,白球白球,白球,有利场合数,有利场合数m=2。因此,。因此,刚好摸出白球的概率为刚好摸出白球的概率为P(A)=m/n=2/5=0.46n (2) 由于摸出由于摸出2只球才成一个基本事件,所以只球才成一个基本事件,所以样本点总数为样本点总数为 故故nP(A)=P(2只球都是白球只球都是白球)=1/ =1/10nP(B)=P(2只球一白一黑只球一白一黑)=23/10=6/10nP(C)=P(2只球都是黑球只球都是黑球)=3/10nNOTE: P(A+B+C)=17n2. 概率的基本性质概率的基本性质n性质性质1 1P(A)0。n性质性质2 P()=1。n性质性质3 若事件若事件A与事件与事
8、件B互不相容,即互不相容,即AB=,则则P(AB)=P(A)+P(B)。 n推论推论1 不可能事件的概率为不可能事件的概率为0,即:,即:P()=0。n推论推论2 P( )=1-P(A), 表示表示A的对立事件,即的对立事件,即它们二者必有一事件发生但又不能同时发生。它们二者必有一事件发生但又不能同时发生。8n例:袋中装有例:袋中装有4只黑球和只黑球和1只白球,每次从袋中随机只白球,每次从袋中随机地摸出地摸出1只球,并换入只球,并换入1只黑球。连续进行,问第三只黑球。连续进行,问第三次摸到黑球的概率是多少?次摸到黑球的概率是多少? n 解解: 记记A为为“第三次摸到黑球第三次摸到黑球”,则,则
9、 为为“第三次第三次摸到白球摸到白球”。先计算。先计算P( )。n由于袋中只有由于袋中只有1只白球,如果某一次摸到了白球,换只白球,如果某一次摸到了白球,换入了黑球,则袋中只有黑球了。所以相当于第一、入了黑球,则袋中只有黑球了。所以相当于第一、第二次都是摸到黑球,第三次摸到白球。注意这是第二次都是摸到黑球,第三次摸到白球。注意这是一种有放回的摸球,样本点总数为一种有放回的摸球,样本点总数为53,有利场合数,有利场合数是是421。故:。故: P( )= ,n 所以所以 9n3. 事件的独立性事件的独立性n定义定义 对事件对事件A与与B,若,若p(AB)=p(B)p(A),则称它们,则称它们是统计
10、独立的,简称相互独立。是统计独立的,简称相互独立。n例:已知袋中有例:已知袋中有6只红球只红球, 4只白球。从袋中有放回地只白球。从袋中有放回地取两次球取两次球,每次都取每次都取1球。设球。设 表示第表示第i次取到红球。次取到红球。那么,那么,n因此,因此, ,也就是说,也就是说,B1,B2相互独立。从题目条件看,这一结论是显然的。相互独立。从题目条件看,这一结论是显然的。10二、随机变量二、随机变量n随机变量随机变量X是定义在样本空间是定义在样本空间 =1,2,n上上的一个函数,这个函数的取值随试验的结果不同而的一个函数,这个函数的取值随试验的结果不同而变化。这个函数还要求满足条件:对任意的
11、实数变化。这个函数还要求满足条件:对任意的实数x,Xx是随机事件。如果随机变量所有可能的取值是是随机事件。如果随机变量所有可能的取值是有限的,或可排成一列的,这种随机变量称为离散有限的,或可排成一列的,这种随机变量称为离散型随机变量;另一种情况是随机变量的取值范围是型随机变量;另一种情况是随机变量的取值范围是一个区间或整个数轴,这种随机变量称为连续型随一个区间或整个数轴,这种随机变量称为连续型随机变量。机变量。n1. 离散型随机变量的概率分布离散型随机变量的概率分布 n设离散型随机变量设离散型随机变量X的所有可能取值为的所有可能取值为x1, x2,, xn, ,相应的概率为,相应的概率为p(x
12、1),p(x2),p(xn),。用。用表格统一表示出来是:表格统一表示出来是:11X x1 x2 xn P p(x1) p(x2) p(xn) n这称为离散型随机变量这称为离散型随机变量X的概率分布。的概率分布。n性质:性质:(1) 0p(xi)1 (i=1,2, );n(2) n定义定义: 离散型随机变量离散型随机变量X的期望值为的期望值为 n n性质:性质:n其中其中X1,X2都是随机变量,都是随机变量,是任意常数。是任意常数。 12n定义定义: 离散型随机变量离散型随机变量X的方差为的方差为n方差的平方根方差的平方根称为标准差。称为标准差。n方差方差2或标准差或标准差反映随机变量反映随机
13、变量X相对其期望相对其期望值的值的n离散程度,离散程度,2或或越小越小, 说明期望值的代表性说明期望值的代表性越好;越好;2或或越大,说明期望值的代表性越差。越大,说明期望值的代表性越差。n性质:对于任意的性质:对于任意的,D(X)=2 D(X) 成立成立13n贝努里试验贝努里试验 与二项分布与二项分布n有时我们只对试验中某事件有时我们只对试验中某事件A是否出现感兴趣,如果是否出现感兴趣,如果A发生,我们称发生,我们称“成功成功”,否则称,否则称“失败失败”。像这样。像这样只有两种结果的试验称为贝努里试验。设只有两种结果的试验称为贝努里试验。设A出现的概出现的概率为率为p,我们独立地重复进行,
14、我们独立地重复进行n次贝努里试验,称为次贝努里试验,称为n重贝努里试验重贝努里试验.以以Bk表示表示n重贝努里试验中事件重贝努里试验中事件A正正好出现好出现k次这一事件,则次这一事件,则 (k=0,1,2,,n) n该分布称为二项分布该分布称为二项分布( q= 1- p ).nNOTE: 14n2. 连续型随机变量的概率分布连续型随机变量的概率分布 n设设X是是R.V., x 是一实数是一实数. 记记nF(x)=P(Xx)。该函数就是随机变量。该函数就是随机变量X的分布的分布函数。分布函数的导数称为密度函数,记作函数。分布函数的导数称为密度函数,记作p(x )。n 性质性质 n(1) p(x)
15、0n(2) n(3) a bxP(axb)15n定义定义: 连续型随机变量连续型随机变量X的期望值为的期望值为 n 方差为方差为 n 性质性质: D(X)=2 D(X) 16n正态分布正态分布 n如果连续型随机变量如果连续型随机变量X的密度函数为的密度函数为 n则称随机变量则称随机变量X服从均值为服从均值为,方差为,方差为2的正态分布,的正态分布,记为记为XN(,2)。 n如果一个正态分布的如果一个正态分布的=0,=1,则称该正态布为标,则称该正态布为标准正态分布,相应的随机变量称为标准正态随机变准正态分布,相应的随机变量称为标准正态随机变量,用量,用Z表示,即表示,即ZN(0,1),相应的分
16、布密度函数,相应的分布密度函数为为17n一般正态分布一般正态分布 与标准正态分布与标准正态分布 的关系的关系:n若随机变量若随机变量X服从正态分布服从正态分布N (,2),则随,则随机机n变量变量 Z = 服从标准正态分布,即服从标准正态分布,即ZN(0,1)。18n例:某大学英语考试成绩服从正态分布,已知平均成绩为例:某大学英语考试成绩服从正态分布,已知平均成绩为70分,标准差为分,标准差为10分。求该大学英语成绩在分。求该大学英语成绩在6075分的概率。分的概率。19第二节第二节 抽样分布抽样分布n一、抽样的基本概念一、抽样的基本概念n二、抽样分布二、抽样分布n(一)重复抽样分布(一)重复
17、抽样分布n(二)不重复抽样分布(二)不重复抽样分布n三、大数定理与中心极限定理三、大数定理与中心极限定理20一、抽样的基本概念一、抽样的基本概念n抽样涉及的基本概念有:抽样涉及的基本概念有:n总体与样本总体与样本(见第一章见第一章)n样本容量与样本个数样本容量与样本个数n总体参数与样本统计量总体参数与样本统计量n重复抽样与不重复抽样重复抽样与不重复抽样n这些概念是统计学特有的,体现了统计学的这些概念是统计学特有的,体现了统计学的基本思想与方法。基本思想与方法。21总体和样本(参见第总体和样本(参见第1章)章)n1.总体:又称全及总体、母体,指所要研究对总体:又称全及总体、母体,指所要研究对象的
18、全体,由许多客观存在的具有某种共同象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用性质的单位构成。总体单位数用 N 表示。表示。n2.样本:又称子样,来自总体,是从总体中按样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构随机原则抽选出来的部分,由抽选的单位构成。样本单位数用成。样本单位数用 n 表示。表示。n3.总体是唯一的、确定的,而样本是不确定的、总体是唯一的、确定的,而样本是不确定的、可变的、随机的。可变的、随机的。 22样本容量与样本个数样本容量与样本个数n样本容量:一个样本中所包含的单位数,用样本容量:一个样本中所包含的单位数,用n表示。
19、表示。n样本个数:又称样本可能数目,指从一个总样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。对于有限总体中所可能抽取的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多体,样本个数可以计算出来。样本个数的多少与抽样方法有关。少与抽样方法有关。(这个概念只是对有限总这个概念只是对有限总体有意义,对无限总体没有意义!体有意义,对无限总体没有意义!)23总体参数和样本统计量总体参数和样本统计量n总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。n样本统计量:根据样本分布计算的指标。是随机变量。样本统计量:
20、根据样本分布计算的指标。是随机变量。平均数平均数标准差、方差标准差、方差成数成数参数参数 、 2p统计量统计量S、 S2P 总体总体 样本样本24重复重复(置置)抽样与不重复抽样与不重复(置置)抽样抽样n重置抽样与不重置抽样(各有重置抽样与不重置抽样(各有3个特点个特点P90)n重复抽样:例如从重复抽样:例如从A、B、C、D、E五个字母五个字母中随机抽取两个作为样本。中随机抽取两个作为样本。N=5,n=2n考虑顺序时:样本个数考虑顺序时:样本个数=Nn=52=25n不考虑顺序时:样本个数不考虑顺序时:样本个数=25重复重复(置置)抽样与不重复抽样与不重复(置置)抽样抽样n不重复抽样:不重复抽样
21、:n例如从例如从A、B、C、D、E五个字母中随机抽取两个作为样本。五个字母中随机抽取两个作为样本。N=5,n=2n考虑顺序时:样本个数考虑顺序时:样本个数n不考虑顺序时:样本个数不考虑顺序时:样本个数26二、抽样分布二、抽样分布n抽样分布的概念:由样本统计量的全部可能抽样分布的概念:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配取值和与之相应的概率(频率)组成的分配数列。(主要求出样本平均数的期望与方差)数列。(主要求出样本平均数的期望与方差)n包括以下内容包括以下内容n重置抽样分布重置抽样分布n样本平均数的分布样本平均数的分布n样本成数的分布样本成数的分布n不重置抽样分布不重置
22、抽样分布n样本平均数的分布样本平均数的分布n样本成数的分布样本成数的分布27重置抽样分布重置抽样分布-样本平均数的分布样本平均数的分布n某班组某班组5个工人的日工个工人的日工资为资为34、38、42、46、50元。元。n = 42n 2 = 32n现用重置抽样的方法从现用重置抽样的方法从5人中随机抽人中随机抽2个构成样个构成样本。共有本。共有52=25个样本。个样本。如右图。如右图。28n验证了以下两个结论:验证了以下两个结论:n抽样平均数的标准差反抽样平均数的标准差反映所有的样本平均数与映所有的样本平均数与总体平均数的平均误差,总体平均数的平均误差,称为抽样平均误差,用称为抽样平均误差,用
23、表示。表示。重置抽样分布重置抽样分布-样本平均数的分布样本平均数的分布29重置抽样分布重置抽样分布-样本平均数的分布样本平均数的分布n由概率论知,如果总体是正态分布的,则样由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布本平均数的抽样分布是如下正态分布n这是一个非常重要的结论,有广泛的应用。这是一个非常重要的结论,有广泛的应用。(请参见中心极限定理。)(请参见中心极限定理。)30重置抽样分布重置抽样分布-样本成数的分布样本成数的分布n总体成数总体成数p是指具有某种特征的单位在总体中的比重。成数是一个特殊平是指具有某种特征的单位在总体中的比重。成数是一个特殊平均数,设总体单
24、位总数目是均数,设总体单位总数目是N,总体中有该特征的单位数是总体中有该特征的单位数是N1。设设x是是0、1变量(总体单位有该特征,则变量(总体单位有该特征,则x取取1,否则取,否则取0),则有:),则有:n现从总体中抽出现从总体中抽出n个单位,如果其中有相应特征的单位数是个单位,如果其中有相应特征的单位数是n1,则样本成则样本成数是:数是: nP也是一个随机变量,利用样本平均数的分布性质结论,即有:也是一个随机变量,利用样本平均数的分布性质结论,即有:31不重置抽样分布不重置抽样分布n样本均值的分布性质:样本均值的分布性质:n样本成数的分布性质样本成数的分布性质32抽样分布总结抽样分布总结样
25、本平均数的分布样本平均数的分布样本成数的分布样本成数的分布重复抽重复抽样样不重复不重复抽样抽样33三、大数定理与中心极限定理三、大数定理与中心极限定理n大数定理大数定理当样本容量当样本容量n 充分大时,可以用充分大时,可以用样本平均估计总体平均。样本平均估计总体平均。当试验次数当试验次数n充分大时,可以用充分大时,可以用频率代替概率。频率代替概率。大数定理的意义:个别现象受偶然因素影响,但是,对大数定理的意义:个别现象受偶然因素影响,但是,对总体的大量观察后进行平均,就能使偶然因素的影响相总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,从而使总体平均数稳定下来,反映出事物变化互抵消,从
26、而使总体平均数稳定下来,反映出事物变化的一般规律,这就是大数定理的意义。的一般规律,这就是大数定理的意义。34中心极限定理中心极限定理 n正态分布的再生定理正态分布的再生定理 :相互独立的两个正态:相互独立的两个正态随机变量相加之和仍服从正态分布。随机变量相加之和仍服从正态分布。n中心极限定理:中心极限定理:n大样本的平均数近似服从正态分布。大样本的平均数近似服从正态分布。35例例1:求样本平均数的概率分布:求样本平均数的概率分布n设某公司设某公司1000名职工的人均年奖金为名职工的人均年奖金为2000元,标准差元,标准差500元,随机抽取元,随机抽取36人作为样本进行调查,问样本的人均年奖金
27、在人作为样本进行调查,问样本的人均年奖金在19002200元之间的概率有元之间的概率有多大?多大?36例例2n某地区职工家庭的人均年收入平均为某地区职工家庭的人均年收入平均为12000元,标准差为元,标准差为2000元。若知该地区家庭的人均年收入服从正态分布,现采用重元。若知该地区家庭的人均年收入服从正态分布,现采用重复抽样从总体中随机抽取复抽样从总体中随机抽取25户进行调查,问出现样本平均数户进行调查,问出现样本平均数等于或超过等于或超过12500元的可能性有多大?元的可能性有多大?37例例3n某商场推销一种洗发水。据统计,本年度购买此种洗发水的某商场推销一种洗发水。据统计,本年度购买此种洗
28、发水的有有10万人,其中万人,其中6万是女性。如果按不重复随机抽样方法,从万是女性。如果按不重复随机抽样方法,从购买者中抽出购买者中抽出100人进行调查,问样本中女性比例超过人进行调查,问样本中女性比例超过50%的的可能性有多大?可能性有多大?38第三节第三节 总体参数估计总体参数估计n本节主要内容:本节主要内容:n总体参数估计概述总体参数估计概述n总体参数的点估计总体参数的点估计n参数区间估计参数区间估计n样本容量的确定样本容量的确定39一、总体参数估计概述一、总体参数估计概述n设待估计的总体参数是设待估计的总体参数是,用以估计该参数的统计量是,用以估计该参数的统计量是 ,抽,抽样估计的样估
29、计的极限误差极限误差是是,即:,即:n极限误差是根据研究对象的变异程度和分析任务的性质来确极限误差是根据研究对象的变异程度和分析任务的性质来确定的在一定概率下的允许误差范围。定的在一定概率下的允许误差范围。n参数估计的两个要求:参数估计的两个要求:n精度:估计误差的最大范围,通过极限误差来反映。显然,精度:估计误差的最大范围,通过极限误差来反映。显然,越小,越小,估计的精度要求越高,估计的精度要求越高,越大,估计的精度要求越低。极限误差的确越大,估计的精度要求越低。极限误差的确定要以实际需要为基本标准。定要以实际需要为基本标准。n可靠性:估计正确性的一个概率保证,通常称为估计的置信度。可靠性:
30、估计正确性的一个概率保证,通常称为估计的置信度。40二、总体参数的点估计二、总体参数的点估计n点估计的含义:直接以样本统计量作为相应点估计的含义:直接以样本统计量作为相应总体参数的估计量。总体参数的估计量。41优良估计量标准优良估计量标准n优良估计标准:优良估计标准:n无偏性:要求样本统计量的平均数等于被估计的总体参数本身。无偏性:要求样本统计量的平均数等于被估计的总体参数本身。n一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。n有效性:有效性:总体方差的无偏估计量为样本方差总体方差的无偏估计量为样本方差点估计完全正确的概
31、率通常为点估计完全正确的概率通常为0。因此,我们更多的是考虑用。因此,我们更多的是考虑用样本统计量去估计总体参数的范围样本统计量去估计总体参数的范围 区间估计。区间估计。 42三、参数区间估计三、参数区间估计n参数区间估计的含义:估计总体参数的区间范围,并给出区参数区间估计的含义:估计总体参数的区间范围,并给出区间估计成立的概率值。间估计成立的概率值。n其中:其中: 1-(01)称为置信度;称为置信度;是区间估计的显著性水平,是区间估计的显著性水平,其取值大小由实际问题确定,经常取其取值大小由实际问题确定,经常取1%、5%和和10%。注间对上式的理解:注间对上式的理解:例如抽取了例如抽取了10
32、00个样本,根据每一个样本均构造了一个置信区间,个样本,根据每一个样本均构造了一个置信区间,这样,由这样,由1000个样本构造的总体参数的个样本构造的总体参数的1000个置信区间中,有个置信区间中,有95%的区间包含了总体参数的真值,而的区间包含了总体参数的真值,而5%的置信区间则没有包含。这里,的置信区间则没有包含。这里,95%这个值被称为置信水平(或置信度)。这个值被称为置信水平(或置信度)。一般地,将构造置区间的步骤重复很多次,置信区间包含总体参数真值一般地,将构造置区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平的次数所占的比例称为置信水平。43样本统计量样本
33、统计量样本统计量样本统计量 ( (点估计点估计点估计点估计) )置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限我们用我们用95%的置信水平得到某班学生考试成绩的置信区间为的置信水平得到某班学生考试成绩的置信区间为60-80分,如何理解?分,如何理解?错误的理解:错误的理解:60-80区间以区间以95%的概率包含全班同学平均成绩的真值;或以的概率包含全班同学平均成绩的真值;或以95%的概率保证全班同学平均成绩的真值落在的概率保证全班同学平均成绩的真值落在60-80分之间。分之间。正确的理解:如果做了多次抽样(如正确的理解:如果做了多次抽样(如10
34、0次),大概有次),大概有95次找到的区间包含真值,次找到的区间包含真值,有有5次找到的区间不包括真值。次找到的区间不包括真值。真值只有一个,一个特定的区间真值只有一个,一个特定的区间“总是包含总是包含”或或“绝对不包含绝对不包含”该真值。但是,用该真值。但是,用概率可以知道在多次抽样得到的区间中大概有多少个区间包含了参数的真值。概率可以知道在多次抽样得到的区间中大概有多少个区间包含了参数的真值。如果大家还是不能理解,那你们最好这样回答有关区间估计的结果:如果大家还是不能理解,那你们最好这样回答有关区间估计的结果:该班同学平均成绩的置信区间是该班同学平均成绩的置信区间是60-80分,置信度为分
35、,置信度为95%。44区间估计的基本要素区间估计的基本要素n包括:样本点估计值、抽样极限误差、估计的可靠程度包括:样本点估计值、抽样极限误差、估计的可靠程度n样本点估计值样本点估计值n抽样极限误差:可允许的误差范围。抽样极限误差:可允许的误差范围。n抽样估计的可靠程度(置信度、概率保证程度)及概率度抽样估计的可靠程度(置信度、概率保证程度)及概率度n注意:本教材所进行的区间估计仅指对注意:本教材所进行的区间估计仅指对总体平均数或成数总体平均数或成数的区间估计,的区间估计,并且在际计算过程中使用下面的式子。式中并且在际计算过程中使用下面的式子。式中是极限误差。是极限误差。45区间估计的内容区间估
36、计的内容 2 2 已知已知 2 2未知未知 均均 值值方方 差差比比 例例置置 信信 区区 间间46平均数的区间估计平均数的区间估计 n对总体平均数或成数的区间估计时,使用下面的式子对总体平均数或成数的区间估计时,使用下面的式子 (式中式中是极限误差是极限误差)n有两种模式:有两种模式:n1、根据置信度、根据置信度1-,求出极限误差,求出极限误差,并指出总体平均数,并指出总体平均数的估计区间。的估计区间。n2、给定极限误差,求置信度。、给定极限误差,求置信度。47n当当已知时,根据相关的抽样分布定理,已知时,根据相关的抽样分布定理, 服从标准正态分布服从标准正态分布N(0,1)。查正态分布概率
37、表,。查正态分布概率表,可得可得 (一般记为一般记为 ),则),则 ,根据重复抽样与不,根据重复抽样与不重复抽样的重复抽样的 求法的不同,进一步可得总体平均数的估计区间:求法的不同,进一步可得总体平均数的估计区间:n重复抽样时,区间的上下限为:重复抽样时,区间的上下限为:n不重复抽样时,区间的上下限为:不重复抽样时,区间的上下限为:平均数区间估计平均数区间估计第第1种模式种模式(求置信区间求置信区间)4849平均数区间估计平均数区间估计第第1种模式种模式(求置信区间求置信区间)n若总体方差未知,则在计算若总体方差未知,则在计算 时,使用样本方差代替总体方差,此时时,使用样本方差代替总体方差,此
38、时 服从自由度为服从自由度为n-1的的t分布。查分布。查t分布表可得分布表可得 ,并,并记为记为n于是:于是:n重复抽样时,区间的上下限为:重复抽样时,区间的上下限为:n不重复抽样时,区间的上下限为:不重复抽样时,区间的上下限为:大样本时,大样本时,t分布与标准正态分分布与标准正态分布非常接近,可直接从标准正布非常接近,可直接从标准正态分布表查临界值态分布表查临界值50例:总体平均数的区间估计例:总体平均数的区间估计1n对某型号的电子元件进行耐用性能检查,抽查资料分组如下表,要求估对某型号的电子元件进行耐用性能检查,抽查资料分组如下表,要求估计该批电子元件的平均耐用时数的置信区间(置信度计该批
39、电子元件的平均耐用时数的置信区间(置信度95%)。)。5168.27%的样本的样本表示样本均值落在表示样本均值落在区区间的概率是间的概率是1-,例,例对总体均值区间估计的进一步理解对总体均值区间估计的进一步理解52平均数区间估计平均数区间估计第第2种模式种模式(求置信度求置信度)n给定极限误差,求置信度给定极限误差,求置信度53例:总体平均数的区间估计例:总体平均数的区间估计2n例:经抽样调查计算样本亩产粮食例:经抽样调查计算样本亩产粮食600公斤,并求得抽样平均公斤,并求得抽样平均误差为误差为3公斤,现给定允许极限误差为公斤,现给定允许极限误差为6公斤,求置信区间包公斤,求置信区间包含总体平
40、均亩产的概率,即求置信水平。含总体平均亩产的概率,即求置信水平。结果表明,如果多次反复抽样,结果表明,如果多次反复抽样,每次都可以由样本值确定一个估每次都可以由样本值确定一个估计区间,每个区间或者包含总体计区间,每个区间或者包含总体参数的真值,或者不包含总体参参数的真值,或者不包含总体参数的真值,包含真值的区间占数的真值,包含真值的区间占F(z),即每一万次抽样,就有即每一万次抽样,就有9545个样本区间包括总体亩产,其余个样本区间包括总体亩产,其余455个样本区间不包括总体平均个样本区间不包括总体平均数,即若接受估计区间的判断要数,即若接受估计区间的判断要冒冒4.55%的机会犯错误的风险。的
41、机会犯错误的风险。54成数的区间估计成数的区间估计n由于总体的分布是(由于总体的分布是(0,1)分布,只有在大样本的)分布,只有在大样本的情况下,才服从正态分布。总体成数可以看成是一情况下,才服从正态分布。总体成数可以看成是一种特殊的平均数,类似于总体平均数的区间估计,种特殊的平均数,类似于总体平均数的区间估计,总体成数的区间估计的上下限是:总体成数的区间估计的上下限是:n注意:在实践中,由于总体成数常常未知,这时,注意:在实践中,由于总体成数常常未知,这时,抽样平均误差公式中的总体成数用样本成数代替。抽样平均误差公式中的总体成数用样本成数代替。 n大样本的条件:大样本的条件:np5且且n(1
42、-p) 5,由于总体成数,由于总体成数p通通常未知,可以用样本成数来近似判断。常未知,可以用样本成数来近似判断。55例:总体平均数的区间估计例:总体平均数的区间估计3n对某型号的电子元件进行耐用性能检查,抽查资料分组如下表,对某型号的电子元件进行耐用性能检查,抽查资料分组如下表, 设该厂的产品质设该厂的产品质量检验标准规定,元件耐用时数达到量检验标准规定,元件耐用时数达到1000小时以上为合格品。要求估计该批电子小时以上为合格品。要求估计该批电子元件的合格率,置信水平元件的合格率,置信水平95%。56总体均值区间估计总结总体均值区间估计总结总体平均数估计区总体平均数估计区间的上下限间的上下限总
43、体方总体方差已知差已知N(0,1)重复抽样重复抽样不重复抽不重复抽样样总体方总体方差未知差未知t(n-1)大样本时近似服从N(0,1)重复抽样重复抽样不重复抽不重复抽样样n 如果是正态总体如果是正态总体57n 如果不是正态总体,或分布未知如果不是正态总体,或分布未知总体方差已知总体方差已知且是大样本且是大样本总体方差未知总体方差未知且是大样本且是大样本 此时不考虑小样本情况此时不考虑小样本情况因此,大样本情况下,直接用标因此,大样本情况下,直接用标准正态分布求置信区间即可。准正态分布求置信区间即可。58总体成数估计区间估计总结总体成数估计区间估计总结n总体成数估计区间的上下限总体成数估计区间的
44、上下限只考虑大样本情况(请记住大样本条件)只考虑大样本情况(请记住大样本条件)59对总量指标的区间估计对总量指标的区间估计n在对总体平均数进行区间估计的基础上,可在对总体平均数进行区间估计的基础上,可进一步推断相应的总量指标,即用总体单位进一步推断相应的总量指标,即用总体单位总数总数N分别乘以总体平均数的区间下限和区间分别乘以总体平均数的区间下限和区间上限,便得到相应总量(上限,便得到相应总量(N)的区间范围。)的区间范围。60例例1n某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样只,样本优质率为本优质率为85%,试计算
45、当把握程度为,试计算当把握程度为90%时优质品率的区间范围。时优质品率的区间范围。61例例2n某商场从一批食品(共某商场从一批食品(共800袋)中随机抽取袋)中随机抽取40袋(假设用重复抽样),测袋(假设用重复抽样),测得每袋平均重量为得每袋平均重量为791.1克,标准差为克,标准差为17.136克,要求以克,要求以95%的把握程度,的把握程度,估计这批食品的平均每袋重量以及这批食品总重量的区间范围。估计这批食品的平均每袋重量以及这批食品总重量的区间范围。800*778.84,800*803.36,即,即623072,642688 62三、样本容量确定三、样本容量确定n什么是样本容量确定问题?
46、什么是样本容量确定问题?63确定样本容量确定样本容量n在设计抽样时,先确定允许的在设计抽样时,先确定允许的误差范围误差范围和必要的和必要的概率保证程概率保证程度度,然后根据历史资料或试点资料确定,然后根据历史资料或试点资料确定总体的标准差总体的标准差,最后,最后来确定样本容量。来确定样本容量。估计总体均值估计总体均值时样本容量的时样本容量的确定确定重复抽样重复抽样 不重复抽样不重复抽样 估计成数时样估计成数时样本容量的确定本容量的确定重复抽样重复抽样 不重复抽样不重复抽样 64确定样本容量应注意的问题确定样本容量应注意的问题n计算样本容量时,一般总体的方差与成数都是未知计算样本容量时,一般总体
47、的方差与成数都是未知的,可用有关资料替代:的,可用有关资料替代:n一是用历史资料已有的方差与成数代替;一是用历史资料已有的方差与成数代替;n二是在进行正式抽样调查前进行几次试验性调查,用试验二是在进行正式抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体方差;中方差的最大值代替总体方差;n三是成数方差在完全缺乏资料的情况下,就用成数方差的三是成数方差在完全缺乏资料的情况下,就用成数方差的最大值最大值0.25代替。代替。n如果进行一次抽样调查,同时估计总体均值与成数,如果进行一次抽样调查,同时估计总体均值与成数,用上面的公式同时计算出两个样本容量,可取一个用上面的公式同时计算出两个样本容
48、量,可取一个最大的结果,同时满足两方面的需要。最大的结果,同时满足两方面的需要。n上面的公式计算结果如果带小数,这时样本容量不上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最小整数按四舍五入法则取整数,取比这个数大的最小整数代替。例如计算得到:代替。例如计算得到:n=56.03,那么,样本容量取,那么,样本容量取57,而不是,而不是56。 65例:确定样本容量例:确定样本容量1n对某批木材进行检验,根据以往经验,木材长度的标准差为对某批木材进行检验,根据以往经验,木材长度的标准差为0.4米,而合格率为米,而合格率为90%。现采用重复抽样方式,要求在。现采用重复
49、抽样方式,要求在95.45%的概率保证程度下,木材平均长度的极限误差不超过的概率保证程度下,木材平均长度的极限误差不超过0.08米,抽样合格率的极限误差不超过米,抽样合格率的极限误差不超过5%,问必要的样本单,问必要的样本单位数应该是多少?位数应该是多少?66例:确定样本容量例:确定样本容量2n对某批木材进行检验,根据以往经验,木材的合格率为对某批木材进行检验,根据以往经验,木材的合格率为90%、92%、95%。现采用重复抽样方式,要求在。现采用重复抽样方式,要求在95.45%的概率保的概率保证程度下,抽样合格率的极限误差不超过证程度下,抽样合格率的极限误差不超过5%,问必要的样本,问必要的样
50、本单位数应该是多少?单位数应该是多少?67第四节第四节 抽样的组织形式抽样的组织形式n本节主要内容:本节主要内容:n抽样估计效果的衡量与抽样组织形式抽样估计效果的衡量与抽样组织形式n简单随机抽样简单随机抽样n类型抽样类型抽样n整群抽样整群抽样n等距抽样等距抽样n阶段抽样阶段抽样n不同抽样组织设计的比较不同抽样组织设计的比较68一、抽样估计效果的衡量与抽样组织形式一、抽样估计效果的衡量与抽样组织形式n抽样估计效果好坏,关键是抽样估计效果好坏,关键是抽样平均误差抽样平均误差的控制。的控制。抽样平均误差小,抽样效果从整体上看就是好的;抽样平均误差小,抽样效果从整体上看就是好的;否则,抽样效果就不理想
51、。否则,抽样效果就不理想。n抽样平均误差受以下几方面的因素影响:抽样平均误差受以下几方面的因素影响:n一是总体的变异性,即与总体的标准差大小有关一是总体的变异性,即与总体的标准差大小有关n二是样本容量二是样本容量n三是抽样方法。三是抽样方法。n四是抽样的组织形式四是抽样的组织形式n抽样的组织形式有如下几种:抽样的组织形式有如下几种:简单随机抽样、类型抽样、等距抽样、整群抽样、简单随机抽样、类型抽样、等距抽样、整群抽样、阶段抽样阶段抽样 69二、简单随机抽样二、简单随机抽样70三、类型抽样三、类型抽样n含义:又称分层抽样。对总体各单位按一定标志加以分组,含义:又称分层抽样。对总体各单位按一定标志
52、加以分组,然后从每一组中按随机原则抽取一定单位构成样本。然后从每一组中按随机原则抽取一定单位构成样本。得到样本如下:得到样本如下:71类型抽样类型抽样求样本平均数求样本平均数72类型抽样类型抽样求抽样平均误差求抽样平均误差73类型抽样类型抽样求抽样平均误差求抽样平均误差74类型抽样类型抽样两点结论两点结论从类型抽样的抽样平均误差公式来看,类型从类型抽样的抽样平均误差公式来看,类型抽样的抽样平均误差与组间方差无关,它决抽样的抽样平均误差与组间方差无关,它决定于组内方差的平均水平。而方差的加法定定于组内方差的平均水平。而方差的加法定理:理: ,因此有如下结论:,因此有如下结论:n抽样效果一般来说好
53、于简单随机抽样。抽样效果一般来说好于简单随机抽样。n因此在分组时应尽量扩大组间方差(组间差因此在分组时应尽量扩大组间方差(组间差异),缩小组内方差(组内差异),从而减异),缩小组内方差(组内差异),从而减少抽样误差,提高抽样效果。少抽样误差,提高抽样效果。75类型抽样类型抽样例例n假设某农场种植小麦假设某农场种植小麦1 200亩,根据其地理条件划分为甲、乙、丙三类,亩,根据其地理条件划分为甲、乙、丙三类,按按5%的比例总共抽取的比例总共抽取60亩进行调查,结果如下表所示。试以亩进行调查,结果如下表所示。试以95%的概率的概率估计农场平均亩产量的区间范围。估计农场平均亩产量的区间范围。 76四、
54、整群抽样四、整群抽样n定义:又称集团抽样。将总体各单位分为若定义:又称集团抽样。将总体各单位分为若干群,然后从中抽取部分群,对中选群的所干群,然后从中抽取部分群,对中选群的所有单位进行全面调查。有单位进行全面调查。77整群抽样整群抽样抽样平均误差的计算抽样平均误差的计算在计算抽样平均误在计算抽样平均误差时假定每群单位差时假定每群单位数是相同的,但实数是相同的,但实际工作中,通常是际工作中,通常是“自然群自然群”,其单,其单位数一般是不等的。位数一般是不等的。78整群抽样整群抽样抽样效果评价抽样效果评价n好处是操作方便、省时、省力。确定一群便好处是操作方便、省时、省力。确定一群便可以调查许多单位
55、,但正是由于抽样单位比可以调查许多单位,但正是由于抽样单位比较集中,限制了样本单位在总体中分配的均较集中,限制了样本单位在总体中分配的均匀性,所以有时代表性较代,抽样误差较大。匀性,所以有时代表性较代,抽样误差较大。可以增加样本单位来减少误差可以增加样本单位来减少误差 。n抽样平均误差只取决于群间方差(与类型抽抽样平均误差只取决于群间方差(与类型抽样相反),因此分群时,应尽量扩大群内方样相反),因此分群时,应尽量扩大群内方差(群内差异),缩小群间方差(群间差异)差(群内差异),缩小群间方差(群间差异)来提高抽样效果。来提高抽样效果。79整群抽样整群抽样例例1n从某县的从某县的100个村庄中抽出
56、个村庄中抽出10村,进行调查得村,进行调查得平均每户饲养家禽平均每户饲养家禽35头,各村的平均数的方头,各村的平均数的方差为差为16头,请计算平均抽样误差。头,请计算平均抽样误差。80整群抽样整群抽样例例2n假设某水泥厂大量连续生产假设某水泥厂大量连续生产100公斤装水泥,一昼夜产量为公斤装水泥,一昼夜产量为14 400袋,平袋,平均每分钟产量均每分钟产量10袋。现每隔袋。现每隔144分钟抽取一分钟的产量分钟抽取一分钟的产量(10袋为一群袋为一群),一,一昼夜共抽取昼夜共抽取100袋水泥,观察结果如下表,试计算样本平均数的抽样平均袋水泥,观察结果如下表,试计算样本平均数的抽样平均误差,并以误差
57、,并以95%的概率估计每包水泥重量的区间范围。的概率估计每包水泥重量的区间范围。81五、等距抽样五、等距抽样n含义:又称机械抽样或系统抽样。先按某个标志对总体单位进行排序,含义:又称机械抽样或系统抽样。先按某个标志对总体单位进行排序,然后依固定的间隔来抽取样本单位。这样可以保证样本单位均匀地分布然后依固定的间隔来抽取样本单位。这样可以保证样本单位均匀地分布在总体的各个部分,有较高的代表性。在总体的各个部分,有较高的代表性。n总体的单位数总体的单位数N,需要抽取的样本单位数,需要抽取的样本单位数n,则等距抽样的间隔大小:,则等距抽样的间隔大小:k=N/n总体排序标志是由总体的有关辅总体排序标志是
58、由总体的有关辅助信息确定的,与调查标志两者助信息确定的,与调查标志两者间可以有关也可以无关。间可以有关也可以无关。1、无关标志排队:如家计调查,、无关标志排队:如家计调查,按门牌号码排序。按门牌号码排序。2、有关标志排队:、有关标志排队:如农产量调查如农产量调查按平均亩产量高低排序。按平均亩产量高低排序。一般来讲,一般来讲,有关标志排序有关标志排序要比无要比无关标志排序的机械抽样更为优越。关标志排序的机械抽样更为优越。在排队时,要注意避免在排队时,要注意避免抽样间隔与现象本身的抽样间隔与现象本身的周期性节奏相重合。以周期性节奏相重合。以减少减少系统偏差的影响,提系统偏差的影响,提高样本的代表性
59、高样本的代表性。82等距抽样等距抽样抽样平均误差的计算抽样平均误差的计算n无关标志排队时,为了方便起见,可以采用无关标志排队时,为了方便起见,可以采用简单随机抽样的平均误差代替等距抽样平均简单随机抽样的平均误差代替等距抽样平均误差误差 :83六、阶段抽样六、阶段抽样n含义:所谓阶段抽样,就是先从总体中抽出含义:所谓阶段抽样,就是先从总体中抽出较大的范围的单位,再从中选的大单位中抽较大的范围的单位,再从中选的大单位中抽较小范围的单位,依次类推,最后从更小的较小范围的单位,依次类推,最后从更小的范围抽出样本基本单位。范围抽出样本基本单位。n阶段抽样一般应用于总体范围很大的情况。阶段抽样一般应用于总
60、体范围很大的情况。如在我国的农产量调查、职工家计调查中都如在我国的农产量调查、职工家计调查中都很适用:先从全国抽出各个省,再从抽中的很适用:先从全国抽出各个省,再从抽中的省中抽出县、市,最后抽出样本的基本单位省中抽出县、市,最后抽出样本的基本单位等等。等等。 84阶段抽样阶段抽样两阶段抽样两阶段抽样n两阶段抽样较为简单。本书主要分析两阶段两阶段抽样较为简单。本书主要分析两阶段抽样平均误差的控制问题。抽样平均误差的控制问题。n两阶段抽样在组织技术上可以看成是整群抽两阶段抽样在组织技术上可以看成是整群抽样和类型抽样的结合。样和类型抽样的结合。n设总体分成设总体分成R组,每组组,每组M个单位。两阶段
61、抽样个单位。两阶段抽样就是:第一阶段用整群抽样方式从总体的全就是:第一阶段用整群抽样方式从总体的全部部R组(群)中,随机抽取组(群)中,随机抽取r组(群);第二组(群);第二阶段用类型抽样方式从每个中选组中抽出阶段用类型抽样方式从每个中选组中抽出m样样本单位。本单位。85两阶段抽样两阶段抽样样本平均数样本平均数86两阶段抽样两阶段抽样抽样平均误码抽样平均误码n两阶段抽样的平均误差是由两部分构成的,第一部分是第一阶段从总体两阶段抽样的平均误差是由两部分构成的,第一部分是第一阶段从总体全部组抽部分组所引起的组间误差,第二部分是由第二阶段在中选组中全部组抽部分组所引起的组间误差,第二部分是由第二阶段
62、在中选组中抽部分单位所引起的组内平均误差。抽部分单位所引起的组内平均误差。 87七、不同抽样组织设计的比较七、不同抽样组织设计的比较n进行抽样设计时需要考虑的两个问题:进行抽样设计时需要考虑的两个问题:n提高样本的代表性,增加抽样的效果。抽样要满提高样本的代表性,增加抽样的效果。抽样要满足随机性要求。足随机性要求。n抽样设计时,要充分考虑如何降低抽样的成本费抽样设计时,要充分考虑如何降低抽样的成本费用。用。88简单随机抽样是基本抽样组织方式简单随机抽样是基本抽样组织方式 n抽样推断效果如何,依赖于所抽出样本的质抽样推断效果如何,依赖于所抽出样本的质量;样本的质量好坏,就看样本对总体的代量;样本
63、的质量好坏,就看样本对总体的代表性如何,而这又依赖于抽取样本时的表性如何,而这又依赖于抽取样本时的 “随随机性机性”。 n如果不满足随机性,则样本的代表性就值得如果不满足随机性,则样本的代表性就值得怀疑,抽样推断就无从进行。怀疑,抽样推断就无从进行。89类型抽样与整群抽样比较类型抽样与整群抽样比较 n1、抽样平均误差的决定因素不同。、抽样平均误差的决定因素不同。n类型抽样的平均误差与组间方差无关,决定于组内方差的平均水平类型抽样的平均误差与组间方差无关,决定于组内方差的平均水平n整群抽样的平均误差与组内方差无关,决定于组间方差大小整群抽样的平均误差与组内方差无关,决定于组间方差大小n2、减小类
64、型抽样与整群抽样平均误差的方法不同。、减小类型抽样与整群抽样平均误差的方法不同。n因为总体方差等于组间方差加上组内方差平均数。所以提高组间方差,因为总体方差等于组间方差加上组内方差平均数。所以提高组间方差,降低组内方差可减小类型抽样平均误差降低组内方差可减小类型抽样平均误差 n对于整群抽样则相反对于整群抽样则相反n3、适应范围不同。、适应范围不同。n类型抽样充分利用总体的已有信息,其前提就是对总体的结构事先有类型抽样充分利用总体的已有信息,其前提就是对总体的结构事先有一定的认识,然后通过分类把总体中调查标志差异比较接近的单位归一定的认识,然后通过分类把总体中调查标志差异比较接近的单位归为一组,
65、减少组内差异,再从各组中抽出样本,这样的样本就对总体为一组,减少组内差异,再从各组中抽出样本,这样的样本就对总体有更大的代表性。有更大的代表性。n整群抽样适用于无原始资料可利用的总体单位。是一种较为方便有效整群抽样适用于无原始资料可利用的总体单位。是一种较为方便有效的抽样组织方式,有利于提高抽样的效率。但要注意整群抽样有时代的抽样组织方式,有利于提高抽样的效率。但要注意整群抽样有时代表性不是很理想,抽样误差较大。在实际抽样中,通常要适当增加一表性不是很理想,抽样误差较大。在实际抽样中,通常要适当增加一些样本单位,以利于缩小抽样误差,提高抽样推断的准确度。些样本单位,以利于缩小抽样误差,提高抽样
66、推断的准确度。 90阶段抽样平均误差的控制阶段抽样平均误差的控制 n阶段抽样误差的控制必须落实到抽样的各个阶段抽样误差的控制必须落实到抽样的各个阶段。两阶段抽样误差控制,要落实为第一阶段。两阶段抽样误差控制,要落实为第一阶段的整群抽样的误差控制与第二阶段的类阶段的整群抽样的误差控制与第二阶段的类型抽样的误差控制两方面。型抽样的误差控制两方面。n两阶段抽样平均误差,既取决于组间方差也两阶段抽样平均误差,既取决于组间方差也取决于组内平均方差,但取决于组内平均方差,但组间方差组间方差是主要的是主要的因素。所以在组织两阶段抽样时在相同样本因素。所以在组织两阶段抽样时在相同样本容量要求下,适当容量要求下
67、,适当增加第一阶段的组数增加第一阶段的组数,比,比增加第二阶段的单位数,能更显著地提高抽增加第二阶段的单位数,能更显著地提高抽样效果。样效果。 91选择题选择题n1.假定样本容量增加假定样本容量增加50%。则重复抽样平均误差:(甲)为。则重复抽样平均误差:(甲)为原来的一半;(乙)为原来的原来的一半;(乙)为原来的81.6%。在重复抽样时,为使。在重复抽样时,为使误差减少误差减少50%,则样本容量:(丙)应增加三倍;(丁)应,则样本容量:(丙)应增加三倍;(丁)应增加四倍。增加四倍。 A.甲丙甲丙 B.甲丁甲丁 C.乙丙乙丙 D.乙丁乙丁n2.抽样估计中的抽样误差(抽样估计中的抽样误差( )
68、A.是不可避免的是不可避免的 B.可以通过改进调查方法避免的可以通过改进调查方法避免的 C.是可以运用数学公式计算的是可以运用数学公式计算的 D.误差大小是可以加以控制的误差大小是可以加以控制的 E. 包含了登记性误差包含了登记性误差n3.抽样平均误差指标说明(抽样平均误差指标说明( ) A.样本平均数的代表性样本平均数的代表性 B.抽样指标的代表性抽样指标的代表性 C.估计值与实际值的平均误差估计值与实际值的平均误差 D.样本指标相对于总体指标离差的平均水平样本指标相对于总体指标离差的平均水平 E.抽样误差的大小抽样误差的大小92n4.从一个全及总体中可以抽取一系列样本,所以(从一个全及总体
69、中可以抽取一系列样本,所以( ) A.样本指标的数值不是唯一确定的样本指标的数值不是唯一确定的 B.样本指标是样本变量的函数样本指标是样本变量的函数 C.总体指标是随机变量总体指标是随机变量 D.样本指标是随机变量样本指标是随机变量 E.样本指标数值随着样本的不同而不同样本指标数值随着样本的不同而不同n5.影响抽样数目(样本容量)的因素有(影响抽样数目(样本容量)的因素有( ) A.允许误差范围允许误差范围 B.抽样指标的大小抽样指标的大小 C.抽样方法抽样方法 D.总体标志变异程度总体标志变异程度 E.概率保证程度概率保证程度93n6. 是非标志不存在变异时,意味着:(是非标志不存在变异时,
70、意味着:( ) A.各标志值(各标志值(1或或0)遇到同样的成数()遇到同样的成数(0.5) B.总体所有单位都只具有某属性总体所有单位都只具有某属性只运用变量值只运用变量值“1” C.总体所有单位都只具有某属性总体所有单位都只具有某属性只运用变量值只运用变量值“0” D.所计算的方差为所计算的方差为0 E.所计算的方差为所计算的方差为0.25n7.抽样推断的置信度、概率度和精确度关系表现在(抽样推断的置信度、概率度和精确度关系表现在( )A.概率度增大,估计的可靠性也增大概率度增大,估计的可靠性也增大B.概率度增大,估计的精确度下降概率度增大,估计的精确度下降C.概率度缩小,估计的精确度也缩
71、小概率度缩小,估计的精确度也缩小D.概率度缩小,估计的可靠性也增大概率度缩小,估计的可靠性也增大E.估计的可靠性增大,估计的精确度也增大估计的可靠性增大,估计的精确度也增大n8.标准差、抽样平均误差的联系和区别?标准差、抽样平均误差的联系和区别?94计算题计算题1 n从某大公司的从某大公司的10000女工中随机抽女工中随机抽取取100名,调查她们每天家务劳动名,调查她们每天家务劳动时间,资料如下:时间,资料如下: 试计算:试计算:n(1) 计算每天家务劳动计算每天家务劳动25小时女工的比重、比重方差、小时女工的比重、比重方差、均方差系数。均方差系数。n(2)在重复抽样条件下,以在重复抽样条件下
72、,以95.45%的置信度来估计公的置信度来估计公司女工平均每天家务劳动时司女工平均每天家务劳动时间的区间估计。间的区间估计。n(3)在不重复抽样条件下,在不重复抽样条件下,以以z=1的概率度估计该公司的概率度估计该公司女工每天家务劳动时间女工每天家务劳动时间25小时的比重区间,指出这种小时的比重区间,指出这种区间的可信程度。区间的可信程度。95计算题计算题2n一一家家公公司司随随机机抽抽取取了了100个个坏坏帐帐,经经计计算算,其其平平均均余余额额为为5570元元,样样本本标标准准差差为为725元元,试试以以90%的的概概率率保保证证程程度度估估计计该该公公司司的的平平均均坏坏帐余额区间。帐余额区间。n另另一一家家公公司司也也为为估估计计坏坏帐帐而而抽抽出出了了100个个坏坏帐帐,这这些些坏坏帐帐的的标标准准差差为为285.3。如如今今公公司司希希望望坏坏帐帐极极限限误误差差不不超超过过35元元,置置信信度度95%,则则应应抽取多少份坏帐?抽取多少份坏帐?96计算题计算题1的答案的答案97计算题计算题2的答案的答案98