文档详情

样本容量确定

博****1
实名认证
店铺
DOCX
28.98KB
约7页
文档ID:457817603
样本容量确定_第1页
1/7

第三节 样本容量的确定在区间估计中我们发现,对于某一个总体的参数进行估计时,在样本数目一定的 条件下,要提高估计结果的可靠性,就需要扩大置信区间,这就要增加估计中的误差, 减少了估计的实际意义如果要减少估计的误差,就要缩短置信区间,但这样就必须 要降低估计的可靠性可见在样本数目一定的条件下,估计的精确性和估计的可靠性 不能两全其美既要提高估计的精确性,减少误差,又要提高估计可靠性的办法就是 增加样本容量但是增加样本就要同时增加抽样调查的成本,同时又可能延误时间 因此就需要研究能够满足对估计的可靠性和精确性要求的最小样本数问题一、均值估计问题中,样本大小的决定在总体均值的估计问题中,要决定必要的样本大小,必须先明确如下三个问题:1. 要规定允许的估计误差的大小,即允许的估计值与实际值之间的最大偏离值 是多少,实际上也就是估计区间的大小,2. 规定置信度,即估计所要求达到的可靠性,也就是实际的抽样误差不超过所 规定的误差的可信度3. 要明确总体的标准差,即要求了解总体的分布情况总体的标准差小,只要 抽较少的样本就能满足对估计精确度和可靠性的要求,若总体标准差大,就必须抽取 较多的样本才能达到对估计精确度和可靠性的要求。

设总体标准差为b,样本均值的标准差为&一估计的置信度为1 -a,于是可以 x相应地得到置信系数Z a/2、于是对总体均值的估计可由下式得到:p\x-卩|< Z ・6丿=1 -aa/2 x上式中的|X-r|实际上就表示估计所允许的最大误差,我们用a表示,于是根 据上式有A< Za/2Z 2 2则 n > a/2 A2由此只要规定了允许误差的大小A和总体的标准差由置信度1-a查表得到 相应的Za/2,代入公式,求得满足要求的最小整数就是满足估计误差不大于人和置信 度为1-a的要求的最少样本数上述公式适用于重复抽样或无限总体不放回抽样时的情形但对于有限总体不放回抽样的情形,公式变为如下的形式:A> Za/2b i'N - n 真飞N -1由此可求得满足上式要求的最小的整数为N - Z 2 -b 2n —0 (N — 1)A2 + Z 2 -b 2a /2 其中:A为允许最大误差,N为有限总体的个体数, a为置信度水平,Za/2为根据置信度水平a查表得到的置信系数二、比例估计问题中,样本大小的决定关于总体比例的估计问题中,要决定样本大小首先也要明确关于均值的估计问题 中同样的三个问题:1. 允许误差的大小,即规定估计值与实际值的最大偏离值。

2. 规定置信度,即估计所要求达到的可信度3. 对总体比例的事先估计值,即大致的或估计的总体比例是多少 与均值的估计问题完全平行地,我们可以得到以下的结果对于重复抽样或无限总、体不重复(放回)抽样时的情形为Z 2 - p(l 一 p)n = 0 A2但对于有限总体不放回抽样的情形,公式变为如下的形式:N - Z 2 - p(1 一 p)0 (N - 1)A^ + Z 2~• pG 一 p)p a /2第四节假设检验一、假设检验的基本原理假设总体的均值为某一个值,为了检验这一假设的正确性,我们收集样本的数据, 计算出假设值与样本均值之间的差异,然后根据差异的大小来判断所作假设的正确 性,这就是假设检验直观地,我们知道差异越小,对于总体均值的假设正确的可能 性就愈大差异越大,对总体均值的假设正确的可能性就愈小然而在多数情况下,对总体参数的假设值与样本统计量之间的差异既不至于大到 显而易见,应该拒绝假设,也不至于小到可以完全肯定,应该接受假设的程度于是 就不能简单地决定接受或拒绝所作的假设,而需要判断所作的假设在多大的程度上是 正确的于是就需要研究假设和判断假设是否正确的程度一)假设检验中的假设假设检验中通常把所要检验的假设称作原假设或零假设,记作H。

例如要检验 总体均值卩=100这个假设是否正确,就表示为H:卩=100如果样本所提供的信息无 法证明原假设成立,则我们就拒绝原假设此时,我们只能接受另外备选的假设了, 称之为备择假设,我们以H表示备择假设备择假设可以有三种形式,例如,在原 假设H:卩=100的条件下,备择假设可以是:H1:卩丰100这表示备择假设是总体的均值不等于100或者是H]:卩>100这表示备择假设是总体的均值大于100或者是H;:卩<100这表示备择假设是总体的均值小于100上述备择假设的选择与检验的要求是密切相关的我们根据假设检验的目的要求 不同又把假设检验分为双侧检验和单侧检验如果样本均值高于或低于假设的总体均值很显著时都拒绝原假设,我们称作双侧检验在双侧检验时有左右两个拒绝区域当原假设是:代:卩=100,备择假设是:Hi:卩H 100时就必须使用双侧检验 ° 1若只有在样本的均值高于(或低于)假设的总体均值很显著时才拒绝原假设,这 就称作单侧检验单侧检验只有一个拒绝区域若假设检验只有在样本均值高于假设 的总体均值很显著时才拒绝原假设,这种假设检验称作右侧检验此时,原假设实际 上变为H :u < 100,备择假设为H]:卩>100。

反之,如果只有在样本均值低于假设的 总体均值很显著时才拒绝原假设,则称作左侧检验此时,原假设实际上变为巒 > 100,备择假设为H:y<100由此可见,原假设和备择假设总是排他性的°(二)检验的显著性水平 假设检验需要确定一个是接受还是拒绝原假设的标准,这个标准就是显著性水 平所谓检验的显著性水平Q就表示,在假设正确的条件下落在某个界限以外的样本 均值所占的百分比具体地说,“在5%的显著性水平下检验假设”就是说,假定对总 体参数所作的假设正确,那么样本均值同假设的总体均值差异过大的,在每 100个样 本中不应超过5个如果样本均值与总体均值差异过大的超过这一数目就认为这个样 本不可能抽自所假设的总体,所以拒绝零假设我们可以用图 5-4 来直观地解释假设检验的原理假如设检验的显著性水平 a =5%,我们已知在概率密度曲线下包括在假设的均值卩 +196两侧直线间的H 0 X面积是 95%,两边每一个尾端的面积各为 2.5%于是若样本的均值落在 95%的区域 内,我们就认为样本统计量与假设的总体参数的差异是不显著的结果就接受原假设 若样本统计量落在左右尾端的各为 2.5%的区域内,则差异就是显著的。

我们就拒绝 原假设接受备择假设图 5-4 假设检验的接受区域和拒绝区域不过应该强调指出,在假设检验中“接受原假设”的意思仅仅是意味着没有充分 的统计证据拒绝原假设在假设检验中“接受原假设”的特定含义就是不拒绝原假设 但实际上,即使样本统计量落在95%的面积内,也并不能证明原假设H0就是正确的 因为只有在知道了总体参数的真实值与假设值完全相同才能证明假设正确但我们无 法知道总体参数的真实值在给定了检验的显著性水平f后,我们可以根据假设来确定接受还是拒绝原假设 的区域或范围如果样本均值X落在某一区域内我们就接受原假设,则就称这一区 域为接受区域如果样本均值X落在某一区域内就拒绝原假设,我们就称这一区域 为拒绝区域对于显著性水平的选择没有一个唯一的或通用的标准实际上在任何显著性水平 下检验某个假设都是可能的,但是必须注意不管选择什么样的显著性水平,都存在假 设为真而被拒绝的可能性另一方面,在检验同一个假设时,使用的显著性水平愈高, 原假设为真时而被拒绝的概率也就愈高这就需要研究假设检验中的错误,我们在以 后将对此进行讨论二、假设检验的步骤1. 提出原假设H和备择假设H原假设和备择假设必须由题意来决定。

在一般 情况下总是把检验的目的作为备择假1设,这样可以有充分的把握拒绝原假设2. 选择检验的显著性水平a,从而确定检验的拒绝区域或临界点a表示在假 设检验时当原假设为真而我们却拒绝了原假设,接受备择假设的错误概率假设检验 中还可能犯另一种错误,这将在下面讨论3. 确定样本的统计量和分布样本统计量又称检验统计量不同的统计量具有 不同的分布,用于检验不同的假设,要根据所检验的假设来正确地选择检验统计量4. 计算检验统计量并由此作出决策根据样本数据计算出检验统计量的值,如 果统计量的值落在拒绝区(包括临界点)内就说明原假设与样本所反映的情形有显著 的差异,应该拒绝原假设如果统计量的值落在接受区域内,就说明原假设与样本所 反映的情形的差异并不显著,应该接受原假设三、几种常用的假设检验(一) 平均数的假设检验1. 双侧检验让我们研究下面的例子例5-4某食品厂规定某种罐头每罐的标准重量是500克多年的经验表明这个 厂每罐重量的标准差是15克今随机抽取了49个罐头,发现这些罐头的平均重量是 506克问在a =0.05的显著性水平下能否认为这批罐头的重量符合标准的要求?要检验这批罐头的重量是否符合标准的要求就是要检验这批样本的平均重量与 标准重量之间是否具有明显的差别。

因此可以列出要检验的假设为:H :卩=500H: u h 500这是一个双侧检验问题根据区间估计的结论可知原假设的接受区域为卩-z ,卩 + z( a/2、;,n a/2 沖丿由于置信度水平a =0.05, Z =1.96由此得到接受区域为[495.8, 504.2]但/2 现在样本的实际均值为506,落在拒绝区域内,因此拒绝原假设接受备择假设我们 无法认为这批罐头的重量符合标准的要求,即这批罐头的重量不符合标准的要求当总体方差未知,样本数量又小于等于30时,检验统计量样本均值服从t分布这 就要用t分布确定原假设的接受区域和拒绝区域了在得到接受区域后也就可以利用上 面同样的方法,根据样本均值所处的位置作出判断2. 单侧检验再看下面的例子例5-5某饮料厂规定某种纸罐包装饮料的容量不得少于500ml今随机抽取了25 个纸罐,发现这些罐头的平均重量是498 ml,标准差S=10问在a =0.05的显著性水 平下能否认为这批纸罐的容重符合标准的要求?根据问题的要求可以列出要检验的假设为:H :u > 500x — y由于总体方差未知,样本容量又小于30,检验统计量一「服从t分布,其自由度Jn为n-1。

因此我们就必须利用t分布来进行检验这又是一个单侧(左侧)检验问题根据区间估计的结论可知原假设的接受区域为[y — t (n -1)・^^ ,+s) a Jn根据置信度水平a =0.05,查表得到t (25 —1)= 1.711所以计算得到接受区域 _ 0.05的临界点是496.6现样本均值X =498〉496.6可见样本均值落在原假设的接受区域内我们接受原假设,即认为这批纸罐的容重符合标准的要求例5-6某特种建材生产厂规定某种规格新型墙体材料的重量不得大于500公斤 今随机抽取了16块这种规格新型墙体材料,测得其平均重量为505公斤,标准差S=10 问在a =0.05的显著性水平下能否认为这批新型墙体材料的重量符合标准的要求?这次要检验的假设为:H :u < 500H:卩 >500这次也需要利用t分布来进行检验这是一个右侧检验问题原假设的接受区域为(—g, y +1 a vn根据置信度水平a =0.05,查表得到t (16 —1)= 1.753由此可以得到原假设的 _0.05接受区域临界点是504.4现样本均值X =505>504.4可见样本均值落在原假设的拒 绝区域内我们拒绝原假设,接受备择假设,即认为这批新型墙体材料的重量不符合 标准的要求。

下载提示
相似文档
正为您匹配相似的精品文档