【2017年整理】抽样检验中样本容量的确定

上传人:爱****1 文档编号:1001224 上传时间:2017-05-25 格式:DOCX 页数:9 大小:289.35KB
返回 下载 相关 举报
【2017年整理】抽样检验中样本容量的确定_第1页
第1页 / 共9页
【2017年整理】抽样检验中样本容量的确定_第2页
第2页 / 共9页
【2017年整理】抽样检验中样本容量的确定_第3页
第3页 / 共9页
【2017年整理】抽样检验中样本容量的确定_第4页
第4页 / 共9页
【2017年整理】抽样检验中样本容量的确定_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《【2017年整理】抽样检验中样本容量的确定》由会员分享,可在线阅读,更多相关《【2017年整理】抽样检验中样本容量的确定(9页珍藏版)》请在金锄头文库上搜索。

1、抽样检验中样本容量的确定林鹤凯、宋明展、杨琨、孔京生摘要: 在实验工作中,常遇到如何把握采集样本的容量的问题,本文结合实际,从三个方面论述如何求出一个既满足精度,又相对较小的样本容量。求解的主体思想,为区间估计,即给定区间范围从而求得最佳 n 值。另外,在假设检验中,本文从生产和检验双方考虑,得到两种不同的容量取值方法,在生产中具有一定意义。根据所做估计,本文用matlab 编程进行了仿真实验。经失败实验的统计,当 n30 的阶段实验,失败实验的次数小于 5 次,可以说实验的成功率为 95%,置信水平在 0.05 下的实验,从而仿真结果还是真实可信。关键词:参数检验、假设检验、最佳检验、样本容

2、量、matlab 实验验证1、问题简述: 在实验工作中常遇到问题是如何把握采集样本的容量,如果容量 n 太小,估计问题不那么精确,检验问题就不太可靠;容量太大,又会造成人力物力的浪费。在此我们的就是要结合实际求出一个即满足精度又相对较小的样本容量。2、问题求解1: 参数估计1、 点估计以正态总体为例,有 ,已知 为其样本。 a 的无偏估计为 ,且 ,若要求 ,其中, 是已知常数,则 ,从而使估计可以更精确 。 2、区间估计以正态总体 为例有:当 已知有 ()/(0,1)naN当 未知有a 的置信水平为 1- 的区间估计分别为: 假设检验(以参数检验为主)2(,)Na12n,/Dn()D2/n2

3、,N1nSt_ _/2 /2()()nauu/ /11tStnS1、 参数检验基本思想:假设总体 ,其中 已知, 未知,显著水平为(,)Na:a(1 )提出假设,如:原假设 备选假设00:H10:a(2 )构造统计量,该统计量满足一个已知的分布,如: _()/()nu(3 )构造拒绝域,如: 从而 (,1)u/22、样本容量 n 确定的本质:(1 )区间估计(2)根据接收域去求 n 的范围,显然 n 在满足的范围内越小越好3、原理及方法:(1 )双侧检验: 1)假设总体 ,其中 未知, 未知,显著水平为(,)Naa原假设 备选假设00:H10:可以得置信水平为 的区间估计 1_/2/2(),(

4、)nnu :定义 为估计精度。/2()nu:若事先给定 值,则 2/在有些问题中,构造的统计量所服从的分布函数与 n 有关,则我们需要采用试差法来如课本 135 页的形式,2)假设总体 ,其中 、 未知,显著水平为(,)Na:a原假设 备选假设00H10:构造统计量 ,拒绝域_0()/()nSntt(1)nt进而求出其置信水平为 的区间估计为_(1),(1)S :在给定 后,我们可以得到,其中 22()()nnst0.5从 t 分布临界表中看到,对于显著水平 的情形,当 时,. 30n其临界值 ,这个临界值对于 各个 n 值的影响不太大,因此我们可以先(1)2nt30采用近似公式 ,若求得的

5、n 大大超过 30,则与 不矛盾了。2)4s(1)2nt否则采用试差法来确定 n,其步骤为:a) 先用 计算出 n21()b) 再用上一步算出来的 n 作为 中的 n,将 代入(1)t(1)t求出新的 n22()()ns:c) 循环 b)直至 两边 n 值相同或差异很小为止21()t(2 )单侧检验:假设总体 ,其中 已知, 已知,显著水平为(,)Na:a原假设 备选假设 00H10:可以将备选假设转化为 ,其中 为有实际意义的最小差值,也就是说如果 ,则我们可以直接认为在考虑随机因素的情况下0a0a由拒绝域 可以推出_()/()nuu()nu从而可得 ,满足该式且最小的整数 极为最合理的样本

6、容量2注:(1 )以上所讲的双侧检验的 以及单侧检验的 均是由检验方制定的精度(有利于检验方) ,以此来确定合理的 n,这与实际情况是相符的。然而我们也应该看到,如果从利于生产方的角度来说,生产方显然希望 n 较小,这可以从直观上理解。当然这里的 n 有一个可以接受的上限,以 u 检验为例,从接受域 得到 ,即在这个范围内检验是 生产商乐于接受的(2 )对于两个总体假设检验样本容量的确定参见课本 138 页,其思想与单参数假设检验样本容量的确定一致(3 )对于非参数检验(以皮尔苏检验为例)可以求出221124(miimpnv :满足该式且最小的整数 极为最合理的样本容量n/2u22/0una4

7、、例题某种电子仪器额定电流的总体方差 ,经校验确定的置信水平 0.95 的置信区间20的长度为 20mA,问要检验多少台仪器,才能满足这样的要去?解:取 ,由 可得 20,1S2()4ns9n由于 ,所以要使用试差法3n查得临界值 ,代入 得 0.5(8).3t221()(1t:.67n又 ,代入 得 0.5122nns0.94因为 10,94 与 11 比较接近,所以不用在“试差”了,即样本容量为 11 最佳检验(两种错误发生的概率均已知)1、最佳检验的回顾(只考虑两点检验)两类错误:原假设 ; 观察值0H112(,)nTx的否定域为 , 为置信水平0Aa第一类错误(弃真): 0Pa第二类错

8、误(取伪): 1TH2、 样本容量 n 确定的本质:(1 ) 控制两类错误在较小的范围内(2 ) 建立错误概率与分布函数的等式关系,求解 n3、原理及方法(不同问题统一的作法 )假设假设检验的参数为 , 为满足 分布的随机变量函数, 为样本的某个统计(;)TZ量, 为 分布函数, 为 分布的分为点。(,)Fx(;)的两点假设。01:Ha第一类错误概率: ,及 0(;)PTH00(,)(,)1FZa(1 )第二类错误概率: ,及 01(;)11(,)(,)a(2 )解得 n.举例: 服从 分布, 未知, 已知,不妨设 , (否则按照书 P130(,)Na10a的例题 8.4.4) 。则对于假设

9、。01:,:Haa最佳否定域应该为 , 服从 分布。A(,/)Nn这里可知 ,满足标准正态分布。00(;)()/Tn令 ,由第一类错误(1)与第二类错误( 2)知/Ua, 。PuPu,故 ,0()/nA1()/nAa查表得两个分为点,从而解方程组得。2210()/()nua3、 例题某种电子仪器额定电流的总体方差 ,经校验确定的置信水平 0.95 的置信区间的长度为 20mA,问要检验多少台仪器,才能满足这样的要去?解:取 ,由 可得 ,由于 ,所以要使用试差法查得临界值 ,代入 得 又 ,代入 得 由自由度 10,得 带入 ,得 因为 10.94 与 10.68 比较接近,所以不用在“试差”

10、了,即样本容量为 11。3、仿真实验2:给定分布函数,生成足够多数据的随机数,通过观察分析这些随机数的统计量来仿真抽样,从而观察样本容量对抽样结果影响。为了方便操作,该实验使用标准正态分布函数。3.1 问题假设(1).假设随机变量方差未知,运用 t-检验。(2).根据实际操作,样本容量不会太大,假设在 60 以内。2020,1S21()4ns300.5(8)2.t2()(t1.67n209n670.5(1). 2()(t60.5().3t2(s10.94n8(3). ,查表可知,假设 n30 的阶段实验,失败实验的次数小于 5 次,可以说实验的成功率为 95%,置信水平在 0.05 下的实验,

11、从而仿真结果还是真实可信。4、总结和体会1、我们在做参数估计等实验之前能够预估需要多大的样本容量才能达到实验目的,这对今后不管走上研究道路还是管理道路都很有帮助。2、其实样本容量的确定,是一个十分重要的工作。正如在前文假设检验中所示,如果从生产方的角度考虑问题,自然希望 n 越小越好,样本容量有一个可接受的上限;而从检验方的角度考虑,n 则是越大越好,在满足精度范围就要有一个起码的下限。说的功利一些,这里的 n 所取值是和一方的利益相关的,选取自然需要谨慎。3、我们在做实验时,是根据具体问题出发的,从而抽象出一个概念或模型,在做出这个模型后,还必须同具体问题进行对照,否则将无法对这个模型的准确

12、性进行判断。这就帮助我们在今后做事时,也要注意同实际情况进行比较。4、样本容量在数理统计的多个方面都有体现,是一个与实践情况联系紧密的概念。我们组所研究的假设检验中的样本容量确定,其实是一种提高假设检验“效率”的方式。事实求是的讲,我组所做成的结论是在一定简化基础上得到的,之后还可以有更多的研究。参考文献: 1 概率论及数理统计(第 4 版)下册.高等教育出版社:中山大学,2009. 2 何正风.Matlab 概率论与数理统计分析.机械工业出版社,2012.附录:matlab 仿真程序n=60;N=0;ta=2.4;for i=5:n clear dh=0;for j=1:100d=randn

13、(i,1);ksai(i-4)=mean(d);sgma1(i-4)=std(d);ssgma(i-4)=(i)*var(d)/(i-1);1.67nsgma2=sqrt(ssgma);t=sqrt(i-1)*ksai(i-4)/sgma1(i-4);if i=30 ta=2.0;endif 30i|i10ta=2.2;endif (tta|t-ta)h=h+1;endendN(i-4)=h;endX=-3:0.1:3;figure(1)hist(d,X);c=1;x=0;j=5:1:60;figure(2);title(100)subplot(2,1,1);plot(j,N,*);subplot(2,1,2);hist(N);figure(3);plot(j,ksai,-*r);hold on;plot(j,sgma2,-ob);hold off

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号