第五章　统计估计和假设检验

资源描述

《第五章　统计估计和假设检验》由会员分享，可在线阅读，更多相关《第五章　统计估计和假设检验（16页珍藏版）》请在金锄头文库上搜索。

1、第五章统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分：一是统计估计，二是假设检验。统计估计问题就是根据样本的数字特征来估计总体参数的数字特征，因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式：点估计和区间估计。假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验，以判断其正确性。假设检验也分为两类：一类是对总体分布的一些数字特征进行检验，称为参数假设检验；另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验，此时只检验分布，而不对参数作检验，这称作非参数的假设检验。非参数

2、检验将在第六章进行讨论，本章着重讨论参数检验。第一节点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为，这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性，统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然，这样做必然会有误差产生。这种误差就称为抽样误差。极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。例5-1。设有一批产品，质量上分为正品与次品。产品的次品率有两种估计：0.1和0.4，今随机抽样15件产品，发现只有一件是次品。现根据这一抽样情况，来决定用哪一种次品率来估计

3、更为可靠呢？记 A =“抽取15件产品，只有一件是次品”，设抽得正品用X=0，抽得次品用X=1来表示。抽样结果只有 X=0 与 X=1 两种情形，于是，可得事件 A发生的概率为： P(A)= 其中：是这批产品的次品率。若次品率=0.1，则P(A)=0.1=0.0229 若次品率=0.4，则P(A)=0.4=0.0003。现在事件A 既然在一次观察中就发生了，直观地我们可以认为事件A发生的概率P(A)不会小，故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。由于0.02290.0003，故应选择0.1作为产品的次品率比选择0.4更可靠些。把上例推广到一般的情形，我们就可以

4、得到极大似然法的一般原理。设是取自密度函数为f(x, )的总体的一组样本。其中：x和都为参数，待估计。的极大似然估计的基本思路是，若记A =“一次观察中，所得一组样本的样本值为( )”。现在在一次观察中A发生了，即P(A)应尽可能地大，即应在所有可能取值的集合中选出一个使P(A)达到最大值的作为的估计值。此时的又称为的极大似然估计值。由于相互独立，且都与X具有相同的分布，由此可以得到，P(A)就相当于事件：同时发生的概率，也就是P(A)=，记为L()=L(), 于是有： L()= L()称为的似然函数。求极大似然值的问题就是求似然函数L()的最大值问题，根据微分学的结果，L()取到最大值的

5、必要条件是它对的导数为零。因为ln L()与L()取得极大值的点相同，为计算方便，我们通常就用对数似然方程来求解最大似然估计值。在我们上述例子中，f(1, )=，f(0，)=1-，于是得到似然函数：L()=令=0，舍去=1，得的最大似然估计值=0.067。实际上，正是在15次抽样中得到一次次品的频率，用频率估计概率，当n充分大时无疑是合理的。例5-2。从一个正态总体中抽取容量为n的样本，求总体参数的极大似然估计。解：构造似然函数为了求和，使ln的极大，令解上述方程得到：所以得到和的极大似然估计量为：二、估计量好坏的评选标准前面讨论了如何利用极大似然法来求参数的估计量。但对于同一个参

6、数可以用不同的方法来求其估计量，于是，在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。那么，什么样的估计量是好的估计量呢。这就有一个如何对估计进行评价的问题。请看下面一个例子。例5-3。假如某一建设单位购进了一批建筑用的线材，就需要了解这批线材的平均抗拉强度是多少。现在要通过抽样，选择样本的某个函数（统计量）来推断总体指标值。由于随机原因，每次抽取样本的测量结果是不同的。如果样本容量为3，抽取4组样本，测得结果如表5-1所示。表5-1 一组抽样样本的观察值样本值样本顺序均值190099910119702995105011051065310109418909474950

7、91011401000 为了说明的方便起见，我们假定，实际上=1000公斤，当然这在事先是不知道的。我们要求利用样本信息来推断总体指标，并使其误差最小。第一组样本的中位数最接近总体指标，第二组样本是最小值最接近总体指标，第三组样本是最大值最接近总体指标，第四组样本是均值刚好等于总体指标。于是就产生了一个问题，在大量的实验中，究竟采用哪一个指标来推断总体指标更合理呢？评价点估计的结果通常有无偏性、有效性和一致性等标准。 1. 无偏性无偏性的含义是个别样本由于随机原因可能偏大或偏小，然而一个好的估计量从平均上看应该等于所估计的那个指标，其直观意义是估计量的值应在参数的真值周围摆动而无系统误差。一

8、般地，无偏性的定义为：设为被估计参数，若有估计量( )，对一切n，有=，则称为的无偏估计量。若-b，则称b为估计量的偏差。若b0，则称为的有偏估计量。如果，则称为的渐近无偏估计量。不论是重复抽样或不重复抽样，也不论样本容量大小，样本均值及样本比例都是总体均值和总体比例的无偏估计，即，但样本方差并不是总体方差的无偏估计量。这是因为如果我们把定义为 =，则：产生偏差的原因是总体方差的无偏估计应该是，但抽样时由于是未知的，因而用估计量来代替。根据最小平方原理，变量X距样本均值的离差平方和为最小，因此就小于，从而用代替计算的方差就低估了，为了得到的无偏估计，令这时，由于，就是的无偏估计了。样

9、本方差与之差称为偏差。但当n很大时，所以它是渐近无偏差估计。当样本容量很大时，也可以直接用样本方差作为总体方差的估计值。但如样本容量较小时偏差就比较大了。图5-1 估计的无偏性和有效性 2. 有效性即使是符合无偏性要求的估计统计量，在抽取个别样本时也会产生误差。为了使误差尽量地小，要求估计量围绕其真值的变动愈小愈好，也就是说要求统计量的离散程度要小，或者说其方差要小。一般地，有效性的定义为：设、是未知参数的两个估计量，若对任意的正常数c，有，则称比有效。有效性反映了估计量分布的集中程度，估计量的分布越是集中在参数真值附近，则其估计效率越高，如图5-1所示。但是为了方便起见，在实际上有效性

10、可定义为：、是未知参数的两个无偏估计量，若用V()，V()分别表示各自的方差，若V()/V()1，则称比有效。例如，对正态总体，利用样本均值及样本中位数M来估计总体的均值时，均为无偏估计，那末哪一个更有效呢？均值的抽样分布为，统计上可以证明中位数的分布为，由于。这就说明比有效，即用样本均值来估计总体的均值比用中位数来估计总体的均值效率高。换句话说，用中位数来估计总体均值的平均误差要比用样本均值来估计总体均值时的更大。如果用中位数作为估计量要达到与以样本均值作为估计量同样可靠的程度，就要增加样本。设用均值估计的样本为，中位数估计的样本为，设其估计效率相等，即方差相等，则，由此得到=1.57，

11、即用中位数估计时要比用样本均值来估计时多抽57%的样本单位。 3. 一致性这就是要使统计量随样本容量n的增加，不断趋近于总体指标。在（有限总体N）时，估计值与总体参数完全一致。一般地，点估计的一致性定义如下：设 ( )为未知参数的估计量，若依概率收敛于，则为的一致估计量。现在来看样本均值这一统计量是否符合一致性的要求。根据切比雪夫等式：令当时一致性是从极限意义上来说明统计量与总体参数关系的。这种性质只有当样本容量很大时才起作用。另外，符合一致性的统计量也不止一个，因此，仅考虑一致性是不够的。事实上，我们也可以证明，当总体为正态分布时，中位数这一统计量也符合一致性的要求。而样本的最小值

12、和最大值尽管在个别的抽样中可能取得好的效果，但从总体上来看并不是一个好的估计量。第二节区间估计一、区间估计的概念和步骤点估计用一个确定的值去估计未知的参数，具有较大的风险。因为估计量来自于一个随机抽取的样本，结果也就带有随机性。样本估计量刚好等于所估计的总体参数的可能性极小。但是如果说所估计的总体参数就落在估计值附近，即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内，那就比较有把握了。这种方法就是区间估计法。在第四章中我们已经知道，一个足够大样本的均值的抽样分布是正态的，并且所抽到的样本均值落在总体均值的两侧范围内的概率是0.683，落在总体均值范围内的概率是0.955

13、，落在总体均值范围内的概率是0.997等等。由此可见，我们可以按照概率来估计总体均值是落在某一区间范围内的。我们把这种对总体均值的估计称作区间估计。从上述说明可以看到： 1. 如果所估计的区间越大，参数被包含在该区间内的概率就越大。 2. 如果样本的方差越小，则在相同的概率下区间估计所得到的结果就越短。一般地，设为总体的一个未知参数，分别为由一组样本所确定的对的两个估计量，对于给定的，若P()=，则称区间为置信度是的置信区间。分别为置信区间的下限和上限。称为置信度或置信概率，表示区间估计的可靠度。称为置信度水平。常用的置信度有0.80，0.90，0.950.99等。一般来说，对于估计要求比

14、较精确的问题，置信程度也要求高一些，在社会经济现象中，通常采用95%就可以了。置信度反过来也表示可能犯错误的概率。如置信度为95%，则犯错误的概率就为1-95%=5%。这一概率也就是置信度水平，也可理解为风险率或风险水平。图5-2 根据不同样本所得到的置信度为95.5%的置信区间需要指出的是，P()=不应理解为落在某一固定区间的概率。因为这里是一个参数，而不是随机变量，而是根据抽样的结果计算出来的，因此，是一个随机区间。即每一个样本都可产生一个估计区间，因此，上述概率可以理解为随机区间中包括参数的概率。图5-2表示根据不同样本所得到的置信度为95.5%的置信区间与总体均值的位置关系。从所有样本得到的置信区间中有95.5%的区间将包括总体均值，因此可以说所得到的估计区间包括总体均值具有95.5%的置信度。二、单个总体参数的区间估计（一）正态总体，方差已知，总体均值的区间估计根据第四章关于样本均值分布的结果，有 N(0，1) 在给定了估计置信度为时，我们有我们可以根据这一原理用样本均值来推断总体均值的区间估计值。若样本的均值为，同时若规定置信度为，则总体均值的区间估计的公式是这一置信区间的估计可以用图5-3来表示。上述估计公式仅适用于无限总体的情形，对

展开阅读全文

第五章 统计估计和假设检验

第五章　统计估计和假设检验