多元正态总体均值向量和协差阵的假设检验.doc

上传人:hs****ma 文档编号:549112782 上传时间:2024-03-23 格式:DOC 页数:13 大小:574.51KB
返回 下载 相关 举报
多元正态总体均值向量和协差阵的假设检验.doc_第1页
第1页 / 共13页
多元正态总体均值向量和协差阵的假设检验.doc_第2页
第2页 / 共13页
多元正态总体均值向量和协差阵的假设检验.doc_第3页
第3页 / 共13页
多元正态总体均值向量和协差阵的假设检验.doc_第4页
第4页 / 共13页
多元正态总体均值向量和协差阵的假设检验.doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《多元正态总体均值向量和协差阵的假设检验.doc》由会员分享,可在线阅读,更多相关《多元正态总体均值向量和协差阵的假设检验.doc(13页珍藏版)》请在金锄头文库上搜索。

1、第三章 多元正态总体均值向量和协差阵的假设检验什么是假设检验及基本思想、计算步骤,在初等数理统计中都已做过介绍。多元分析也涉及这方面内容,在后面介绍的常用各种统计方法,有时要对总体的均值向量和协差阵做检验,比如,对两个总体做判别分析时,事先就需要对两个总体的均值向量做检验,看看是否在统计上有显著差异,否则做判别分析就毫无意义。本章类似一元统计分析中的各种均值和方差的检验相应给出多元统计分析中的各种均值向量和协差阵的检验。不论做上述任何检验,其基本步骤均可归纳为四步:第一步,提出待检验的假设和。第二步,给出检验的统计量及它服从的分布。第三步,给定检验水平a,查统计量的分布表,确定临界值,从而得到

2、否定域。第四步根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设检验做出决策(拒绝或接受)。由于各种检验的计算步骤类似,关键在于对不同的检验给出不同的统计量,而有关统计量的给出大多用似然比方法得到。本章只侧重于解释选取统计量的合理性,而不给出推导过程,最后给出几个实例。同时为了说明统计量的分布,自然地给出HotellingT2分布和Wilks分布的定义,它们分别是一元统计中t分布和F分布的推广。3.1 均值向量的检验为了对多元正态总体均值向量作检验,首先需要给出HotellingT2分布的定义。1 HotellingT2分布定义 设且X与S相互独立,则称统计量的分布为非中心Ho

3、tellingT2分布,记为。当时,称服从(中心)HotellingT2分布,记为,由于这一统计量的分布首先由Harold Hotelling提出来的,故称为HotellingT2分布,值得指出的是,我国著名统计学家许宝马录先生在1938年用不同方法也导出T2分布的密度函数,因表达式很复杂,故略去。在一元统计中,若来自总体的样本,则统计量:分布其中 显然,与上边给出的T2统计量形式类似,且。可见,T2分布是一元统计中t分布的推广。基本性质:在一元统计中,若统计量分布,则分布,即把t分布的统计量转化为F统计量来处理,在多元统计分析中T2统计量也具有类似的性质。定理 若且X与S相互独立,令,则这个

4、性质在后面经常用到。2 均值向量的检验设p元正态总体,从总体中抽取容量为n的样本。(1)已知时均值向量的检验检验统计量:(在H0成立时)给出检验水平a,查分布表使,可确定出临界值,再用样本值计算出,若,则否定H0,否则H0相容。这里要对统计量的选取作两点解释,一是说明它为什么取为这种形式。二是说明它为什么服从分布。一元统计中,当已知时,作均值检验所取的统计量为:显然,与上边给出的检验统计量形式相同。另外根据二次型分布定理:若,则。显然,。其中,因此,。(2)未知时均值向量的检验检验统计量:(在H0成立时)其中给定检验水平a,查F分布表,使,可确定出临界值,再用样本值计算出,若,则否定,否则相容

5、。这里需要解释的是,当未知时,自然想到要用样本协差阵去代替,因(n-1)S-1是的无偏估计量,而样本离差阵再根据HotellingT2分布性质,所以3 协差阵相等时,两个正态总体均值向量的检验设且两组样本相互独立,。(1)有共同已知协差阵时检验统计量: (在H0成立时)给出检验水平a,查分布表使,可确定出临界值,再用样本值计算出,若,则否定H0,否则H0相容。在一元统计中作均值相等检验所给出的统计量:显然,此式恰为上边统计量当时的情况,不难看出这里给出的检验统计量是一元情况的推广。(2)有共同的未知协差阵时检验统计量:(在H0成立时)其中:给定检验水平,查F分布表使,可确定出,再用样本值计算出

6、F,若,则否定H0,否则H0相容。当两个总体的协差阵未知时,自然想到用每个总体的样本协差阵和去代替,而从而所以下述假设检验统计量的选取和前边统计量的选取思路是一样的,以下只提出待检验的假设,然后给出统计量及其分布,为节省篇幅,不做重复的解释。4 协差阵不等时,两个正态总体均值向量的检验设且两组样本相互独立,分两种情况(1)n=m令检验统计量: (在H0成立时)(2)不妨假设令 检验统计量:5 多个正态总体均值向量的检验(多元方差分析)多元方差分析是一元方差分析的推广。为此先复习一下一元方差分析,之后为了对多个正态总体均值向量作检验,自然地先给出Wilks分布的定义。(1)复习一元方差分析(单因

7、素方差分析)设k个正态总体分别为,从k个总体取ni个独立样本如下: H1:至少存在使检验统计量:(在H0成立时)其中组间平方和组内平方和总平方和给定检验水平, 查F分布表使,可确定出临界值,再用样本值计算出F值,若则否定H0,否则H0相容。(2)Wilks分布在一元统计中,方差是刻划随机变量分散程度的一个重要特征,而方差概念在多变量情况下变为协差阵。如何用一个数量指标来反映协差阵所体现的分散程度呢?有的用行列式,有的用迹等方法,目前使用最多的是行列式。定义1 若,则称协差阵的行列式为X的广义方差。称为样本广义方差。其中。定义2 若,且A1和A2相互独立,则称为Wilks统计量,的分布称为Wil

8、ks分布,简记为,其中为自由度。在实际应用中,经常把统计量化为T2统计量进而化为F统计量,利用F统计量来解决多元统计分析中有关检验问题。当时,用n代替n1,可得到它们之间的关系式如下:即由前边定理知所以当n2=2时有如下关系:当p=1时有:当p=2时有:以上几个关系式说明对一些特殊的统计量可以化为F统计量,而当时,可用统计量或F统计量来近似表示,后面给出。(3)多个正态总体均值向量检验(多元方差分析)设有k个p元正态总体,从每个总体抽取独立样品个数分别为,每个样品观测p个指标得观测数据如下:第一个总体:此处第二个总体:此处第k个总体: 此处全部样品的总均值向量:各总体样品的均值向量:此处类似一

9、元方差分析办法,将诸平方和变成了离差阵有:组间离差阵组内离差阵总离差阵这里T=A+E欲检验假设用似然比原则构成的检验统计量为:给定检验水平,查Wilks分布表,确定临界值,然后作出统计判断。当手头没有Wilks分布表时可用如下分布或F分布来近似。设 令式中则V近似服从,R近似服从,这里不一定为整数,可用与它最近的整数来作为F的自由度,且min。3.2 协差阵的检验1 一个正态总体协差阵检验设来自p元正态总体的样本,未知,且。(1)检验统计量:其中(2)因为,所以存在使令则因此,检验等价于检验检验统计量其中给定检验水平,因为直接由分布计算临界值很困难,所以通常采用的近似分布。在H0成立时,一2l

10、n极限分布是分布。因此当,由样本值计算出值,若-2ln即,则拒绝H0,否则H0相容。2 多个协差阵相等检验设k个正态总体分别为且未知,。从k个总体分别取个样本且未知,。从k个总体分别取个样本不全相等令检验统计量:在实际应用中,将改为,n改为n-k,得修正的统计量记为,则近似分布,其中,例1 人的出汗多少与人体内钠和钾的含量有一定的关系。今测20名健康成年女性的出汗多少(X1)、钠的含量(X2)和钾的含量(X3),其数据如下表。试检验。序号X1X2X313.748.59.325.765.18.033.847.210.943.253.212.053.155.59.764.636.17.972.42

11、4.814.087.233.17.696.747.48.5105.454.111.3113.936.912.7124.558.812.3133.527.89.8144.540.28.4151.513.510.1168.556.47.1174.571.68.2186.552.810.9194.144.111.2205.640.99.4经计算为了计算令,于是得如下方程组,解得:于是=0.016494查F表得因此在a=0.05或0.01时接受H0假设。例2 为了研究日、美两国在华投资企业对中国经营环境的评价是否存在差异,今从两国在华投资企业中各抽出10家,让其对中国的政治、经济、法律、文化等环境进行

12、打分,其结果如下表:序号政治环境经济环境法律环境文化环境16535256027550305536045356547540407057030305065541356576045306086540256096050307010555535751155554065125060457013454535751450505070155550307516604045601765554575185060358019404530652045504570110号为美国在华投资企业代号,1020号为日本在华投资企业的代号。数据来源:国务院发展研究中心APEC在华投资企业情况调查。设两组样本来自正态总体分别记为:且两

13、组样本相互独立,共同未知协差阵检验统计量:经计算代入统计量中得查F分布表得 显然故否定H0,即认为日、美两国在华投资企业对中国经营环境的评价存在显著差异。3.3 附注近年来很多人,使用国际上著名的SAS或SPSS软件进行统计分析,为便于和国际接轨,这里简单介绍一下现代国际统计学关于显著性检验的作法,它与国内多数统计教科书及期刊论文的处理方法不同。为了便于直观说明这种作法的基本思想,下面以一元正态总体U检验法、t检验法为例作介绍,对其它检验法也类似处理。设样本来自正态总体已知,未知,要对作显著性检验,统计假设检验统计量:该统计量在H0成立时服从N(0,1)将给出的样本数据代入统计量中,算出统计量值,比如,说明观测的平均值与期望值之差为标准差的3倍,由原则知:。因此可以计算出,其中。从上图很直观看出,在正态曲线下,-3与+3左右两尾部的面积非常小,或者说要取得一个样本平均值

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号