多元正态分布参数的假设检验

上传人:mg****85 文档编号:44548316 上传时间:2018-06-14 格式:PDF 页数:65 大小:459.18KB
返回 下载 相关 举报
多元正态分布参数的假设检验_第1页
第1页 / 共65页
多元正态分布参数的假设检验_第2页
第2页 / 共65页
多元正态分布参数的假设检验_第3页
第3页 / 共65页
多元正态分布参数的假设检验_第4页
第4页 / 共65页
多元正态分布参数的假设检验_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《多元正态分布参数的假设检验》由会员分享,可在线阅读,更多相关《多元正态分布参数的假设检验(65页珍藏版)》请在金锄头文库上搜索。

1、1第三章多元正态分布参数的假设检验2武汉理工大学统计学系唐湘晋3.1 基本概念?统计假设检验包括两类问题:一是已经知道随机变量分布函数的形式,但其中包含几个未知的参数,要求检验这些参数是否等于某些已知的数值,这类问题称为参数的假设检验;二是随机变量的分布函数未知,要检验它是否服从某一已知的分布,这类问题称为分布的假设检验。?在假设检验理论中,把原假设以外的那些值称为备择 假设。3武汉理工大学统计学系唐湘晋?例如,若正态总体的平均数未知,但知道它的取值域为0,我们要检验原假设“=0”,这样,除0以外的一切正实数都是备择假设。但是,如果在假设检验中只提出原假设,检验的目的只是通过观测资料来判断是接

2、受还是拒绝这个假设,那么这种假设称为显著性检验。如果检验结果否定了原假设,就说(假设与实际)差异显著;如果检验结果不能否定原假设,就说(假设与实际)无显著差异。4武汉理工大学统计学系唐湘晋?小概率原理一个概率很小的事件,在一次试验中可以认为是不可 能发生的;?在假设检验中,接受或拒绝原假设的决定是根据样本 特征值与假设值的偏差超过一定界限的概率作出的, 如果这个概率很小,就拒绝假设;如果这个概率较 大,就接受假设。这里显然有一个标准问题,即要规 定一个很小的概率作为临界值,当上述偏差超出规 定界限的概率小于或等于时,就拒绝原假设,反之 就接受原假设。这个临界概率称为显著性水平。5武汉理工大学统

3、计学系唐湘晋3.2 多元正态分布的均值向量的检验?p维正态总体的统计推断问题,包括均 值向量的检验和均值的置信域问题。 p维正态随 机向量的每一个分量都是一元正态变量,若将p 维均值向量的检验问题化为p个一元正态的均值 检验问题,虽然可以使问题简化,但忽略了p个分量间的互相依赖关系,常常得不出正确的结 论。()pN,6武汉理工大学统计学系唐湘晋设 X1, X2, Xn是来自正态总体的样本,考虑假设:()pN, 0010:, :HH=a) p = 1b) p 1()00, 1XUnN=()()21 000.Tn=XX 一、已知时单个总体均值向量的检验7武汉理工大学统计学系唐湘晋在原假设 H0 下

4、,则01.pNnX , ()1 2 01, .ppNn=+X Y Y0 I , ()1 2 0n=XY ()()212 000( )np=XXTY Y 定理 设 X1, , Xn是来自正态总体的样本,且已知,则在原假设下, 服从自由度为 p 分布,且原假设的拒绝域为: ()pN, 2 0T200:H=( )22 0.pT8武汉理工大学统计学系唐湘晋具体步骤是:1.作统计假设:2.算样本的均值3.计算统计量T的具体值4.按规定的小概率标准,查分布表,得临界值,并作出判断:当,接受H0,拒绝H1,即认为与没有显著差异。当,接受H1,拒绝H0,即认为与有显著差异。01:, :HH=00 X ()()

5、1.2 0Tn=XX002)(2p2 0T)(2p2 0T)(2p9武汉理工大学统计学系唐湘晋建议:用样本协方差S来替换,即其中()()()()()21 001 001-nn n=XVXX SXT()() 111 11njj jn-n-=VSXXXX二、未知时单个总体均值向量的检验10武汉理工大学统计学系唐湘晋在, 故由T2分布定义知利用T2与F分布的关系,检验统计量取为()2,1npTF p npnp()00:, H= 下01(,)PNnX01( ,)PNnX0()()()212 001( ,1)TnnnTp n=XSX()()() 11, .njjp j-Wn=SXXXX11武汉理工大学统

6、计学系唐湘晋具体步骤是:1.作统计假设:2.算样本的均值和样本协方差3.由公式计算F统计量具体值F。4.按规定的显著水平,查F分布临界值,并作出判断:当,接受H0,拒绝H1,即认为与没有显著差异。当,接受H1,拒绝H0,即认为与有显著差异。01:, :HH=00X 11()()1nii in=VXX XX()2,1npTF p npnp()),(pnpF),(0pnpFF),(0pnpFF12武汉理工大学统计学系唐湘晋?例 某小麦良种的四个主要经济性状的理论值为。现在从外地引入一新品种,在21个小区种值,取得如表所示数据。设新品种的四个性状, 试检验假设0(22.75, 32.75, 51.5

7、0, 61.50)=12344(,) ()XXXXN=X,00:(0.05)H=13武汉理工大学统计学系唐湘晋小区号 性状1234567X122.8822.7422.6022.9322.7422.5322.67X232.8132.5632.7632.9532.7432.5332.58X351.5151.4951.5051.1751.4551.3651.44X461.5361.3961.2260.9161.5661.2261.30小区号 性状891011121314X122.7422.6222.6722.8222.6722.8122.67X232.6732.5732.6732.8032.6732

8、.6732.67X351.4451.2351.6451.3251.2151.4351.43X460.3061.3961.5060.9761.4961.1561.15小区号 性状15161718192021X122.8123.0223.0223.1522.8823.1623.13X233.0233.0532.9533.1533.0632.7832.95X351.7051.4851.5551.5851.4551.4831.38X461.4961.4461.6261.6561.5461.4161.5814武汉理工大学统计学系唐湘晋?解:123422.8232.7951.45 61.38X XX X

9、= X2111()()21 170.3076 52.146973.5511 3.446219.363790.4098 6.96241.202233.698940.0895ii i= = VXX XX21 0021()()15.2910T=XVX2493. 320417 ) 1(22 0=TTnppnF查F表,得F0.05(4,17) = 2.96,因为故拒绝H0。00.05(4,17)FF15武汉理工大学统计学系唐湘晋三、两总体协差阵相等(但未知)时均值向量的检验?设为来自总体的样本;为来自总体的样本,且两总体相互相互独立,未知。要检验两总体均值是否相等,即()1pNX , ()2pNY ,

10、12,nX XXK12,mY YYK012:H=112:H16武汉理工大学统计学系唐湘晋?当p = 1时,因为,, 且相互独立,在H0成立条件下,有显然211(,)XNn,212(,)YNm221111() (2)()()(2)nmii ijX Ynmtt n mXXY Yn m=+ =+ +1 22112()() ()() (1,2)2nmij ijXXYYnmtX YX YFn mm nn m=+ =+ 17武汉理工大学统计学系唐湘晋?推广到p元总体,可以得到形式类似的统计量 T2:记()()()() 111 2nmeiijj ijnm=+VXXXXYYYY其中1111,nmij ijnm

11、=XXYY()21,12nmpTF p nmpnmp+()()212() ( , -1) - enmTTp nmnm=+XYVXY在原假设H0下18武汉理工大学统计学系唐湘晋因为在H0成立条件下11() (0,() ),pNnm+X-Y() ()pnmNnm+X-Y0,1 1(-)(-) (1,)niip iWn=SXX XX2 1()() (1,)mjjp jWm=SYY YY且相互独立,由Wishart分布的可知性知12(2,)pWnm+SS19武汉理工大学统计学系唐湘晋由T2统计量的定义知212 12(2)() () () ( ,2)nmTnmTp nmnm=+XYSSXY利用T2与F的

12、关系,检验统计量取为) 1,()2(1)2(2+=pmnpFTpmnpmnF20武汉理工大学统计学系唐湘晋具体步骤是:1.作统计假设:2.计算样本的均值和,样本离差阵S1和S23.由公式计算F统计量具体值F。4. 按规定的显著水平,查F分布临界值并作出判断: 当接受H0,拒绝H1,即认为与没有显著差异。 当接受H1,拒绝H0,即认为与有显著差异。012112:, :HH=X( ,1)Fp nmp+0( ,1)FFp nmp+0( ,1)FFp nmp+Y) 1,()2(1)2(2+=pmnpFTpmnpmnF21武汉理工大学统计学系唐湘晋?例 为了判别两个不同产地的鸢尾花是否属于同一个 种,各

13、取50个样本,量测了花的萼片长度X1,萼片宽 度X2,花瓣长度X3,花瓣宽度X4,共四个指标。希望通过比较这些形态上的差异是否显著,作为分类的一 个依据。?解:1提出假设2由原始数据计算得012:,H=112:H50.06 34.28 14.62 2.46 = X59.3627.66 42.6013.26 = Y22武汉理工大学统计学系唐湘晋112.425 9.92214.369 1.6361.1703.015 1.0330.9300.6071.111 = S226.6438.2889.902 18.2908.12722.082 5.5784.0497.3103.911 = S21(2)()(

14、) () 125530nmTn mn m=+=+12X-Y S +SX-Y2 0(2)130423(2)nmpFTnmp+=+3查F表得F0.01(4,95) = 3.52,由F0F0.01,完全可以拒绝的假设,即两组鸢尾花的形态之间有显著差异。23武汉理工大学统计学系唐湘晋?已知时, 的置信域设X1, X2, Xn是来自正态总体的样本,因为对任给置信度,查分布临界值表得满足()pN, 四、多元正态分布的均值的置信域()()212 0( )np=XXT12)(2p22 0( )1P Tp= 24武汉理工大学统计学系唐湘晋则均值向量的置信度为的置信域为该置信域是一个中心在的椭球。当检验时,若落在该置信域内,即,则在显著水平下,接受H0;若没有落入该置信域内,则否定H0。所以在多元统计中,也可以说均值向量的假设检验问题本质上也等价于求均值向量的置信域。112()()( )npX- X-00:H=012 00()()( )npX-X-0X25武汉理工大学统计学系唐湘晋?置信域椭球各半轴长的求法由于对称且正定,则由线性代数知,有实的特征根且均大于零。设p个特征根为其所对应的单位特征向量为它们均为p维列向量,且,。记

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号