3 极值分布的统计推断

上传人:pu****.1 文档编号:496933307 上传时间:2023-04-19 格式:DOCX 页数:9 大小:37.75KB
返回 下载 相关 举报
3 极值分布的统计推断_第1页
第1页 / 共9页
3 极值分布的统计推断_第2页
第2页 / 共9页
3 极值分布的统计推断_第3页
第3页 / 共9页
3 极值分布的统计推断_第4页
第4页 / 共9页
3 极值分布的统计推断_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《3 极值分布的统计推断》由会员分享,可在线阅读,更多相关《3 极值分布的统计推断(9页珍藏版)》请在金锄头文库上搜索。

1、3 极值分布的统计推断统计推断就是依据样本推断总体分布的未知部分。本章只讨论在已知总体分 布为极值分布或属于极值分布最大值吸引场情况下,如何估计其中的未知参数或 其它数值特征,如高分位数、尾部特征,如何进行模型的检验等问题。依照统计学中惯用的记号,以X X表示一个随机样本,x ,x表1 n 1 n 示相应的观测值。前者强调所处理的是独立同分布的随机变量,后者则强调它们 是一组实数值。3.1 数据的经验分析给定数据集合x ,x,统计分析的目的之一是寻找一个较好的模型拟 1n合这些数据。为寻求合适的模型,首先必须了解这些数据的统计特征。我们从散 点图开始,因为图形醒目直观,尤其对于大型数据集合,更

2、是如此。数据的散点 图由点(i, x ) , i =1,2,组成,从图上可粗略估计数据是否平稳(见4.1i 节)。如果平稳,再进一步确认数据是独立同分布还是存在相关性。大多数情况 下,可以假定数据是独立同分布的。样本(X ,,X )的数字特征能从不同角度综合反映数据的概况,最常用 1n的就是样本的q阶原点矩(moment of order q about the origin),它是观测值q次 幂的算术平均A =丄工X q,q nii=1和q阶中心矩(central moment of order q),它是观测值与它们算术平均之差的q次 幂的算术平均B = 1 工(X - X),q nii=

3、1其中 表示样本均值,即一阶原点矩。一阶中心矩等于零,二阶中心矩即样本方 差,记为 , S 称为样本标准差。通过样本矩估计总体分布未知参数的方法, 既是通常所说的参数矩估计。样本偏度系数是3阶中心矩与标准差3次幂的比,即1 E n (X - X )ni=1ini/2E3/2 I (X -X)Li=1i -n (X - X)* 33/2若偏度系数小于 0,则该分布是一种左偏的分布,又称为负偏。若偏度系数大于 0,则该分布是一种右偏的分布,又称为正偏。样本偏度系数是 4 阶中心矩与标准差 4 次幂的比,即1 E n (X - X ) b = ni=1is1 E n (X - X)ni=1inEn

4、(X - X )4也是常用的数字特征,它是分布形状的另一种度量。2.5 节已提到正态分布的峰度为3若b 3,表示分布有较厚的尾部,说明样本含有较多远离均值的数据, k即通常所说的“尖峰后尾”,金融数据大部分是以峰度判定它的后尾性的。若对总体分布没有多少认识,样本经验分布不失为一个较好的选择。假定x xn,nn-1.nV1,nnn即经验p分位数,特别,对连续的分布函数F,我们有F-1(p) = X 1 -k /nVpW1-(k -1)/ n,其中 k=1,,n 即 X是经验 pnk ,n,n (1-p )+1,n分位数。例如95%经验分位数就是xn ,其中y 表示y的整数分布。如果l.0.05n

5、J+1,n选择适当的分布F作为样本X,,X 的总体分布,则F必须与经验分布f1nn在某种度量上尽可能一致,许多模型就是基于F和F的这种比较。n3.3 广义极值分布的参数估计 本节主要讨论GEV分布三个参数的各种估计方法,包括最常用的极大似然估计、 概率权矩估计和L矩估计。由于极大似然估计的优良性质,R中的极值统计包括 如evir, evd和ismev提供的GEV分布参数估计的函数都是基于极大似然方法的。 最后还探讨了参数的bayes估计以及自助(bootstrap)方法,ebdbayes包主要处 理参数的bayes估计,至于自助法,可以进一步参阅其他书籍,R中boot包提供 了更多关于自助法的

6、函数。3.3.1GEV 模型的建立由定理2.2可知,GEV分布为区组最大值提供了一个理想的模型。为此首先按等 长度对数据进行分组,并以GEV分布作为区组最大值序列的模型。区组大小的 选择是关键问题,这需要权衡偏和方差:区组过小使得由定理2.1得到的极限模 型与实际模型有较大差别,导致一个有偏估计;区组过大,只能得到少量的区组 最大值,由此得到的统计量有较大方差。在实际应用中,如果只是记录了年最大 值,自然形成最大值序列。如果记录的是每日观测值,一般按年度分组,此时定 理 2.1 独立同分布的条件不满足,它们可能是相关的,但年最大值可以认为是满 足定理2.1的条件。例如,日温度随季节而变化,这不

7、满足x具有相同分布的假i定。如果将数据以3各月为一季分组,夏季的最高温度将远大于冬季的最高温度, 这种没有考虑到非齐次性的推断会得到不准确的结论。但如果是以年度分组,由 于不同姐姐的日温度各有不同的分布,GEV分布作为年最高温度近似分布的理 由似乎不是很充分,但各个区组最大值有共同分布的假定却是可以将接受的。为简单起见,记区组最大值序列为x ,,x,且假定是含有未知参数的GEV分1m布的独立观测值。极值模型参数估计方法,包括图形法、矩法、L矩法以及基于似然估计的各种方 法。每种方法均有其优劣,但极大似然法是一个比较好的,且是对复杂模型具有 易适应性的方法。3.3.2极大似然估计假定X ,,X是

8、服从GEV分布的独立随机变量,当工0时,GEV分布的1m对数似然函数为0(u,G, g)二m log g (1+1/ g 正 logi=11匕/X u、1+g )IE1匕/X u、1+g )i=1这里要求1 + g ( _ )0 , i = 1 , ,mg否则似然函数值为零,对应的对数似然函数值为-g 当g = 0时,对数似然函数为式(3.7)。将式(3.21)关于参数向量(RQ,g ) 极大化,得到 GEV 分布的极大似然估计.尽管不存在解析解,但对给定的数据,用数值算法可得到极大似然估计值,注意这里始终要求式(3.22)成立。当g在0 附近时,对数似然用式(3.7)而不是式(3.21),以

9、避免数值计算时可能遇上 的麻烦。当g 0.5时,极大似然估计量(|1,&, )的渐近分布是多元正态分布178,均值向量为(RQ,g ),协方差矩阵为观测信息矩阵I (9 )在极大似然估计值处的逆 0矩阵。尽管对极值分布,协方差矩阵I-1(9)有解析表示,但对一般分布,I (9 )的 EE元素未必有解析表示,因此用数值微分法来计算0(9 )的二阶导数,并用标准的数值方法计算逆矩阵,即用1-1(9)作为(,&, )的协方差矩阵,可能会更容易些。E相应的置信区间及其它推断可推断可由估计量的渐近正态性得到。有了参数的估计值后,就可以进一步估计分位数。对于0VpV1,由式(2.13 )和 式(2.14)

10、知分位数x的极大似然估计为当E丰0;当 E=0;pn-尹(1 yg, =0时,上端l点xn的极大似然估计为8。当有讨厌参数(见3.4.3节)时,可以用轮廓似然函数构造感兴趣参数的置信 区间,一般对形状参数g是最感兴趣的。为了得到g的轮廓似然函数,我们可以 假定g=g不变,求式(3.21)关于n和g的极大值,并对一定范围内的g重复此 oo步骤。这样每给定一个g,就可以得到一个似然函数的极大值,实际上就是g的 o轮廓似然函数值。在对轮廓似然函数取极大值,对应的g就是g的轮廓似然估计,最后由定理3.5可得到g的近似置信区间。轮廓似然方法也可以用于估计多参数函数的置信区间。例如,为得到分位数 x的置信

11、区间,需要重新定义GEV模型的参数,使x是其中一个参数,比如新 pp的参数为x , o和x,有关系式ppn = x log p_gpg将式(3.26)打入式(3.21)就可得到GEV模型关于参数(x ,o,g )的对数似p然函数。再按照上述方法求出参数x的轮廓似然估计x及轮廓似然置信区间。 pp使用极大似然法估计GEV分布不满足这些正则条件,因为GEV分布的支撑 是其参数的函数:gvo时,n_o/g是分布的上端点;当go时,n_o/g是分布支撑的下端点。极大似然估计的渐近正态性不一定成立,但有以下结论179:1当g0.5时,极大似然估计是正则的,即通常的渐进性质成立;2当-lVg V0.5时,可得到极大似然估计,但它不具有标准的渐进性质;3.当gV-1时,得不到极大似然估计。在g 0表示Gamma函数,特别当r = 0,1,2时,由上式可得0O (0)=p ?1T(1 g),0g2o (0)=p ?1T(1 g) 2g,1g3o (0)=y ?1-T(1 g) 3g,2g因此3(0)-w(0) 3 12(0)-3(0)2g -110定义样本的 r 阶概率权矩为3 (0)=1 (n-j)(n-j-1)(n-j-r + 1)x ,r = 1,2.r n(n

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号