007第 水文频率计算1110

上传人:hs****ma 文档编号:567609605 上传时间:2024-07-21 格式:PPT 页数:117 大小:2.46MB
返回 下载 相关 举报
007第 水文频率计算1110_第1页
第1页 / 共117页
007第 水文频率计算1110_第2页
第2页 / 共117页
007第 水文频率计算1110_第3页
第3页 / 共117页
007第 水文频率计算1110_第4页
第4页 / 共117页
007第 水文频率计算1110_第5页
第5页 / 共117页
点击查看更多>>
资源描述

《007第 水文频率计算1110》由会员分享,可在线阅读,更多相关《007第 水文频率计算1110(117页珍藏版)》请在金锄头文库上搜索。

1、第第 七七 章章 水文频率计算水文频率计算 水文频率计算水文频率计算 l7-1 7-1 概述概述l7-2 7-2 几种理论分布的频率计算与分析几种理论分布的频率计算与分析l7- -3 参数点估计的数理统计法l7-4 7-4 参数点估计的水文统计法参数点估计的水文统计法l7-5 7-5 估计量好坏的评判标准估计量好坏的评判标准l7-6 7-6 参数的区间估计参数的区间估计l问题的提出问题的提出(堤防高度,历史洪水加成堤防高度,历史洪水加成,频率计算频率计算,设计标设计标准准)l基本问题基本问题: 线型选择线型选择, 参数估计参数估计l线型选择线型选择: 理论导出理论导出 (中心极限定理中心极限定

2、理,极值分布极值分布,物理机制物理机制)因其不同程度假定往往不能满足因其不同程度假定往往不能满足,一般通过线型与实测数一般通过线型与实测数据拟合作出判断据拟合作出判断)。不同国家洪水特性不同,结果不一样。不同国家洪水特性不同,结果不一样。l关于国内采用的分布线型:我国水利水电设计洪水设计规范推荐使用P-III型分布,特殊情况可以使用其他线型,如对数正态分布,GUMBEL分布等。l参数估计:已知实测资料,分布线型推求总体参数(适线参数估计:已知实测资料,分布线型推求总体参数(适线法,概率权重矩法,线性矩法,权函数法)法,概率权重矩法,线性矩法,权函数法)71 概 述不同国家采用总体分布线型l点估

3、计点估计 所谓点估计就是用一个具体的数值去估计一个所谓点估计就是用一个具体的数值去估计一个 未知的参数。未知的参数。l参数的区间估计参数的区间估计 所谓区间估计就是估计参数所在的区间,也就是说用所谓区间估计就是估计参数所在的区间,也就是说用 一一 个区间估计未知参数。个区间估计未知参数。 参数估计有两种常用的形式,即点估计和区间估计参数估计有两种常用的形式,即点估计和区间估计参数估计有两种常用的形式,即点估计和区间估计参数估计有两种常用的形式,即点估计和区间估计72 几种理论分布的频率计算和分析几种理论分布的频率计算和分析 1,P-III型分布型分布 (重点)(重点)2,对数正态分布,对数正态

4、分布3,耿贝尔分布,耿贝尔分布1, P-型分布频率计算l(1) P-型分布的密度曲线形状0112f(x)x当01时,2CS ,密度曲线呈乙型,以x轴和x=a0为渐近线当=1时,CS =2,密度曲线仍呈乙型,但左端截止在曲线的起点,右端以x轴为渐近线当12时, 21/2 CS 2时, CS 21/2 ,密度曲线呈铃型,在起点处与x轴相切,右端以x轴为渐近线=1120a0铃形比较符合实际, 原因是水文变量最小值结合水文随机变量物理性质,从理论上讲,在水文中应用P-型分布时,三参数应满足以下二个关系:(2)P-III型分布频率曲线 (xpp的关系)X的超过累积概率为在已知,可通过积分求出不同对应的P

5、值。有于不同则可以画出频率曲线。但这样求解工作量太大,太复杂了,因此,必须想办法简化计算。 当为了简化,可以对X作标准化变换,即标准化后的变量也是随机变量,常数为离均系数,若X的数字特征为,方差为1,的最小值为:,此时为标准化正体分布结论是对的从以上所推导出离均系数分布密度可知,该分布密度仅与有关,那么只要给即由于上式右边只是Cs的函数,故可以编制关系数值表,这方面工作已有人做好;本书在附表4列出了关系表,表中取值05.0,取86数位,P取值0.01%99.9%共26位,表格形式。 皮尔逊皮尔逊型分布型分布 值表值表 例例: :设设X服从服从P P型分布型分布, ,且且 求求 解解 求p=0.

6、01的情况下的设计值xp =? l另求Cs=2.05,p=0.2%时的设计值lxp = (3)P-III型频率曲线绘制l海森几率格纸,横坐标是频率,纵坐标水文变量,正态分布成直线,偏态分布曲线(p163,例子)分布参数对频率曲线形状的影响E(x)CvCs30020010000.111050909999.9P(%)Cv=0.5Cs=1.054000.111050 709099.9Cv=1.0P(%)3212309895Cv=0.5Cv=0.2模比系数 K1.31.20.80.70.111050709099.9P(%)1.11.00.92309895模比系数 K1.41.50.5Cs=3.0Cs=

7、0Cs=0.8另外两种理论分布频率计算l已知参数查表可以算出。l2, 对数正态分布(EX,Cv,Cs,p-Xp)附表五l3,耿贝尔分布(EX,Cv,可以求出 Xp)附表七73 参数点估计的矩法和极大参数点估计的矩法和极大似然法似然法 点估计的一般提法点估计的一般提法参数点估计的矩法参数点估计的矩法 参数点估计的极大似然法参数点估计的极大似然法 一、点估计的一般提法一、点估计的一般提法样本,但其中,个参数未知,一般为3个。点估计基本步骤:A:把实测样本()当作随机样本()一次观测值。B:构造统计量作为总体参数的估计量。C:分析的统计性能(抽样误差大小)。D:以代替估计量所得的作为总体参数的估计值

8、。第B步:研究的是总体参数的估计量,我们称确定估计量的方法为估计方法。理论上讲,估计方法可以有很多种。第C步:通过分析不同估计方法的统计性能,可对不同估计方法好坏做出评判,将在第四节中讨论,可以说这两步是参数估计中最重要的两个环节,下面先介绍数理统计点估计法中的矩法及极大似然法。样本,但其中,个参数未知,一般为3个。点估计基本步骤:A:把实测样本()当作随机样本()一次观测值。B:构造统计量作为总体参数的估计量。C:分析的统计性能(抽样误差大小)。D:以代替估计量所得的作为总体参数的估计值。第B步:研究的是总体参数的估计量,我们称确定估计量的方法为估计方法。理论上讲,估计方法可以有很多种。第C

9、步:通过分析不同估计方法的统计性能,可对不同估计方法好坏做出评判,将在第四节中讨论,可以说这两步是参数估计中最重要的两个环节,下面先介绍数理统计点估计法中的矩法及极大似然法。具体问题具体问题: 作为总体参数的估计值。随机变量X ,F(x)已知,并已有样本,但其中,个参数未知,一般为3个。点估计基本步骤:)当作随机样本()一次观测值。作为总体参数的估计量。的统计性能(抽样误差大小)。A:把实测样本(B:构造统计量C:分析D:以代替 估计量所得的确定估计方法l求未知参数点估计的方法很多, 一般可以分成两类:一是数理统计中使用方法,如矩法和极大似然法;另一类是水文统计中使用方法,包括我国水文计算中广

10、泛使用的适线法,权函数法、概率权重矩法,线性矩法等。下面主要介绍矩法和极大似然法,适线法,还要简要介绍水文统计中新方法。二、参数点估计的矩法l做法:用样本原点矩来估计总体原点矩( vk = Ak )。l依据:l设总体分布函数为F(x; u01, u02, ,u0l),则X的k阶原点矩vk =E(Xk)是参数u01, u02, ,u0l的函数,记 vk= E(Xk)=gk(u01,u02,u0l)l从方程组可解出l l l以后在不造成混淆的情况下,随机变量与普通变量不再严格按大小写作区分。 例 题l例:设(例:设(X1,X2 , , Xn )为总体为总体X的一个样本,求的一个样本,求总体的均值总

11、体的均值a , 及方差及方差2的矩估计。的矩估计。l解:解: 样本均值和样本方差是总体数学期望与总体方差的矩估计量。可以证明,前面讲过的样本各种数字特征是总体同名特征的矩估计量, l例:设总体X服从指数分布,其分布密度为 其中为 未知参数,现有X的一组样本值:0.17,0.05,0.15,0.06,0.28,0.05,试求的距估计量和矩估计值。 解:首先要找出未知参数 与总体分布的矩的关系。 已知 所以 按矩估计法, 的估计量 为 根据样本,求得 , 所以 的估计值为 例:设总体X在a,b区间上服从均匀分布,求a, b的矩估计量。解:X的分布密度为 因为: 由此可解得:因此,a,b的矩估计量为

12、 : 例:求相关系数的矩估计量解 首先用样本相关矩作为总体相关矩的矩估计量式中再利用例1结果,可得到相关系数的估计量类似地,可以得到总体变差系数CV,偏态系数CS的矩估计量,即考虑历史洪水时矩法(了解)l连序样本,不连序样本,历史洪水l公式由来(由实测期连续代表N-a长度数值)参数点估计的极大似然法参数点估计的极大似然法 l由经验可知,若某项试验有多种可能的结由经验可知,若某项试验有多种可能的结果,它们发生的概率各不相同,那么在一果,它们发生的概率各不相同,那么在一次试验之前,可以合理地认为发生概率最次试验之前,可以合理地认为发生概率最大的那个事件将要发生;反之,如果在一大的那个事件将要发生;

13、反之,如果在一次试验中,某个事件发生了,那么认为在次试验中,某个事件发生了,那么认为在诸事件中,该事件发生的概率为最大也是诸事件中,该事件发生的概率为最大也是合理的。极大似然法就是根据这样的经验合理的。极大似然法就是根据这样的经验提出的。通常把这种思想称为提出的。通常把这种思想称为极大似然原极大似然原理理。 l若A,B为两事件,如事先已知P(A)P(B),则试验之前可以推断事件A发生的可能性更大,显然这是十分合理的。相反,若A,B两事件各自发生的概率未知,当一次试验后有:A发生但B不发生,此时P(A) ,P(B)俩哪个大? 仍是无法可知。要判断它们哪个大,从理论上讲,必须作无穷多次试验,此时频

14、率=概率。但实际上往往仅能作一次试验,因此,必须根据这一次试验结果对P(A),P(B)谁大谁小作出判断,此时有两种可能一是P(B) P(A),也可能是P(A) P(B),显然后者更合理。因此,实际上总是以为P(A) P(B)。极大似然法就是居于以上想法来构造统计量。极大似然函数(连续型随机变量)极大似然函数(连续型随机变量)l对于连续型的总体X,设它的密度函数为f (x; u01, u02, ,u0l ),其中u01, u02, ,u0l 为待估计的未知参数, X1,X2 , , Xn 是X的样本,则 X1,X2 , , Xn的联合密度为 :极大似然函数(离散型随机变量)极大似然函数(离散型随

15、机变量)l对于离散型的总体X,设它的分布律为 P(X=xi)=p(xi; u01, u02, , u0l )极大似然法基本思想极大似然法基本思想l极大似然法: 根据极大似然原理,应该认为作为n元随机变量的样本X1,X2 , , Xn 的取值在(x1,x2 , , xn ) 邻域内的概率较大,或者说X1,X2 , , Xn取得x1,x2 , , xn这一组数值的概率密度比它取得其他数值的概率密度要大。而这就等价于似然函数L在已知样本值x1,x2 , , xn处的值比较大,而对似然函数而言 ,x1,x2 , , xn 是常数,似然函数L是参数 的函数,因而可以将使L取得极大值时的参数值 作为参数

16、估计值。l 似然方程如下:由如下似然方程求出估计参数: 由于lnL与L同时达到极大值,为便于计算,可求解方程组在使用以上似然方程求极大似然估计量时还必注意两点:l1.使用似然方程 前提条件是 中x的取值范围与 无关。l2.从理论上讲应验证 ,这样才能 保证极大值,但通常并未作验证。例: 如均匀分布中x取值与未知参数有关,故不能用这一似然方程。如果使用的话l例例:设(设(X1,X2 , , Xn )为正态总体为正态总体X的一个样的一个样本,求总体的均值本,求总体的均值a 及方差及方差2极大似然估计极大似然估计 。l解:似然函数为解:似然函数为 得l例:设总体X的密度函数为 其中 为未知参数,设x

17、1,x2,,xn为X的样本,试求 的矩估计和极大似然估计。解:矩估计,矩估计,因为 因此 的估计值为 所以l极大似然估计,极大似然估计,似然函数为 l于是似然方程为:l解得: 由此例可见,矩法与极大似然法求得的结果一般并不是相同的。对于一个随机样本可求出最大值及极小值,由于它们是抽自以上总体中。故:解:设样本为极大值 是抽自以上总体的。故 为使似然函数达最大 即 对于P-III型分布中的分布(即a0=0的P-III分布),可以用两个似然方程求参数极大似然估计,但对于一般P-III分布即,密度,因此仅有两个似然方程,然而却有三个未知参数,因此有无穷多个解。极大似然原理是选参数使得L达最大,,由2

18、个似然方程求出L。找出一个a0,能使得L达最大,对应参数即为P-III由于P-极大似然估计时需要繁琐计算,且在Cs2时似然方程无解,正因为如此,水文上使用得很少。因此,可以假定极大似然估计量。a0取值要求在之间,矩法和极大似然法优缺点比较l矩法的一个优点是寻求总体数学期望、方差、变差系数、偏差系数等的估计量时无须知道随机变量的分布函数,而应用极大似然法时必须知道总体的概率分布,但是极大似然估计量的性质要比矩估计量好。在数理统计中,极大似然法被认为是最好的方法。但极大似然法用于估计 P型分布参数时,需要试算,而且有时似然方程无解,因此,在我国水文计算工作中并不常用。对P分布,我国常采用适线法估计

19、其参数。74 参数点估计的水文统计方法参数点估计的水文统计方法lP-型型分分布布是是我我国国水水利利水水电电工工程程水水文文计计算算规规范范中中推推荐荐采采用用的的分分布布,我我国国水水文文工工作作者者对对其其参参数数估估计计的的方方法法作作了了大大量量研研究究,现现行行广广泛泛采采用用的的是是适适线线法法。新新近近估估计计方方法法包包括括:概概率率权权重重矩矩法法( P W M) ,权权 函函 数数 法法 , 线 性矩矩 法法 等等 。一、适线法适线法不是给出估计量的计算公式,而是由实测样本直接推求参数的估计值。包括目估和计算机优化适线法。适线法。绘制经验频率点据绘制经验频率点据,指的是在概

20、率格纸上绘制点据(), 从理论上讲应该是。但由于总体X实际上是未知数,要画出()点据,显然必须对作出估计。最简单的就是,因此,也把称为样本频率或经验频率。还有其他更好估计方法,这些点据点绘在概率格纸上分布密度中参数未知,因此不过,如前面讲过1,适线法的基本原理绘制理论频率曲线绘制理论频率曲线假定X分布符合某一总体概率模型(我国规定使用P-III),用某种估计方法,通常是矩法估计分布密度中的未知参数,有了分布参数可用下面介绍的频率计算方法求出在这种参数下 关系,从而可以绘制理论频率曲线与第步中经验频率点据在同一张概率格纸上。l检查拟合情况l 好:所给参数即为适线法估计结果。l 不好:调整参数,重

21、绘理论频率曲线再检查拟合好坏,如拟合好,新参数即为适线结果,否则重新调整参数,直到拟合好为止。l以上其实也是适线法估计参数的基本步骤,这些步骤并不难理解,但要完成某一测站适线工作,可不是件容易的事,三峡水库频率计算(适线)搞了几十年。做好适线工作必须解决好三个问题l给定总体参数 (基本问题,已经解决)。l各经验点据的绘点公式,也很重要,直接影响结果。l拟合好坏如何确定,这同样也很重要,拟合好坏标准也有很多种,有的人认为应主要看左端点据的拟合好坏,有的人则认为看理论频率曲线与所有点据拟合好坏,此外有人认为应以纵标离差为评价拟合好坏的标准,有人则认为应以横标离差为评价拟合好坏的标准,那么到底应该选

22、哪个?这很重要,因不同拟合标准,适线结果不一样,今后我们将介绍有关结论。2,绘点 (经验频率)公式选择(1)经验公式(等概率公式) 等概率公式是根据概率的古典定义,假定样本中各项是等可能发生的。n年老大,重现期是n年,任何n年样本最小值几乎当成总体最小值,是其最大不足(2)海森公式(又称为平均公式)海森公式(又称为平均公式) 从该公式可知从该公式可知,n年最大其重现期年最大其重现期2n年年,如如n=50,最大值最大值是百年一遇是百年一遇,这样一来这样一来,对于工程设计太不安全对于工程设计太不安全, 不过最不过最小值的频率比经验公式合理小值的频率比经验公式合理,m=n时时 (3)期望值公式 (也

23、叫Weibull 公式) 期望值公式具有较强的理论基础,而且偏于安全,被各国广泛采用,是规范建议公式。 如m=1,n=99,p=1/100, 表明99年老大是100年一遇 最小值经验频率不为1,比较符合实际,是经验公式的改进. l(4)切哥达也夫公式(又称中值公式)表明约表明约70年老大是年老大是100年一遇年一遇,最小最小值经验频率不为值经验频率不为1,比较符合实际比较符合实际, 是经验公式的改进是经验公式的改进. 华家鹏公式华家鹏公式,针对针对P-III型分布型分布,表明约表明约55年老大是年老大是100年一遇年一遇,最小值经验频率最小值经验频率不为不为1.其他的其他的,可以考虑次序统计量

24、可以考虑次序统计量中值等中值等,其他分布情况其他分布情况. l(4)其他公式3, P-型分布参数估计的适线法(1)目估适线法 通过例子说明适线法估计参数的具体步骤。参数的具体步骤。例:下表为某水文站年平均流量资料,假定总体服从P-P-型分布,试用适线法估计参数型分布,试用适线法估计参数E(X),CE(X),CV V,C,CS S。 表表 1 1 年份年份流量流量年份年份流量流量年份年份流量流量年份年份流量流量19761676.01676.019841984614.0614.019921992343.0343.0200020001029.01029.01977601.0601.019851985

25、490.0490.019931993413.0413.0200120011463.01463.01978562.0562.019861986990.0990.019941994493.0493.020022002540.0540.01979697.0697.019871987597.0597.019951995372.0372.0200320031077.01077.01980407.0407.019881988214.0214.019961996214.0214.020042004571.0571.019812259.02259.019891989196.0196.0199719971117

26、.01117.0200520051995.01995.01982402.0402.019901990929.0929.019981998761.0761.0200620061840.01840.01983777.0777.0199119911828.01828.019991999980.0980.0 序号序号1 1225922592.64802.64801.64801.64802.71592.71594.47584.47583.1253.1252 2199519952.33852.33851.33851.33851.79161.79162.39802.39806.2506.2503 31840

27、18402.15682.15681.15681.15681.33821.33821.54801.54809.3759.3754 4182818282.14282.14281.14281.14281.30601.30601.49251.492512.50012.50029292142140.25080.2508-0.7492-0.74920.56130.5613-0.4205-0.420590.62590.62530302142140.25080.2508-0.7492-0.74920.56130.5613-0.4205-0.420593.75093.75031311961960.22980.2

28、298-0.7702-0.77020.59320.5932-0.4569-0.456996.87596.875264472644731.001131.00110.00110.001113.095713.09578.91008.9100表表2 统计参数计算表统计参数计算表解:解: 将表将表1中的流量按从大到小顺序列于表中的流量按从大到小顺序列于表2中中 第第 (2)栏。)栏。 计算表计算表2中第(中第(3)至第()至第(7)各栏数值。)各栏数值。 l 将表将表2中的经验点据中的经验点据 点在机率格点在机率格 纸上,如图纸上,如图3中中“X ”所示所示 l 参数的初值由矩法公式计算,由表参数的初值

29、由矩法公式计算,由表2得得l 选择一些选择一些P值,根据矩估计的值,根据矩估计的 , 和和 ,计算理论频率曲线,如表,计算理论频率曲线,如表3。 表表3 P-型分布频率曲线配线计算表型分布频率曲线配线计算表 0.1151099第第一一次次配配线线4.6943.0931.8951.341-1.5113497.72593.41919.51612.42.6第第二二次次配配线线5.4783.5421.9861.312-1.0174530.03122.32124.21689.1179.2 l 将表将表3中的各点中的各点 点绘在图点绘在图2中,并通中,并通过这些点描绘光滑曲线(图中虚线所示)。此过这些点描

30、绘光滑曲线(图中虚线所示)。此曲线即为曲线即为 的的P-型型分布超过累积频率的理论曲线。分布超过累积频率的理论曲线。l 观察上述曲线与实测点据吻合的程度,如观察上述曲线与实测点据吻合的程度,如吻合满意,则该理论频率曲线相应的参数就是吻合满意,则该理论频率曲线相应的参数就是要估计的总体的分布参数。要估计的总体的分布参数。l 因为上述理论曲线与实测点据吻合不太好,因为上述理论曲线与实测点据吻合不太好,重新调整重新调整CV,CS值(见表值(见表3),该理论频率曲),该理论频率曲线(图中实线所示)与实测点据吻合较好,相线(图中实线所示)与实测点据吻合较好,相应的参数应的参数 这就是要估计总体的分布参数

31、。这就是要估计总体的分布参数。点线拟合不好原因分析: 若第一次计算得的理论曲线与实测点吻合不好,可若第一次计算得的理论曲线与实测点吻合不好,可能有五种原因:能有五种原因:第一第一,可能是根据实测资料(样本),可能是根据实测资料(样本)由矩法计算出的参数作为总体分布参数的估计值有误由矩法计算出的参数作为总体分布参数的估计值有误差;差;第二第二,经验点据的绘点位置不合理;,经验点据的绘点位置不合理;第三第三,可能,可能是所研究的随机变量的概率分布不符合是所研究的随机变量的概率分布不符合P-型分布配型分布配合各种水文变量;第四合各种水文变量;第四,样本本身随机性;第五样本本身随机性;第五,资料资料误

32、差等。误差等。 上述适线法又称目估适线法,经验点据与理论曲上述适线法又称目估适线法,经验点据与理论曲线拟合的好坏全凭人们的目测来判断,因此,估计结线拟合的好坏全凭人们的目测来判断,因此,估计结果往往因人而异。随着计算机技术的普及,可以根据果往往因人而异。随着计算机技术的普及,可以根据某种优选准则,由计算机进行自动优选参数,这为适某种优选准则,由计算机进行自动优选参数,这为适线法开辟了一条新的途径。线法开辟了一条新的途径。(2)计算机优化适线法l反映经验点据与理论曲线吻合程度的指标对适线结反映经验点据与理论曲线吻合程度的指标对适线结果也有较大影响,不同的指标将会得出不同的估计果也有较大影响,不同

33、的指标将会得出不同的估计结果。结果。l适线准则:适线准则:1)以经验点据与理论频率曲线的纵向)以经验点据与理论频率曲线的纵向离差绝对值之和,离差绝对值之和, 2)以经验点据与理论频率曲线的纵向离差平方和。)以经验点据与理论频率曲线的纵向离差平方和。 优化方法:使得目标函数达到最小,用模式优化方优化方法:使得目标函数达到最小,用模式优化方法优选(对于法优选(对于2,3个参数优化)个参数优化)考虑历史洪水的期望值绘点公式l分别处理法PM=M/(N+1), M=1, , aPm=m/(n+1), m=l+1 , n (m为实测期由大到小排列序号)l统一处理法Pm= a/(N+1)+(1- a/(N+

34、1) (m-l)/(n-l+1), m=l+1,n (m为实测期由大到小排列序号)二,其他方法l权函数估计法l概率权重矩法l线性矩法1,权函数估计法l60年代马秀峰率先提出l1984年水文杂志发表l硕士生研究生论文研究内容(刘,黄)l专题研究(陈,李,梁)l目前是规范中建议采用参数估计方法(初估计法)考虑历史洪水权函数估计法,1992 设设有有独独立立的的非非连连序序样样本本X X,其其最最大大重重现现期期为为N N,实实测测年年数数为为n n,历历史史洪洪水水个个数数为为a a,实实测测期期内内历历史史洪洪水水个个数数为为 ,并并令令 x xm m,m m =1=1,2 2,n n- - +

35、a+a,为为X X由由大大到到小小排排列列的序列,则三个参数估计公式如下:的序列,则三个参数估计公式如下:考虑历史洪水权函数估计法l l其中其中l l l l (x)(x)为为均均值值为为EXEX,均均方方差差为为 的的正正态态分分布密度函数。布密度函数。 2,2,概率权重矩法与线性矩概率权重矩法与线性矩法法 常规矩(常规矩(Conventional moment) 概率权重矩概率权重矩 (Probability weighted moment) 线性矩(线性矩(Linear moment)(1) 常规矩(不致混淆时简称矩)常规矩(不致混淆时简称矩) 以变量以变量X X的幂次定阶次的幂次定阶次

36、(常用常用r=1,2,3,4) 原点矩:原点矩: 导出统计参数导出统计参数: 均值均值方差方差标准差标准差离差系数离差系数 偏态系数偏态系数 (2) 概率权重矩概率权重矩 变量系列按变量系列按递增递增次序排列次序排列概率分布函数概率分布函数f(x)f(x)为密度函数为为密度函数为概率权重矩定义:概率权重矩定义: 经研究,经研究,P Pi i的无偏估计取为(下列的无偏估计取为(下列i=1,2,i=1,2,,n n为次序)为次序)样本矩计算样本矩计算关系已经导出关系已经导出, ,故可根据样本估计故可根据样本估计出三个特征参数出三个特征参数 设设水水文文样样本本最最大大重重现现期期N N,历历史史洪

37、洪水水个个数数a a,实实测测期期历历史史洪洪水水个个数数为为l l,实实测测期期样样本本长长度度n n,且且由由小小至至大大排排列列的的样样本本为为 , ,则则计计算算公公式式 具有历史洪水时的线性矩计算公式的推荐具有历史洪水时的线性矩计算公式的推荐(3)(3)线性矩定义线性矩定义, Hosking, Hosking等等(1990)(1990)线性矩与顺序统计量线性矩与顺序统计量由由Legendre多项式推导上列各数学期望式,可得到与多项式推导上列各数学期望式,可得到与概率权重矩的关系。概率权重矩的关系。线性矩与概率权重矩的关系线性矩与概率权重矩的关系由线性矩表示的参数由线性矩表示的参数可见

38、线性矩是概率权重矩的线性组合可见线性矩是概率权重矩的线性组合导出了线性矩与特征参数关系后导出了线性矩与特征参数关系后,可有样本估计可有样本估计EX,Cv,CsP-III分布密度函数分布密度函数分布密度参数与线性矩的关系分布密度参数与线性矩的关系l反之,当已知 ,则EX, 计算公式如下l当 3 1/3,则l l l当1/3t31,则l 分布密度参数与线性矩的关系分布密度参数与线性矩的关系分布密度参数与线性矩的关系分布密度参数与线性矩的关系75 估计量好坏的评选标准估计量好坏的评选标准l从前面的讨论中,可以看到,参数估计的方法很多,对于总体的某一参数,可以构造出许多不同的估计量。例如,对于数学期望

39、的估计,可以用样本平均值 估计,也可以用样本的加权平均值 估计,其中 是满足 的任意一组实数。于是就产生了一个问题:哪种估计量比较好呢?为此,必须有一种衡量估计量好坏的标准。一、抽 样 误 差l由于估计量是样本的函数,对于样本(X1,X2,Xn)的不同取值,由该估计量求得的估计值的误差是不同,因此,在描述估计量的误差时,我们应当用平均误差来表示,即 并称WU为估计量U的抽样误差。而称 为U 的(抽样)均方误差。由于 从而有 式中 为U的(抽样)方差,若记b = E(U )uo则称b为估计量U对uo的偏。二、估计量好坏的评价标准二、估计量好坏的评价标准 l1,无偏性:,无偏性:设设U是未知参数是

40、未知参数u0的估计量,如果的估计量,如果E(U)= u0,则称则称U为为u0的无偏估计量。的无偏估计量。 通俗地讲,无偏估计量是没有通俗地讲,无偏估计量是没有“系统误差系统误差”的估的估计量,如果计量,如果 E(U)u0 ,说明,说明 U 有偏大于有偏大于 u0 的倾向,的倾向,如果如果 E(U)u0 ,说明,说明 U 有偏小于有偏小于u0的倾向,而当的倾向,而当E(U)=u0时,说明时,说明U与与u0无系统的偏差。对无偏差无系统的偏差。对无偏差估计量估计量U来讲,虽然不同的样本,它的取值也不同,来讲,虽然不同的样本,它的取值也不同,但这些取值的平均数等于参数但这些取值的平均数等于参数u0.

41、例例:设(X1,X2 , , Xn )为X的样本,E(X)=a,D(X)=2, 试问下列统计量是否分别是a , 2的无偏估计量? 解:解: 但是 样本样本Cv, Cs有偏的,偏小有偏的,偏小l2,有有效效性性 :设设U1,U2都都是是参参数数的的无无偏偏估估计计量量,若若对对任任一一n,D(U1)0具有性质 估计量作为样本的函数 ,与样本容量 n 有关,n越大,包含信息越多。一个好的估计量应随着n的增大而愈加精确,当 n 无限增大时,估计量的取值与参数真值十分接近几乎是必然的,这就是一致性的含义。样本均值若用X1做估计是无偏估计量,但不是一致的估计量。水文频率计算中参数估计优劣评价标准l一般除

42、了参数不偏性,有效性外,还要看设计值的不偏性和有效性。因为P-III分布三个参数估计效果不同方法可能时好时坏,故以设计值可以综合反映不同估计方法性能优劣l参数估计一致性实用上没有问题,只是特殊情况下不能满足。76 参数的区间估计参数的区间估计 l一、区间估计的概念 设u0是总体X的未知参数,(X1, X2 , , Xn )为样本,对于给定的,01,若存在统计量 U1=U1 (X1, X2 , , Xn ) ,U2=U2 (X1, X2 , , Xn )使得 P(U1u0 U2)=1-= P 则称区间(U1 , U2)为参数u0的置信区间,U1与U2分别称为置信下限与置信上限,1-称为置信概率或

43、置信度。用置信区间作为参数估计值叫区间估计。lP(U1u0 U2)=1-= P的意义:若从总体中反复抽取许多容量相同的样本,就可得到许多区间(u1 , u2) ,其中有的包含u0 ,有的不包含u0 ,但若试验次数很多,则大约有100P个区间包含有u0 ,有100(1-P)个区间不包含 u0 。二、正态总体均值二、正态总体均值a的区间估计的区间估计l方差已知时正态总体均值a 的区间估计方法。 当总体方差 已知时,样本均值 分布,从而统计量 服从N(0,1)分布,于是对给定的置信概率 由标准化正态分布表可查得 ,使其满足下式: 由此可解得 l方差未知时正态总体均值的区间估计方法。方差未知时正态总体

44、均值的区间估计方法。 统计量 服从自由度n-1的t分布,因此可用t分布给出置信区间。即对给定的置信概率 ,以自由度n-1查t分布表得 ,使满足 从而有例:对一段距离测量16次,测得数据(单位:km)为:2.14, 2.10,2.13,2.15,2.13,2.12,2.13,2.10,2.15,2.12, 2.14,2.10,2.13,2.11,2.14,2.11。设测量值X服从 分布,试在下列情况下求实际距离a的95的置信 区间: 已知0.01;未知。解:由 0.05查正态分布表得 ,又由 题给数据算得 ,于是所求的置信区间为 即(2.120,2.130)。 因未知,以自由度n-115查t分布

45、表得 ,又 由题给数据算得S0.017,代入公式 从而求得置信区间为(2.116,2.134)。三、一般总体均值三、一般总体均值a的区间估计的区间估计 对于一般总体 当样本容量 时, 近似于标准正态分布N(0,1),于是,只要样本容量n足够大,可近似地 有 :正态总体方差的区间估计正态总体方差的区间估计 l若 为抽自正态总体的样本方差,则统计量 服从自由度n-1的 分布,于是可用 分布设置方差 的置信区间。即对给定的置信概率1-,查 分布表得和 ,使得: 例:对某商品的价格进行10次调查,该商品的价格与 规定价格之差如下:2,1,-2,3,2,4,5,-2, 3,4,设该商品的价格与规定价格之

46、差X服从正态分 布 ,a 、2均未知,求X的方差的置信度 为0.95的置信区间。解: 所以,D(X)的置信区间为(2.74,19.26)。 四、事件概率的区间估计(不作要求)(不作要求) 设事件A发生的概率为p,在n次重复独立试验中, A出现了m次,有德莫佛拉普拉斯定理可知 渐进于正态分布 N(0,1),因此,当 n 足够大 时,近似地有 化简后可得 例:对某事件A作了1000次试验,发现A发生了600次, 试以0.95的置信度估计A发生概率p的置信区间。解:这里 所以 p 的0.95的置信区间为: (0.6-1.960.015,0.61.960.015)(0.57,0.63) 就是说,有95%的把握相信A发生的概率在 5763之间。 本 章 小 结l本章讨论的是估计理论和方法,较详细地介绍了参数估计的基本原理和具体方法 ,这是数理统计中最基本和最重要的内容。l一定要弄清估计量评判标准,并真正学会常用的参数点估计方法,如矩法、极大似然法和水文中使用十分广泛的适线法。弄懂参数的区间估计原理和方法。估计方法很多,各有优缺点,同学们也可以研究、提出其他参数估计方法。了解其他新的常见水文参数估计方法。l了解水文频率计算两个基本问题。历史洪水信息如何考虑要有所了解

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号