依分布收敛与中心极限定理

上传人:平*** 文档编号:14010168 上传时间:2017-10-27 格式:DOC 页数:11 大小:278.27KB
返回 下载 相关 举报
依分布收敛与中心极限定理_第1页
第1页 / 共11页
依分布收敛与中心极限定理_第2页
第2页 / 共11页
依分布收敛与中心极限定理_第3页
第3页 / 共11页
依分布收敛与中心极限定理_第4页
第4页 / 共11页
依分布收敛与中心极限定理_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《依分布收敛与中心极限定理》由会员分享,可在线阅读,更多相关《依分布收敛与中心极限定理(11页珍藏版)》请在金锄头文库上搜索。

1、第四章 第四章 极限定理1 依分布收敛与中心极限定理一、 一、分布函数弱收敛二、性质三、中心极限定理概率论早期发展的目的在于揭示由于大量随机因素产生影响而呈现的规律性. 贝努里首先认识到研究无穷随机试验序列的重要性,并建立了概率论的第一个极限定理大数定律,清楚地刻画了事件的概率与它发生的频率之间的关系. 棣莫佛和拉普拉斯提出将观察的误差看作大量独立微小误差的累加,证明了观察误差的分布一定渐近正态中心极限定理. 随后,出现了许多各种意义下的极限定理. 这些结果和研究方法对概率论与数理统计及其应用的许多领域有着重大影响. 本章着重介绍上述大数定律和中心极限定理等有关内容.1 依分布收敛与中心极限定

2、理我们知道,如果 是概率空间 (, F, P)上的随机变量,那么它的分布函数 F(x)=P( x)刻画了它的全部概率性质. 因此,对随机变量序列的研究就必须首先对相应的分布函数序列作深入研究.一、分布函数弱收敛定义 1 设 F 是一分布函数, Fn是一列分布函数,如果对 F 的每个连续点 xR,都有Fn(x) F(x) (n),则称 弱收敛(weak convergence)于 F,记作 nW F.设 是一随机变量, n是一列随机变量,如果 n的分布函数列弱收敛于 的分布函数,则称 n依分布收敛(convergence in distribution)于 ,记作 d .注 1 注 1 分布函数

3、逐点收敛的极限函数未必是分布函数. 例如, Fn(x)= ,0.x该分布函数列处处收敛于 0, 但 G(x) 0 不是分布函数. 因此对一般的分布函数列,要它们逐点收敛于分布函数,要求是过高了,不得不如定义 1 加上限制.注 2 定义 1 中的限制条件“对 F 的每个连续点 x, Fn(x) F(x) ”是足够宽的,例如, Fn(x)= ,10./,nxF(x)= ,10.,x除在 0 点以外( Fn(0)=0F(0)=1),逐点收敛于 F(x),而 0点刚好是 F(x) 的唯一不连续点,因此按定义 1, W F.*注 3 由于分布函数 F 的不连续点最多有可数个, n F 意味着 n在 R

4、的一个稠密子集上处处收敛于 F(D 在 R 上稠密,是指对任意 xoR, 在 o的任意小邻域内,一定有xD).下面给出海莱(Helly)定理,它们对分布函数列弱收敛性的研究起着重要作用.定理 1(海莱第一定理) 设 Fn是一列分布函数,那么存在一个单调不减右连续的函数F (不一定是分布函数),0 x()1, xR, 和一子列 knF,使得对 F 的每个连续点 x, knF(x)F(x) (k+).证 令 r12, 表示全体有理数. 0 1)(n意味着 )(1rn是有界数列,因此可以找到一个收敛子列 )(1n, 记 rGlim)(1rF. 接着考虑有界数列 2F,存在它的一个收敛子列 )(2rn

5、,记 nrGlim)(2)(2rFn. 如此继续,得到 kn nk,1, nkrGli)()(krF, k 2.现在考虑对角线序列 F. 显然, m= 对所有正整数 k 都成立. 另外,由于 Fn单调不减,如果 rij,有 )(jir. 因此 G(r)是定义在有理数上的有界不减函数. 定义 )(inf)(jxrGjxR. (1)这个函数在有理数上与 G(x)相等,它显然也是有界不减的. 下面证明,对 F 的每个连续点 x, nlim)(F=F(x). (2)任意给定 0 和 F 的连续点 x,选取 h 0,使得F(x+h)-F(x-h) 0 使得 |g (x) | 0, 可以选取 a0 使得a

6、 是 F 的连续点,并且F(-a)0, 仅考虑 | t | b. 令itxteg)(, xR. 注意到下列事实 :| )(xgt|=1, |sup| ybyxttt , 则该定理的证明完全类似于定理 2,不再重复.由前面一章知道,特征函数与分布函数相互唯一确定. 同样,勒维连续性定理的逆命题也成立.定理 4(逆极限定理) 设 )(tfn是分布函数 Fxn()的特征函数,如果对每一个 t, )(fn)(tf, 且 tf在 t=0 处连续,则 一定是某个分布函数 F 的特征函数, 且 FnW F.本定理的证明比较繁复,从略. 但定理的作用是很大的,它使得特征函数成为研究某些极限定理的重要工具. 这

7、里先举个例子来说明这个定理的应用.例 1 用特征函数法证明二项分布的泊松逼近定理.证 设 n服从二项分布 B (n, pn),且 nplim. 它的特征函数为 )(tfn=itnqep)(, 其中 n1. 当 n 时,它的极限为 )1()(li)(li itenitnn etf ,这正是泊松分布的特征函数. 由逆极限定理,二项分布 B (n, pn)依分布收敛于泊松分布 P( ).二、性质除连续性定理外,分布函数弱收敛还有下列性质.性质 1 设 Fn是一列分布函数,如果 nF WF, F 是一连续的分布函数,则 nF(x)在R 上一致收敛于 F(x).证明留给读者.性质 2 设 是一随机变量,

8、 n是一列随机变量, g(x)是 R 上的连续函数,如果 n d,则 )(ng)(d .证 假设 和 的分布函数分别为 F 和 n. 如果 n d,即 nF WF,由定理2, )(ng的特征函数 )()(xdenitg收敛于 )()(xeitg, 该极限正是 )(g的特征函数. 再类似定理 4, )(n的分布函数弱收敛于 的分布函数,即 nd .性质 3 设 a和 b是两列常数,F 是一分布函数, F是一列分布函数. 如果 ana, bb, nW F, 则 n( nbxa)F(a x +b ),其中 x 使得 a x +b 是 F 的连续点.证 设 x 使得 a x +b 是 F 的连续点.

9、令 0 使得 F 在 a x +b处连续(这是可能的,因为 F 的连续点在 R 上稠密). 显然 na x +b, 故对充分大的 n,.bbn(13)因此 ).()()( axFxaaxFnnn由于 nW F ,则).()(lim)(li)( baxFxabxaFbaxF nnnn让 0,由于 F 在 a x+b 处连续,即可完成证明.推论 如果 n d,则dn , ( 0,n).这是因为 nba与 的分布函数分别为 nF( abx)与 F(x),再应用性质 3即可.三、中心极限定理设一次贝努里试验中成功的概率为 p (0 1-25 / n, 只当 n 250 时才满足要求. 通过比较可以看出

10、正态逼近比切比雪夫不等式要精确得多.德莫佛拉普拉斯定理的意义远不限于这些数值计算. 该定理及其推广形式实际上是概率论早期研究的中心问题.定义 2 设 n是一列随机变量. 如果存在常数列 Bn0与 An,使dnnkAB1N (0,1), (18)就称 n满足中心极限定理 (central limit theorem).定理 6(林德贝格(Lindeberg)勒维定理) 设 n是一列独立同分布的随机变量. 记 Sn=nk1, E 1=a, Var 1= 2, 则中心极限定理成立,即 dnaSN (0,1).证 我们用特征函数法. 令 )(tf与 tn分别为 1-a 与 naS的特征函数,由于12,

11、 n独立同分布,故 )(tfn=nf. 另外,已知 E 1=a, Var 1= 2, 所以特征函数有二阶连续导数,并且由泰勒 (Taylor) 展开式得xfxf)0()(12)()(2xof, x0.对给定的 tR, ntf=1-nt2, n,从而2/)(tnetf, 后者是标准正态分布的特征函数,由定理 4 即得定理 6 的结论.中心极限定理有着广泛的应用,在实际工作中,只要 n 足够大,便可以把独立同分布的随机变量和的标准化当作正态变量. 下面再看两个例子.例 4 近似计算时,原始数据 kx四舍五入到小数第 m 位,这时舍入误差 k可以看作在-0.5 m10,0.5 上均匀分布,而据此得

12、n 个 kx的和 k,按四舍五入所得的误差是多少呢?习惯上人们总是以各 kx误差上限的和来估计 k的误差限,即 0.5n10m. 当 n 很大时,这个数自然很大.事实上,误差不太可能这么大. 因为 k独立同分布,E k=0, Var k= 2= /12. 由定理 6,P(| nxk|)2(x)-1.若取 x=3,上述概率为 0.997. 和的误差超过 mn1035.03的可能性仅为 0.003. 显然,对较大的 n,这一误差界限远小于习惯上的保守估计 0.5 .*例 5 正态随机数的产生有各种方法. 除第二章5 介绍的以外,下面这种方法也是常用的:设 k独立同分布,都服从0,1 上的均匀分布,

13、则 E k=0.5, 12/kVar,由中心极限定理,n 很大时,= 12/nnk近似服从标准正态分布,事实上取 n=12 就够了. 于是取区间 0, 1上 12 个均匀随机数,则 16k即近似为标准正态随机数.定理 6 要求各 k同分布,这要求有时还是高了一点. 更一般地,林德贝格证明了在各独立随机变量 k组成的和式 kVarE)(中,只要各被加项 kkarVE依概率“均匀地小”,中心极限定理就仍然成立. 即定理 7(林德贝格费勒(Lindeberg-Feller)定理)设 k为独立随机变量序列,则nkkn1varmxli=0 (费勒条件 )与 )(var)(1xEdnkkkk成立的充要条件

14、是林德贝格条件被满足 : 0,nkEx kkk xdFEx1var| 2)(0.特别地有定理 8(李雅普诺夫(Lyapunov)定理) 若对独立随机变量序列 k,存在常数 0, 使当n时有nkknkkEVar1212/ 0|)( ,则中心极限定理成立. 这些结果解释了正态随机变量在自然界中普遍存在的原因.例 6 设 k是相互独立的随机变量序列, k的分布列是5.0k. 易知 0kE,2Vark,3|E. 因此,当 n时, .0)/()/(| 231312331 nkkkknkVar也就是说满足李雅普洛夫条件,所以 满足中心极限定理.对数理统计学的许多分支,如参数(区间)估计、假设检验、抽样调查等,中心极限定理都有着重要的作用. 事实上,它也是保险精算等学科的理论基础之一. 假定某保险公司为某险种推出保险业务,现有 n个顾客投保,第 i份保单遭受风险后损失索赔量记为 i. 对该保险公司而言,随机理赔量应该是所有保单索赔量之和,记为 S,即S.1nii弄清 S 的概率分布对保险公司进行保费定价至关重要. 在实际问题中,通常假定所有保单索赔相互独立. 这样,当保单总数 n充分大时,我们并不需要计算 S 的精确分布(一般情况下这是困难甚至不可能的). 此时,可应用中心极限定

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号