432编号统计学三大分布与正态分布的关系

上传人:玩*** 文档编号:145840019 上传时间:2020-09-23 格式:PDF 页数:12 大小:288.67KB
返回 下载 相关 举报
432编号统计学三大分布与正态分布的关系_第1页
第1页 / 共12页
432编号统计学三大分布与正态分布的关系_第2页
第2页 / 共12页
432编号统计学三大分布与正态分布的关系_第3页
第3页 / 共12页
432编号统计学三大分布与正态分布的关系_第4页
第4页 / 共12页
432编号统计学三大分布与正态分布的关系_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《432编号统计学三大分布与正态分布的关系》由会员分享,可在线阅读,更多相关《432编号统计学三大分布与正态分布的关系(12页珍藏版)》请在金锄头文库上搜索。

1、统计学三大分布与正态分布的关系统计学三大分布与正态分布的关系1 张柏林 41060045 理实 1002 班 摘要:摘要:本文首先将介绍分布, 分布,分布和正态分布的定义及基本性质, 2 tF 然后用理论说明分布, 分布,分布与正态分布的关系, 并且利用数学软件 2 tF MATLAB 来验证之. 1. 三大分布函数三大分布函数2 1.1分布分布 2 分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 2( ) n (Benayme)、 赫尔默特(Helmert)、 皮尔逊分别于 1858 年、 1876 年、 1900 年所发现, 它是由正态分布派生出来的,主要用于列联表检验。 定义:定

2、义:若随机变量相互独立,且都来自正态总体,则称 12n ,XX X0 1N ( , ) 统计量为服从自由度为的分布,记为. 2222 12n =+XXXn 2 22 ( )n 分布的概率密度函数为 2 1 22 2 1 0 ( ; ), 2( ) 2 00 nx n xex n f x n x 其中伽玛函数,分布的密度函数图形是一个只取非负 1 0 ( ),0 t x xe tdt x 2 值的偏态分布,如下图. 卡方分布具有如下基本性质: 性质性质 1:; 22 ( ),( )2Enn Dnn 性 质性 质2: 若,相 互 独 立 , 则 22 1122 (),()XnXn 12 ,XX ;

3、 2 1212 ()XXnn 性质性质 3:; 2 n 时, (n)正态分布 性质性质 4:设,对给定的实数)( 22 n 称满足条件:),10( )( 22 2 )()( n dxxfnP 的点为分布的水平的上侧)( 2 n )( 2 n 分位数. 简称为上侧分位数. 对不同 的与 n, 分位数的值已经编制成表供 查用. 分布的上分位数 2( ) n 1.2 分布分布t 分布也称为学生分布,是由英国统计学家戈赛特在 1908 年“student”的笔名t 首次发表的,这个分布在数理统计中也占有重要的位置. 定义定义:设,相互独立, ,则称统计量 2 0X N( ,1),Y(n),X Y /

4、X T Y n 服从自由度为的 分布,记为.nt ( )Tt n 分布的密度函数为t 12 2 1 () 2 ( ; )(1),. ( ) 2 n n x t x nt n n n 分布的密度函数图t 分布具有如下一些性质:t 性质性质 1:是偶函数, ; ( ) n f t 2 2 1 ,( )( ) 2 t n nf tte 性质性质 2:设,对给定的实数 称满足条件;)(ntT ),10( 的点为分 )( )()( nt dxxfntTP)(nt)(nt 布的水平的上侧分位数. 由密度函数)(xf 的对称性,可得 类似地,我们).()( 1 ntnt 可以给出 t 分布的双侧分位数 ,)

5、()()(| )( )( 2/ 2/ 2/ nt nt dxxfdxxfntTP 显然有 . 2 )(; 2 )( 2/2/ ntTPntTP 对不同的与, 分布的双侧分位数可从nt 附表查得. 分布的上分位数t 1.3分布分布F 分布是随机变量的另一种重要的小样本分布,应用也相当广泛. 它可用F 来检验两个总体的方差是否相等, 多个总体的均值是否相等. 分布还是方差分F 析和正交设计的理论基础. 定义定义:设,相互独立,令则称统计量服 22 ( ),( )Xn Ym,X Y / / Xn F Y m 从为第一自由度为,第二自由度为的分布.nmF 分布的密度函数图F 分布具有如下一些性质:F

6、性质性质 1:若 ; ( ,),1/( , )FF n mFF m n则 性质性质 2:若,则 ; )(ntX 2 (1, )XFn 性质性质 3:设,对给定的实数),(mnFF 称满足条件;),10( ),( )(),( mnF dxxfmnFFP 的点为分布的水平的上侧),(mnF),(mnF 分位数. 分布的上分位数F 分布的上侧分位数的可自附表查得.F 性质性质 4: 此式常常用来求分布表中没有列出的某些上. ),( 1 ),( 1 mnF nmF F 侧分位数. 1.4 正态分布正态分布 正态分布是数理统计中的一种重要的理论分布 ,是许多统计方法的理论基 础. 高斯(Gauss)在研

7、究误差理论时首先用正态分布来刻画误差的分布,所以 正态分布又称为高斯分布. 正态分布有两个参数, 和 ,决定了正态分布的位 置和形态. 为了应用方便,常将一般的正态变量 X 通过 u 变换转化成标准正态变 量 u, 以使原来各种形态的正态分布都转换为 =0, =1 的标准正态分布.N (0,1) 正态分布的密度函数和分布函数 若连续型随机变量具有概率密度为X( )f x 其中为常数,则称服从参数 2 2 () 2 1 ( ), 2 x f xex ,(0) X 为的正态分布,记为., 2 ()XN, 正态分布的密度函数图 特征特征 1:正态曲线(normal curve)在横轴上方均数处最高;

8、 特征特征 2:正态分布以均数为中心,左右对称; 特征特征 3:正态分布有两个参数, 即均数和标准差. 是位置参数, 固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横 轴越向左移动. 是形状参数,当固定不变时,越大,曲线越平阔; 越小,曲线越尖峭. 通常用表示均数为,方差为的正态分布. 2 N( ,) 2 用表示标准正态分布. N (0,1) 特征特征 4:正态曲线下面积的分布有一定规律。 实际工作中,常需要了 解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间 的例数占总例数的百分数(频数分布)或观察值落在该区间的概率. 正态 曲线下一定区间的面积可以通过标准正态

9、分布函数表求得。对于正态或近 似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计. 2. 三大分布与正态分布的密度函数比较三大分布与正态分布的密度函数比较3 2.1分布收敛于正态分布2.1分布收敛于正态分布 2 设,则对任意 x,有 . 2 ( )Xn 2/21 lim() 22 x t n Xn Pxedt n 证明:因为 分布的 2( ) n 222 111 ()()()( ) nnn iii iii EExE xD xn 222 11 ()()()2 nn ii ii DDxD xn 所以由独立同分布中心极限定理得(0,1) 2 Xn YN n 因为且 1 22 /2 1

10、,0 ( )2 2 nx n Xxex n 2 xn y n 所以2xnny 因为( )( ) YX fy dyfx dx 所以 1 1(2) 22 /2 1 ( )(2) ( )2 2 n nny Y n dx fynnye n dy = 1 11(2) 222 /2 12 (1) 2( )2 2 nn nny n nye n n n 令,利用 Stirling 公式:2nm 1 m!2,0 12 m mmm m mee m 则上式= 11() 11 (2 )(1) 4( )2 mmmmy m mye mmm = 11() 11 (2 )(1) 4(1)!2 mmmmy m mye mm m

11、 = 11() 1 (2 )(1) 422 m mmmmy mmm m mye mmm mee = 1 (1) 1 11 (1) 4 2 m my m m m ye mee 2 1 2 1 2 y n e 所以分布的极限分布为正态分布. 2 下面用 MATLAB 来验证上面结论,首先定义分布函数和相应的正态分布 2( ) n ,再依次增大,比较两者关系:4( ,2 )N nnn 从上面三个图形可以看出,越大,分布密度函数与正态分布度n 2( ) n( ,2 )N nn 函数越接近,这就和所证结论相符合. 2.2t 分布收敛于标准正态分布 若服从自由度为的 t 分布, (1) n Xn 2/21

12、 lim() 2 x t n n P Xxedt 证法 1:由于自由度为 n 的 t 分布的概率密度函数为 12 2 1 () 2 p( ; )(1), ( ) 2 n n x x nx n n n = 因此(1)式等价于 (2) 2/21 , 2 x n ex l i mp(x; n)= 先利用 Stirling 公式: 1 m!2,0 12 m mmm m mee m 证明 1 () 1 2 2 ( ) 2 n n n n l i m 事实上,利用函数的性质 1132121 ().() 22222 242222 ( ).() 22222 nnnnknk nnnnknk nn 21 (1)(

13、3).(21) () 2 22 2(2)(4).(22) () 2 nk nnnk nk n nnnk 当时2nk 11 ()(21)(23).1( ) 22 2 2 (22)(24).2(1) ( ) 2 n kk n kkk n 222 (21)! 2 2 2(1)!) k k kk 21 221 2 21 2 (21) () 1 2 22( 2 (1) () k kk k k e k kk e 21 21 22 22 22 (21) 2 21 (1) 2 222 (1) k k k k k k k e k kk e 21 121111 (1)() 22222 k k n kke 当时亦可

14、推出同样的结果。21nk 另外,由特殊极限公式可得 22 2 1122 () 222 lim(1)lim(1) nn xnx xn nn xx e nn 综合上诉,即证明(2)式 所以, 分布的极限分布是正态分布.t 下面用 MATLAB 来验证上面结论,首先定义分布函数和相应的正态分布( )t n ,再依次增大,比较两者关系:(0,) 2 n N n n 从上面三个图形可以看出,越大,分布密度函数与正态分布度n( )t n(0,) 2 n N n 函数越接近,这就和所证结论相符合. 2.3分布收敛于标准正态分布分布收敛于标准正态分布F 若 服从为第一自由度为,第二自由度为的分布,则 / /

15、Xm F Y n mnF . 2/21 lim() 2 x t n n P Xxedt 证明:m/ m1 P Y 当时 所以/ n L FX 因为 2 22 (/ )1,(/ ) n E XnD Xn nn 所以由中心极限定理,当时n 1 (0,1) 2 L F N n 所以分布的极限分布是正态分布.F 下面用 MATLAB 来验证上面结论,首先定义分布函数和相应的正态分( , )F m n 布,再依次增大,比较两者关系: 2 2 2(2) (,) 2(2) (4) nn mn N nm nn n 从上面三个图形可以看出,越 大 ,分布密度函数与正态分布n( , )F m n 度函数越接近,这就和所证结论相符合. 2 2 2(2) (,) 2(2) (4) nn mn N nm nn 在实际应用中我们往往在取得总体的样本后,通常是借助样本的统计量对 未知的总体分布进行推断,为此须进一步确定相应的统计量所服从的分布,正态 分布、 分布、 分布、分布是统计学最基本的四种分布, 而分布、 2( ) ntF 2( ) n 分布和分布又都收敛于正态分布, 可见正态分

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号