《6.2概率与数理统计》由会员分享,可在线阅读,更多相关《6.2概率与数理统计(14页珍藏版)》请在金锄头文库上搜索。
1、6.2 三大统计分布三大统计分布 本节介绍数理统计中的三个著名分布,本节介绍数理统计中的三个著名分布,它们在参数估计和假设检验等统计推断问它们在参数估计和假设检验等统计推断问题中有广泛应用题中有广泛应用. 一、一、X平方平方-分布分布定义定义6.1 设随机变量设随机变量 独立且服从相同独立且服从相同分布分布 ,则称,则称 (6-8) 所服从的分布是所服从的分布是自由度为自由度为n n的的 - -分布分布,记为记为 ,称,称 为为 -变量变量. 为纪念英国为纪念英国著名统计学家皮尔(著名统计学家皮尔(K.Pearson,1857-1936)- 分布也称为皮尔逊分布也称为皮尔逊 -分布分布. 这是
2、数理统计这是数理统计中一个十分重要的概率分布中一个十分重要的概率分布. 根据独立随机变量和的密度公式根据独立随机变量和的密度公式(3-27)和数和数学归纳法,可以证明:学归纳法,可以证明: -分布的概率密度分布的概率密度函数为(详见函数为(详见5) ,(,(6-9)其中其中 是是 -函数,定义见第四章附录函数,定义见第四章附录2 图图6.1是是 -变量的概率密度函数变量的概率密度函数(6-9)在几种在几种不同参数下的图像不同参数下的图像. 特别地,当特别地,当 时,时, 服从参数服从参数 的指数的指数分布分布. 此外,此外, -分布具有以下性质:分布具有以下性质:(1)数字特征)数字特征. 若
3、若 ,则,则 , . (2)可加性)可加性. 若若 且且 与与 独立,则独立,则. (6-10) 为便于今后的应用,现在我们引入为便于今后的应用,现在我们引入上侧分上侧分位数位数的概念的概念. 所谓一个分布的所谓一个分布的 -上侧分位上侧分位数就是指这样一个数,它使相应分布的随数就是指这样一个数,它使相应分布的随机变量不小于该数的概率为机变量不小于该数的概率为 . 比如,若记比如,若记 -变量变量 的的 -上侧分位数为,则满足(见上侧分位数为,则满足(见图图6.2). 对不太大的对不太大的n,如,如 60,可用附表,可用附表3查查 的的值,而对较大的值,而对较大的n,则可用(,则可用(6-11
4、)近似计)近似计算算 , (6-12) 其中其中 是标准正态分布是标准正态分布 的的 -上侧分位上侧分位数,可通过附表数,可通过附表2查出查出. 二、二、t t - -分布分布定义定义6.2 设设 , ,X与与Y独立,独立,则称则称 (6-13) 所服从的分布是所服从的分布是自由度为自由度为n n的的t t- -分布分布,记作,记作 . t -分布分布也称为也称为学生分布学生分布,是英国统计学家戈塞特,是英国统计学家戈塞特(Goset,1876-1937)在)在1908年年“Student”的笔名首次发表的,这个分布的笔名首次发表的,这个分布在数理统计中也占有重要的地位在数理统计中也占有重要的
5、地位. 根据独立随机变量商的密度公式根据独立随机变量商的密度公式(3-32),可以证明(过程从略):,可以证明(过程从略):(6-13)中的中的 概率密度函数为概率密度函数为 根据独立随机变量商的密度公式根据独立随机变量商的密度公式(3-32),可以证明(过程从略):可以证明(过程从略):(6-13)中中 的概的概率密度函数为率密度函数为 , . (6-14) 另外,另外,t -分布具有以下性质:分布具有以下性质:(1)(近似标准正态)(近似标准正态) 当当 时,时, 这就是说,当这就是说,当n充分大时,充分大时,t -分布分布 近似于近似于标准正态分布标准正态分布 ,但如果,但如果n较小,这
6、两较小,这两个分布的差别还是比较大的,见图个分布的差别还是比较大的,见图6.3, 其中粗虚线是其中粗虚线是 的密度函数的密度函数 . 我们我们看到,所有的看到,所有的t -分布密度函数值在分布密度函数值在 附附近均未超过的值,而在两边的尾部均超过近均未超过的值,而在两边的尾部均超过 了的值了的值. 这就是统计学中所谓的这就是统计学中所谓的“重尾重尾”(Heavy Trails)现象)现象. (2)(数字特征)若)(数字特征)若 , ,则,则 顺便指出,自由度为顺便指出,自由度为1的的t -分布也称为分布也称为柯西柯西(Cauchy)分布分布,它以其数学期望和方差,它以其数学期望和方差均不存在而
7、闻名(见例均不存在而闻名(见例4.3). 记记t -分布分布 的的 -上侧分位数为上侧分位数为 ,附表,附表4给出了不同给出了不同n和和 所对应的所对应的 数值数值. 另外,另外,由性质(由性质(1)知,对较大的)知,对较大的n(比如(比如 60) ,可用下式近似,可用下式近似. (6-15) 三、三、F -分布分布定义定义6.3 设设 且且X与与Y独立,则称独立,则称 (6-16) 所服从的分布是所服从的分布是自由度为自由度为 的的F F- -分布分布,记作记作 ,这是为纪念英国著名统计学家费歇,这是为纪念英国著名统计学家费歇(R.A. Fisher,1890-1962)而命名的)而命名的F
8、-分布也分布也是数理统计的一个重要分布是数理统计的一个重要分布. 注意到注意到(6-16)的商结构,则根据随机变量商的商结构,则根据随机变量商的密度计算公式(的密度计算公式(3-34)可求得)可求得F-分布分布 的概率密度函数为(过程从略,详见的概率密度函数为(过程从略,详见3, 4) , (6-17) 图图6.4是四组不同参数下该密度函数的图像是四组不同参数下该密度函数的图像. 另外,由定义另外,由定义6.3,立即有以下结论:,立即有以下结论:若若 ,则,则 .这个结论可用于计算分布这个结论可用于计算分布 的的 -上侧上侧分位数分位数 . 具体地说,我们有具体地说,我们有. (6-18) 事实上,由事实上,由 、 以及上以及上侧分位数的定义可推出侧分位数的定义可推出故故(6-18)式成立式成立. 对较小的对较小的 (如(如0.1、0.05、0.025等),等), 的数值可由附表的数值可由附表5查得查得. 但附表但附表5并未给出较并未给出较大时的数值,此时,可用公式大时的数值,此时,可用公式(6-18)求出求出 .