正态分布下的累积概率

资源描述

《正态分布下的累积概率》由会员分享，可在线阅读，更多相关《正态分布下的累积概率（13页珍藏版）》请在金锄头文库上搜索。

1、正态分布3.1 正态分布对于连续型随机变量而言，正态分布(normal distribution)是最重要的一种概率分布。经验表明：对于依赖于众多微小因素；且每一因素均产生微小的或正或负影响的连续型随机变量来说，正态分布是一个相当好的描述模型。如人的体重，因为遗传、骨骼结构、饮食、锻炼、等都对人的体重有影响，但又没有一种因素起到压到一切的主导作用。与此相类似，人的身高、考试分数等都近似地服从正态分布。通常用：XN(u, ) (3 - 1)表示随机变量X服从正态分布。N表示正态分布，括号内的参数u, 称为正态分布的总体均值(或期望)和方差。3.1.1 正态分布的性质(1) 正态分布曲线以均值u为

2、中心，对称分布。(2) 正态分布的概率密度函数呈中间高、两边低，在均值u处达到最高，向两边逐渐降低，即随机变量在远离均值处取值的概率逐渐变小。(3) 正态曲线下的面积约有68%位于u 两值之间；约有95%的面积位于u2之间；而约有99.7%的面积位于u3之间。 (4) 两个(或多个)正态分布随机变量的线性组合仍服从正态分布。令X和Y相互独立：XN(uX，)YN(uY，)现在考虑两个变量的线性组合：Wa X+b Y则 WN(uW，) ( 3 - 2 )其中，uW =(auXbuY) ( 3 - 3 ) = (+) (3 - 4)例3.1令X表示在下沙高教区一花店每日出售玫瑰花数量， Y表示在下沙

3、镇一花店每日出售玫瑰花的数量，假定X和Y服从正态分布，且相互独立，并有： XN( 100，64 )，YN( 150，81 )求两天内两花商出售玫瑰花数量的期望及方差？W2X2Y根据式( 3 - 3 )E(w)E( 2X+ 2Y) = 5 0 0，Var (w) = 4var(X) + 4var(Y) = 5 8 0因此，W服从均值为5 0 0，方差为5 8 0的正态分布，即WN( 5 0 0，5 8 0 )。3.1.2 标准正态分布两个正态分布可能因为期望或方差的不同，或是期望和方差均不同而相区别。如何比较各种不同的正态分布呢？定义一个新的变量Z：如果变量X的均值为u，方差为，则根据式(3 -

4、 4)，变量Z的均值为0，方差为1。称之为标准正态变量(standard normal variable) 。即若XN(u，)，那么变量Z就是标准正态变量，用符号表示为：ZN(0，1) (3 - 5)证明：（1）均值为0因为有E (aX+b) = a E(X) + b，所以（2）方差为1因为有var ( aX +b ) = a2var ( X ) ，所以图3 - 3a和3 - 3b分别给出标准正态分布的概率密度函数和累积分布函数。例3.2变量x表示花房每日出售的玫瑰花量，假定它服从均值为70、方差为9的正态分布，即XN( 70，9 )，求任给一天，出售玫瑰花数量大于75支的概率。服从标准正

5、态分布，求P(Z 1 . 6 7 )。从附录表可知， Z位于区间( 0 , 1.3 )的概率为0.4032，位于( 0，2.5 )的概率为0.4938。由正态分布的对称性可知，Z位于区间(-1.3 , 0 )的概率也为0.4032，位于(-2.5 , 0 )的概率为0.4938。由于这种对称性，在标准正态分布表中一般仅给出Z取正值的情形。也就是说，标准正态密度函数，在Z=0的左右面积均为0.5，整个面积(或概率)为1。根据正态分布表得：P( 0Z1.67)=0.4525因此，P(Z1.67)=0.50000.4257=0.0475即每天出售玫瑰花的数量超过75支的概率为0.0475。(参见图3

6、-3a )例3.3继续例3. 2 ,现假定要求每天出售玫瑰花数量小于或等于7 5支的概率。概率为： 0.500 0+0.452 5=0.952 5 (见图3-3b )。例3.4求每天出售玫瑰花数量在在65与75支之间的概率。查表得，P(1.67Z0)=0.4525P(0Z1.67)=0.4525由正态分布的对称性得到，P(1.67Z1.67)=0.9050即每天出售面包的数量介于65条与75条之间的概率约为90.5% (见图3-3a )。上面的例子表明：一旦知道某一正态变量的期望与方差，先将其转化为标准正态变量，然后根据正态分布表求得相应的概率。3.2样本均值的抽样分布或概率分布样本均值是总体

7、均值的估计量，但由于样本均值是依据某一给定样本而定，因此其值也会因随机样本的不同而变化。也就是说，样本均值也是随机变量，并且有其自己的概率分布函数。称X1，X2，Xn构成一个容量为n的独立同分布随机变量(independently and identically distributed random variables,i.i.d.random variables)，即所有的X是从同一概率密度(即每个Xi有相同的概率密度函数)中独立抽取得到的。如果XiN(u，)且每个Xi独立抽取得到，则称X1，X2，，Xn是 i.i.d.随机变量，正态概率密度函数是其共同的概率密度。估计量(比如样本均值)的

8、概率密度。例3.6正态分布的均值为10，方差为4，即N( 10，4 )。从这个正态总体中抽取20个随机样本，每个样本包括2 0个观察值。对抽取的每一个样本，得到其样本均值，因而共有20个样本均值，见表3-3。图3- 的条线图描绘了样本均值的经验概率分布。如果列出更多这样的样本，那么样本均值的概率分布服从正态分布。若X1,X2, ,Xn是来自于均值为u，方差为的正态总体的一随机样本。则样本均值，也服从正态分布，其均值为u，方差为，即 (3 - 6)样本均值(u的估计量)的抽样(或概率)分布，同样服从正态分布。其均值与每一个Xi的均值相同，但方差等于Xi的方差()除以样本容量n。证明：因为= (X

9、1 + X2 + Xn ) nE() = E(X1) + E(X2) + E(Xn ) n= u + u + u n= uVar() = var（X1 + X2 + Xn ）/ n= var( X1 + X2 + Xn ) n2= var(X1 )+ var(X2) + var(Xn) n2(独立变量方差性质)= ( + + ) / n2= n / n2= / n N(u，) 可以转化为标准正态分布中心极限定理从正态总体中抽样，其样本均值同样服从正态分布。但是如果从其他总体中抽样又如何呢？中心极限定理(central limit theorem,CLT)：如果X1，X2，Xn是来自(均值为u方

10、差为的)任一总体的随机样本，随着样本容量无限增大，则其样本均值趋于正态分布，其均值为u，方差为/n。注意样本方差的公式，分母是n-1，因为要求估计量是无偏的。证明：（注：如果为样本均值，则为）3.3 分布如果随机变量X服从均值为u，方差为的正态分布，即XN(u，)，则随机变量Z= (Xu) / 是标准正态变量，即ZN(0，1)。标准正态变量的平方服从自由度(degrees of freedom,d.f.)为1的分布，即是一种特殊的分布，用符号表示为，Z2= (3 - 7)其中的下标(1)表示自由度(d.f.)为1，这里定义自由度是平方和中独立观察值的个数。令Z1，Z2，ZK为K个独立的标准正

11、态变量(即每一个变量均是均值为0，方差为1的正态变量)，对所有的变量Z平方，它们的平方和服从自由度为K的分布，即 ( 3 - 8 )这里的自由度为k，因为在式(3 - 8)的平方和中，有K个独立的观察值。分布的性质(1) 如图3 - 8示, 与正态分布不同, 分布只取正值(它是平方和的分布)且取值范围从0到无限大。(2)与正态分布不同，分布是斜分布，其偏度取决于自由度的大小，自由度越小，越向右偏，但随着自由度的增大，逐渐呈对称，接近正态分布。( 3 ) 分布的期望为k，方差为2k。( 4 ) 若E1、E2分别为自由度为k1,k2的两个相互独立的变量，则其和(Z1+Z2)也是一个变量，其自由度为

12、(k1+k2)。 3.4 t分布运用最广泛的另一个概率分布是t分布，t分布又称为学生t分布(Students t distribution)，与正态分布也密切相关。（注：学生是统计学家W.S.Gosset的笔名，他于1908年发现了这一概率分布。）若 N(u，)则变量Z服从标准正态分布： (3 - 9)假定仅知道u及的估计量的值，用样本标准差S代替总体标准差，得到一个新的变量 (3 -10)变量t服从自由度为(n-1)的学生t分布。与分布类似，t分布也与参数自由度有关，自由度为n-1。t分布的性质(1) t分布与正态分布类似，具有对称性。(2) t分布均值，与标准正态分布均值相同为0，但方差为

13、k / (k2)。（注：在求t分布的方差时定义自由度必须大于2。）标准正态分布方差总为1，表明t分布方差总比标准正态分布方差大t分布比正态分布略“胖”一些。但是当k增大时， t分布的方差接近于标准正态分布方差值1。如果自由度k=10，则t分布方差为10/8 = 1.25；如果自由度k30，则其方差为30 / 28 = 1.0；如果自由度k=100，则其方差为100 / 98 = 1.02因此与分布类似，随着自由度的逐渐增大时， t分布近似正态分布。（注：当k为30，t分布的方差已与标准正态分布方差相差不大。）例3.7假定真实的出售平均数量为70支，那么15天内出售玫瑰花平均数量为74支的概率是

14、多少？(样本方差为4)如果知道真实的标准差，则可通过标准正态分布变量Z来解答。但是，现在仅知道真实标准差的估计量S，则可以利用式(3 - 10)来计算t值。自由度为14时，查表得，t值大于等于2.145的概率为0.025 (2.5%)，t值大于等于2.624的概率为0.01 (1%)，t值大于等于3.787的概率为0.001 (0.1%)。 3.5 F分布如果随机样本X1，X2，Xm来自均值为uX，方差为的正态总体，其样本容量为m；随机样本Y1，Y2，Yn为来自均值为uY，方差为的正态总体，其样本容量为n，且这两个样本相互独立。如何知道这两个正态总体是否同方差？即 = 由于不能直接观察两个总体的方差，但假定可以知道它们

展开阅读全文

正态分布下的累积概率

最新文档