第二章第二章 概率与理论分布概率与理论分布《理论分布正式》PPT课件第二节、理论分布2.2.1二项式分布二项式分布2.2.1.1二项总体及二项式分布二项总体及二项式分布 二项总体二项总体((binary population):间断性随机变数):间断性随机变数的总体包含两项,即非此即彼的两项,它们构成的总的总体包含两项,即非此即彼的两项,它们构成的总体称为二项总体体称为二项总体 如小麦种子的发芽与不发芽,大豆子叶为黄色和如小麦种子的发芽与不发芽,大豆子叶为黄色和绿色,调查荔枝蒂蛀虫为害分为受害株和不受害株等绿色,调查荔枝蒂蛀虫为害分为受害株和不受害株等等 通常将二项总体中的通常将二项总体中的“此此”事件以变量事件以变量“1”表示,表示,具概率具概率p;将;将“彼彼”事件以变量事件以变量“0”表示,具概率表示,具概率q因而二项总体又称为因而二项总体又称为0、、1总体,其概率则有总体,其概率则有p+q=1或或者者q=p-1 《理论分布正式》PPT课件第二节、理论分布2.2.1二项式分布二项式分布2.2.1.1二项总体及二项式分布二项总体及二项式分布 二项式分布二项式分布((binomial distribution):):从二项总体中抽取从二项总体中抽取n个个体,则间断性变量个个体,则间断性变量y就就有有n+1种取值,这种取值,这n+1种取值各有其概率,因种取值各有其概率,因而由变量及其概率就构成了一个分布,这个分而由变量及其概率就构成了一个分布,这个分布就是二项式分布(又称二项分布或者二项式布就是二项式分布(又称二项分布或者二项式概率分布。
概率分布 《理论分布正式》PPT课件第二节、理论分布2.2.1二项式分布二项式分布2.2.1.1二项总体及二项式分布二项总体及二项式分布 如如观察使用某种农药后供试观察使用某种农药后供试5只蚜虫的死亡数目只蚜虫的死亡数目,,记记 “死死”为为“0”,记,记 “活活”为为“1”,观察结果将,观察结果将出现出现6个事件:个事件:5只全死,只全死,4死死1活,活,3死死2活,活,2死死3活,活,1死死4活,活,5只全活,这只全活,这6个事件就构成一个完全事件系,个事件就构成一个完全事件系,但但6个事件的概率不同,将完全事件系的总概率个事件的概率不同,将完全事件系的总概率1分布分布到到6个事件中去,就是所谓的个事件中去,就是所谓的概率分布概率分布如果将活的如果将活的虫数虫数y来代表相应的事件,便得到了关于变量来代表相应的事件,便得到了关于变量y的概率的概率分布《理论分布正式》PPT课件2.2.1.2二项分布的概率计算方法二项分布的概率计算方法 大豆子叶的颜色受一对等位基因控制,黄大豆子叶的颜色受一对等位基因控制,黄色(色(Y)对绿色()对绿色(G)为显性,则)为显性,则F2代按代按3::1比例分离,黄色子叶的概率为比例分离,黄色子叶的概率为0.75((3/4),绿,绿色子叶的概率为色子叶的概率为0.25(1/4),这是二项总体的,这是二项总体的概率分布。
若从总体中抽取概率分布若从总体中抽取n粒,那么粒,那么y粒是粒是黄子叶的概率是多少呢?黄子叶的概率是多少呢?《理论分布正式》PPT课件1.以二粒荚为例:出现黄色子叶种子数(.以二粒荚为例:出现黄色子叶种子数(y)可能就)可能就有有2+1种取值,即为种取值,即为0、、1或或2个 ①① 出现出现0个个y的概率:的概率:P((y=0))= ②② 出现一黄一绿的概率:出现一黄一绿的概率:P((YG))= P((GY))= 这两个为互斥事件这两个为互斥事件所以所以P((y=1)为)为3/16+3/16=6/16③③ 出现出现2个个Y的概率:的概率:P((y=2))= 故,出现故,出现黄子叶种子数黄子叶种子数0,,1,,2三个事件三个事件A0.A1.A2构成一完构成一完全事件系全事件系 P((A0))+P((A1))+P((A2))=黄子叶数(黄子叶数(y)) 0 1 2黄子叶出现黄子叶出现y次的概率次的概率 1/16 6/16 9/16 合计为合计为1《理论分布正式》PPT课件2.以三粒为例:出现黄色子叶的种子数(.以三粒为例:出现黄色子叶的种子数(y)可能为)可能为0.1.2或或3个。
个①① 出现出现0个个y的概率:的概率:P((y=0))=②② 出现出现1个个y的概率:的概率:P((GGY))= ,, P((GYG))= P((YGG))= ,,故故 P((y=1))=③③ 出现出现2个个Y的概率:的概率:P((YYG))= ,, P((YGY))= P((GYY))= ,, 故故P((y=2))=④④ 出现出现3个个Y的概率:的概率:P((GGG))= P((y=3))=所以完全事件系所以完全事件系P((A0))+P((A1))+P((A2))+ P((A3))=《理论分布正式》PPT课件从以上可看出,每一复合事件的概率必等于该从以上可看出,每一复合事件的概率必等于该事出现的组合数乘以单个事件的概率事出现的组合数乘以单个事件的概率组合数公式为:组合数公式为:n相当于豆荚内的种子总数,相当于豆荚内的种子总数,y相当于黄色的种相当于黄色的种子数,所以:子数,所以:P((y))=例如:例如:n=3,,y=2 P((y=2))=《理论分布正式》PPT课件二项式中包括两项,这两项的概率为p、q,则变量y的概率函数为:这一分布律也称为贝努里(贝努里(Bernoulli)分布,且有二项分布的概率之和等于1。
《理论分布正式》PPT课件2.2.1.3二项式分布概率的计算例例1、棉田盲椿象危害的统计概率是从调查、棉田盲椿象危害的统计概率是从调查2000株后获得的近似值株后获得的近似值p=0.35,现受害株事,现受害株事件为件为A,其概率为,其概率为p(A)=0.35,未受害株事件,未受害株事件为对立事件,其概率为为对立事件,其概率为q=1-p=0.65这一试验是可以重复的假定作了多次试验,即抽验是可以重复的假定作了多次试验,即抽出出n株为一个抽样单位,那么,试问出现有株为一个抽样单位,那么,试问出现有y株是受害的,其概率应为多少?株是受害的,其概率应为多少? n=1受害株树受害株树y=0,1 n=5受害株树受害株树y=0,1,2,3,4,5 P(y=k)= 《理论分布正式》PPT课件2.2.1.3二项式分布概率的计算例例1、、n=1时,时,由于已知由于已知 P(A)=0.35,,P(( ))=1-0.35=0.65 总体的理论分布则以总体的理论分布则以n乘上述概率分布,即乘上述概率分布,即np和和n(1-p),所以有所以有2000*0.35=700株受害和株受害和2000*0.65=1300株未受害。
株未受害n=5 时,受害株数时,受害株数 y=0,1,2,3,4,5 ,变量,变量y相应相应的概率函数的概率函数 P(y=i)= ,其累积函,其累积函数数F((y)就如)就如P54页的公式页的公式调查单位为调查单位为5株的概率分布表就如株的概率分布表就如P55的表的表4.2《理论分布正式》PPT课件例例2、某种昆虫在某地区的死亡率为、某种昆虫在某地区的死亡率为40%,即,即p=0.4,,现对这种害虫用一种新药进行治虫试验,每次抽样现对这种害虫用一种新药进行治虫试验,每次抽样10头作为一组治疗试问新药无疗效,在头作为一组治疗试问新药无疗效,在10头中死头中死3头、头、2头、头、1头,以及全部愈好的概率为多少?头,以及全部愈好的概率为多少?10头中不超过两头死亡的概率各为多少?头中不超过两头死亡的概率各为多少? n=10 p=0.4 q=0.6 求求 P(y=3) p(y=2) p(y=1) p(y=0) P(y=3)= p(y=2)= p(y=1)= p(y=0)= =0.21499=0.12093=0.04031=0.00605《理论分布正式》PPT课件F(2) ==p(y=0)+p(y=1)+p(y=2)= 0.00605 + 0.04031 +0.12093= 0.16729如果问超过两头死去的概率是多少如果问超过两头死去的概率是多少? = P(y=3)+ P(y=4)+ P(y=5)+ P(y=6)+ P(y=7)+ P(y=8)+ P(y=9)+ P(y=10)如用对立事件来解则容易的多如用对立事件来解则容易的多:1- F(2) =1-=1-0.16729=0.83271《理论分布正式》PPT课件2.2.1.4二项分布的形状及参数二项分布的形状及参数 二项分布定义如下:二项分布定义如下: 设随机变量设随机变量y所有可能取的值为零或正整数:所有可能取的值为零或正整数:0,1,2,…,,n,且有,且有 Pn(y=k) = k=0,1,2…,,n其中其中p>>0,,q>>0,,p+q=1,,则称则称随机变量随机变量y服从参数为服从参数为n和和p的二项分布的二项分布(binomial distribution),记为记为 y~~B(n,p)。
《理论分布正式》PPT课件二项分布是一种离散型随机变量的概率分布参数二项分布是一种离散型随机变量的概率分布参数n称为离散参数称为离散参数 ,, 只能取正整数;只能取正整数; p 是连续参数,它是连续参数,它能取能取0与与1之间的任何数值之间的任何数值,q由由p确定,故不是另一个确定,故不是另一个独立参数独立参数二项分布由二项分布由n和和p两个参数决定:两个参数决定: 1、当、当p值较小且值较小且n不大时不大时 ,分,分 布布 是偏倚的但随是偏倚的但随着着n的增大的增大 ,分布逐渐趋于对称,如,分布逐渐趋于对称,如图图4—2 所示;所示; 《理论分布正式》PPT课件图4—2 n值不同的二项分布比较 图4—3 p值不同的二项分布比较《理论分布正式》PPT课件2、当、当 p 值值 趋趋 于于 0.5 时时 ,分,分 布布 趋于对称,趋于对称, 如如图图4—3所示;所示;3、对于固定的、对于固定的n及及p,当,当k增加时,增加时,Pn(k)先随先随之增加并达到其极大值,以后又下降之增加并达到其极大值,以后又下降 此外此外 ,在,在n较大,较大,np、、nq 较接近时较接近时 ,二项分,二项分布接近于正态分布;当布接近于正态分布;当n→∞时,二项分布的时,二项分布的极限分布是正态分布。
极限分布是正态分布《理论分布正式》PPT课件二项分布的平均数与标准差二项分布的平均数与标准差 统计学证明,服从二项分布统计学证明,服从二项分布B(n,p)的随机变量的随机变量y平平均数均数μ、标准差、标准差σ与参数与参数n、、p有如下关系:有如下关系: μ=np σ= σ2=npq如果如果n适当大适当大,如大于如大于30,而而 p值又不太小值又不太小,并且并且np及及nq均不小于均不小于5时时,那么这个二项分布趋近于即将介绍的正那么这个二项分布趋近于即将介绍的正态分布态分布《理论分布正式》PPT课件2.2.1.4多项式分布 多项总体:多项总体: 若总体中包含几种特性或者分类标志,可将总若总体中包含几种特性或者分类标志,可将总体中的个体分为几类这种将变数资料分为体中的个体分为几类这种将变数资料分为3类类或者多类的总体称为或者多类的总体称为多项总体多项总体 例如某种农药在防治某种病害的效果时可能例如某种农药在防治某种病害的效果时可能有的效果好,有的无效果,有的有副作用,这些有的效果好,有的无效果,有的有副作用,这些构成的总体就是多项总体。
构成的总体就是多项总体 研究多项总体的随机变量的概率分布可使用研究多项总体的随机变量的概率分布可使用多项式分布(多项式分布(multinomial distribution)《理论分布正式》PPT课件2.2.1.4多项式分布 设总体中共包含有设总体中共包含有k项事件,它们的概率分别为项事件,它们的概率分别为p1、、p2、、p3、、p4…pk,且,且p1+p2+p3+…+pk=1若从这种总体中随机抽取若从这种总体中随机抽取n个个体,个个体,那么可能那么可能得到这得到这k项的个数分别为项的个数分别为y1、、y2、、y3…yk,显然,显然y1+y2+y3+…+yk=n这样一个事件的概率应该是这样一个事件的概率应该是:P(y1、、y2、、y3…yk) =这一概率分布称为这一概率分布称为多项式分布多项式分布《理论分布正式》PPT课件2.2.1.4多项式分布 例例3、某药对病人有效的概率为、某药对病人有效的概率为1/2,对病人无效的,对病人无效的概率为概率为1/3,有副作用的概率为,有副作用的概率为1/6,若随机抽取,若随机抽取2个试验该药的病人,那么我们抽取的结果包括个试验该药的病人,那么我们抽取的结果包括这样几个事件:这样几个事件:2个病人有副作用;个病人有副作用;1个无效,个无效,1个有副作用;个有副作用;2个无效;个无效;1个有效,个有效,1个有副作用;个有副作用;1个有效,个有效,1个无效;个无效;2个均有效。
这几个事件的个均有效这几个事件的概率可用以上公式计算如概率可用以上公式计算如P57页页《理论分布正式》PPT课件2.2.1.5泊松分布—二项分布的一种极限分布泊松分布泊松分布 (Poisson distribution) 在二项分布中,当某事件出现的概率 p或q 值比较小 (如小于 0.1 ), 而样本容量又很大,二项分布就接近泊松分布了主要描述大量实验中随机稀疏现象如将np=m(n比较大,而m比较小时),其概率密度函数为:P(y) =e=2.71828…, y=0,1,2…《理论分布正式》PPT课件其参数为:其参数为: 即:平均数、方差与标准差如下:即:平均数、方差与标准差如下:μ=m,, σσ2 2 =m,,σ=σ= 不同不同m值的分布及例子如书本第值的分布及例子如书本第58页图页图4.4和例和例4.4 m的大小决定其分布形状,当的大小决定其分布形状,当m值很小时值很小时分布呈很偏斜形状,分布呈很偏斜形状,m增大后则逐渐对称,增大后则逐渐对称,趋向于后面要介绍的正态分布趋向于后面要介绍的正态分布 泊松分布有一特性泊松分布有一特性:即两个或两个以上的:即两个或两个以上的泊松分布之和,也是一个泊松分布。
泊松分布之和,也是一个泊松分布《理论分布正式》PPT课件2.2.2正态分布正态分布 正态分布正态分布((normal distribution)是一种很是一种很重要的连续型随机变量的概率分布生物现象重要的连续型随机变量的概率分布生物现象中有许多变量是服从或近似服从正态分布的中有许多变量是服从或近似服从正态分布的许多统计分析方法都是以正态分布为基础的许多统计分析方法都是以正态分布为基础的此外,还有不少随机变量的概率分布在一定条此外,还有不少随机变量的概率分布在一定条件下以正态分布为其极限分布件下以正态分布为其极限分布因此在统计学因此在统计学中,正态分布无论在理论研究上还是实际应用中,正态分布无论在理论研究上还是实际应用中中 ,, 均占有重要的地位均占有重要的地位 《理论分布正式》PPT课件2.2.2.1二项分布的极限—正态分布 以二项分布棉株受害率为例,假定受害率以二项分布棉株受害率为例,假定受害率p=0.5,q=p=0.5,现假定每个抽,现假定每个抽样单位包括样单位包括20株,这样株,这样y有有21种取值,其受害株的概率种取值,其受害株的概率p(y)=于是概率分布计算如下:于是概率分布计算如下: 将这些概率绘于图。
此图是对称的将这些概率绘于图此图是对称的 如如p=q,不论,不论n值大或小,二项分布的多边形图必形成对称;如值大或小,二项分布的多边形图必形成对称;如p≠q,而,而n很大时,多边形图仍趋对称很大时,多边形图仍趋对称n 增加到无穷多时,每组的直方形都一一变增加到无穷多时,每组的直方形都一一变为纵轴线,此时的多边形边变为一光滑曲线此光滑曲线是二项分布的极为纵轴线,此时的多边形边变为一光滑曲线此光滑曲线是二项分布的极限曲线此极限曲线属于连续性变数分布曲线这一曲线一般称之为限曲线此极限曲线属于连续性变数分布曲线这一曲线一般称之为正态正态分布曲线或正态概率密度曲线分布曲线或正态概率密度曲线如图4-4 《理论分布正式》PPT课件图4—4 正态分布密度曲线《理论分布正式》PPT课件2.2.2.2正态分布的定义及其特征正态分布的定义及其特征 (一)(一) 正态分布的定义正态分布的定义 若连续型随机变量若连续型随机变量y的概率的概率分布密度函数为分布密度函数为 ((4-6)) 其中其中μ为平均数,为平均数,σ2为方差,则称随机变量为方差,则称随机变量y服从服从正态分布正态分布(normal distribution),, 记为记为y~~N(μ,σ2)。
相应的概率分布函数为相应的概率分布函数为 ((4-7))《理论分布正式》PPT课件 分布密度曲线如分布密度曲线如图图4—4所示 (二二) 正态分布的特征正态分布的特征 1、正态分布密度曲线是单峰、对称的悬钟、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为形曲线,对称轴为y=μ;算术平均数、中数和众;算术平均数、中数和众数是相等的;数是相等的; 2、、f(y) 在在 y =μ 处达处达 到到 极极 大大 ,, 极大值极大值 ;; 3、、f(y)是非负函数,以是非负函数,以y轴为渐近线,分布轴为渐近线,分布从从-∞至至+∞;; 《理论分布正式》PPT课件 4、曲线在、曲线在y=μ±σ处各有一个拐点,即曲线在处各有一个拐点,即曲线在(-∞,μ-σ)和和(μ+σ,+∞) 区间上是下凸的,在区间上是下凸的,在[μ-σ,μ+σ]区间内是上凸的,曲线两尾向左右延伸,永不区间内是上凸的,曲线两尾向左右延伸,永不接触横轴;接触横轴; 5、正态分布有两个参数,即平均数、正态分布有两个参数,即平均数μ和标准差和标准差σ,,在在μ±3 σ范围内包括了绝大多数频率范围内包括了绝大多数频率 。
μ是位置参数,如是位置参数,如图图4—5所示 当当σ恒定时,恒定时,μ愈大,愈大,则曲线沿则曲线沿y轴愈向右移动;反之,轴愈向右移动;反之,μ愈小,曲线沿愈小,曲线沿y轴愈轴愈向左移动向左移动 σ是变异度参数,是变异度参数, 如如图图4—6所示所示 当当μ恒定时,恒定时, σ愈大,表示愈大,表示 y 的取值愈分散,的取值愈分散, 曲线愈曲线愈“胖胖”;;σ愈小,愈小,y的取值愈集中在的取值愈集中在μ附近,曲线愈附近,曲线愈“瘦瘦”《理论分布正式》PPT课件图4—5 σ相同而μ不同的三个正态分布图4—6 μ相同而σ不同的三个正态分布0 1 2《理论分布正式》PPT课件 6、分布密度曲线与横轴所夹的面积为、分布密度曲线与横轴所夹的面积为1,即:,即: 区间区间μ±1σ 面积或概率面积或概率= 0.6827 μ±2σ = 0.9545 μ±3σ = 0.9973 μ±1.960σ = 0.9500 μ±2.576σ = 0.9900 《理论分布正式》PPT课件 2.2.2.2标准正态分布标准正态分布 由上述正态分布的特征可知由上述正态分布的特征可知 ,正态分布是依赖,正态分布是依赖于参数于参数μ和和σ2 (或或σ) 的一簇的一簇 分布分布 ,, 正态曲线之正态曲线之位置及形态随位置及形态随μ和和σ2的不同而不同的不同而不同 。
这就给研究这就给研究具体的正态总体带来困难,具体的正态总体带来困难, 如以新变量如以新变量u来代替来代替μ,令,令 u= ,则将一般的,则将一般的N(μ,,σ2) 转转 换为换为 μ= 0,σ2=1的正态分布,的正态分布, u 称为称为正态离差正态离差《理论分布正式》PPT课件 我们称我们称μ=0,σ2=1的正态分布为标准正态分布的正态分布为标准正态分布(standard normal distribution) 标准正态分布的概率密度函数及分布函数分标准正态分布的概率密度函数及分布函数分别记作别记作ψ(u)和和Φ(u),由,由 (4-6)及及(4-7) 式得:式得: (4-8) (4-9) 随机变量随机变量u服从标准正态分布,记作服从标准正态分布,记作u~~N(0,,1),分布密度曲线如,分布密度曲线如图图4—7所示 《理论分布正式》PPT课件图4—7 标准正态分布密度曲线《理论分布正式》PPT课件 对于任何一个服从正态分布对于任何一个服从正态分布N(μ,σ2)的随机的随机变量变量y,都可以通过标准化变换:,都可以通过标准化变换: u=(y-μ)//σ (4-10) 将将 y其变换为服从标准正态分布的随机变量其变换为服从标准正态分布的随机变量u。
u 称称 为为 标标 准准 正正 态变量或标准正态离差态变量或标准正态离差(standard normal deviate) 《理论分布正式》PPT课件2.2.2.3正态分布的概率计算正态分布的概率计算 (一)标准正态分布的概率计算(一)标准正态分布的概率计算 设设u服从标准正态分布,则服从标准正态分布,则 u 在在[u1,u2 )内取值的)内取值的概率为:概率为: ==Φ(u2)--Φ(u1) (4-11) 而而Φ(u1)与与Φ(u2)可由可由附表附表2累积正态分布累积正态分布FN((y)值)值表表查得 《理论分布正式》PPT课件 例如,例如,u=1.75 ,,1.7放在第一列放在第一列0.05放在第一行放在第一行 在在附表附表2累积正态分布累积正态分布FN((y)值)值中中 ,, 1.7所在行与所在行与 0.05 所在列相交处的数值为所在列相交处的数值为0.95994,即,即 Φ(1.75)=0.95994 有有 时时 会会 遇遇 到到 给给 定定 Φ(u) 值值 ,, 例例 如如 Φ(u)=0.284,, 反过来查反过来查u值。
这只要在值这只要在附表附表2累积正态分布累积正态分布FN((y))值值中找到与中找到与 0.284 最接近的值最接近的值0.2843,对应行的第一列,对应行的第一列数数 -0.5,, 对应列的第一行数对应列的第一行数 值值 0.07 ,即相应的,即相应的u值为值为 u = - 0.57,即,即 Φ(-0.57)=0.284 如果要求更精确的如果要求更精确的u值,可用线性插值法计算值,可用线性插值法计算 《理论分布正式》PPT课件 由由(4-11) 式及正态分布的对称性可推出下列关系式,式及正态分布的对称性可推出下列关系式, 再借助再借助附表附表2累积正态分布累积正态分布FN((y)值)值,, 便能很方便地计便能很方便地计算有关概率(有时要利用分布曲线的对称性来解题):算有关概率(有时要利用分布曲线的对称性来解题): P(0≤u<<u1)==Φ(u1)-0.5 P(u≥u1) =Φ(-u1) P(||u||≥u1)=2Φ(-u1) (4-12) P(||u|<|<u1)=)=1-2Φ(-u1) P(u1≤u<<u2)==Φ(u2)-Φ(u1) 《理论分布正式》PPT课件 【例【例4.6】】 已知已知u~~N(0,,1),试求:,试求: (1) P(u<<-1.64)==? (2) P (u≥2.58)=? (3) P (||u||≥2.56)=? (4) P(0.34≤u<<1.53) =? 《理论分布正式》PPT课件 利用利用(4-12)式,查式,查附表附表2累积正态分布累积正态分布FN((y)值)值得:得: (1) P(u<<-1.64)=0.05050 (2) P (u≥2.58)=Φ(-2.58)=0.024940 (3) P (||u||≥2.56) =2Φ(-2.56)=2×0.005234 =0.010468 (4) P (0.34≤u<<1.53) =Φ(1.53)-Φ(0.34) =0.93669-0.6331=0.30389《理论分布正式》PPT课件 关于标准正态分布,以下几种概率应当熟记:关于标准正态分布,以下几种概率应当熟记: P((-1≤u<<1))=0.6826 P((-2≤u<<2))=0.9545 P((-3≤u<<3))=0.9973 P((-1.96≤u<<1.96))=0.95P (-2.58≤u<<2.58)=0.99 图图4—8 标准正态分布的三个常用概率标准正态分布的三个常用概率《理论分布正式》PPT课件图4—8 标准正态分布的三个常用概率 《理论分布正式》PPT课件 u变量在上述区间以外取值的概率分别为:变量在上述区间以外取值的概率分别为: P(||u||≥1)=2Φ(-1)=1- P(-1≤u<<1) =1-0.6826=0.3174 P(||u||≥2)=2Φ(-2) =1- P((-2≤u<<2)) =1-0.9545=0.0455 P(||u||≥3)=1-0.9973=0.0027 P(||u||≥1.96)=1-0.95=0.05 P(||u||≥2.58)=1-0.99=0.01 《理论分布正式》PPT课件 (二)一般正态分布的概率计算(二)一般正态分布的概率计算 正正 态态 分分 布布 密度曲线和横轴围成的一个区域,密度曲线和横轴围成的一个区域,其面积为其面积为1,这实际上表明了,这实际上表明了“随机变量随机变量y取值取值在在-∞与与+∞之间之间”是一个必然事件,其概率为是一个必然事件,其概率为1。
若随机变量若随机变量 y服从正态分布服从正态分布N(μ,σ2),则,则y的的取值落在任意区间取值落在任意区间 [y1, y2)) 的概率的概率 ,记作,记作P(y1≤ y <<y2),等于,等于图图4—9 中阴影部分曲边梯中阴影部分曲边梯形面积即:形面积即:《理论分布正式》PPT课件图4—9 正态分布的概率《理论分布正式》PPT课件 (4-13) 对对 (4-13)式作变换式作变换u=(y-μ)//σ,得,得dy=σdu,故有,故有其中,其中,《理论分布正式》PPT课件 这表明服从正态分布这表明服从正态分布N(μ,σ2)的随机变量的随机变量y 在在 [ y1 ,,y2 )内取值的概率)内取值的概率 ,, 等等 于服于服 从从 标标 准准 正正 态态 分分 布布 的的 随随 机机 变变 量量 u 在在[(y1-μ)/σ, (y2-μ)/σ)内取值的概率)内取值的概率 因此,计算一般正态分布的概率时,因此,计算一般正态分布的概率时, 只要只要将区间的上下限作适当变换将区间的上下限作适当变换(标准化标准化),, 就可用就可用查标准正态分布的概率表的方法求得概率了。
查标准正态分布的概率表的方法求得概率了 《理论分布正式》PPT课件 【例【例4.7】】 设设y服从服从μ=30.26,σ2=5.102的正态分布,试求的正态分布,试求P(21.64≤y<<32.98) 令令 则则u服从标准正态分布,故服从标准正态分布,故 =P(-1.69≤u<<0.53) =Φ(0.53)-Φ(-1.69) =0.7019-0.04551 =0.6564 《理论分布正式》PPT课件 关于一般正态分布,以下几个概率关于一般正态分布,以下几个概率(即随即随机变量机变量y落在落在μ加减不同倍数加减不同倍数σ区间的概率区间的概率)是是经常用到的经常用到的 P(μ-σ≤y<<μ+σ)=0.6826 P(μ-2σ≤y<<μ+2σ) =0.9545 P (μ-3σ≤y<<μ+3σ) =0.9973 P (μ-1.96σ≤y<<μ+1.96σ) =0.95 P (μ-2.58σ≤y<<μ+2.58σ)=0.99《理论分布正式》PPT课件 上述关于正态分布的结论,可用一实例上述关于正态分布的结论,可用一实例来印证。
来印证 例如上章水稻例如上章水稻140行产量资料的样本分行产量资料的样本分布表现出接近正态分布布表现出接近正态分布 ,其,其 平均数平均数 =157.9 (g) ,标,标 准准 差差S=36.4(g) ,算出平,算出平均数加减不同倍数标准差区间内均数加减不同倍数标准差区间内 所包括的所包括的次数与频率次数与频率 ,列于表,列于表4—2 《理论分布正式》PPT课件表表4—2 140行水稻产量在行水稻产量在 ±kS 区间内所包括的次数与频率区间内所包括的次数与频率 ±kS 数值数值 区间区间 区间内包括的次数区间内包括的次数 次数次数 % ±1S 157.9 ±36.4 121.5~~194.3 99 70.71±2S 157.9 ±72.8 85.1 ~~230.7 134 95.71 ±3S 157.9 ±109.2 48.7 ~~267.1 140 100《理论分布正式》PPT课件 由表由表4—2可见,实际频率与理论概率相当接可见,实际频率与理论概率相当接近,说明近,说明140行水稻产量资料的频率分布接近正行水稻产量资料的频率分布接近正态分布态分布 ,从而可推断水稻产量这一随机变量很,从而可推断水稻产量这一随机变量很可能是服从正态分布的。
可能是服从正态分布的 生物统计中,不仅注意随机变量生物统计中,不仅注意随机变量y落在平均落在平均数加减不同倍数标准差区间数加减不同倍数标准差区间(μ-kσ,μ+kσ)之内之内的概率而且的概率而且 也很也很 关心关心 y落在此区间之外的概率落在此区间之外的概率 我们把随机变量我们把随机变量y落在平均数落在平均数μ加减不同倍加减不同倍数标准差数标准差σ区间之外的概率称为区间之外的概率称为双侧概率双侧概率(两尾两尾概率概率),,记作记作α《理论分布正式》PPT课件 对应于双侧概率可以求得随机变量对应于双侧概率可以求得随机变量y小于小于μ-kσ或大于或大于μ+kσ的概率,称为的概率,称为单侧概率单侧概率(一尾概率一尾概率),记作记作α//2 例如,例如,y落在落在(μ-1.96σ,μ+1.96σ)之外的双侧之外的双侧概率为概率为0.05,而单侧概率为,而单侧概率为0.025即 P(y<<μ-1.96σ))= P(y>>μ+1.96σ)=0.025 双侧概率或单侧概率如双侧概率或单侧概率如图图4—10所示 y落在落在(μ-2.58σ,μ+2.58σ)之外的双侧概率为之外的双侧概率为0.01,而单侧概率,而单侧概率 P(y<<μ-2.58σ)= P(y>>μ+2.58σ)=0.005 《理论分布正式》PPT课件图4—10 双侧概率与单侧概率《理论分布正式》PPT课件 附表附表3给出了满足给出了满足P (||u|>|> )=α的双的双侧分位侧分位 的数值。
因此,的数值因此, 只要已知双侧概率只要已知双侧概率α的值,由附表的值,由附表3就可直接查出对应的双侧分位数就可直接查出对应的双侧分位数 ,查法与附表,查法与附表2相同 例如,已知例如,已知u~~N(0,1)试求:试求: (1) P(u<<- )+P(u≥ )=0.10的的 (2) P(- ≤u<< ﹚=0.86的的 因为附表因为附表3中的中的α值是:值是:《理论分布正式》PPT课件所以所以 ((1) P(u<<- )+ P(u≥ ) =1- P(- ≤ u<< ﹚=0.10=α由附表由附表3查得:查得: =1.644854 (2) P (- ≤u << ) =0.86 ,, α=1- P (- ≤u<< )=1-0.86=0.14 由附表由附表3查得:查得: =1.475791 对于对于y~~N(μ,σ2),只要将其转换为,只要将其转换为u~~N(0,1),即可求得相应的双侧分位数。
即可求得相应的双侧分位数 《理论分布正式》PPT课件 [例例4.4] 假定假定y是一随机变数具有正态分布,平均数是一随机变数具有正态分布,平均数 =30,标准差,标准差 =5,试计算小于,试计算小于26,小于,小于40的概率,的概率,介乎介乎26和和40区间的概率以及大于区间的概率以及大于40的概率 首先计算:首先计算:先将先将y转换为转换为u值值 p63 《理论分布正式》PPT课件同理可得:同理可得: FN(40)=0.9773 所以:所以:P(26<y≤40)=FN(40)--FN(26)=0.9773--0.2119 = 0.7654 P(y>40)=1-P(y≤40)=1-0.9773 =0.0227 查附表查附表2,当,当u=-0.8时,时,FN(26)=0.2119,说明这,说明这一分布从一分布从--∞到到26范围内的变量数占全部变量数的范围内的变量数占全部变量数的21.19%,或者说,,或者说,y≤26概率为概率为0.2119.《理论分布正式》PPT课件图4.12 概率计算图示《理论分布正式》PPT课件 p63 [例例4.5] 在应用正态分布时,经常要讨论随机变数在应用正态分布时,经常要讨论随机变数y离其平均数的差数大于或小于若干个值的概率。
例如计离其平均数的差数大于或小于若干个值的概率例如计算离均差绝对值等于小于和等于大于算离均差绝对值等于小于和等于大于1 的概率为:的概率为:也可以简写为也可以简写为 《理论分布正式》PPT课件 相应地,离均差绝对值等于小于相应地,离均差绝对值等于小于2 、等于大于、等于大于2 、等、等于小于于小于3 和等于大于和等于大于3 的概率值为:的概率值为:以上结果解释了正态分布曲线的概率特性,可参考图以上结果解释了正态分布曲线的概率特性,可参考图4.13《理论分布正式》PPT课件图图4.13 离均差的绝对值离均差的绝对值≤1 , 2 和和1.96 的概率值的概率值《理论分布正式》PPT课件 p64[例例4.6] 计算正态分布曲线的中间概率为计算正态分布曲线的中间概率为0.99时,时,其其y或或u值应等于多少?值应等于多少? 因为正态分布是对称的,故在曲线左边从-因为正态分布是对称的,故在曲线左边从-∞到-到- u的概率和在曲线右边从的概率和在曲线右边从u到到∞的概率都应等于的概率都应等于1/2(1--0.99)=0.005。
查表,查表,u=--2.58时,时, fN(y) =0.00494≈0.005 于是知,当于是知,当 ±2.58时,在其范围内包括时,在其范围内包括99%的的变量,仅有变量,仅有1%变量在此范围之外上述结果写作:变量在此范围之外上述结果写作:《理论分布正式》PPT课件同理可求得:同理可求得: 以上以上 乃正态曲线下左边一尾乃正态曲线下左边一尾y从从--∞到到 上的面积和右边一尾上的面积和右边一尾y从从 到到∞上的面积之和,亦可写成:上的面积之和,亦可写成:同理,同理, 亦可写成:亦可写成:《理论分布正式》PPT课件 以上两式等号右侧的前一项为以上两式等号右侧的前一项为左尾概率左尾概率,后一项为,后一项为右右尾概率尾概率,其和概率称为,其和概率称为两尾概率值两尾概率值 在附表3列出了两尾概率取某一值时的临界在附表3列出了两尾概率取某一值时的临界u值值(正态正态离差离差u值值),可供直接查用。
可供直接查用 例如,可查得例如,可查得P=0.01时时u=2.5758,P=0.05时时u=1.9599,即表示:,即表示: P(|u|≥2.5758)=0.01, P(|u|≥1.9599)=0.05如果仅计算一尾,则为一尾概率值例如计算如果仅计算一尾,则为一尾概率值例如计算 P(u≥1.6448)=P(|u|≥1.6448)=(0.1)=0.05这个这个0.05称为称为y值大于值大于 的一尾概率值的一尾概率值当概率一定时,两尾概率的当概率一定时,两尾概率的|u|总是大于一尾概率总是大于一尾概率|u|《理论分布正式》PPT课件。