第三章概率与概率分布

上传人:s9****2 文档编号:568271021 上传时间:2024-07-23 格式:PPT 页数:167 大小:2.63MB
返回 下载 相关 举报
第三章概率与概率分布_第1页
第1页 / 共167页
第三章概率与概率分布_第2页
第2页 / 共167页
第三章概率与概率分布_第3页
第3页 / 共167页
第三章概率与概率分布_第4页
第4页 / 共167页
第三章概率与概率分布_第5页
第5页 / 共167页
点击查看更多>>
资源描述

《第三章概率与概率分布》由会员分享,可在线阅读,更多相关《第三章概率与概率分布(167页珍藏版)》请在金锄头文库上搜索。

1、概 率概率分布与第三章第一节:概率基础知识一、概率的概念一、概率的概念二、概率的计算二、概率的计算三、概率的分布三、概率的分布四、大数定律四、大数定律一、概率基本概念(一)事件一)事件定义:在一定条件下,某种事物出现与否定义:在一定条件下,某种事物出现与否就称为是事件。就称为是事件。 自然界和社会生活上发生的现象是各自然界和社会生活上发生的现象是各种各样的,常见的有两类。种各样的,常见的有两类。在在一定条件下必然出现某种结果或必然不出现某种结果。一定条件下必然出现某种结果或必然不出现某种结果。确定性事件确定性事件必然事件(必然事件(U)(certain event)不可能事件(不可能事件(V)

2、(impossible event)一、概率基本概念在在一定条件下可能发生也可能不发生。一定条件下可能发生也可能不发生。随机事件随机事件(random event)不确定事件不确定事件(indefinite event)一、概率基本概念为了研究随机现象,需要进行大量重复的调查、实验、测试为了研究随机现象,需要进行大量重复的调查、实验、测试等,这些统称为试验。等,这些统称为试验。一、概率基本概念随机事件随机事件事事 件件一、概率基本概念(二)频率二)频率(frequency)若若在在相同的条件下,进行了相同的条件下,进行了n次次试验,在这试验,在这n次次试验中,事件试验中,事件A出现的次数出现的

3、次数m称为事件称为事件A出现的频出现的频数,比值数,比值m/n称为事件称为事件A出现的频率出现的频率(frequency),记为记为W(A)=m/n。0W(A) 1一、概率基本概念 表表3-1 玉米种子发芽试验结果玉米种子发芽试验结果种子总数种子总数(n) 10 20 50 100 200 500 1000发芽种子数发芽种子数(m) 9 19 47 91 186 458 920种子发芽率种子发芽率(m/n) 0.900 0.950 0.940 0.910 0.930 0.918 0.920种子发芽与否是不能事先确定的,但从表中可以看出,种子发芽与否是不能事先确定的,但从表中可以看出,试验随着试

4、验随着n值的不同,种子发芽率也不相同,当值的不同,种子发芽率也不相同,当n充分大时,充分大时,发芽率在发芽率在0.92附近摆动。附近摆动。例:例:一、概率基本概念频率表明了事件频繁出现的程度,因而其稳定性说频率表明了事件频繁出现的程度,因而其稳定性说明了随机事件发生的可能性大小,是其本身固有的明了随机事件发生的可能性大小,是其本身固有的客观属性,提示了隐藏在随机现象中的规律性。客观属性,提示了隐藏在随机现象中的规律性。概概 率率一、概率基本概念(三)概率(三)概率(probability,P)概率的统计定义:设在相同的条件下,进行大量重复试验,概率的统计定义:设在相同的条件下,进行大量重复试验

5、,若事件若事件A的频率稳定地在某一确定值的频率稳定地在某一确定值p的附近摆动,则称的附近摆动,则称p为事件为事件A出现的概率。出现的概率。 P(A) = p统计概率统计概率(statistics probability)后验概率后验概率(posterior probability)统计概率一、概率基本概念 抛掷一枚硬币发生正面朝上的试验记录抛掷一枚硬币发生正面朝上的试验记录实验者实验者 投掷次数投掷次数 发生正面朝上的次数发生正面朝上的次数 频率频率(m/n) 蒲丰蒲丰 4040 2048 0.5069K 皮尔逊皮尔逊 12000 6019 0.5016K 皮尔逊皮尔逊 24000 12012

6、 0.5005随着实验次数的增多,正面朝上这个事件发生的频率稳定随着实验次数的增多,正面朝上这个事件发生的频率稳定接近接近0.5,我们称,我们称0.5作为这个事件的概率。作为这个事件的概率。一、概率基本概念(三)概率(三)概率(probability,P) P(A) = p=lim 在一般情况下,随机事件的概率在一般情况下,随机事件的概率P是不可能准是不可能准确得到的。通常以试验次数确得到的。通常以试验次数n充分大时,随机充分大时,随机事件事件A的频率作为该随机事件概率的的频率作为该随机事件概率的近似值近似值。mnmn概率的古典定义概率的古典定义一、概率基本概念一、概率基本概念对于某些随机事件

7、,不用进行多次重复试验来确定其概对于某些随机事件,不用进行多次重复试验来确定其概率,而是根据随机事件本身的特性直接计算其概率。率,而是根据随机事件本身的特性直接计算其概率。随随机机事事件件(1)试验的所有可能结果只有有限个,即样本试验的所有可能结果只有有限个,即样本空间中的基本事件只有有限个空间中的基本事件只有有限个;(2)各个试验的可能结果出现的可能性相等,各个试验的可能结果出现的可能性相等,即所有基本事件的发生是等可能的即所有基本事件的发生是等可能的;(3)试验的所有可能结果两两互不相容。试验的所有可能结果两两互不相容。概率的古典定义概率的古典定义一、概率基本概念一、概率基本概念具有上述特

8、征的随机试验,称为古典概型(具有上述特征的随机试验,称为古典概型(classical model).设样本空间有设样本空间有n个等可能的基本事件所构成,其中事件个等可能的基本事件所构成,其中事件A包含包含有有m个基本事件,则事件个基本事件,则事件A的概率为的概率为m/n,即即P(A)=m/n。古典概率古典概率(classical probability)先验概率先验概率(prior probability)一、概率基本概念一、概率基本概念12345678910随机抽取一个球,求下列事件的概率随机抽取一个球,求下列事件的概率;(1)事件事件A抽得一个编号抽得一个编号 4 (2)事件事件B =抽得

9、一个编号是抽得一个编号是2的倍数的倍数 该该试验样本空间由试验样本空间由10个等可能的基本事件构成,即个等可能的基本事件构成,即n=10,而事而事件件A所包含的基本事件有所包含的基本事件有3个,即抽得编号为个,即抽得编号为1、2、3中的任何一中的任何一个,事件个,事件A便发生。便发生。P(A)=3/10=0.3P(B)=5/10=0.5一、概率基本概念一、概率基本概念12345678910A“一次取一个球,取得红球的概率一次取一个球,取得红球的概率”10个球中取一个球,其可能结果有个球中取一个球,其可能结果有10个基本事件(即每个球个基本事件(即每个球被取到的可能性是相等的),即被取到的可能性

10、是相等的),即n=10事件事件A:取得红球,则取得红球,则A事件包含事件包含3个基本事件,即个基本事件,即m=3P(A)=3/10=0.3一、概率基本概念一、概率基本概念12345678910B “一次取一次取5个球,其中有个球,其中有2个红球的概率个红球的概率”10个球中任意取个球中任意取5个,其可能结果有个,其可能结果有C105个个基本事件,即基本事件,即n= C105事件事件B =5个球中有个球中有2个红球,则个红球,则B包含的基本事件数包含的基本事件数m= C32 C73P(B) = C32 C73 / C105 = 0.417一、概率基本概念0P(A)10P(A)1 任何事件任何事件

11、P(U)=1P(U)=1 必然事件必然事件P(V)P(V)0 0 不可能事件不可能事件0P(A)10P(A)1 随机事件随机事件概率的计算概率的计算概率的计算概率的计算第二部分第二部分二、概率的计算二、概率的计算(一)事件的相互关系一)事件的相互关系和和事件事件积积事件事件互斥事件互斥事件对立事件对立事件独立事件独立事件完全事件系完全事件系二、概率的计算二、概率的计算1 和和事件事件事件事件A和事件和事件B中至少有一个发生而构成的新中至少有一个发生而构成的新事件称为事件事件称为事件A和事件和事件B的和事件,记作的和事件,记作A+B。n个事件的和,可表示为个事件的和,可表示为A1+A2+An二、

12、概率的计算二、概率的计算2 积事件积事件事件事件A和事件和事件B中同时发生而构成的新事件称中同时发生而构成的新事件称为事件为事件A和事件和事件B的积事件,记作的积事件,记作AB。n个事件的积,可表示为个事件的积,可表示为A1 A2 An二、概率的计算二、概率的计算3 互斥事件(互不相容事件)互斥事件(互不相容事件)事件事件A和事件和事件B不能同时发生,则称这两个事不能同时发生,则称这两个事件件A和和B互不相容或互斥。互不相容或互斥。n个事件两两互不相容,则称这个事件两两互不相容,则称这n个事件互斥。个事件互斥。二、概率的计算二、概率的计算4 对立事件对立事件事件事件A和事件和事件B必有一个发生

13、,但二者不能同必有一个发生,但二者不能同时发生,且时发生,且A和和B的和事件组成整个样本空间。的和事件组成整个样本空间。即即A+B=U,AB=V。我们称事件我们称事件B为事件为事件A的的对立事件。对立事件。B= A二、概率的计算二、概率的计算5 独立事件独立事件事件事件A和事件和事件B的发生无关,事件的发生无关,事件B的发生与的发生与事件事件A的发生无关,则事件的发生无关,则事件A和事件和事件B为独立为独立事件。事件。如果多个事件如果多个事件A1、A2、A3、An 彼此独立,彼此独立,则称之为独立事件群。则称之为独立事件群。二、概率的计算二、概率的计算6 完全事件系完全事件系如果多个事件如果多

14、个事件A1、A2、A3、An两两互斥,两两互斥,且每次试验结果必然发生其一,则称事件且每次试验结果必然发生其一,则称事件A1、A2、A3、An为完全事件系。为完全事件系。完全事件系的和事件概率为,任何一个事完全事件系的和事件概率为,任何一个事件发生的概率为件发生的概率为1/n。即:即:P(A1A2An)二、概率的计算二、概率的计算(二)概率的计算法则二)概率的计算法则1 互斥事件加法定理互斥事件加法定理定理定理: 若事件若事件A与与B互斥,则互斥,则 P(A+B)=P(A)+P(B) 试验的全部结果包含试验的全部结果包含n个基本事件,事件个基本事件,事件A包含其中包含其中m1个个基本事件,事件

15、基本事件,事件B包含其中包含其中m2个基本事件。由于个基本事件。由于A和和B互斥,互斥,因而它们各包含的基本事件应该完全不同。所以事件因而它们各包含的基本事件应该完全不同。所以事件AB所所包含的基本事件数为包含的基本事件数为m1+m2。P(A+B)=m1+m2/n=m1/n+m2/n=P(A)+P(B)二、概率的计算二、概率的计算1 互斥事件加法定理互斥事件加法定理推理推理1 P(A1+A2+An)=P(A1)+P(A2)+P(An)推理推理2 P(A)=1-P(A)推理推理3 完全事件系的和事件的概率为完全事件系的和事件的概率为1。二、概率的计算二、概率的计算1 互斥事件加法定理互斥事件加法

16、定理例:玉米田中,一穗株(A)占67.2%,双穗株(B)占30.7%,空 穗株(C)占2.1%,试计算一穗株和双穗株的概率。P(A+B)=P(A)+P(B)=0.672+0.307=0.979因为P(A)+P(B)+P (C) =1 P(A+B)=1-P(C)=1-0.021=0.979二、概率的计算2 独立事件乘法定理独立事件乘法定理定理定理: 事件事件A和事件和事件B为独立事件,则事件为独立事件,则事件A与事与事件件B同时发生的概率为各自概率的乘积。同时发生的概率为各自概率的乘积。 P(AB)=P(A)P(B)推理:推理:A1、A2、An彼此独立,则彼此独立,则 P(A1A2A3An)=P

17、(A1)P(A2)P(A3)P(An)二、概率的计算二、概率的计算2 独立事件乘法定理独立事件乘法定理例例:播种玉米,种子的发芽率为播种玉米,种子的发芽率为90%,每穴两粒,则:,每穴两粒,则:A:第一粒种子发芽,第一粒种子发芽,P (A) = 0.9, P(A) = 0.1B:第二粒种子发芽,第二粒种子发芽,P (B) = 0.9, P( B ) = 0.1C:两粒种子均发芽,两粒种子均发芽,C = AB,P(C) = P(A) P(B) = 0.81D:一粒种子发芽:一粒种子发芽:D= AB + AB,P(D)0.9*0.1+ 0.1*0.9=0.18E:两粒种子均不发芽:两粒种子均不发芽

18、:E= A B,P(E)P(A)P(B)=0.1*0.1=0.01求:求:概概概概 率率率率 分分分分 布布布布第三部分第三部分三、概率分布三、概率分布(一)离散型变量的概率分布一)离散型变量的概率分布要了解离散型随机变量要了解离散型随机变量x的统计规律,必须知道的统计规律,必须知道它的一切可能值它的一切可能值xi及取每种及取每种可能值的概率可能值的概率pi。对离散型变量对离散型变量x的一切可能值的一切可能值xi(i=1,2,3),及其对应的概率及其对应的概率piP (x=xi) = pi, i=1,2,3三、概率分布例:例: 表3-2某鱼群的年龄组成年龄(x) 1 2 3 4 5 6 7频率

19、(W) 0.4597 0.3335 0.1254 0.0507 0.0215 0.0080 0.0012此表给出了该鱼群年龄构成的全部,我们称之为该鱼群年龄的概率分布。三、概率分布 表 婴儿的性别情况表性别(x) 0(男) 1(女)概率(P) 0.517 0.483此表列出了性别变量的取值及相应值的概率,揭示了观此表列出了性别变量的取值及相应值的概率,揭示了观察婴儿性别试验的统计规律。察婴儿性别试验的统计规律。用随机变量的可能取值及取相应值的概率来表示随机用随机变量的可能取值及取相应值的概率来表示随机试验的规律称为随机变量的分布律或概率函数。试验的规律称为随机变量的分布律或概率函数。例:例:三

20、、概率分布 表3-3 离散型变量的概率分布变量(x) x1 x2 x3 x4 . xn概率(P) p1 p2 p3 p4 . pnP (x=xi) = pi, i=1,2,3设离散型变量x的所有一切可能值xi(i=1,2,3),取相应值的概率为pi,则P (x=xi)称为离散型随机变量x的概率函数。三、概率分布离散型变量的概率分布的特点离散型变量的概率分布的特点特点Pi 0 (i=1,2,)= 1三、概率分布三、概率分布(二)连续型变量的概率分布二)连续型变量的概率分布当试验资料为连续型变量,一般通过分组当试验资料为连续型变量,一般通过分组整理成频率分布表。如果从总体中抽取样本的整理成频率分布

21、表。如果从总体中抽取样本的容量容量n相当大,则频率分布就趋于稳定,我们将相当大,则频率分布就趋于稳定,我们将它近似地看成总体概率分布。它近似地看成总体概率分布。图3.1 鲢鱼体长的频率分布图35 40 45 50 55 60 65 70 75 80 85 90直方图中同一组内的频率是相等的。直方图中同一组内的频率是相等的。三、概率分布直方图中每一矩形的面积就表示该组的频率。直方图中每一矩形的面积就表示该组的频率。三、概率分布三、概率分布当当n无限大时,频率转化为概率,频率密度也转化为概率无限大时,频率转化为概率,频率密度也转化为概率密度,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率密度,阶

22、梯形曲线也就转化为一条光滑的连续曲线,这时频率分布也就转化为概率分布了,此曲线为总体的概率密度曲线,分布也就转化为概率分布了,此曲线为总体的概率密度曲线,曲线函数曲线函数f(x)称为概率密度函数。称为概率密度函数。三、概率分布ab三、概率分布对于一个连续型随机变量对于一个连续型随机变量x,取值于区间取值于区间a,b内的内的概率为函数概率为函数f(x)从从a到到b的积分,即:的积分,即:连续型随机变量的概率由概率分布密度函数所确定。连续型随机变量的概率由概率分布密度函数所确定。概率密度函数概率密度函数f(x)曲线与曲线与x轴所围成的面积为轴所围成的面积为1。大大大大 数数数数 定定定定 律律律律

23、第四部分第四部分四、大数定律大大数数定律:定律:是概率论中用来阐述大量随机是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。现象平均结果稳定性的一系列定律的总称。主要内容:主要内容:样本容量越大,样本统计数与样本容量越大,样本统计数与总体参数之差越小。总体参数之差越小。四、大数定律贝努里大数贝努里大数贝努里大数贝努里大数定律定律定律定律辛钦大辛钦大辛钦大辛钦大数数数数定律定律定律定律四、大数定律(1)1)贝努里大数定律贝努里大数定律设m是n次独立试验中事件A出现的次数,而p是事件A在每次试验中出现的概率,则对于任意小的正数,有如下关系:= 1= 1 limlim P P四、大数定

24、律(2)2)辛钦大数定律辛钦大数定律设x1,x2,x3,xn是来自同一总体的变量,对于任意小的正数,有如下关系:= 1lim P几种常见的理论分布几种常见的理论分布几种常见的理论分布几种常见的理论分布随机变量的概率分布 (probability distribution) 离散型变量(discrete random variable) 连续型变量(continuous random variable)二项分布泊松分布正态分布变量第二节:几种常见的理论分布一、二一、二一、二一、二 项项项项 分分分分 布布布布离散型随机变量的分布哺乳动物种子穗子生物个体雄性雌性发芽不发芽有芒无芒成活死亡对立事件一

25、、二项分布的概率函数一、二项分布的概率函数一、二项分布设有一随机试验设有一随机试验, ,每次试验结果出现且只出现对立事每次试验结果出现且只出现对立事每次试验结果出现且只出现对立事每次试验结果出现且只出现对立事件件件件A A A A与与与与 之一之一之一之一,这两种结果是互不相容的,这两种结果是互不相容的,在每次试在每次试在每次试在每次试验中出现验中出现验中出现验中出现A A A A的概率是的概率是的概率是的概率是p p p p(0(0(0(0p p p p1)1)1)0p0,q0q0,p+q=1p+q=1,x是一个离散型随机变量,取是一个离散型随机变量,取值为值为0,1,2,n。p(x) Cn

26、xpxqn-xCnxn!x!(n-x)!n=试验次数(或样本含量) n=4x=在n次试验中事件A出现的次数 x=2p=事件A发生的概率(每次试验是恒定的) p=0.91-p=事件A不发生的概率 1-p=0.1p(x)=X的概率函数=P(X=x) P(2)则则4粒种子有两粒发芽的概率为:粒种子有两粒发芽的概率为: P(x)= p2 q4-2=60.920.12=0.0486 例:例:由于二项式中由于二项式中p+q=1p+q=1,( p+q ) n = 1p(0) +p(1) +p(2) + + p(x) + + p(n) =1一、二项分布P(x) =1nx=0或者或者n n个事件构成一个完全事件

27、系,所以有:个事件构成一个完全事件系,所以有: 现已求出某事件发生的概率,若试验现已求出某事件发生的概率,若试验N次,次,则该事件发生的理论次数为:则该事件发生的理论次数为: 理论次数理论次数NP(x) 二项分布的概率累积函数为:二项分布的概率累积函数为: F (x) =P(x)=13:1若每次观察4株,共观察100次,问花为0、1、2、3、4株的概率各为多少?(二)二项分布的计算(二)二项分布的计算例:豌豆例:豌豆F1为红花和白花,杂交后为红花和白花,杂交后F2红花:白花红花:白花3:1F1F2概率函数 Cnxpxqn-x P(x) F(x) NP(x) P(0) C40p0q4 0.003

28、9 0.0039 0.39 P(1) C41p1q3 0.0469 0.0508 4.69 P(2) C42p2q2 0.2109 0.2617 21.09 P(3) C43p3q1 0.4219 0.6836 42.19 P(4) C44p4q0 0.3164 1.000 31.64 合计 1.000 100 表 观察4株出现红花的概率分布表 (p=0.75 q=1-p=0.25)概率函数 Cnxpxqn-x P(x) F(x) NP(x) P(0) C50p0q5 0.00001 0.00001 0.01 P(1) C51p1q4 0.00045 0.00046 0.45 P(2) C52

29、p2q3 0.0081 0.00856 8.1 P(3) C53p3q2 0.0729 0.08046 72.9 P(4) C54p4q1 0.32805 0.40951 328.05 P(5) C55p5q0 0.59049 1.0000 590.49 孵化小鸡的概率分布表(p= 0.90 q=0.10)例例2:鸡蛋孵化率为,每次选:鸡蛋孵化率为,每次选5个进行孵化,试求孵出小鸡的各个进行孵化,试求孵出小鸡的各种可能概率,若做种可能概率,若做1000次试验,其理论次数分别为多少?次试验,其理论次数分别为多少?二项二项分布概率函数分布概率函数概率的计算概率的计算样本容量的确定样本容量的确定p(

30、x) Cnxpx(1-p)n-x例:某小麦品种在田间出现自然变异的概率为例:某小麦品种在田间出现自然变异的概率为0.0045,(1)调查调查100株,获得两株或两株以上变异植株的概率是多少?株,获得两株或两株以上变异植株的概率是多少?(2)期望有期望有0.99的概率获得的概率获得1株或株或1株以上的变异植株,至少应调株以上的变异植株,至少应调查多少株?查多少株?n=100, p=0.0045P(x2)=1- P(0)- P(1)=0.07512)=1- P(0)- P(1)=0.0751 P(0)=0.01n=1021(株)株)一、二项分布(三)二项分布的形状和参数(三)二项分布的形状和参数(

31、 (1)1)当当p p值值较小且较小且n n不大不大时,分布是偏倚的。时,分布是偏倚的。随随n n的增大,分布趋于的增大,分布趋于对称;对称;二项分布的二项分布的形状形状由由n n和和p p两个参数决定。两个参数决定。B(n,p)B(n,p)一、二项分布(三)二项分布的形状和参数(三)二项分布的形状和参数(2 2)当)当p p值趋于值趋于0.50.5时,分布趋于对称。时,分布趋于对称。统计学证明,服从二项分布B(n,p)的随机变量所构成的总体的平均数 、标准差与n、p这两个参数有关。一、二项分布(三)二项分布的形状和参数(三)二项分布的形状和参数n p)1 (pnp- -= =s s 在二项分

32、布中,事件在二项分布中,事件A发生的频率发生的频率 x/n称称为二项成数,即百分数或频率。则为二项成数,即百分数或频率。则二项成数二项成数的平均数的平均数和和标准差标准差分别为:分别为: 也称为也称为二项总体百分数的标准误二项总体百分数的标准误,当,当 p 未知时,常以样本百分数未知时,常以样本百分数 来估计。此时上来估计。此时上式改写为:式改写为: = 称为样本百分数标准误。称为样本百分数标准误。 例:豌豆红花纯合基因型和白花纯合基因型杂交后,在F2代红花植株与白花植株出现的比例为3:1。每次观察4株,n=4, 红花出现概率为红花出现概率为p=340.75。(1 1)红花出现的平均株数)红花

33、出现的平均株数=n p = 3.0 (株)株)(2)标准差)标准差 =0.8660=0.8660(株)(株))1 (pnp - -= =s sn10,1,2,3,4n2n3n4n5n100总体总体红花出现株数红花出现株数一、二项分布一、二项分布(三)二项分布的形状和参数(三)二项分布的形状和参数(1 1)红花出现的频率的平均数:)红花出现的频率的平均数:p p n p /n = 3.0/4 = 0.75 = pn1n2n3n4n5n1000,0.25,0.5,0.75,1.0总体总体红花出现频率红花出现频率二项二项分布的百分数,成数分布的百分数,成数二、泊二、泊二、泊二、泊 松松松松 分分分分

34、 布布布布二、泊松分布二、泊松分布泊松泊松分布分布(Poisson distribution) 是一种可是一种可以用来描述和分析随机地发生在单位空间或以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布,也是一种离时间里的稀有事件的概率分布,也是一种离散型随机变量的分布。散型随机变量的分布。泊松泊松分布是二项分布的一种特殊类型。分布是二项分布的一种特殊类型。二、泊松分布二、泊松分布泊松泊松分布的概率函数分布的概率函数 可由二项分布概率函数推导出来可由二项分布概率函数推导出来!)(xexPl l= =- x为参数,为参数, = = npnp x = 0,1,2,p(x) Cnxpx(

35、1-p)n-x!)(xexPl l= =- x=2 2 = =P( )p(x) Cnxpx(1-p)n-x n p )1 (pnp- -= =s s2 2= =npnp(1-p)(1-p)= npnp = =二、泊松分布二、泊松分布P( )的形状由的形状由确定确定 较小时,泊松分布偏倚。较小时,泊松分布偏倚。 增大时,泊松分布趋于对称。增大时,泊松分布趋于对称。 无限增大时,泊松分布接近正态分布。无限增大时,泊松分布接近正态分布。形状形状形状形状形状形状二、泊松分布二、泊松分布对于小概率事件,可用泊松分布描述其概率分布。对于小概率事件,可用泊松分布描述其概率分布。二项二项分布当分布当p0.1和

36、和np5时,可用泊松分布来近似。时,可用泊松分布来近似。21应用应用应用应用应用应用!)(xexPl=- x二、泊松分布二、泊松分布!)(xexPl l= =- x显微镜检查某样本内结核菌的数目显微镜检查某样本内结核菌的数目细菌数细菌数(x) 0 1 2 3 4 5 6 7 8 9 总计总计实际格子数实际格子数 5 19 26 26 21 13 5 1 1 1 118P(x) 0.0506 0.1511 0.2253 0.2240 0.1671 0.0997 0.0496 0.0211 0.0079 0.0026 0.9990理论格子数理论格子数 5.97 17.83 26.59 26.43

37、19.72 11.76 5.85 2.49 0.93 0.31 117.88三、正三、正三、正三、正 态态态态 分分分分 布布布布围绕在平均值左右,由平均值到分布的两侧,围绕在平均值左右,由平均值到分布的两侧,变量数减少,即变量数减少,即两头少,中间多,两侧对称两头少,中间多,两侧对称。正态分布(正态分布(normal distribution)特点特点正态分布也称为高斯分布正态分布也称为高斯分布(Gauss distribution)。三、正态分布三、正态分布n大大p与与1-p接近接近大大二项二项分布分布泊松分布泊松分布正态分布正态分布正态分布是生物统计学的重要基础。正态分布是生物统计学的重

38、要基础。三、正态分布三、正态分布(一)正态分布的概率函数(一)正态分布的概率函数连续型随机变量的概率分布是用概率密度函数来描述的。连续型随机变量的概率分布是用概率密度函数来描述的。三、正态分布三、正态分布(一)正态分布的概率函数(一)正态分布的概率函数f(x) 为正态分布的概率密度函数,表示某一定为正态分布的概率密度函数,表示某一定x值出现的概率值出现的概率密度函数值。密度函数值。总体平均数总体平均数总体标准差总体标准差圆周率,圆周率,3.14159e为自然对数底,为自然对数底,2.71828N (,2)三、正态分布(一)正态分布的概率函数x=x=时,时,f(x)f(x)值最大,正态分布曲线以

39、平均数值最大,正态分布曲线以平均数为中心的分布。为中心的分布。(二)正态分布的特征(二)正态分布的特征1x-x-的绝对值相等时,的绝对值相等时,f(x)f(x)也相等,正态分布也相等,正态分布密度曲线以密度曲线以为中心向左右两侧对称。为中心向左右两侧对称。三、正态分布三、正态分布(二)正态分布的特征(二)正态分布的特征2f(x)是非负函数,以是非负函数,以x轴为渐近线,轴为渐近线,x的取值区的取值区间为间为(-,+)(-,+) 。三、正态分布三、正态分布(二)正态分布的特征(二)正态分布的特征3正态分布曲线由参数正态分布曲线由参数,决定,决定, 确定正态分确定正态分布曲线在布曲线在x轴上的中心

40、位置,轴上的中心位置,确定正态分布确定正态分布的变异度。的变异度。三、正态分布三、正态分布(二)正态分布的特征(二)正态分布的特征4正态分布曲线在正态分布曲线在x=x=处各有一个拐点,处各有一个拐点,曲线通过拐点时改变弯曲度曲线通过拐点时改变弯曲度。三、正态分布三、正态分布(二)正态分布的特征(二)正态分布的特征5分布曲线与分布曲线与x轴围成的全部面积为轴围成的全部面积为1三、正态分布三、正态分布(二)正态分布的特征(二)正态分布的特征6三、正态分布三、正态分布若若一个连续型随机变量一个连续型随机变量x取取值于区间值于区间a,b,其概率为其概率为ab三、正态分布三、正态分布(三)标准正态分布(

41、三)标准正态分布N (,2)正态分布是依赖于参数正态分布是依赖于参数( (,2 2) )的一个曲线系,正态曲的一个曲线系,正态曲线的位置及形态随线的位置及形态随( (,2 2) )的的不同而不同,这就给研究不同而不同,这就给研究具体的正态分布总体带来了困难,我们现将其标准化。具体的正态分布总体带来了困难,我们现将其标准化。N(,2)N(0,1)三、正态分布三、正态分布u u表示标准正态离差(表示标准正态离差(standard normal deviate)standard normal deviate),它表示离开平均数它表示离开平均数有几个标准差有几个标准差。f(u)称为标准正态分布称为标准

42、正态分布(standard normal distribution)或或u分布方程。分布方程。 标准正态分布的概率累积函数记作标准正态分布的概率累积函数记作F(u),它是它是变量变量u小于某一定值的概率。小于某一定值的概率。ui三、正态分布三、正态分布 为了计算方便,对于不同的为了计算方便,对于不同的u值,计算出不同的值,计算出不同的F(x),编成函数表,称为正态分布表,从中可以查到编成函数表,称为正态分布表,从中可以查到u任意一个任意一个区间内取值的概率。区间内取值的概率。三、正态分布三、正态分布标准正态分标准正态分布布u落在区间落在区间a,b的概率的概率三、正态分布三、正态分布(四)正态分

43、布的概率计算a b-a三、正态分布三、正态分布2 一般正态分布的概率计算一般正态分布的概率计算若若随机变量服从正态分布随机变量服从正态分布N(,2 2) ),则则x x的取值落在区的取值落在区间间 x x1 1,x,x2 2 的的概率,记作概率,记作P(xP(x1 1xxxx2 2) )。 三、正态分布三、正态分布(四)正态分布的概率计算(四)正态分布的概率计算2 一般正态分布的概率计算一般正态分布的概率计算服从正态分布服从正态分布N(,N(,2 2) )的随机变量的随机变量,x x的取值落在区的取值落在区间间 x x1 1,x,x2 2 的的概率,记作概率,记作P(xP(x1 1xxxx2

44、2) ),等于服从标准等于服从标准正态分布的随机变量正态分布的随机变量u u在在(x x1 1-)/ , (x-)/ , (x2 2-)/ -)/ 内取值的概率。内取值的概率。 计算一般正态分布的概率时,只要将区间的上下限作计算一般正态分布的概率时,只要将区间的上下限作适当变换(标准化),就可用查标准正态分布的概率适当变换(标准化),就可用查标准正态分布的概率表的方法求得概率了。表的方法求得概率了。三、正态分布三、正态分布2 一般正态分布的概率计算一般正态分布的概率计算三、正态分布三、正态分布(四)正态分布的概率计算(四)正态分布的概率计算2 一般正态分布的概率计算一般正态分布的概率计算P(-

45、x+)P(-x+)P(-2x+2)P(-2x+2)P(-P(-3x+3)330n30当当2 2未知,未知,且且n30n30时,时,其曲线接近正态分布曲线,其曲线接近正态分布曲线,df时则和正态分布曲线重合。时则和正态分布曲线重合。t分布曲线与横轴所围成的面积为分布曲线与横轴所围成的面积为1。同同标准正态分布曲线一样,统计应用中最为关心的是标准正态分布曲线一样,统计应用中最为关心的是t分布曲线下的面积(即概率)与横轴分布曲线下的面积(即概率)与横轴t值间关系。值间关系。为为使用方便,统计学家编制不同自由度使用方便,统计学家编制不同自由度df下的下的t值表。值表。在在相同的自由度相同的自由度df时

46、,时,t值越大,概率值越大,概率P越小。越小。在在相同相同t值时,双尾概率值时,双尾概率P为单尾为单尾概率概率P的两倍。的两倍。12df增大,增大,t分布接近正态分布,即分布接近正态分布,即t值接近值接近u值。值。3t落于落于- t0.05, + t0.05 内的内的概率为概率为0.95t落于落于- t0.01, + t0.01 内的内的概率为概率为0.99置信度为和的置信度为和的t临界值。临界值。t0.05(4)2.776 t0.01(4)4.604-2.776+2.776五、五、五、五、xx2 2 分布分布分布分布从方差为从方差为2 2的的正态总体中,随机抽取正态总体中,随机抽取k个个独立

47、样本,计算独立样本,计算出样本方差出样本方差S2 2,研究其样本方差的分布。研究其样本方差的分布。df = k-1在在研究样本方差的分布时,通常将其标准化,得到研究样本方差的分布时,通常将其标准化,得到k个正个正态离差态离差u,则则概率密度函数概率密度函数概率累积函数概率累积函数2 2分布于区间分布于区间0,+ ),并且呈反),并且呈反J型的偏斜分型的偏斜分布。布。12 2分布的偏斜度随自由度降低而增大,当自分布的偏斜度随自由度降低而增大,当自由度由度df=1时,曲线以纵轴为渐近线。时,曲线以纵轴为渐近线。2随随自由度自由度df的增大,的增大, 2 2分布曲线渐趋左右对称,分布曲线渐趋左右对称

48、,当当df30时,卡方分布已接近正态分布。时,卡方分布已接近正态分布。3对于给定的对于给定的(0x2(n)=的点的点 x2(n)为为x2分布的上分布的上分位点(右尾概率)。分位点(右尾概率)。表中表头的概率表中表头的概率是是2 2大于表内所列大于表内所列2 2值的概率。值的概率。df = 2P P(2 2 5.99 5.99)0.050.05P P(2 2 9.21 9.21)0.010.01P P(2 2 0.10 0.10)0.950.95六、六、六、六、F F 分布分布分布分布设从一正态设从一正态总体总体N(,N(,2 2) ) 中中随机抽取样本容量为随机抽取样本容量为n1、n2的两个独

49、立样本,其样本方差为的两个独立样本,其样本方差为s12、 s22,则定义其则定义其比值:比值:此值具有此值具有s12的自由度的自由度df1=n1-1和和s22的自由度的自由度df2=n2-1。如果对一正态总体在特定的如果对一正态总体在特定的dfdf1 1和和dfdf2 2进行一系列进行一系列随机独立抽样,则所有可能的值就构成一个随机独立抽样,则所有可能的值就构成一个分布。分布。分布的概率密度函数是两个独立分布的概率密度函数是两个独立2 2变量的概变量的概率密度所构成的联合概率密度。率密度所构成的联合概率密度。分布是随自由度分布是随自由度dfdf1 1和和dfdf2 2进行变化的一组曲线。进行变

50、化的一组曲线。分布的概率累积函数分布的概率累积函数分布的平均数分布的平均数F F=1 =1 ,的取值的取值区间为区间为00,+,+)分布曲线的形状仅决定于分布曲线的形状仅决定于dfdf1 1和和dfdf2 2。在在dfdf1 11 1或或2 2时,时,分布曲线呈严重倾斜的反向型,当分布曲线呈严重倾斜的反向型,当dfdf1 1 3 3时,时,转为左偏曲线。转为左偏曲线。12对于给定的对于给定的(0(n,)=的点的点 (n,)为分布的上为分布的上分位点(或临界值点)。分位点(或临界值点)。P P( 3.483.48)0.050.05P P(5.995.99)0.010.01F0.05 (4,10)=3.48F0.01 (4,10)=5.99

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号