常用概率分布

上传人:豆浆 文档编号:37445021 上传时间:2018-04-16 格式:DOC 页数:24 大小:2.13MB
返回 下载 相关 举报
 常用概率分布_第1页
第1页 / 共24页
 常用概率分布_第2页
第2页 / 共24页
 常用概率分布_第3页
第3页 / 共24页
 常用概率分布_第4页
第4页 / 共24页
 常用概率分布_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《 常用概率分布》由会员分享,可在线阅读,更多相关《 常用概率分布(24页珍藏版)》请在金锄头文库上搜索。

1、第四章 常用概率分布为了便于读者理解统计分析的基本原理,正确掌握和应用以后各章所介绍的统计分析方法, 本章在介绍概率论中最基本的两个概念事件、概率的基础上,重点介绍生物科学研究中常用的几种随机变量的概率分布正态分布、二项分布、泊松分布以及样本平均数的抽样分布和t分布。第一节 事件与概率一、事 件(一)必然现象与随机现象 在自然界与生产实践和科学试验中,人们会观察到各种各样的现象,把它们归纳起来,大体上分为两大类:一类是可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果总是确定的,必然发生(或必然不发生)。例如,在标准大气压下,水加热到100必然沸腾;步行条件下必然不可能到达月球等。

2、这类现象称为必然现象(inevitable phenomena)或确定性现象(definite phenomena)。另一类是事前不可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果未必相同。例如,掷一枚质地均匀对称的硬币,其结果可能是出现正面,也可能出现反面;孵化6枚种蛋,可能“孵化出0只雏”,也可能“孵化出1只雏”,也可能“孵化出6 只雏”,事前不可能断言其孵化结果。这类在个别试验中其结果呈现偶然性、不确定性现象,称为随机现象(random phenomena)或不确定性现象(indefinite phenomena)。人们通过长期的观察和实践并深入研究之后,发现随机现象或不确

3、定性现象,有如下特点:在一定的条件实现时,有多种可能的结果发生,事前人们不能预言将出现哪种结果;对一次或少数几次观察或试验而言,其结果呈现偶然性、不确定性;但在相同条件下进行大量重复试验时,其试验结果却呈现出某种固有的特定的规律性频率的稳定性,通常称之为随机现象的统计规律性。例如,对于一头临产的妊娠母牛产公犊还是产母犊是事前不能确定的,但随着妊娠母牛头数的增加,其产公犊、母犊的比例逐渐接近1:1的性别比例规律。概率论与数理统计就是研究和揭示随机现象统计规律的一门科学。(二)随机试验与随机事件1、随机试验 通常我们把根据某一研究目的,在一定条件下对自然现象所进行的观察或试验统称为试验(trial

4、)。而一个试验如果满足下述三个特性,则称其为一个随机试验(random trial),简称试验:(1)试验可以在相同条件下多次重复进行;(2)每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果; (3)每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果。如在一定孵化条件下,孵化6枚种蛋,观察其出雏情况;又如观察两头临产妊娠母牛所产犊牛的性别情况,它们都具有随机试验的三个特征,因此都是随机试验。2、随机事件 随机试验的每一种可能结果,在一定条件下可能发生,也可能不发生,称为随机事件(random event),简称事件(event),通常用A、B

5、、C等来表示。(1)基本事件 我们把不能再分的事件称为基本事件(elementary event),也称为样本点(sample point)。例如,在编号为1、2、3、10的十头猪中随机抽取1头,有10种不同的可能结果:“取得一个编号是1”、“取得一个编号是2”、“取得一个编号是10”,这10个事件都是不可能再分的事件,它们都是基本事件。由若干个基本事件组合而成的事件称为复合事件(compound event)。如“取得一个编号是2的倍数”是一个复合事件,它由“取得一个编号是2”、“是4”、“是6、“是8”、“是10”5个基本事件组合而成。(2)必然事件 我们把在一定条件下必然会发生的事件称为

6、必然事件(certain event),用表示。例如,在严格按妊娠期母猪饲养管理的要求饲养的条件下,妊娠正常的母猪经114天左右产仔,就是一个必然事件。(3)不可能事件 我们把在一定条件下不可能发生的事件称为不可能事件(impossible event),用表示。例如,在满足一定孵化条件下,从石头孵化出雏鸡,就是一个不可能事件。必然事件与不可能事件实际上是确定性现象,即它们不是随机事件,但是为了方便起见,我们把它们看作为两个特殊的随机事件。二 、 概 率(一)概率的统计定义 研究随机试验,仅知道可能发生哪些随机事件是不够的,还需了解各种随机事件发生的可能性大小,以揭示这些事件的内在的统计规律性

7、,从而指导实践。这就要求有一个能够刻划事件发生可能性大小的数量指标,这指标应该是事件本身所固有的,且不随人的主观意志而改变,人们称之为概率(probability)。事件A的概率记为P(A)。下面我们先介绍概率的统计定义。在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率(frequency);当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值p,那么就把p称为随机事件A的概率。这样定义的概率称为统计概率(statistics probability),或者称后验概率(posterior probability)。例如为了确定抛掷一枚硬币

8、发生正面朝上这个事件的概率,历史上有人作过成千上万次抛掷硬币的试验。在表41中列出了他们的试验记录。 表41 抛掷一枚硬币发生正面朝上的试验记录实验者投掷次数发生正面朝上的次数频率(m/n)蒲 丰404020480.5069k皮尔逊1200060190.5016k皮尔逊24000120120.5005从表4-1可看出,随着实验次数的增多,正面朝上这个事件发生的频率越来越稳定地接近0.5,我们就把0.5作为这个事件的概率。在一般情况下,随机事件的概率p是不可能准确得到的。通常以试验次数n充分大时随机事件A的频率作为该随机事件概率的近似值。即 P(A)=pm/n (n充分大) (4-1)(二)概率

9、的古典定义 上面介绍了概率的统计定义。但对于某些随机事件,用不着进行多次重复试验来确定其概率,而是根据随机事件本身的特性直接计算其概率。有很多随机试验具有以下特征:1、试验的所有可能结果只有有限个,即样本空间中的基本事件只有有限个;2、各个试验的可能结果出现的可能性相等,即所有基本事件的发生是等可能的;3、试验的所有可能结果两两互不相容。具有上述特征的随机试验,称为古典概型(classical model)。对于古典概型,概率的定义如下:设样本空间由n个等可能的基本事件所构成,其中事件A包含有m个基本事件,则事件A的概率为m/n,即P(A)=m/n (4-2)这样定义的概率称为古典概率(cla

10、ssical probability)或先验概率(prior probability)。【例4.1】在编号为1、2、3、10的十头猪中随机抽取1头,求下列随机事件的概率。(1)A=“抽得一个编号4”;(2)B=“抽得一个编号是2的倍数”。因为该试验样本空间由10个等可能的基本事件构成,即n=10,而事件A所包含的基本事件有4个,既抽得编号为1,2,3,4中的任何一个,事件A便发生,即mA=4,所以P(A)=mA/n=4/10=0.4同理,事件B所包含的基本事件数mB=5,即抽得编号为2,4,6,8,10中的任何一个,事件B便发生,故P(B)=mB/n=5/10=0.5。 【例4.2】 在N头奶

11、牛中,有M头曾有流产史,从这群奶牛中任意抽出n头奶牛,试求:(1)其中恰有m头有流产史奶牛的概率是多少?(2)若N=30,M =8,n =10,m =2,其概率是多少?我们把从有M头奶牛曾有流产史的N头奶牛中任意抽出n头奶牛,其中恰有m头有流产史这一事件记为A,因为从N头奶牛中任意抽出n头奶牛的基本事件总数为,事件A 所包含的基本事件数为 ,因此所求事件A的概率为=将N=30,M =8,n =10,m =2代入上式,得= 0.0695即在30头奶牛中有8头曾有流产史,从这群奶牛随机抽出10头奶牛其中有2头曾有流产史的概率为6.95%。(三)概率的性质 根据概率的定义,概率有如下基本性质:1、对

12、于任何事件A,有0P(A)1;2、必然事件的概率为1,即P()=1;3、不可能事件的概率为0,即P()=0。三、小概率事件实际不可能性原理随机事件的概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件。小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。在下一章介绍显著性检

13、验的基本原理时,将详细叙述小概率事件实际不可能性原理的具体应用。第二节 概率分布事件的概率表示了一次试验某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布(probability distribution)。为了深入研究随机试验,我们先引入随机变量(random variable)的概念。一、随机变量 作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为变量x的取值范围,则试验结果可用变量x来表示。 【例4.3】 对100头病畜用某种药物进行治疗,其可能结果是“0头治愈”、 “1头治愈”、“2

14、头治愈”、“”、“100头治愈”。若用x表示治愈头数,则x的取值为0、1、2、100。 【例4.4】 孵化一枚种蛋可能结果只有两种,即“孵出小鸡”与“未孵出小鸡”。 若用变量x表示试验的两种结果,则可令x=0表示“未孵出小鸡”,x=1表示“孵出小鸡”。 【例4.5】 测定某品种猪初生重,表示测定结果的变量x所取的值为一个特定范围(a,b),如0.51.5kg,x值可以是这个范围内的任何实数。如果表示试验结果的变量x,其可能取值至多为可列个,且以各种确定的概率取这些不同的值,则称x为离散型随机变量 (discrete random variable);如果表示试验结果的变量x,其可能取值为某范围

15、内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量(continuous random variable)。引入随机变量的概念后,对随机试验的概率分布的研究就转为对随机变量概率分布的研究了。二、离散型随机变量的概率分布 要了解离散型随机变量x的统计规律,就必须知道它的一切可能值xi及取每种可能值的概率pi。 如果我们将离散型随机变量x的一切可能取值xi (i=1,2,),及其对应的概率pi,记作P(x=xi)=pi i=1,2, (43) 则称(43)式为离散型随机变量x的概率分布或分布。常用分布列(distribution series)来表示离散型随

16、机变量:x1 x2 xn . p1 p2 pn 显然离散型随机变量的概率分布具有pi0和pi=1这两个基本性质。三、连续型随机变量的概率分布 连续型随机变量(如体长、体重、蛋重)的概率分布不能用分布列来表示,因为其可能取的值是不可数的。我们改用随机变量x在某个区间内取值的概率P(axb)来表示。 下面通过频率分布密度曲线予以说明。 由表27作126头基础母羊体重资料的频率分布直方图,见图41,图中纵座标取频率与组距的比值。可以设想,如果样本取得越来越大(n+),组分得越来越细(i0),某一范围内的频率将趋近于一个稳定值概率。这时,频率分布直方图各个直方上端中点的联线频率分布折线将逐渐趋向于一条

17、曲线,换句话说,当n+、i0时,频率分布折线的极限是一条稳定的函数曲线。 对于样本是取自连续型随机变量的情况,这条函数曲线将是光滑的。 这条曲线排除了抽样和测量的误差,完全反映了基础母羊体重的变动规律。 这条曲线叫概率分布密度曲线,相应的函数叫概率分布密度函数。若记体重概率分布密度函数为f(x),则x取值于区间a,b)的概率为图中阴影部分的面积,即P(axb)= (4-4)图4-1 表2-7资料的分布曲线(44)式为连续型随机变量x在区间a,b)上取值概率的表达式。可见,连续型随机变量的概率由概率分布密度函数确定。 此外,连续型随机变量概率分布还具有以下性质: 1、分布密度函数总是大于或等于0

18、,即f(x)0; 2、当随机变量x取某一特定值时,其概率等于0;即 (c为任意实数)因而,对于连续型随机变量,仅研究其在某一个区间内取值的概率,而不去讨论取某一个值的概率。 3、在一次试验中随机变量x之取值必在-x+范围内,为一必然事件。所以 (4-5)(45)式表示分布密度曲线下、横轴上的全部面积为1。第三节 正态分布 正态分布是一种很重要的连续型随机变量的概率分布。生物现象中有许多变量是服从或近似服从正态分布的,如家畜的体长、体重、产奶量、产毛量、血红蛋白含量、血糖含量等。许多统计分析方法都是以正态分布为基础的。此外,还有不少随机变量的概率分布在一定条件下以正态分布为其极限分布。因此在统计

19、学中,正态分布无论在理论研究上还是实际应用中,均占有重要的地位。一、正态分布的定义及其特征 (一) 正态分布的定义 若连续型随机变量x的概率分布密度函数为 (4-16)其中为平均数,2为方差,则称随机变量x服从正态分布(normal distribution), 记为xN(,2)。相应的概率分布函数为 (4-17)图42 正态分布密度曲线分布密度曲线如图42所示。 (二) 正态分布的特征 由(46)式和图42可以看出正态分布具有以下几个重要特征: 1、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x=; 2、f(x)在x=处达到极大,极大值; 3、f(x)是非负函数,以x轴为渐近线,分布从

20、-至+; 4、曲线在x=处各有一个拐点,即曲线在(-,-)和(+,+) 区间上是下凸的,在-,+区间内是上凸的;5、正态分布有两个参数,即平均数和标准差。是位置参数,如图43所示。 当恒定时,愈大,则曲线沿x轴愈向右移动;反之,愈小,曲线沿x轴愈向左移动。是变异度参数,如图44所示。当恒定时,愈大,表示x的取值愈分散, 曲线愈“胖”;愈小,x的取值愈集中在附近,曲线愈“瘦”。6、分布密度曲线与横轴所夹的面积为1,即:图43 相同而不同的三个正态分布图44 相同而不同的三个正态分布二、标准正态分布 由上述正态分布的特征可知,正态分布是依赖于参数和2(或)的一簇分布, 正态曲线之位置及形态随和2的

21、不同而不同。这就给研究具体的正态总体带来困难, 需将一般的N(,2)转换为=0,2=1的正态分布。我们称=0,2=1的正态分布为标准正态分布(standard normal distribution)。标准正态分布的概率密度函数及分布函数分别记作(u)和(u),由 (4-6)及(4-7) 式得: (4-8) (4-9)随机变量u服从标准正态分布,记作uN(0,1),分布密度曲线如图45所示。图45 标准正态分布密度曲线 对于任何一个服从正态分布N(,2)的随机变量x,都可以通过标准化变换:u=(x-) (4-10)将其变换为服从标准正态分布的随机变量u。u称为标准正态变量或标准正态离差(sta

22、ndard normal deviate)。 按(4-9)式计算,对不同的u值编成函数表,称为正态分布表,见附表1,从中可查到u在意一个区间内取值的概率。这就给解决不同、 2的正态分布概率计算问题带来很大方便。三、正态分布的概率计算 关于正态分布的概率计算,我们先从标准正态分布着手。这是因为,一方面标准正态分布在正态分布中形式最简单,而且任意正态分布都可化为标准正态分布来计算;另一方面,人们已经根据标准正态分布的分布函数编制成正态分布表(附表1)以供直接查用。(一) 标准正态分布的概率计算 设u服从标准正态分布,则u在u1,u2内取值的概率为: (u2)(u1) (4-11)而(u1)与(u2

23、)可由附表1查得。 附表1只对于-4.99u4.99给出了(u)的数值。 表中,u值列在第一列和第一行,第一列列出u的整数部分及小数点后第一位, 第一行为u的小数点后第二位数值 。例如,u=1.75,1.7放在第一列,0.05放在第一行。在附表1中,1.7所在行与0.05 所在列相交处的数值为0.95994,即(1.75)=0.95994。有时会遇到给定(u)值,例如(u)=0.284, 反过来查u值。这只要在附表1中找到与0.284最接近的值0.2843,对应行的第一列数-0.5, 对应列的第一行数值0.07,即相应的u值为u=-0.57,亦即(-0.57)=0.284。如果要求更精确的u值

24、,可用线性插值法计算。 表中用了象.032336,.937674这种写法,分别是0.0002326和0.9997674的缩写,03表示连续3个0,93表示连续3个9。 由(4-11) 式及正态分布的对称性可推出下列关系式,再借助附表1, 便能很方便地计算有关概率: P(0uu1)(u1)-0.5 P(uu1) =(-u1) P(uu1)=2(-u1) (4-12) P(uu1)=1-2(-u1) P(u1uu2)(u2)-(u1) 【例4.6】 已知uN(0,1),试求: (1) P(u-1.64)? (2) P (u2.58)=? (3) P (u2.56)=? (4) P(0.34u1.5

25、3) =? 利用(4-12)式,查附表1得: (1) P(u-1.64)=0.05050 (2) P (u2.58)=(-2.58)=0.024940 (3) P (u2.56)=2(-2.56)=20.005234=0.010468 (4) P (0.34u1.53)=(1.53)-(0.34)=0.93669-0.6331=0.30389 关于标准正态分布,以下几种概率应当熟记:P(-1u1)=0.6826P(-2u2)=0.9545P(-3u3)=0.9973P(-1.96u1.96)=0.95P (-2.58u2.58)=0.99图46 标准正态分布的三个常用概率u变量在上述区间以外取

26、值的概率分别为:P(u1)=2(-1)=1- P(-1u1)=1-0.6826=0.3174P(u2)=2(-2)=1- P(-2u2)=1-0.9545=0.0455P(u3)=1-0.9973=0.0027P(u1.96)=1-0.95=0.05P(u2.58)=1-0.99=0.01 (二) 一般正态分布的概率计算 正态分布密度曲线和横轴围成的一个区域,其面积为1,这实际上表明了“随机变量x取值在-与+之间”是一个必然事件,其概率为1。若随机变量 x服从正态分布N(,2),则x的取值落在任意区间x1,x2)的概率,记作P(x1xx2),等于图4-7中阴影部分曲边梯形面积。即:图47 正态

27、分布的概率 (4-13) 对 (4-13)式作变换u=(x-),得dx=du,故有 =其中, 这表明服从正态分布N(,2)的随机变量x在x1,x2)内取值的概率,等于服从标准正态分布的随机变量u在(x1-)/, (x2-)/)内取值的概率。因此,计算一般正态分布的概率时,只要将区间的上下限作适当变换(标准化),就可用查标准正态分布的概率表的方法求得概率了。 【例4.7】 设x服从=30.26,2=5.102的正态分布,试求P(21.64x32.98)。 令, 则u服从标准正态分布,故 =P(-1.69u0.53)=(0.53)-(-1.69) =0.7019-0.04551=0.6564 关于

28、一般正态分布,以下几个概率(即随机变量x落在加减不同倍数区间的概率)是经常用到的。P(-x+)=0.6826P(-2x+2) =0.9545P (-3x+3) =0.9973P (-1.96x+1.96) =0.95P (-2.58x+2.58)=0.99上述关于正态分布的结论,可用一实例来印证。从图2-7可以看出,126头基础母羊体重资料的次数分布接近正态分布,现根据其平均数=52.26(kg),标准差S=5.10(kg),算出平均数加减不同倍数标准差区间内所包括的次数与频率,列于表42。表42 126头基础母羊体重在kS 区间内所包括的次数与频率kS数 值区 间区间内所包含的次数与频率次数

29、频率(%)1S52.265.1047.1657.368467.462S52.2610.2042.0662.4611994.443S52.2615.3036.9667.56126100.001.96S52.2610.0042.2662.2611994.442.58S52.2613.1639.1065.42126100.00 由表42可见,实际频率与理论概率相当接近,说明126头基础母羊体重资料的频率分布接近正态分布,从而可推断基础母羊体重这一随机变量很可能是服从正态分布的。 生物统计中,不仅注意随机变量x落在平均数加减不同倍数标准差区间(-k,+k)之内的概率而且也很关心x落在此区间之外的概率。

30、我们把随机变量x落在平均数加减不同倍数标准差区间之外的概率称为双侧概率(两尾概率),记作。对应于双侧概率可以求得随机变量x小于-k或大于+k的概率,称为单侧概率(一尾概率),记作2。例如,x落在(-1.96,+1.96)之外的双侧概率为0.05,而单侧概率为0.025。即P(x-1.96)= P(x+1.96)=0.025双侧概率或单侧概率如图48所示。x落在(-2.58,+2.58)之外的双侧概率为0.01,而单侧概率P(x-2.58)= P(x+2.58)=0.005图48 双侧概率与单侧概率 附表2给出了满足P (u)=的双侧分位的数值。因此, 只要已知双侧概率的值,由附表2就可直接查出

31、对应的双侧分位数,查法与附表1相同。例如,已知uN(0,1)试求: (1) P(u-)+P(u)=0.10的 (2) P(-u=0.86的因为附表2中的值是:所以 (1) P(u-)+ P(u)=1- P(-u=0.10=由附表2查得: =1.644854(2) P (-u)=0.86 ,=1- P (-u)=1-0.86=0.14由附表2查得:=1.475791 对于xN(,2),只要将其转换为uN(0,1),即可求得相应的双侧分位数。 【例4.8】 已知猪血红蛋白含量x服从正态分布N(12.86,), 若P(x) =0.03, P(x)=0.03,求,。由题意可知,2=0.03,=0.06

32、 又因为 P(x)=故 P(x+ P(x)= P(u-+ P(u) =1- P(-P)=0.06=由附表2查得:=1.880794,所以 (-12.86)/1.33=-1.880794, (-12.86)/1.33=1.880794即 10.36, 15.36。第四节 二项分布一、贝努利试验及其概率公式 将某随机试验重复进行n次,若各次试验结果互不影响, 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n次试验是独立的。 对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与之一,在每次试验中出现A的概率是常数p(0p1),因而出现对立事件的概率是1-p=q,则称这一串重复的

33、独立试验为n重贝努利试验,简称贝努利试验(Bernoulli trials )。 在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n枚种蛋的出雏数、n头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。 在n重贝努利试验中,事件A可能发生0,1,2,n次,现在我们来求事件A 恰好发生k(0kn)次的概率Pn(k)。 先取n=4,k=2来讨论。在4次试验中,事件A发生2次的方式有以下种: 其中Ak(k=1,2,3,4)表示事件A在第k次试验发生;(k=1,2,3,4)表示事件A在第k次试验不发生。由于试验是独立的,按概率的乘法法则,于是有 P()=P()= P()= P()

34、P()P()P()=又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A恰好发生2次的概率为= P()+P()+ P()=一般,在n重贝努利试验中,事件A恰好发生k(0kn)次的概率为= k=0,1,2,n (4-14)若把(4-14)式与二项展开式相比较就可以发现,在n重贝努利试验中,事件A发生k次的概率恰好等于 展开式中的第k+1项,所以也把(4-14)式称作二项概率公式。二、二项分布的意义及性质二项分布定义如下: 设随机变量x所有可能取的值为零和正整数:0,1,2,,n,且有= k=0,1,2,n其中p0,q0,p+q=1,则称随机变量x服从参数为n

35、和p的二项分布 (binomial distribution),记为 xB(n,p)。 显然,二项分布是一种离散型随机变量的概率分布。参数n称为离散参数, 只能取正整数;p是连续参数,它能取0与1之间的任何数值(q由p确定,故不是另一个独立参数)。 容易验证,二项分布具有概率分布的一切性质,即: 1、P(x=k)= Pn(k) (k=0,1,,n) 2、二项分布的概率之和等于1,即3、 (4-15)4、 (4-16) 5、(m11), (df2) (4-27) t分布密度曲线如图4-13所示,其特点是: 1、t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。 2、t分布密度曲线以纵轴为

36、对称轴,左右对称,且在t0时,分布密度函数取得最大值。 3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与标准正态分布相同;n时,t 分布与标准正态分布完全一致。 t分布的概率分布函数为: (4-28)因而t在区间(t1,+)取值的概率右尾概率为1-F t (df)。由于t分布左右对称,t在区间(-,-t1)取值的概率也为1-F t (df)。于是t分布曲线下由-到- t 1和由t 1到+两个相等的概率之和两尾概率为2(1-F t (df)。对于不

37、同自由度下t分布的两尾概率及其对应的临界t值已编制成附表3,即t分布表。该表第一列为自由度df,表头为两尾概率值,表中数字即为临界t值。 例如,当df=15时,查附表3得两尾概率等于0.05的临界t值为 =2.131,其意义是:P(-t-2.131)= P(2.131t+)=0.025;P(-t-2.131)+ P(2.131t+)=0.05。由附表3可知,当df一定时,概率P越大,临界t值越小;概率P越小,临界t值越大。 当概率P一定时,随着df的增加,临界t值在减小,当df=时,临界t值与标准正态分布的临界u值相等。习 题1、什么是随机试验?它具有那三个特征? 2、什么是必然事件、不可能事

38、件、随机事件?3、概率的统计定义及古典定义分别是什么? 事件的概率具有那些基本性质?4、什么是小概率事件实际不可能性原理? 5、袋中有10只乒乓球,分别编浩为1到10,从中随机抽取3只记录其编号。(1) 求最小的号码为5的概率;(1/12)(2) 求最大的号码为5的概率;(1/20)6、现有6只雏鸡,其中4只是雌的,2只是雄的,从中抽取两次,每次取一只,在返回抽样情况下求:(1)取到的两只雏鸡都是雌性的概率;(2)取到的两只雏鸡性别相同的概率;(3)取到的两只雏鸡至少有一只是雌性的概率; (1) 0.444; (2) 0.556; (3) 0.8897、假设每个人的血清中含有肝炎病毒的概率为0

39、.4%,混和100个人的血清, 求此血清中含有肝炎病毒的概率。你认为计算结果会告诉我们一个什么事实?(0.33)8、离散型随机变量概率分布与连续型随机变量概率分布有何区别?9、什么是正态分布?标准正态分布?正态分布的密度曲线有何特点? 10、已知随机变量u服从N(0,1),求P(u-1.4), P(u1.49), P(u2.58), P(-1.21u0.45),并作图示意。(0.0792,0.06811,0.00988,0.5605)11、已知随机变量u服从N(0,1),求下列各式的。 (1) P(u-)+P(u)=0.1;0.52 (2) P(-u)=0.42;0.95 (1)1.64485

40、4,0.643345;(2)0.553385,1.95996412、猪血红蛋白含量x服从正态分布N(12.86,1.332) (1) 求猪血红蛋白含量x在11.5314.19范围内的概率。 (2) 若P(x)=0.025,P(x)=0.025,求,。 (1)0.6826,(2)=10.25,=15.47 13、设x变量服从正态分布,总体平均数=10,P(x12)=0.1056,试求x在区间616内取值的概率。(0.914948)14、什么是二项分布?如何计算二项分布的平均数、方差和标准差?15、已知随机变量x服从二项分布B(100,0.1),求及。(10,3)16、记录表明,10头家畜已有3头

41、死于某种疾病,现有5头病畜,试求以下情况的概率: 恰有3头死亡; (1323/10000) 前面3头死亡,后2头康复; (1323/100000) 前面3头死亡; (27/1000) 死亡3头以上。 (1539/50000)17、已知随机变量x服从二项分布B(10,0.6),求P(2x6),P(x7),P(x3)。 (0.61605,0.38228,0.01229)18、什么是泊松分布?其平均数、方差有何特征?19、已知随机变量x服从泊松分布P(4),求P(x=1),P(x=2),P(x4)。 (0.0733,0.1465,0.5665)20、某种疾病的死亡率为0.005。试问在患有此病的36

42、0个病例中,(a)有3例或3例以上死亡的概率;(b)恰有3例死亡的概率。 (0.269,0.160)21、验收某大批货物时,规定在到货的1000件样品中次品不多于10件时方能接受。如果说整批货物的次品率为0.5,试求拒收这批货物的概率。(0.014)22、什么是标准误?标准误与标准差有何联系与区别?23、样本平均数抽样总体与原始总体的两个参数间有何联系?24、t分布与标准正态分布有何区别与联系?第四章 常用概率分布32第一节事件与概率32一、事 件32二 、 概 率33三、小概率事件实际不可能性原理35第二节概率分布35一、随机变量35二、离散型随机变量的概率分布35三、连续型随机变量的概率分布36第三节正态分布37一、正态分布的定义及其特征37二、标准正态分布38三、正态分布的概率计算39第四节二项分布43一、贝努利试验及其概率公式43二、二项分布的意义及性质44三、二项分布的概率计算及应用条件45四、二项分布的平均数与标准差46第五节泊松分布46二、泊松分布的概率计算47第六节样本平均数的抽样分布49一、样本平均数抽样分布49二、标 准 误51第七节t 分 布52习 题53

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号