《常用概率分布最新课件》由会员分享,可在线阅读,更多相关《常用概率分布最新课件(121页珍藏版)》请在金锄头文库上搜索。
1、第三章第三章 常用概率分布常用概率分布 本章在介绍概率论中本章在介绍概率论中事件事件、概率概率的基础上,重点介绍生物科学研究中常用的的基础上,重点介绍生物科学研究中常用的几种随机变量的概率分布几种随机变量的概率分布二项分布二项分布、正态分布正态分布以及样本以及样本平均数的抽样分布平均数的抽样分布、t分布、卡方分布和分布、卡方分布和F分布分布。 难点:难点:各种概率分布的特点和概率计算各种概率分布的特点和概率计算。 常用概率分布常用概率分布 最新最新第一节第一节 事件与概率事件与概率第二节第二节 概率分布概率分布第三节第三节 二项分布二项分布第四节第四节 正态分布正态分布第五节第五节 平均数抽样
2、分布平均数抽样分布第六节第六节 t分布、分布、 分布、分布、F分布分布常用概率分布常用概率分布 最新最新第一节第一节 事件与概率事件与概率 一、事一、事 件件 (一)必然现象与随机现象(一)必然现象与随机现象 在一定条件下,重复进行观察或试验,其在一定条件下,重复进行观察或试验,其结果总是确定不变的现象结果总是确定不变的现象必然现象必然现象。 在同样条件下,重复进行观察或试验,其在同样条件下,重复进行观察或试验,其结果总是不确定的现象结果总是不确定的现象随机现象随机现象 。但通过。但通过大量重复观察又确有统计规律性。大量重复观察又确有统计规律性。常用概率分布常用概率分布 最新最新 (二)随机试
3、验与随机事件(二)随机试验与随机事件 1、随机试验、随机试验 对随机现象的观察称为随对随机现象的观察称为随机试验(机试验(trial)。有以下特点:)。有以下特点: (1 1)试验可以)试验可以重复进行重复进行; (2 2)全部可能的结果是可知的全部可能的结果是可知的; (3 3)但在一次试验之前)但在一次试验之前不能肯定会出现哪一不能肯定会出现哪一个结果。个结果。 常用概率分布常用概率分布 最新最新 2、随机事件、随机事件 随机试验的每一种可能结果,称为随机试验的每一种可能结果,称为随机随机事件。事件。 基本事件:基本事件: 把随机试验每一个可能的结果称为一个把随机试验每一个可能的结果称为一
4、个基基本事件本事件。由基本事件构成的事件称。由基本事件构成的事件称复合事件复合事件. 常用概率分布常用概率分布 最新最新必然事件必然事件 在一定条件下必然会发生的事件称为在一定条件下必然会发生的事件称为必然必然事件事件,用,用表示。表示。 不可能事件不可能事件 在一定条件下不可能发生的事件称为在一定条件下不可能发生的事件称为不可不可能事件能事件,用,用表示。表示。常用概率分布常用概率分布 最新最新事件的关系图示事件的关系图示n n和事件和事件:事件:事件A和事件和事件B至少有一个发生。至少有一个发生。常用概率分布常用概率分布 最新最新事件的关系图示事件的关系图示n n积事件积事件:事件:事件A
5、和事件和事件B同时发生。同时发生。常用概率分布常用概率分布 最新最新事件的关系图示事件的关系图示n n独立事件独立事件:事件:事件A发生与否不影响事件发生与否不影响事件B发生发生的可能性,则称事件的可能性,则称事件A与事件与事件B相互独立。满相互独立。满足足ABn n互斥事件互斥事件 :AB= 。常用概率分布常用概率分布 最新最新n n对立事件对立事件:A+B= ,AB= 。是互斥但。是互斥但不独立。不独立。事件关系的计算事件关系的计算常用概率分布常用概率分布 最新最新n n差事件差事件:事件:事件A发生而事件发生而事件B不发生,不发生,AB。事件关系的计算事件关系的计算常用概率分布常用概率分
6、布 最新最新n n完完全全事事件件系系:A A1 1+A+A2 2 +A+An n= =,A A1 1AA2 2 AAn n = = 。 如如种种子子的的发芽芽与与不不发芽芽则构构成成一一个个完完全全事事件系。件系。事件关系的计算事件关系的计算常用概率分布常用概率分布 最新最新二二 、 概概 率(率(probabilityprobability) 研究随机现象,仅知道发生哪些可能结果研究随机现象,仅知道发生哪些可能结果(随机事件)是不够的,还需了解发生这些结(随机事件)是不够的,还需了解发生这些结果的可能性大小。果的可能性大小。这种描述事件发生可能性大这种描述事件发生可能性大小的数值小的数值,
7、称为概率称为概率。如事件。如事件A的概率记为的概率记为P(A)。)。常用概率分布常用概率分布 最新最新 (一)概率的古典定义(一)概率的古典定义 如果随机试验具有以下特征:如果随机试验具有以下特征: 1、试验所有可能结果是、试验所有可能结果是有限有限个;个; 2、而且出现的、而且出现的可能性相等可能性相等; 3、两两结果、两两结果互斥互斥; 则称其为古典概型。则称其为古典概型。P(A)=m/n常用概率分布常用概率分布 最新最新【例【例31】 在在1、2、3、 、20这这20个数字个数字中随机抽取中随机抽取1个,求下列随机事件的概率。个,求下列随机事件的概率。 (1)A=“抽得抽得1个数字个数字
8、4”;(2)B=“抽得抽得1个数字是个数字是2的倍数的倍数”。常用概率分布常用概率分布 最新最新 (二)概率的统计定义(二)概率的统计定义 在相同条件下进行在相同条件下进行n次重复试验,如果随机次重复试验,如果随机事件事件A发生的次数为发生的次数为m ,那么,那么m/n称为随机事称为随机事件件A的的频率频率(frequency);当试验重复数;当试验重复数n逐渐逐渐增大时,随机事件增大时,随机事件A的频率越来越稳定地接近一的频率越来越稳定地接近一个常数值个常数值p ,把,把 p称为随机事件称为随机事件A的的概率概率。 这就是统计意义上的这就是统计意义上的概率定义概率定义。P(A)= p m/n
9、 (n充分大充分大)常用概率分布常用概率分布 最新最新(三)、概率的性质(三)、概率的性质(1) 0P(A)1(2) P()=1 (3) P()=0常用概率分布常用概率分布 最新最新表表3-1 3-1 小麦种子发芽小麦种子发芽试验记录试验记录试验粒数n 100200300400500600700发芽粒数m 65155204274349419489频率m/n 0.6500.6750.6800.6850.6980.69830.6986 例:例: 随着实验次数增多,这个事件的频率越来随着实验次数增多,这个事件的频率越来越稳定接近越稳定接近0.7,则把,则把0.7看作这个事件的概看作这个事件的概率。率
10、。 常用概率分布常用概率分布 最新最新(四)、概率的运算(四)、概率的运算n n加法运算:加法运算:P(A+B)=P(A)+P(B)-P(AB)P(A+B)=P(A)+P(B)-P(AB)常用概率分布常用概率分布 最新最新n n乘法运算:乘法运算:P(AB)=P(A)P(B/A)P(AB)=P(A)P(B/A) =P(B)P(A/B) =P(B)P(A/B)常用概率分布常用概率分布 最新最新n n设有某产品一件共设有某产品一件共10个,其中有个,其中有3只为次只为次品,接连从中取品,接连从中取2次(不放回)。求第一次次(不放回)。求第一次取到次品后第二次取到次品的概率。取到次品后第二次取到次品
11、的概率。解:令解:令A=第一次取到次品,第一次取到次品, B=第二次取到次品,第二次取到次品, 则则P(BA)=2/9P(AB)=P(A) P(BA)=3/102/9常用概率分布常用概率分布 最新最新n n对立事件概率运算:对立事件概率运算:n n完全事件系的概率:完全事件系的概率:P(A1+A2+ + An)= P(A1+A2+ + An)= P(A1)+P(A2)+ +P(An)=1P(A1)+P(A2)+ +P(An)=1P(A)=1- P(A)常用概率分布常用概率分布 最新最新 三、小概率事件实际不可能性原理三、小概率事件实际不可能性原理 随机事件的概率表示了随机事件在一次试随机事件的
12、概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很验中出现的可能性大小。若随机事件的概率很小,例如小于小,例如小于0.050.05、0.01、0.001,称之为,称之为小小概率事件。概率事件。 常用概率分布常用概率分布 最新最新统计学认为:统计学认为:概率很小的事件在一次试验概率很小的事件在一次试验中几乎不可能发生。这就是小概率事件实际不中几乎不可能发生。这就是小概率事件实际不可能性原理,亦称小概率原理可能性原理,亦称小概率原理。小概率事件实。小概率事件实际不可能性原理是统计学上进行假设检验(显际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。著性检验)的基本依据。
13、 常用概率分布常用概率分布 最新最新第二节第二节 概率分布概率分布 要要全全面面了了解解一一个个试试验验,则则必必须须知知道道试试验验的的全全部部可可能能结结果果及及其其各各自自概概率率,即即把把所所有有可可能能结结果果与与概概率率一一一一对对应应起起来来,这这就就是是概概率率分分布布。概概率率分分布布就就是是描描述述随随机机现现象象的的统统计计规规律律性性。具具体体地地说说就就是是随随机机变变量量取取值值的概率的函数的概率的函数.常用概率分布常用概率分布 最新最新【例【例 32】 对对 100 株树苗进行嫁株树苗进行嫁接,观察其成活株数,其可能结果是接,观察其成活株数,其可能结果是 “0 株
14、成活株成活”,“1 株成活株成活”,“100 株成活株成活”。 用用x表示成活株表示成活株数,则数,则x的取值为的取值为0、1、2、100。一、随机变量一、随机变量常用概率分布常用概率分布 最新最新 【例【例33】 抛掷一枚硬币,其可能结果抛掷一枚硬币,其可能结果是是“币值朝上币值朝上” 或或“币值朝下币值朝下”。如果。如果“朝朝上上”用用1表示,表示,“朝下朝下”用用0表示,则随机变表示,则随机变量量x的取值为的取值为0、1。常用概率分布常用概率分布 最新最新 【例【例 34】 测定某品种小麦产量测定某品种小麦产量(/666.7),表示测定结果的变量),表示测定结果的变量x所取的值为一个特定
15、范围所取的值为一个特定范围(a, b),例,例如如200300(/666.7),),x可以可以取这个范围内的任何数值。取这个范围内的任何数值。 常用概率分布常用概率分布 最新最新 如果表示试验结果的变量如果表示试验结果的变量x,其取值是,其取值是可列举的可列举的 ,则称,则称x为为离散型随机变量离散型随机变量; 相反,若相反,若X的取值为某范围内的任何数的取值为某范围内的任何数值,是不可列举的,则称值,是不可列举的,则称x为为连续型随机变连续型随机变量量。 离散型随机变量与连续型随机变量离散型随机变量与连续型随机变量常用概率分布常用概率分布 最新最新二、离散型随机变量的概率分布二、离散型随机变
16、量的概率分布如果将离散型随机变量如果将离散型随机变量x的可能取值的可能取值xi ( i=,1,2 , ),与其概率,与其概率pi一一对应起一一对应起来,则有来,则有P(x=xi)=pi 。 如果用函数如果用函数f(x)表示的概率对应关系,表示的概率对应关系,记为记为f(xi) P(X=xi)=pi,则称,则称f(x)为为概率概率函数函数。常用概率分布常用概率分布 最新最新 x x1 x2 xn p p1 p2 pn 如果用如果用(xi)表示离散型随机变量的概表示离散型随机变量的概率分布函数,记为率分布函数,记为(xi)(xxi i),则),则概率函数与分布函数共同构成的概率函数与分布函数共同构
17、成的概率分布概率分布。显然有:显然有:(xi)f(xf(xi i) )常用概率分布常用概率分布 最新最新三、连续型随机变量的概率分布三、连续型随机变量的概率分布 对连续型随机变量对连续型随机变量x,只能了解它在某个,只能了解它在某个区间区间a,b)取值的概率,即)取值的概率,即p(axb)。 如果把如果把140行水稻产量的频率分布直方行水稻产量的频率分布直方图的纵轴变成频率与组距的比值,并使图的纵轴变成频率与组距的比值,并使n,i0,i0,则频率分布折线图越来越趋近一则频率分布折线图越来越趋近一条光滑曲线。条光滑曲线。 常用概率分布常用概率分布 最新最新频率分布密度直方图及分布折线频率分布密度
18、直方图及分布折线x0.011910.010.00069 a bn+i0 常用概率分布常用概率分布 最新最新 上述曲线称为概率分布密度曲线,相上述曲线称为概率分布密度曲线,相应的函数称为应的函数称为概率密度函数概率密度函数,则有,则有 P(axb)=相应地有,相应地有,连续型随机变量连续型随机变量x的分布函数为的分布函数为常用概率分布常用概率分布 最新最新 连续型随机变量概率分布性质连续型随机变量概率分布性质1、概率密度函数、概率密度函数f(x)0;2、 (c为任意实数)3、 在一次试验中随机变量在一次试验中随机变量x之取值必在之取值必在 -x+范围内,为一必然事件。范围内,为一必然事件。此式表
19、示分布密度曲线与横轴围成的面积为此式表示分布密度曲线与横轴围成的面积为1。 常用概率分布常用概率分布 最新最新第三节第三节 二项分布二项分布 一、贝努利试验及其概率公式一、贝努利试验及其概率公式 将某随机试验重复进行将某随机试验重复进行n 次,若各次次,若各次试验结果相互独立,则称这试验结果相互独立,则称这n次试验是相互次试验是相互独立的独立的。如果每次独立试验的结果是对立。如果每次独立试验的结果是对立的,则称其为的,则称其为贝努利试验。贝努利试验。常用概率分布常用概率分布 最新最新若有若有n4次的贝努利试验,事件次的贝努利试验,事件A发生发生2 次(次(k=2)的全部可能结果有如下)的全部可
20、能结果有如下6种:种: 贝努利试验的概率公式贝努利试验的概率公式(AA ), (A A ), (A A), ( AA ), ( A A), ( AA)常用概率分布常用概率分布 最新最新把把贝努利试验的概率公式贝努利试验的概率公式与二项展开式与二项展开式比较发现,在比较发现,在n n重贝努利试验中,事件重贝努利试验中,事件A A发生发生k k次的概率恰好等于二项展开式中含次的概率恰好等于二项展开式中含P Pk k项,所项,所以也把以也把贝努利试验的概率公式贝努利试验的概率公式称作二项概率称作二项概率公式。公式。常用概率分布常用概率分布 最新最新二、二项分布的定义及性质二、二项分布的定义及性质二项
21、总体:二项总体: 将个体某一性状只发生两种对将个体某一性状只发生两种对立结果的总体叫二项总体。立结果的总体叫二项总体。二项分布二项分布:从二项总体独立抽取从二项总体独立抽取n个个体,个个体,“此此”事件出现的次数可能有事件出现的次数可能有0次、次、1次、次、2次、次、.n次次,共共n+1种可能,这种可能,这n+1种可能种可能有它们各自的概率,组成一个概率分布,叫有它们各自的概率,组成一个概率分布,叫二项概率分布,简称二项分布。二项概率分布,简称二项分布。常用概率分布常用概率分布 最新最新二项分布的概率函数就是二项分布的概率函数就是二项概率公式二项概率公式因为二项分布的形状由因为二项分布的形状由
22、n与与p二个参数决二个参数决定,定,因此,把服从二项分布的随机变量因此,把服从二项分布的随机变量一般记为一般记为 xB(n,p)。常用概率分布常用概率分布 最新最新二项分布的性质:二项分布的性质: 1 1、P(x=k)P(x=k)= = P Pn n(k)(k) ( (k=0,k=0,1 1,,n n) ) 2 2、二项分布的概率之和等于、二项分布的概率之和等于1 1,即,即3 3、分布函数、分布函数常用概率分布常用概率分布 最新最新三、二项分布的概率计算三、二项分布的概率计算 【例【例 3 5 】 有一批玉米种子有一批玉米种子 ,出苗率为,出苗率为0.67,每穴播种,每穴播种6粒,问一穴至少
23、有粒,问一穴至少有1粒种子出粒种子出苗的概率是多少苗的概率是多少? 根据题意,根据题意, n=6, p=0.67,q =(1-0.67)=0.33。设。设x 为种子出苗数,则为种子出苗数,则x为服为服从二项分布从二项分布B(6,0.67)的随机变量。于是的随机变量。于是6粒粒种子至少有种子至少有1粒种子出苗的概率为:粒种子出苗的概率为:常用概率分布常用概率分布 最新最新 P P(“至少至少1 1粒种子出苗粒种子出苗”) = P(x=1)+P(x=2)+P(x=6) = P(x=1)+P(x=2)+P(x=6) = = = 0.0157 = 0.01570.07990.07990.21620.2
24、162 0.32920.32920.26720.26720.09050.0905 = 0.9987 = 0.9987 或或=1-P(=1-P(不出苗不出苗)=1-)=1-常用概率分布常用概率分布 最新最新 【 例例3 6 】大大豆豆紫紫花花与与白白花花这这一一相相对对性性状状在在F2的的分分离离比比例例符符合合一一对对等等位位基基因因的的遗遗传传规规律律,即即紫紫花花与与白白花花之之比比为为3:1。现现在在F2 群群体体随机观察随机观察10株株,问有问有7株是紫花的概率。株是紫花的概率。 根根据据题题意意,n=10,p=34=0.75,q=14=0.25。设设F2 10株株中中紫紫花花植植株株
25、为为x株株,则则x为为服服从从二二项项分分布布B(10,0.75)的的随随机变量。于是机变量。于是10株有株有7株是紫花的概率为:株是紫花的概率为: 常用概率分布常用概率分布 最新最新 即从即从F F2 2群体随机观察群体随机观察1010株大豆的花色株大豆的花色, ,有有7 7株是紫花的概率为株是紫花的概率为0.25030.2503。常用概率分布常用概率分布 最新最新四、二项分布的平均数与标准差四、二项分布的平均数与标准差 统计学证明,服从二项分布统计学证明,服从二项分布B(n,p)的随机的随机变量之平均数变量之平均数、标准差、标准差与参数与参数n、p有如下有如下关系:关系:次数形式频率形式次
26、数形式频率形式 =np 常用概率分布常用概率分布 最新最新 例例:假假如如贮贮藏藏两两年年的的“川川单单21”21”发发芽芽频频率率为为86%86%,现现随随机机从从中中取取1010粒粒种种子子做做发发芽芽试试验。试计算平均发芽数和标准差。验。试计算平均发芽数和标准差。这表示这表示1010粒种子平均发芽数是粒种子平均发芽数是8.68.6粒粒, ,误差为正负误差为正负1.11.1粒。粒。常用概率分布常用概率分布 最新最新若用百分数(即成数)表示若用百分数(即成数)表示10粒种子的粒种子的发芽结果。则有发芽结果。则有这表示这表示1010粒种子平均发芽率是粒种子平均发芽率是86%,86%,误误差为正
27、负差为正负11%11%粒。粒。常用概率分布常用概率分布 最新最新 【例【例37】 某树种幼苗成材率为某树种幼苗成材率为70%,现种植现种植2000株,问成材幼苗株数的平均数株,问成材幼苗株数的平均数、标准差是多少标准差是多少? 根据题意根据题意 , n=2000 , p=0.70,q=0.30。设。设2000株幼苗成材为株幼苗成材为x株,则株,则x为服从二项分布为服从二项分布B(2000,0.70)的随机变的随机变量。量。常用概率分布常用概率分布 最新最新成材幼苗株数的平均数成材幼苗株数的平均数 成材幼苗株数的标准差成材幼苗株数的标准差 20000.71400(株) 20.49 (株) 常用概
28、率分布常用概率分布 最新最新连连续续性性变变异异资资料料,当当观观察察次次数数(n)无无限限增增大大,组组限限无无限限缩缩小小时时,连连接接各各组组频频率率的的折折线线就就会会变变成成一一条条光光滑滑的的曲曲线线,呈呈现现两两端端低低中中间间高高、左左右右对对称称的的理理论论概概率率分分布布,称称为为正正态态概概率率分分布布,简称简称正态分布正态分布(normal distribution)(normal distribution)。第四节第四节 正态分布正态分布常用概率分布常用概率分布 最新最新正态分布的普遍性正态分布的普遍性n n自然界许多现象都服从或接近正态分布;自然界许多现象都服从或接
29、近正态分布;n n一定条件下,不少随机变量的概率分布极一定条件下,不少随机变量的概率分布极限是正态分布;限是正态分布;n n不管总体是否呈正态分布不管总体是否呈正态分布, ,从中抽出的样本从中抽出的样本平均数平均数(n(n较大较大) )趋近于正态分布。趋近于正态分布。 因之因之, ,正态分布是统计学研究所涉及的正态分布是统计学研究所涉及的主要理论分布。在理论和实践上都具有非主要理论分布。在理论和实践上都具有非常重要的意义。常重要的意义。常用概率分布常用概率分布 最新最新一、正态分布的定义及其特征一、正态分布的定义及其特征 (一一) 正正态态分分布布的的定定义义 若若连连续续型型随随机机变变量量
30、x的概率密度函数为的概率密度函数为 其其中中为为平平均均数数,2为为方方差差,则则称称随随机机变变量量x服从正态分布服从正态分布 , 记为记为xN(,2)。 相应的概率分布函数为相应的概率分布函数为 常用概率分布常用概率分布 最新最新-3 -2 -1 +1 +2 +3 x0.40.30.20.1f(x) 正态分布概率密度曲线正态分布概率密度曲线68.26%95.45%99.73%区间区间 概率概率1 0.68262 0.95453 0.99731.96 0.952.576 0.99常用概率分布常用概率分布 最新最新 (二二) 正态分布特征正态分布特征 1、正态分布密度曲线是单峰、对称的、正态分
31、布密度曲线是单峰、对称的“悬钟悬钟”形曲线,对称轴为形曲线,对称轴为x=; 2、f(x) 在在 x = 处达到极大,极大值处达到极大,极大值 ; 3、 绝对值愈小,绝对值愈小,f(x)值愈大;值愈大; 常用概率分布常用概率分布 最新最新4、曲线在、曲线在x=处各有一个拐点;处各有一个拐点; 5、正态分布有两个参数,即平均数正态分布有两个参数,即平均数和标准差和标准差。6、分布密度曲线与横轴所夹的面积为、分布密度曲线与横轴所夹的面积为1。正态分布特征正态分布特征-3 -2 -1 +1 +2 +3 常用概率分布常用概率分布 最新最新0.40.30.20.1f(x)图图 方差相同平均数不同的一组正态
32、分布曲线方差相同平均数不同的一组正态分布曲线常用概率分布常用概率分布 最新最新0.40.30.20.1f(x)图图 平均数平均数相同相同方差方差不同的一组正态分布曲线不同的一组正态分布曲线1 1=0.5=0.52 2=1.5=1.53 3=2=2常用概率分布常用概率分布 最新最新 二、标准正态分布二、标准正态分布 =0,2=1的正态分布为标准正态分的正态分布为标准正态分布布,记作随机变量,记作随机变量uN(0,1)。 标准正态分布的概率密度函数及分标准正态分布的概率密度函数及分布函数分别记作布函数分别记作(u)和和(u)。附表附表1就是按标准正态分布的分布函数就是按标准正态分布的分布函数(u)
33、(u)计算出计算出u取某一值的累积概率。取某一值的累积概率。常用概率分布常用概率分布 最新最新(u)1.00.80.60.40.20常用概率分布常用概率分布 最新最新例如,当例如,当u=1.75 (1.75)=0.95994 它实际上表示它实际上表示u从从-到到1.75的累积概率是的累积概率是0.95994。反过来,也可由概率查出对应的反过来,也可由概率查出对应的u值。如值。如果要求更精确的果要求更精确的u值,可用线性插值法计算。值,可用线性插值法计算。如如U0.009,则累积概率为,则累积概率为0.4964。常用概率分布常用概率分布 最新最新 对于任何一个服从正态分布对于任何一个服从正态分布
34、N(,2)的的随机变量随机变量x,都可以通过标准化变换:,都可以通过标准化变换: 将其变换为服从标准正态分布的随机变量将其变换为服从标准正态分布的随机变量u. u称为标准正态变量或标准正态离差,称为标准正态变量或标准正态离差,表示表示x离开平均数离开平均数有几个标准差单位。有几个标准差单位。常用概率分布常用概率分布 最新最新-3 -2 -1 +1 +2 -3 x0.40.30.20.1f(x)-3 - 2 -1 0 1 2 3(u) 从从正正态态分分布布到到标标准准正正态态分分布布,只只是是将将变变量量x的的分分布布中中心心从从平平移移到到0,变变异异单单位位由由原原来来变变量量x的的单单位位
35、变变为为标标准准离离差差单单位位,具具体体到到横横轴轴上上就就是是一一个个标标准准差差距距离离。这这些些变化不影响正态分布的性质。变化不影响正态分布的性质。常用概率分布常用概率分布 最新最新 由正态分布的性质得,变量在某个区间由正态分布的性质得,变量在某个区间取值的概率等于描述该变量的正态分布曲线取值的概率等于描述该变量的正态分布曲线与与x轴在该区间围成的面积。因此,在这个轴在该区间围成的面积。因此,在这个区间的概率计算就变成了正态概率密度函数区间的概率计算就变成了正态概率密度函数的定积分计算。的定积分计算。三、正态分布的概率计算三、正态分布的概率计算常用概率分布常用概率分布 最新最新服服从从
36、N(,2)的的x 在在 a ,b )区区间间取取值值的的概概 率率 , 等等 于于 服服 从从N( 0,1 )随随 机机 变变 量量u在在(a-)/, (b-)/ 区区 间间 取取 值值 概概 率率 。常用概率分布常用概率分布 最新最新【例【例39】 设设x服从服从=30.26, 2=5.102 的正态分布,求的正态分布,求P(21.64x32.98)。 先求标准正态离差先求标准正态离差u值值查附表查附表1常用概率分布常用概率分布 最新最新图图3.2 3.2 正态分布概率计算示意图。正态分布概率计算示意图。u(u)0 0.53-1.694.55%70.19%65.64%常用概率分布常用概率分布
37、 最新最新我们不仅关心随机变量我们不仅关心随机变量x落在以平均数为落在以平均数为对称的某个数值区间内的概率,也很关心对称的某个数值区间内的概率,也很关心x落落在这个区间外的概率。把这个概率称为在这个区间外的概率。把这个概率称为两尾概两尾概率,率,记作记作。附表。附表2给出了绝对值给出了绝对值u的两尾概的两尾概率值。率值。x/2/2/2/2常用概率分布常用概率分布 最新最新查附表查附表2得得0.0250.0250.0050.0050.950.99-1.961.9600-2.582.58u常用概率分布常用概率分布 最新最新P(u1.96)=1-0.95=0.05P(u2.58)=1-0.99=0.
38、01常用概率分布常用概率分布 最新最新第五节第五节 样本平均数抽样分布样本平均数抽样分布统计学研究的中心内容:样本与总体的关系。统计学研究的中心内容:样本与总体的关系。 1、总体、总体 样本样本 抽样分布抽样分布 2、样本、样本总体总体 统计推断统计推断一、抽样试验一、抽样试验二、单个样本平均数的抽样分布二、单个样本平均数的抽样分布三、两个样本平均数差数的抽样分布三、两个样本平均数差数的抽样分布常用概率分布常用概率分布 最新最新 由由总总体体中中随随机机地地抽抽取取若若干干个个体体组组成成样样本本,即即使使每每次次抽抽取取的的样样本本容容量量相相等等,其其统统计计数数(如如 ,S,) 也也将将
39、随随样样本本的的不不同同而而有有所所不不同同,因因而而样样本本统统计计数数也也是是随随机机变变量量,也也有有其其概概率率分布。分布。 统计上把统计上把统计数的概率分布称为统计数的概率分布称为抽样分布。抽样分布。 常用概率分布常用概率分布 最新最新一、抽样试验一、抽样试验抽样要求:抽样要求: (1)随随机机;(2)独独立立;(3)样样本本容容量量大大。用用独独立立、随随机机方方法法抽抽取取的的样样本本称称为为简简单单随机样本,简称样本。随机样本,简称样本。常用概率分布常用概率分布 最新最新可以设想,从原总体中可抽出很多甚至无可以设想,从原总体中可抽出很多甚至无穷多个含量为穷多个含量为 n的样本。
40、由这些样本算得的统的样本。由这些样本算得的统计数有大有小(如),不尽相同,与原总计数有大有小(如),不尽相同,与原总体参数(如体参数(如)相比往往表现出不同程度的差异。)相比往往表现出不同程度的差异。这种差异是由随机抽样造成的这种差异是由随机抽样造成的 ,称为,称为抽样误差。抽样误差。常用概率分布常用概率分布 最新最新 设设有有一一个个N=3的的原原总总体体,其其变变量量分分别别取取值值2、4、6。现现以以样样本本容容量量n=2进进行行独独立立随随机机抽抽样样,全全部部样样本本组组成成的的新新总总体体与与原原总总体体有有什什么么样样的的关关系系?或或者者说说所所得得样样本本统统计计数数的的数数
41、学学期望是否是原总体参数的期望是否是原总体参数的无偏估计无偏估计? 原原总总体体常用概率分布常用概率分布 最新最新以样本容量以样本容量n=2从总体(从总体(2,4,6)抽取所有样本的平均)抽取所有样本的平均数、方差和标准差数、方差和标准差样本观察值样本观察值xxs s2 2s s0 02 2s s 2 2 2 2 2 4 2 4 2 6 2 6 4 2 4 2 4 4 4 4 4 6 4 6 6 2 6 2 6 4 6 4 6 6 6 64 46 68 86 68 810108 810101212 2.0 2.0 3.0 3.0 4.0 4.0 3.0 3.0 4.0 4.0 5.0 5.0
42、4.0 4.0 5.0 5.0 6.0 6.0 0.00.02.02.08.08.02.02.00.00.02.02.08.08.02.02.00.00.00.00.01.01.04.04.01.01.00.00.01.01.04.04.01.01.00.00.00.0000.0001.4141.4142.8282.8281.4141.4140.0000.0001.4141.4142.8282.8281.4141.4140.0000.000N Nn n=3=32 2=9=97272 36 3624.024.012.012.011.31211.312x常用概率分布常用概率分布 最新最新全全部部样
43、样本本由上表次数分布可计算由上表次数分布可计算常用概率分布常用概率分布 最新最新抽样试验结论一抽样试验结论一 1)、)、 是是的的无偏估计值;无偏估计值; 2)、)、S2是是 2 2的无偏估计值;的无偏估计值; 3 3)、以)、以n n为分母计算的为分母计算的S S2 20 0不是不是 2 2的无偏估的无偏估 计值;计值; 常用概率分布常用概率分布 最新最新 显然,样本平均数也是一个随机变量,显然,样本平均数也是一个随机变量,其概率分布叫做其概率分布叫做样本平均数的抽样分布样本平均数的抽样分布。由。由样本平均数构成的总体称为样本平均数构成的总体称为样本平均数的抽样本平均数的抽样总体样总体。 其
44、平均数和标准差分别记为其平均数和标准差分别记为 和和 。二、单个样本平均数抽样分布二、单个样本平均数抽样分布常用概率分布常用概率分布 最新最新 是样本平均数抽样总体的标准差,简是样本平均数抽样总体的标准差,简称称标准误标准误,它,它表示平均数抽样误差的大小表示平均数抽样误差的大小。 统计学已证明,全部样本平均数构成的新统计学已证明,全部样本平均数构成的新总体(总体)的两个参数与原总体(总体(总体)的两个参数与原总体(x总体)总体)的两个参数有如下关系:的两个参数有如下关系: 常用概率分布常用概率分布 最新最新 以以n=2和和n=4分别从上述总体分别从上述总体(2,4,6)抽样,样本总数分别为抽
45、样,样本总数分别为32= 9和和34=81。分别。分别将其样本平均数的次数分布列于下表。将其样本平均数的次数分布列于下表。 已计算上述总体参数如下:已计算上述总体参数如下:常用概率分布常用概率分布 最新最新表:样本平均数的次数分布表:样本平均数的次数分布 n=2 n=2 n=4 n=4f ff ff ff ff ff f2.02.03.03.04.04.05.05.06.06.01 12 23 32 21 12.02.06.06.012.012.010.010.06.06.04.04.09.09.016.016.025.025.036.036.04.04.018.018.048.048.050
46、.050.036.036.02.02.02.52.53.03.03.53.54.04.04.54.55.05.05.55.56.06.01 14 4101016161919161610104 41 12.02.010.010.030.030.056.056.076.076.072.072.050.050.022.022.06.06.04.004.006. 256. 259. 009. 0012.2512.2516.0016.0020.2520.2525.0025.0030.2530.2536.0036.004.04.025.025.090.090.0196. 0196. 0304.0304.0
47、324.0324.0250.0250.0121.0121.036.036.0 9 936.036.090.090.0156156818132432415915913501350常用概率分布常用概率分布 最新最新n=2时样本平均数分布的均数和方差为:时样本平均数分布的均数和方差为: 常用概率分布常用概率分布 最新最新n=4时样本平均数分布的均数和方差:时样本平均数分布的均数和方差:常用概率分布常用概率分布 最新最新0f12 4 6 f32102 3 4 5 6f201510502 3 4 5 62=8/3n=1平均数平均数 的抽样分布图的抽样分布图x常用概率分布常用概率分布 最新最新抽样试验结论
48、二抽样试验结论二:常用概率分布常用概率分布 最新最新 从从抽抽样样试试验验可可以以看看出出 ,虽虽然然原原总总体体并并非非正正态态分分布布,但但从从中中抽抽取取样样本本(n=2, n=4)平平均均数数的的分分布布却却趋趋向向于于正正态态分分布布。随随着着样样本本含含量量 n 的的增增大大,这这种种正正态态分分布布趋趋势势表表现现得得越越来来越越明明显显。 当当n30时,时, 的分布就近似正态分布了。的分布就近似正态分布了。 X 变变量量与与 变变量量概概率率分分布布间间的的关关系系可可由由下列两下列两 个定理说明:个定理说明: 常用概率分布常用概率分布 最新最新 1)从正态总体)从正态总体N(
49、 , 2)抽取样本,无抽取样本,无论样本容量或大或小,样本平均数分布必做论样本容量或大或小,样本平均数分布必做正态分布正态分布N( , 2/n) 。单个样本平均数分布定理单个样本平均数分布定理常用概率分布常用概率分布 最新最新2)、若原总体不是正态分布,则样本平)、若原总体不是正态分布,则样本平均数分布不一定属正态分布,但当均数分布不一定属正态分布,但当n增大时,增大时,总是愈来愈趋近正态分布总是愈来愈趋近正态分布N( , 2/n) 。这就是。这就是中心极限定理中心极限定理。无论是连续性还是间断性变量资料,无论无论是连续性还是间断性变量资料,无论变量所在总体是否呈正态分布,只要变量所在总体是否
50、呈正态分布,只要n30,n30,平平均数的分布可认为是正态分布。均数的分布可认为是正态分布。常用概率分布常用概率分布 最新最新标标 准准 误误 标准误标准误(平均数抽样总体的标准差平均数抽样总体的标准差) 的大小反映样本平均数的大小反映样本平均数 的抽样误差大小,即的抽样误差大小,即精确性的高低精确性的高低 。 样本样本标准误标准误用于估计平均数的用于估计平均数的抽样误差抽样误差。常用概率分布常用概率分布 最新最新三、两个样本平均数差数分布参数三、两个样本平均数差数分布参数NN1 1(1 1 , , 2 21 1) ) 样本容量样本容量样本容量样本容量n n1 1 N(N(1 1 , , 2
51、21 1/ n/ n1 1 1 1 ) ) NN2 2(2 2 , , 2 22 2) ) 样本容量样本容量样本容量样本容量n n2 2 N(N(2 2 , , 2 22 2/ n/ n2 2 ) ) 将将将将 与与与与 一一相互比较一一相互比较一一相互比较一一相互比较得:得: 差数差数 d 就组成一个次数分布。就组成一个次数分布。 常用概率分布常用概率分布 最新最新 从总体从总体N1(2,4,6)以)以n1=2抽样,共抽样,共个样本,有个样本,有9个个 又从总体又从总体N2(3,6)以以n2=3抽样抽样;共共23个样本,有个个样本,有个 常用概率分布常用概率分布 最新最新平均数差数次数分布表
52、平均数差数次数分布表2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 3 3 4 4 5 5 6 6 3 3 4 4 5 5 6 6 3 3 4 4 5 5 6 6 3 3 4 4 5 5 6 6 3 3 4 4 5 5 6 6- -1 1- -2 2- -3 3- -4 40 0 - -1 1- -2 2- -3 31 1 0 0 - -1 1- -2 22 2 1 1 0 0 - -1 13 3 2 2 1 1 0 0f f1 1 3 3 3 3 1 1 2 2 6 6 6 6 2
53、 2 3 3 9 9 9 9 3 3 2 2 6 6 6 6 2 2 1 1 3 3 3 3 1 17 72 2常用概率分布常用概率分布 最新最新f ff( f( ) )f f- 4- 4- 3- 3- 2- 2- 1- 10 01 12 23 31 15 512121818181812125 51 1- 4- 4- 15- 15- 24- 24- 18- 180 0121210103 3- 3.5- 3.5- 2.5- 2.5- 1.5- 1.5- 0. 5- 0. 50.50.51.51.52.52.53.53.512.2512.2531.2531.2527.0027.004.504.50
54、4.504.5027.0027.0031.2531.2512.2512.25 7272- 36- 36150.0150.0样本平均数差数分布平均数与方差的计算样本平均数差数分布平均数与方差的计算常用概率分布常用概率分布 最新最新由差数由差数d的次数分布表可计算出:的次数分布表可计算出:常用概率分布常用概率分布 最新最新抽样试验结论三:抽样试验结论三:两个总体呈正态分布两个总体呈正态分布 ,则两样本平均数,则两样本平均数差数差数(d)准确遵循正态分布。准确遵循正态分布。常用概率分布常用概率分布 最新最新第六节第六节 t 分布分布、 分布与分布与F分布分布常用概率分布常用概率分布 最新最新一、一、
55、 t 分分 布布 若若若若x xN(, N(, 2 2) ),则,则,则,则 NN( ( , , 2 2/ /n n) )。 将随机变量将随机变量将随机变量将随机变量 标准化得:标准化得:标准化得:标准化得: ,则则则则u uNN(0,1)(0,1)。 当总体标准差当总体标准差当总体标准差当总体标准差 未知时,未知时,未知时,未知时, 以样本标准差以样本标准差以样本标准差以样本标准差S S代替代替代替代替 所得到的统计数所得到的统计数所得到的统计数所得到的统计数 记为记为记为记为t t。即。即。即。即常用概率分布常用概率分布 最新最新 在计算在计算 时,由于采用时,由于采用S来代替来代替,使得
56、使得t 变量不再服从标准正态分布,而是服变量不再服从标准正态分布,而是服从自由度从自由度df=n-1 的t分布。分布。t的取值范围是(的取值范围是(-,+)。)。常用概率分布常用概率分布 最新最新 1、t分分布布受受自自由由度度制制约约,每每一一个个自自由由度都有一条度都有一条t分布密度曲线。分布密度曲线。 2、t分分布布密密度度曲曲线线以以t0为为对对称称轴轴,此时,分布密度函数取得最大值。此时,分布密度函数取得最大值。t分布密度曲线特点分布密度曲线特点 3、与与标标准准正正态态分分布布曲曲线线相相比比,t分分布布曲曲线线顶顶部部略略低低 ,两两尾尾稍稍高高。n时时, t 分分布布与标准正态
57、分布完全一致。与标准正态分布完全一致。常用概率分布常用概率分布 最新最新-3 -2 -1 0 1 2 3 t或或u0.40.30.20.1f(t)或或 (u)u分布分布t分布分布(df=1)图图5.3 t5.3 t分布及其与标准正态曲线的比较分布及其与标准正态曲线的比较t分布分布df=5常用概率分布常用概率分布 最新最新 用用 表示表示t分布的概率密度函数,则分布的概率密度函数,则 t分布的概率分布函数为:分布的概率分布函数为: 常用概率分布常用概率分布 最新最新 因而因而t在区间(在区间(t1,+)取值的概率)取值的概率右尾概率为右尾概率为1-F t1 (df)。 由于由于t分布左右对称,分
58、布左右对称,t在区间(在区间(-,-t1)取值的概率也为)取值的概率也为1-F t (df)。1-F t1 (df)t1-t1常用概率分布常用概率分布 最新最新 于于是是 t 分分布布曲曲线线 下下由由-到到- t1和和由由t1到到+ 两两个个相相等等的的 概概 率率 之之和和两两尾尾概概率率为为21-F t1 (df) 。 对对不不同同自自由由度度下下t分分布布的的两两尾尾概概率率及及其其对对应的临界应的临界t值已编制成附表值已编制成附表3,即,即t分布表。分布表。 常用概率分布常用概率分布 最新最新 例如,当例如,当df=15时,查附表时,查附表3得两尾概率得两尾概率等于等于0.05的临界
59、的临界t值为值为 =2.131,其意义是:,其意义是: P(-t-2.131) = P(2.131t+) =0.025; P(-t-2.131)+ (2.131t+) =0.05。常用概率分布常用概率分布 最新最新二、二、 2分布分布 设有一平均数为设有一平均数为、方差为、方差为 的正态总体。的正态总体。现从中独立随机抽取样本,样本容量为现从中独立随机抽取样本,样本容量为n,x1、x2、xn n,并求出其标准正态离差:,并求出其标准正态离差: , , , 常用概率分布常用概率分布 最新最新 记这记这n个相互独立的标准正态离差的平方之个相互独立的标准正态离差的平方之和称为和称为 2 : 它服从自
60、由度为它服从自由度为n的的 2分布,记为分布,记为 常用概率分布常用概率分布 最新最新 若用样本平均数若用样本平均数 估计总体平均数估计总体平均数,则统计量则统计量服从自由度为服从自由度为n-1的的 2分布,记为分布,记为 常用概率分布常用概率分布 最新最新 2 2分布曲线与横轴围成的面积为分布曲线与横轴围成的面积为1 1,即,即P(0 2 2 )=1-)=1- F( 2 2)= )= f( 2 2)d( 2 2)图 2 2分布概率累积函数图解 f( 2 2) ) 2 2 0F( 2 2) ) 1-F( 2 2) ) 2 2 i常用概率分布常用概率分布 最新最新各各种种自自由由度度下下右右尾尾
61、概概率率取取a a的的临临界界 2 2a a,df值值列列于于附附表表6 6,供供测测验验时时查查用用。例例如如, df=10, a a=0.05, 2 20.050.05,10 10 =18.31=18.31,表表示示P( 2 2 18.31)=0.05)=0.05。常用概率分布常用概率分布 最新最新 三、三、F分布分布 设在一正态总体设在一正态总体N(,2)中随机抽)中随机抽取样本容量为取样本容量为n1和和n2的两个样本,得到两的两个样本,得到两个样本方差(均方)个样本方差(均方) 、 , 构成一构成一新的统计量,记为新的统计量,记为F,即即 常用概率分布常用概率分布 最新最新 服从 ,
62、的F 分布分布 。 F 分布密度曲线是随自由度分布密度曲线是随自由度df1、df2的的变变化化而而变变化化的的一一簇簇偏偏态态曲曲线线,其其形形态态随随着着df1、df2的增大逐渐趋于对称,见下图所示。的增大逐渐趋于对称,见下图所示。常用概率分布常用概率分布 最新最新Ff(F)df1=2 df2=5df1=5 df2=4df1=1 df2=5图图 几种自由度下的几种自由度下的F分布分布常用概率分布常用概率分布 最新最新F分布的性质分布的性质n n F分布的取值范围是分布的取值范围是0,+)n nF分布形状取决于分布形状取决于df1和和df2。n nF分布曲线与横轴围成的面积为分布曲线与横轴围成
63、的面积为1。常用概率分布常用概率分布 最新最新 用用 表示表示F分布的概率密度函数,则分布的概率密度函数,则其分布函数其分布函数 为:为: 因而因而F分布右尾从分布右尾从 到到+的概率为:的概率为: 常用概率分布常用概率分布 最新最新Ff(F)F(F)1-F(F)F常用概率分布常用概率分布 最新最新 附表附表4列出的是不同列出的是不同 df1 和和 df2 下,下, P(F )=0.05和和P(F )=0.01 时的时的F值,即右尾概率值,即右尾概率=0.05和和=0.01 时的临界时的临界F值,一般记作:值,一般记作: 常用概率分布常用概率分布 最新最新 例如例如,查附表查附表4,当,当df
64、1=3,df2=18时,时, F0.05(3,18)=3.16,F0.01(3,18)=5.09 表表示示如如以以n1=4,n2=19,在在同同一一正正态态总总体体中中连连续续抽抽样样 ,所所得得 F 值值大大于于 3.16 的的仅仅有有5%,大于,大于5.09的仅有的仅有1%。常用概率分布常用概率分布 最新最新本章重点:本章重点:n n小概率事件实际不可能性原理;小概率事件实际不可能性原理;n n二项分布及正态分布的特点及参数;二项分布及正态分布的特点及参数;n n样本平均数抽样分布规律;样本平均数抽样分布规律;n n中心极限定律;中心极限定律;n nt分布、卡分布、分布、卡分布、F分布的计算公式。分布的计算公式。常用概率分布常用概率分布 最新最新