西财统计学概率与概率分布

上传人:壹****1 文档编号:567710666 上传时间:2024-07-22 格式:PPT 页数:68 大小:317KB
返回 下载 相关 举报
西财统计学概率与概率分布_第1页
第1页 / 共68页
西财统计学概率与概率分布_第2页
第2页 / 共68页
西财统计学概率与概率分布_第3页
第3页 / 共68页
西财统计学概率与概率分布_第4页
第4页 / 共68页
西财统计学概率与概率分布_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《西财统计学概率与概率分布》由会员分享,可在线阅读,更多相关《西财统计学概率与概率分布(68页珍藏版)》请在金锄头文库上搜索。

1、第三章第三章 概率与概率分布概率与概率分布第一节 随机事件与概率第二节 随机变量及其分布第三节 大数定律与中心极限定理引言:现实中的随机性和规律性引言:现实中的随机性和规律性自然科学中有许多定律,如牛顿三定律,物质不灭定律以及化学中的各种定律等等。在许多领域,一些现象的规律性很难用在许多领域,一些现象的规律性很难用确定的公式或论述来描述。确定的公式或论述来描述。引言:现实中的随机性和规律性引言:现实中的随机性和规律性(续)(续)例如:例如:每个人的寿命长短具有一定随机性每个人的寿命长短具有一定随机性 (randomness)(randomness)。这种随机性可能与个人的基因、习惯、经历等无数

2、这种随机性可能与个人的基因、习惯、经历等无数说不清的因素都有关系。说不清的因素都有关系。但是从总体来说,一国公民的平均年龄却是非常稳但是从总体来说,一国公民的平均年龄却是非常稳定的,而且女性平均年龄也稳定地比男性高几年。定的,而且女性平均年龄也稳定地比男性高几年。这说明了随机性之中寓含着规律性。这种规律就是这说明了随机性之中寓含着规律性。这种规律就是统计规律统计规律。研究统计规律就往往就要借助于有关概率与概研究统计规律就往往就要借助于有关概率与概率分布的理论。率分布的理论。第一节第一节 随机事件与概率随机事件与概率一、随机事件及其运算二、概率的性质与运算法则一、随机事件及其运算一、随机事件及其

3、运算(一)基本概念(一)基本概念随机现象(偶然现象、不确定现象)在一定条件下可能发生也可能不发生的现象。从一次观察来看,随机现象似乎没有什么规律,但大量观察的结果会呈现出某种明显的规律性。随机试验随机试验严格意义上的随机试验满足三个条件:试验可以在系统条件下重复进行;试验的所有可能结果是明确可知的;每次试验前不能肯定哪一个结果会出现。广义的随机试验是指对随机现象的观察(或实验)。由于多数试验不能同时满足这些条件,因此实际应用中常常从广义角度来理解。随机事件随机事件随机事件(简称事件)随机试验(或随机现象)的每一个可能结果基本事件不可能再分成为两个或更多事件的事件,也称为样本点。基本事件的全体(

4、全集)称为样本空间或基本空间复合事件由某些基本事件组合而成的事件,也称为样本空间中的子集。随机事件(续)随机事件(续)必然事件在一定条件下,每次试验都必然发生的事件。 不可能事件在一定条件下,每次试验都必然不会发生的事件。 (二)随机事件的关系和运算(二)随机事件的关系和运算1、事件的包含事件B包含事件A,是指事件A发生必然导致事件B发生。2、事件的并(和)指事件A与事件B至少一个发生。3、事件的交(积)指事件A与事件B同时发生。ABAB(二)随机事件的关系和运算(续)4、事件的差(AB)指事件A发生而事件B不发生。5、互不相容(互斥)事件指事件A与事件B不可能同时发生。6、A的对立(逆)事件

5、指样本空间中所有不属于事件A的样本点。ABAA机会和概率机会和概率你可能经常听到概率(probability)这个名词。例如在天气预报中会提到降水概率。因此,从某种意义说来,概率描述了某件事情发生的机会。显然,这种概率不可能超过百分之百,也不可能少于百分之零。换言之,概率是在0和1之间的一个数,说明某事件发生的机会有多大。(三)事件的概率(三)事件的概率1、概率的古典定义、概率的古典定义古典概型(等可能概型)具有以下两特点每次试验的可能结果有限(即样本空间中基本事件总数有限);每个试验结果出现的可能性相同。它是概率论的发展过程中人们最早研究的对象1、概率的古典定义、概率的古典定义在古典该型中,

6、事件A发生的概率等于该事件所包含的基本事件数m占基本事件总数n的比重,即:例(概率的古典定义)例(概率的古典定义)设有50件产品,其中有5件次品,现从这50件中任取2件,求抽到的两件产品均为合格品的概率是多少?抽到的两件产品均为次品的概率又是多少?解:任一件被抽到的机会均等,而且从50件产品中抽出2件相当于从50个元素中取2个进行组合,共有C502 种可能,所以这是一个古典概型。2、概率的统计定义、概率的统计定义在相同条件下重复进行n次试验,随着n的增大,事件A出现的频率趋于稳定,这个稳定值就是事件A发生的概率。根据概率的统计定义,通过大量重复试验,可以用事件发生的频率来近似代替其概率。即:

7、P(A)=m/n其中: n试验(观察)次数, m n次试验中事件A发生的次数 例(补充)根据古典概率定义可算出,抛一枚质地均匀的硬币,出现正面与出现反面的概率都是0.5。历史上有很多人都曾经做过抛硬币试验。试验者试验次数正面出现的频率蒲丰40400.5069K.皮尔逊120000.5016K.皮尔逊240000.5005罗曼诺夫斯基806400.49793、概率的主观定义有些概率无法精确计算。既不能由等可能性来计算,也不可能从大量随机试验的结果来计算。但根据经验、常识或其他相关因素对事件发生的可能性大小给以主观估计,这样确定的概率称为主观概率。例如,某人认为甲乙两足球队的对抗中,甲队获胜的概率

8、是70。(补充)关于概率的公理化定义概率的以上三种定义,各有其特定的应用范围,也存在局限性,都缺乏严密性。古典定义要求试验的基本事件有限且具有等可能性统计定义要求试验次数充分大,但试验次数究竟应该取多大、频率与概率有多接近都没有确切说明主观概率的确定又具有主观随意性前苏联数学家柯尔莫哥洛夫于1933年提出了概率的公理化定义通过规定应具备的基本性质来定义概率公理化定义为概率论严谨的逻辑推理打下了坚实的基础二、概率的性质与运算法则(一)概率的性质(一)概率的性质非负性:对任意事件A,有 0 P(A) 1。规范性:必然事件的概率为1,即: P()=1不可能事件的概率为0 ,即:P()=0。可加性:若

9、A与B互斥,则:P ( AB ) = P ( A ) + P ( B )对于多个两两互斥事件A1,A2,An,则有: P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An )上述三条基本性质,也称为概率的三条公理三条公理。 (二)概率的运算法则1概率的加法公式对于两个互斥事件P(A+B)P(A)+P(B)即如果两个事件不可能同时发生,那么至少其中之一发生的概率为这两个概率的和。对于两个任意事件,P(A+B)P(A)+P(B) P(AB) 即如果两个事件有可能同时发生,则【P(A)+P(B)】中事件A和B同时发生的概率P(AB)被重复计算了一次,因此,应该减去。

10、【例】设有50件产品,其中有5件次品,现从这50件中任取2件,若问至少抽到一件次品的概率?解:“至少抽到一件次品”这一事件实质上就是“抽取的2件产品中有一件次品”(记为A)与“抽取的两件产品均为次品”(记为B)这两个事件的和。由于A与B是两个互斥事件,故计算 “至少抽到一件次品”的概率采用公式: P(AB) =P(A)+P(B) 两个互补事件的概率之和等于1例如:掷一个骰子,“出现2点”的概率是1/6,则“不出现2点”的概率就是5/6 。互补事件的概率2概率的乘法公式用于计算两个事件同时发生的概率,即 “A发生且B发生”的概率 P(AB) 先关注事件是否相互独立条件概率在事件A已经发生的条件下

11、事件B发生的概率,称为“事件A已经发生的条件下B发生的条件概率”,记为P(B|A),并且有: P(B|A)P(A B)/ P(A)概率的乘法公式的一般形式: P(A B) P(A) P(B|A) 或:P(A B) P(B) P(A| B)如果事件A、B相互独立,则 P(A B) P(A) P(B)(1)条件概率条件概率在某些附加条件下计算的概率在已知事件B已经发生的条件下A发生的条件概率P(A|B)条件概率的一般公式: 其中 P(B) 0 【例】某公司甲乙两厂生产同种产品。甲厂生产400件,其中一级品为280件;乙厂生产600件,其中一级品有360件。若要从该厂的全部产品中任意抽取一件,试求:

12、已知抽出产品为一级品的条件下该产品出自甲厂的概率;已知抽出产品出自甲厂的条件下该产品为一级品的概率。解:设A“甲厂产品”,B“一级品”,则: P(A)0.4, P(B) 0.64,P(AB)0.28 所求概率为事件B发生条件下A发生的条件概率 P(A|B)0.28/0.64所求概率为事件A发生条件下B发生的条件概率 P(B|A)0.28/0. 4乘法公式的一般形式: P(AB) P(A)P(B|A) 或 P(AB) P(B)P(A|B) 【例例】从从50件中任取件中任取2件产品,可以看成是分两次抽取,件产品,可以看成是分两次抽取,每次只抽取一件,不放回每次只抽取一件,不放回解:设解:设A1第一

13、次抽到合格品,第一次抽到合格品,A2第二次抽到合格品第二次抽到合格品A1 A2抽到的两件产品均为合格品抽到的两件产品均为合格品P(A1A2)P(A1)P(A2|A1) 事件的独立性两个事件独立一个事件的发生与否并不影响另一个事件发生的概率P(A|B)P(A),或 P(B|A)P(B)独立事件的乘法公式: P(AB) P(A)P(B)推广到 n 个独立事件,有: P P P P( ( ( (A A A A1 1A A A An n) ) ) )P P P P( ( ( (A A A A1 1) ) ) )P P P P( ( ( (A A A A2 2) ) ) ) P P P P( ( ( (

14、A A A An n) ) ) ) 3. 全概率公式完备事件组事件A1、 A2、An互不相容,AA2An且P(Ai ) 0(i=1、2、.、n)对任一事件B,它总是与完备事件组A1、 A2、An之一同时发生,则有求P(B)的全概率公式:例假设有一道四选一的选择题,某学生知道正确答案的可能性为2/3,他不知道正确答案时猜对的概率是1/4。试问该生作出作答的概率?解:设 A知道正确答案,B选择正确。 “选择正确”包括:“知道正确答案而选择正确”(即AB)“不知道正确答案但选择正确”(即 )P(B)2/311/31/43/4贝叶斯公式若A1、 A2、An为完备事件组,则对于任意随机事件B,有: 计算

15、事件Ai在给定B条件下的条件概率公式。公式中,P(Ai)称为事件Ai的先验概率P(Ai|B)称为事件Ai的后验概率 全概率公式贝叶斯公式全概率公式的直观意义:每一个Ai的发生都可能导致B出现,每一个Ai导致B发生的概率为,因此作为结果的事件B发生的概率是各个“原因” Ai引发的概率的总和 相反,在观察到事件B 已经发生的条件下,确定导致B 发生的各个原因Ai的概率贝叶斯公式(逆概率公式) (后验概率公式)第二节第二节随机变量及其分布随机变量及其分布 一、随机变量的概念 二、随机变量的概率分布 三、随机变量的数字特征 四、常见的离散型概率分布 五、常见的连续型概率分布一、随机变量的概念随机变量表

16、示随机试验结果的变量。对于随机试验的样本空间中的每一个样本点(事件 )总有一个实数X()与之对应,则称实数函数X() 为随机变量简记为X。离散型随机变量取值可以一一列举;连续随机变量取值不能一一列举。二、随机变量的概率分布(一)离散型随机变量的概率分布将离散型随机变量X的所有可能取值xi及其对应的概率P(xi)用函数式、表格或图形表示出来,就称为离散型随机变量的概率分布。离散型随机变量的概率分布具有下列性质:P(xi)0;离散型概率分布的表示:概率函数:P(X= xi)= pi分布列:分布图X = xix1x2xnP(X =xi)=pip1p2pn0.60.300 1 2 xP( x )例示例

17、示 X的概率分布的概率分布 (二)连续型随机变量的概率密度连续变量的概率分布是用概率分布密度函数 f (x)表示的,简称概率密度。连续变量落入某个区间的概率就是该概率密度曲线在这个区间上所覆盖的面积,即密度函数在这个区间上的积分。对于连续变量,取某个特定值的概率都是零,而只有变量取值于某个(或若干个)区间的概率才有意义:P(x1Xx2)P(x1Xx2)概率密度 f (x) 的性质(1) f (x)0,概率密度是非负函数。(2)即所有区域上取值的概率总和为1。 随机随机变量量X在一定区在一定区间(a,b)上的概率:)上的概率: f f( (x x) )xab(三)随机变量的分布函数设X为随机变量

18、,x为任意实数,称函数 F(x) P(Xx) 为X的累计分布函数,简称分布函数。已知X的分布函数,就可以求出X在任一区间上的概率:P(x1Xx2)F(x2)F(x1)f f( (x x) )xx0F F ( ( x x0 0 ) )(三)随机变量的分布函数(续)离散型随机变量的分布函数:F(x) P(Xx)连续型随机变量的分布函数:F(x) P(Xx)三、随机变量的数字特征(一)随机变量的数学期望(均值)记为E(X) 或它是随机变量所有可能取值的平均水平是随机变量集中趋势的度量。(一)随机变量的数学期望离散型随机变量的数学期望:E(X)连续型随机变量的数学期望:E(X)注意数学期望与加权算术平

19、均数的相似与区别。(二)随机变量的方差记为D(X) 或2它们是随机变量所有可能取值偏离其均值的离差的平均水平,是随机变量离中趋势的度量。(二)随机变量的方差(续)离散型随机变量的方差:D(X)ExiE(X)2 xiE(X) 2 P(xi )连续型随机变量的方差:D(X) 均方差(或标准差)方差的平方根四、常用的随机变量分布(一)常用的离散型随机变量分布1. 二项分布贝努里试验的特点:每次试验只有两种结果“成功”(事件A发生)和“失败”(事件A不发生);每次试验得到一种结果的概率不变(“成功”的概率总是p);每次试验互相独立。二项分布(续)如果进行n次贝努里试验,每次成功的概率为p,那么成功次数

20、X是个随机变量,其概率分布就是分布,记为XB(n,p),此时有: , k=0,1,2,n二项分布的数学期望和方差:E(X)np;D(X)np(1p)二项分布的特例二点分布(01分布)即n1时的二项分布。2.泊松分布它衡量某种事件在一定期间出现的数目的概率。比如说在一定时间内顾客的人数、打入电话总机电话的个数、放射性物质放射出来并到达某区域的粒子数等等。在一定时间(或长度)、区域、容积内,小概率事件(稀有事件)发生的次数的概率分布常常用泊松分布来描述。2.泊松分布(续)参数为的泊松分布记为P()。若X P(),则X的概率分布为: , k=0,1,2,n 泊松分布的数学期望和方差: E(X) ;

21、D(X)二项分布与泊松分布的关系:当二项分布的n大而p小时,二项分布趋近于泊松分布。(二)常用的连续型随机变量分布1、正态分布、正态分布正态分布是最重要、最常用的连续型随机变量分布。主要原因在于:许多随机变量服从或近似服从正态分布;由于它特有的数学性质,许多分布(如二项分布)可以用正态分布近似计算;根据中心极限定理,样本平均数的分布服从或近似服从正态分布;由正态分布可以导出其他许多有用的分布(如卡方分布、t分布、F分布)等等。正态分布的概率密度正态分布也是一族分布,各种正态分布根据它们的均值和标准差不同而有区别.若X服从正态分布,其均值为 ,方差为2,则记为X N(, 2),其概率密度为: ,

22、 -x+正态曲线正态分布的概率密度所对应的图形简称正态曲线正态曲线的主要特征:钟型;对称(以X=为对称轴);以X轴为渐近线;曲线在 x= -及 x= + 处有拐点;曲线的陡缓程度取决于参数(方差) 2。标准正态分布特别地,均值为0,标准差为1的正态分布称为标准正态分布。常用(x)、(x)分别表示标准正态分布的概率密度和分布函数。任何正态分布变量都可以用简单的线性变换(减去其均值、再除以标准差)而成为标准正态分布。X N(, 2) ,则Z=(X )/ N(0 ,1)几乎所有的统计学书后都附有标准正态分布的函数值。查表或利用统计软件即可查得正态分布在一定区间的概率。但最常用的是求在中心(均值)附近

23、、标准差的1、2、3倍区间内的概率:落在总体均值附近某一区间内的概率落在总体均值附近某一区间内的概率标准正态分布(图)及其概率68.27%68.27% -1-1 +1 +195.45%95.45% -2-2 +2+299.73%99.73% -3 -3 +3+32.2分布(卡方分布)n个独立正态随机变量的平方和仍然为一随机变量,其概率分布是有n个自由度的2分布,记为2(n)。2 分布是一个以自由度为参数的分布族,其分布形状取决于自由度,是一非对称分布;随着自由度n的增大,2分布逐渐趋于正态分布2分布适用于对总体方差的统计推断、拟合优度检验、独立性检验等等。卡方 (c2) 分布的图示不同自由度的

24、卡方分布曲线不同自由度的卡方分布曲线 c c c c2 22 2n=1n=4n=10n=203. t分布t分布也是一个以自由度为参数的分布族。其分布形状取决于自由度。标准正态曲线与 t分布曲线异同:相同点:都是关于X=0对称的、取值范围都是-xt)= t分布(图)0N(0,1)t(n)t4.F分布4.F分布变量为两个2分布变量(在除以它们各自自由度之后)的比。4.F分布有两个自由度:第一个自由度等于在分子上的2分布的自由度,第二个自由度等于在分母的2分布的自由度。5.第一个自由度越小,分布曲线的峰越靠近左边。5.F分布在一个重要性质:4.如果FF(n1, n2),则1/F F(n2, n1)。

25、第三节第三节 大数定律与中心极限定理大数定律与中心极限定理一、大数定律二、中心极限定理一、大数定律大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律。独立同分布大数定律贝努里大数定律(一)独立同分布大数定律设独立随机变量x1、x2、x3、具有相同分布,且存在有限的数学期望和方差2 ,则对于任意小的正数,有:该定律表明:当n足够大时,独立同分布的一系列随机变量的算术平均数依概率收敛于数学期望,即平均数具有稳定性,它为样本平均数用于估计总体平均数提供了理论依据。(二)贝努里大数定律设m是n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意小的正数,有:该定律表明

26、:当然n足够大时,事件A发生的频率依概率收敛于事件A发生的概率,即频率具有稳定性,它为频率代替概率提供了理论依据。 二、中心极限定理中心极限定理是阐述大量随机变量的总和的极限分布是正态分布的一系列定理。 独立同分布中心极限定理 德莫佛拉普拉斯中心极限定理(一)独立同分布中心极限定理设随机变量x1、x2、x3、独立且服从同一分布,且存在有限的数学期望和方差2 ,当n时,有: x N( n ,n2),或 N(, 2 / n)该定理表明:不论总体服从何种分布,只要它的数学期望和方差存在,从这个总体中随机抽取容量n 的样本,当n充分大时,这个样本的总和x 的分布趋于均值为n、方差为 n2 的正态分布(

27、或样本平均数趋于均值为、方差为2 / n的正态分布)中心极限定理(图示)总体分布总体分布样本均值的分布样本均值的分布(二)德莫佛拉普拉斯中心极限定理设X表示n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则XB(n,p)。当n时,有: X N (np, np(1-p) )该定理表明:正态分布是二项分布的极限分布。只要n足够大时,其概率可利用正态分布来近似计算。本章小结随机现象、随机试验、事件的概念概率的定义、基本性质和运算法则随机变量的概念、概率分布的表示随机变量的主要数字特征三种常见的离散型概率分布二项分布、泊松分布和超几何分布两种连续型概率分布均匀分布、正态分布的主要特征和应用大数定律和中心极限定理

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号