《第五章概率和概率分布》由会员分享,可在线阅读,更多相关《第五章概率和概率分布(105页珍藏版)》请在金锄头文库上搜索。
1、中国人民大学出版社All rights reserved统统 计计 学学第五章第五章 概率和概率和 概率分布概率分布第五章第五章 概率和概率分布概率和概率分布1 1 概率的问题概率的问题2 2 离散变量的概率分布离散变量的概率分布 3 3 连续变量的概率分布连续变量的概率分布 4 4 抽样分布抽样分布学习目标学习目标1.了解随机事件的概念、事件的关系和运算了解随机事件的概念、事件的关系和运算2.理解概率的定义,掌握概率的性质和运算法则理解概率的定义,掌握概率的性质和运算法则3.3.理解随机变量及其分布,计算各种分布的概率理解随机变量及其分布,计算各种分布的概率1 1 概率的问题概率的问题1.1
2、 1.1 事件事件 1.2 1.2 概率概率1.3 1.3 概率分布概率分布 随机事件的几个基本概念随机事件的几个基本概念随机事件的几个基本概念随机事件的几个基本概念试试 验验1.在相同条件下,对事物或现象所进行的观察2.例如:掷一枚骰子,观察其出现的点数3.试验具有以下特点可以在相同的条件下重复进行每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的在试验结束之前,不能确定该次试验的确切结果事件的概念事件的概念1.1.事件:事件:随机试验的每一个可能结果(任何样本点集合)例如:掷一枚骰子出现的点数为32.2.随机事件:随机事件:每次试验可能出现也可能不出现的事件例如:掷
3、一枚骰子可能出现的点数3.3.必然事件必然事件:每次试验一定出现的事件,用表示例如:掷一枚骰子出现的点数小于74.4.不可能事件不可能事件:每次试验一定不出现的事件,用表示例如:掷一枚骰子出现的点数大于6事件与样本空间事件与样本空间1.基本事件一个不可能再分的随机事件例如:掷一枚骰子出现的点数2.样本空间一个试验中所有基本事件的集合,用表示例如:在掷枚骰子的试验中,1,2,3,4,5,6在投掷硬币的试验中,正面,反面1.1 1.1 事件事件1.1.2 1.1.2 事件的关系事件的关系事件的包含;事件的互斥;事件的并(或和);事件的交(或积);事件的差;事件的逆。 1.1.2 1.1.2 事件的
4、关系和运算事件的关系和运算(事件的包含)(事件的包含)(事件的包含)(事件的包含)A A AB B B B A A 若若事事件件A A发发生生必必然然导导致致事事件件B B发发生生, 则则称称事事件件B B包包含含事事件件A A,或或事事件件A A包包含含于于事事件件B B,记记作作或或 A A B B或或 B B A A1.1.21.1.2 事件的关系和运算事件的关系和运算(事件的并或和)(事件的并或和)(事件的并或和)(事件的并或和) 事事件件A A和和事事件件B B中中至至少少有有一一个个发发生生的的事事件件称称为为事事件件A A与与事事件件B B 的的并并。它它是是由由属属于于事事件件
5、A A或或事事件件B B的的所所有的样本点组成的集合,记为有的样本点组成的集合,记为A AB B或或A A+ +B BBA A A AB B1.1.21.1.2 事件的关系和运算事件的关系和运算(事件的交或积)(事件的交或积)(事件的交或积)(事件的交或积)A AB B A AB B 事件A与事件B同时发生的事件称为事件A与事件B的交,它是由属于事件A也属于事件B的所有公共样本点所组成的集合,记为BA 或AB1.1.2 1.1.2 事件的关系和运算事件的关系和运算(互斥事件(互斥事件(互斥事件(互斥事件)A AB B A A 与与与与 B B互不相容互不相容互不相容互不相容 事事件件A A与与
6、事事件件B B中中,若若有有一一个个发发生生,另另一一个个必必定定不不发发生生, 则则称称事事件件A A与与事事件件B B是是互互斥斥的的,否否则则称称两两个个事事件件是是相相容容的的。显显然然,事事件件A A与与事事件件B B互互斥斥的的充充分分必必要要条件是事件条件是事件A A与事件与事件B B没有公共的样本点没有公共的样本点1.1.2 1.1.2 事件的关系和运算事件的关系和运算(事件的逆)(事件的逆)(事件的逆)(事件的逆)A A A 一一个个事事件件B B与与事事件件A A互互斥斥,且且它它与与事事件件A A的的并并是是整整个个样样本本空空间间,则则称称事事件件B B是是事事件件A
7、A的的逆逆事事件件。它它是是由由样样本本空空间间中中所所有有不不属属于于事事件件A A的的样样本本点点所所组组成成的集合,记为的集合,记为 A A1.1.2 1.1.2 事件的关系和运算事件的关系和运算(事件的差)(事件的差)(事件的差)(事件的差) A A - - B BAB B 事事件件A A发发生生但但事事件件B B不不发发生生的的事事件件称称为为事事件件A A与与事事件件B B的的差差,它它是是由由属属于于事事件件A A而而不不属属于于事事件件B B的的那那些些样本点构成的集合,记为样本点构成的集合,记为A A- -B B 1.1.3 1.1.3 事件的性质事件的性质事件的性质事件的性
8、质 设A、B、C为三个事件,则有1.交换律:AB=BA 2. AB=BA2.结合律:A(BC)=(AB)C A(BC) =(AB) C3.分配律:A(BC)=(AB)(AC) A(BC)=(AB)(AC)1.2 1.2 概率概率1.2.1 1.2.1 事件的概率事件的概率 事件A的概率是对事件A出现的可能性大小的一种度量,数学表示为 ,概率的数学性质有:1.非负性对任意事件A,有 0 P 12.规范性必然事件的概率为1;不可能事件的概率为0。即P ( ) = 1; P ( ) = 03.可加性若A与B互斥,则P ( AB ) = P ( A ) + P ( B )推广到多个两两互斥事件A1,A
9、2,An,有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An )事件的概率事件的概率1.事件A的概率是对事件A在试验中出现的可能性大小的一种度量2.表示事件A出现可能性大小的数值3.事件A的概率表示为P(A)4.概率的定义有:古典定义、统计定义和主观概率定义事件的概率事件的概率例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数 n 的增大,出现正面和反面的频率稳定在1/2左右试验的次数试验的次数正面正面 / /试验次数试验次数1.001.000.000.000.250.250.500.500.750.750 025255050757510010012
10、51251.21.2.2 .2 概率的古典定义概率的古典定义 如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数m与样本空间中所包含的基本事件个数n的比值,记为1.21.2.2 .2 概率的古典定义概率的古典定义(实例)(实例)(实例)(实例)【例例】某钢铁公司所属三个工厂的职工人数如下表。从 该公司中随机抽取1人,问: (1)该职工为男性的概率 (2)该职工为炼钢厂职工的概率某某钢铁公司所属企业职工人数钢铁公司所属企业职工人数工厂工厂男男职工职工女女职工职工合计合计炼钢厂炼钢厂炼铁厂炼铁厂轧钢厂轧钢厂4000320090018
11、001600600620048001500合计合计85004000125001.21.2.2 .2 概率的古典定义概率的古典定义(计算结果)(计算结果) 解解解解:(1)(1)用用A A 表表示示“抽抽中中的的职职工工为为男男性性”这这一一事事件件;A A为为全全公公司司男男职职工工的的集集合合;基基本本空空间间为为全全公公司司职职工工的的集集合。则合。则 (2) (2) 用用B B 表表示示“ “抽抽中中的的职职工工为为炼炼钢钢厂厂职职工工” ”;B B为为炼炼钢钢厂厂 全体职工的集合;基本空间为全体职工的集合。则全体职工的集合;基本空间为全体职工的集合。则1.21.2.2 .2 概率的统计
12、定义概率的统计定义 在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,取向于稳定,这个频率的稳定值即为事件A的概率,记为1.21.2.2 .2 概率的统计定义概率的统计定义 (实例)(实例)(实例)(实例)【例例】:某工厂为节约用电,规定每天的用电量指标为1000度。按照上个月的用电记录,30天中有12天的用电量超过规定指标,若第二个月仍没有具体的节电措施,试问该厂第一天用电量超过指标的概率。 解:解:上个月30天的记录可以看作是重复进行了30次试验,试验A表示用电超过指标出现了12次。根据
13、概率的统计定义有1.21.2.2 .2 概率的主观定义概率的主观定义1.对一些无法重复的试验,确定其结果的概率只能根据以往的经验人为确定2.概率是一个决策者对某事件是否发生,根据个人掌握的信息对该事件发生可能性的判断3.例如,我认为2012年的中国股市是一个盘整年概率的主观定义叫主观概率,也叫个人概率。 法则一:法则一:加法的特殊定理加法的特殊定理1.两个互斥事件之和的概率,等于两个事件概率之和。设A和B为两个互斥事件,则 P ( AB ) = P ( A ) + P ( B )2.事件A1,A2,An两两互斥,则有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + +
14、P (An )3.特别的,若事件A与B互斥,并且事件A与B的和组成了整个样本空间,此时,事件A与B互为逆事件。 有 ,个式子还可以写成 或写作: 。上式也叫概率的补偿定理。 1.21.2.3.3 概率概率的的加法加法1.21.2.3 .3 概率的加法概率的加法(实例)(实例)(实例)(实例)【例例例例】根根据据钢钢铁铁公公司司职职工工的的例例子子,随随机机抽抽取取一一名名职工,计算该职工为炼钢厂或轧钢厂职工的概率职工,计算该职工为炼钢厂或轧钢厂职工的概率 解解解解:用用A A表表示示“ “抽抽中中的的为为炼炼钢钢厂厂职职工工” ”这这一一事事件件;B B表表示示“ “抽抽中中的的为为轧轧钢钢厂
15、厂职职工工” ”这这一一事事件件。随随机机抽抽取取一一人人为为炼炼钢钢厂厂或或轧轧钢钢厂厂职职工工的的事事件件为为互互斥斥事事件件A A与与B B 的和,其发生的概率为的和,其发生的概率为1.21.2.3.3 概率概率的的加法加法法则二:法则二:加法的一般定理加法的一般定理有的事件并不是互斥的,有可能同时发生,存在交集。要计算两个事件之和的概率,要减去一次交集的概率,否则这部分就包括了两次,重复多算了一次。对任意两个随机事件A和B,它们和的概率为两个事件分别概率的和减去两个事件交的概率,即 P ( AB ) = P ( A ) + P ( B ) - P ( AB ) 对于两个互斥事件而言,有
16、P ( AB) = P () =0加法的特殊定理是一般定理的一个特例。加法的特殊定理是一般定理的一个特例。1.21.2.3.3 概率概率的的加法加法(实例)(实例)(实例)(实例)【例例】设某地有甲、乙两种报纸,该地成年人中有20%读甲报纸,16%读乙报纸,8%两种报纸都读。问成年人中有百分之几至少读一种报纸。 解解:设A读甲报纸,B读乙报纸,C至少读一种报纸。则 P ( C ) =P ( AB ) = P ( A ) + P ( B ) - P ( AB ) =0.2=0.2 + + 0.160.16 - - 0.080.08 = = 0.280.281.2.4 1.2.4 概率的乘法概率的
17、乘法-条件概率条件概率1.1.条件概率条件概率在事件B已经发生的条件下,求事件A发生的概率,称这种概率为事件A的条件概率,记为 若 ,事件A的条件概率(事件B发生的条件下),与事件A本身的概率相等,意味着事件B的信息对于事件A没有影响,说明这两个事件是独立的。 条件概率的图示条件概率的图示 事件事件 A AB B及其及其概率概率P P ( (A AB B) )事件事件B B及其及其概率概率P P ( (B B) )事件事件事件事件事件事件A A A AA A 事件事件事件事件事件事件B B B B B B一旦事件一旦事件一旦事件一旦事件B B B B发生发生发生发生1.2.4 1.2.4 概率
18、的乘法概率的乘法2. 2. 乘法的特殊定理乘法的特殊定理两个独立事件之积(同时发生)的概率,等于两个事件的概率之积。即若事件A与B独立,有 P(AB)=P(A)P(B)推广到n个独立事件,有 P(A1 A2 An)=P(A1)P(A2) P(An) 1.2.4 1.2.4 概率的乘法概率的乘法(乘法的特殊定理实例)(乘法的特殊定理实例)(乘法的特殊定理实例)(乘法的特殊定理实例)【例例例例】某某工工人人同同时时看看管管三三台台机机床床,每每单单位位时时间间( (如如3030分分钟钟) )内内机机床床不不需需要要看看管管的的概概率率:甲甲机机床床为为0.90.9,乙乙机机床床为为0.80.8,丙
19、丙机机床为床为0.850.85。若机床是自动且独立地工作,求。若机床是自动且独立地工作,求 (1 1)在在3030分钟内三台机床都不需要看管的概率分钟内三台机床都不需要看管的概率 (2 2)在在3030分分钟钟内内甲甲、乙乙机机床床不不需需要要看看管管,且且丙丙机机床床需需要要看看管的概率管的概率 解解解解:设设 A A1 1,A A2 2,A A3 3为为甲甲、乙乙、丙丙三三台台机机床床不不需需要要看看管管的的事事件,件, A A3 3 为丙机床需要看管的事件,依题意有为丙机床需要看管的事件,依题意有 (1) (1) P P( (A A1 1A A2 2A A3 3)= )= P P( (A
20、 A1 1) ) P P( (A A2 2) ) P P( (A A3 3)=0.9)=0.9 0.80.8 0.85=0.6120.85=0.612 (2)(2) P P( (A A1 1A A2 2 A A3 3)= )= P P( (A A1 1) ) P P( (A A2 2) ) P P( ( A A3 3) ) = 0.9 = 0.9 0.80.8 (1-0.85)=0.108(1-0.85)=0.1081.2.4 1.2.4 概率的乘法概率的乘法3.3.乘法的一般定理乘法的一般定理更多的时候,事件并不是独立的,概率的计算是有条件的。一般意义上,两个事件之积(同时发生)的概率,为:
21、 上式也可以写作 求两个以上事件之积(同时发生)的概率与之相似。 以三个事件A、B、C为例。事件A、B、C同时发生的概率为: 1.2.4 1.2.4 概率的乘法概率的乘法(实例)(实例)(实例)(实例)【例例】设有1000中产品,其中850件是正品,150件是次品,从中依次抽取2件,两件都是次品的概率是多少? 解解:设 Ai 表示“第 i 次抽到的是次品”(i=1,2),所求概率为P(A1A2) 1.2.5 1.2.5 全概公式和贝叶斯公式全概公式和贝叶斯公式1.全概公式全概公式设n个事件 两两互斥,并有 ,说明n个事件两两互斥没有交集,并且组成了整个样本空间,满足这两个条件的事件组称为一个完
22、备事件组。 若 ,则对任意事件B,有:我们把事件 看作是引起事件B发生的所有可能原因,事件B 能且只能在原有 之一发生的条件下发生,求事件B 的概率就是上面的全概公式 全概公式全概公式(实例)(实例)(实例)(实例)【例例例例】某某车车间间用用甲甲、乙乙、丙丙三三台台机机床床进进行行生生产产,各各种种机机床床的的次次品品率率分分别别为为5%5%、4%4%、2%2%,它它们们各各自自的的产产品品分分别别占占总总产产量量的的25%25%、35%35%、40%40%,将将它它们们的的产产品品组组合合在在一一起起,求求任任取取一一个是次品的概率。个是次品的概率。 解解解解:设设 A A1 1表表示示“
23、 “产产品品来来自自甲甲台台机机床床” ”, A A2 2表表示示“ “产产品品来来自自乙乙台台机机床床” ”, A A3 3表表示示“ “产产品品来来自自丙丙台台机机床床” ”, B B表表示示“ “取取到到次品次品” ”。根据全概公式有。根据全概公式有1.2.5 1.2.5 全概公式和贝叶斯公式全概公式和贝叶斯公式2.2.贝叶斯公式贝叶斯公式贝叶斯公式与全概率公式要解决的问题正好相反。它是在条件概率的基础上寻找事件发生的原因在条件概率的基础上寻找事件发生的原因(或事件是在什么条件下发生的)。贝叶斯公式也称作逆概公式逆概公式。 设n个事件 两两互斥,并有 就是贝叶斯公式(逆概公式),它是基于
24、事件B已发生的结果,推导事件B是在 情况下发生的概率。1.2.5 1.2.5 全概公式和贝叶斯公式全概公式和贝叶斯公式进一步有: 已知事件B发生了,未知(想去知道)的是事件B是在什么情况下发生,这可以通过计算逆概率来做出判断。 贝叶斯公式贝叶斯公式(实例)(实例)(实例)(实例)【例例例例】某某车车间间用用甲甲、乙乙、丙丙三三台台机机床床进进行行生生产产,各各种种机机床床的的次次品品率率分分别别为为5%5%、4%4%、2%2%,它它们们各各自自的的产产品品分分别别占占总总产产量量的的25%25%、35%35%、40%40%,将将它它们们的的产产品品组组合合在在一一起起,如如果果取取到到的的一件
25、产品是次品,分别求这一产品是甲、乙、丙生产的概率一件产品是次品,分别求这一产品是甲、乙、丙生产的概率 解解解解:设设 A A1 1表表示示“ “产产品品来来自自甲甲台台机机床床” ”, A A2 2表表示示“ “产产品品来来自自乙乙台台机机床床” ”, A A3 3表表示示“ “产产品品来来自自丙丙台台机机床床” ”, B B表表示示“ “取取到到次品次品” ”。根据贝叶斯公式有:。根据贝叶斯公式有:1.3 1.3 概率分布概率分布概率分布指的是随机变量的概率分布。对离散变量,列出其所有可能的取值以及随机变量取这些值的概率,便构成了离散变量的概率分布。对连续变量,可计算某段(区间)取值的概率(
26、或概率密度),相应地便构成了连续变量的概率分布。 随机变量的概念随机变量的概念1.一次试验的结果的数值性描述2.一般用 X、Y、Z 来表示3.例如: 投掷两枚硬币出现正面的数量4.根据取值情况的不同分为离散型随机变量和连续型随机变量离散型随机变量离散型随机变量1.随机变量 X 取有限个值或所有取值都可以逐个列举出来 X1 , X2,2.以确定的概率取这些不同的值3.离散型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽抽查查100个个产品产品一家餐馆营业一天一家餐馆营业一天电脑公司一个月的销售电脑公司一个月的销售销售一辆汽车销售一辆汽车取到次品的个数取到次品的个数顾顾客数客数销
27、销售量售量顾顾客性客性别别0,1,2, ,1000,1,2, 0,1, 2,男性男性为为0,女性女性为为1连续型随机变量连续型随机变量1.随机变量 X 取无限个值2.所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点3.连续型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽抽查查一批一批电电子元件子元件新建一座住宅楼新建一座住宅楼测量一个产品的测量一个产品的长长度度使用寿命使用寿命(小小时时)半年后工程完成的百分比半年后工程完成的百分比测测量量误误差差(cm)X 00 X 100X 02 2 离散变量的概率分布离散变量的概率分布首先看离散型随机变量的概率分布。为得到
28、离散型随机变量X的概率分布,通常需要列出X的所有可能取值,以及X取这些值的概率。用下面的表格来表示: 2 2 离散变量的概率分布离散变量的概率分布1.列出离散型随机变量X的所有可能取值2.列出随机变量取这些值的概率3.通常用下面的表格来表示X = xix1 ,x2 , ,xnP(X =xi)=pip1 ,p2 , ,pn4. P(X =xi)=pi称为离散型随机变量的概率函数pi00离散型随机变量的概率分布离散型随机变量的概率分布(实例)实例)实例)实例)【例例】如规定打靶中域得3分,中域得2分,中域得1分,中域外得0分。今某射手每100次射击,平均有30次中域,55次中域,10次中,5次中域
29、外。则考察每次射击得分为0,1,2,3这一离散型随机变量,其概率分布为X = xi0 1 2 3P(X=xi) pi0.05 0.10 0.55 0.30离散型随机变量的数学期望离散型随机变量的数学期望1.在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和2.描述离散型随机变量取值的集中程度3.计算公式为离散型随机变量的方差离散型随机变量的方差1.随机变量X的每一个取值与期望值的离差平方和的数学期望,记为V(X)2.描述离散型随机变量取值的分散程度3.计算公式为离散型随机变量的方差离散型随机变量的方差(实例)实例)实例)实例)【例例例例】投投掷掷一一枚枚骰
30、骰子子,出出现现的的点点数数是是个个离离散散型型随随机机变量,其概率分布为如下。计算数学期望和方差变量,其概率分布为如下。计算数学期望和方差X = xi1 2 3 4 5 6P(X =xi)=pi1/6 1/6 1/6 1/6 1/6 1/6解:解:解:解:数学期望为数学期望为:方差为:方差为:2 2 离散变量的概率分布离散变量的概率分布几种主要的离散变量概率分布几种主要的离散变量概率分布2.1 2.1 均匀分布均匀分布2.2 0-12.2 0-1分布分布 2.3 2.3 二项分布二项分布2.4 2.4 泊松分布泊松分布 2.1 2.1 均匀分布均匀分布当离散型随机变量X的所有可能取值的概率相
31、同,即 都相同,则X服从均匀分布。设所有可能的取值个数为n,则对于服从均匀分布的离散型随机变量X,有:均匀分布实例均匀分布实例【例例例例】投投掷掷一一枚枚骰骰子子,出出现现的的点点数数是是个个离离散散型型随随机机变量,其概率分布为变量,其概率分布为X = xi1 2 3 4 5 6P(X=xi)=pi1/6 1/6 1/6 1/6 1/6 1/6 1/61/61/61/6P P( (x x) )1 1 1 1x x2 2 2 23 3 3 34 4 4 45 5 5 56 6 6 6伯努利试验伯努利试验( 0-10-10-10-1分布分布分布分布、二项分布二项分布)1.0-1分布、二项分布与伯
32、努利试验有关2.伯努利试验具有如下属性试验包含了n 个相同的试验每次试验只有两个可能的结果,即“成功”和“失败”出现“成功”的概率 p 对每次试验结果是相同的;“失败”的概率 q 也相同,且 p + q = 1试验是相互独立的试验“成功”或“失败”可以计数2.2 0-12.2 0-12.2 0-12.2 0-1分布分布分布分布 当离散型随机变量X的只有两个可能的取值,并且其中一个赋值为1,另一个赋值为0,则X服从0-1分布。例如,男性用 1表示,女性用0表示;合格品用 1 表示,不合格品用0表示设取1的概率为 ,则取0的概率对于服从0-1分布的离散型随机变量X,有:2.2 2.2 0 01 1
33、分布分布( (实例实例实例实例) ) ) )【例例例例】已已知知一一批批产产品品的的次次品品率率为为p p0.050.05,合合格格率率为为q q=1-=1-p p=1-0.5=0.95=1-0.5=0.95。并并指指定定废废品品用用1 1表表示示,合合格格品品用用0 0表表示示。则则任任取取一一件件为为废废品品或或合合格格品品这这一一离离散散型型随机变量,其概率分布为随机变量,其概率分布为X = xi0 1P(X=xi)=pi0.05 0.95.5.5.5.5 1 1 1 11 1 1 1x xP P( (x x) )2.3 2.3 二项分布二项分布二项分布研究的是类型变量,并且类型只能够表
34、现为两种形式,这与0-1分布一致。二项分布其实是多个0-1分布的结合。0-1分布是一次实验,二项分布则是多次试验。二项分布的多次试验中,每次试验都是独立于其他试验的,试验之间也不会互相影响。 2.3 2.3 二项分布二项分布设成功的概率为p,则失败的概率为q=1-p。试验的总次数为n,则n次试验中成功的次数X服从二项分布。记作:设X为 n 次重复试验中事件A出现的次数,X 取 x 的概率为2.32.3 二项分布二项分布1.显然, 对于PX=x 0, x =1,2,n,有2.同样有3.当 n = 1 时,二项分布化简为2.3 2.3 二项分布二项分布二项分布随机变量的期望和方差为: 2.32.3
35、 二项分布二项分布(实例)(实例)(实例)(实例)【例例】已知100件产品中有5件次品,现从中任取一件,有放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的概率 解解:设 X 为所抽取的3件产品中的次品数,则XB ( 3 , 0.05),根据二项分布公式有 2.4 2.4 泊松分布泊松分布泊松分布泊松分布 n很大而p很小时二项分布的极限形式叫做泊松分布。设参数 ,代表某结果出现次数的期望,若试验总次数为n,某结果每次出现的概率为p,当n很大而p很小时, 。某结果出现的次数X在服从泊松分布的情况下,X的取值为 ,有 给定的时间间隔、长度、面积、体积内“成功”的平均数e = 2.71828 x
36、 给定的时间间隔、长度、面积、体积内“成功”的次数2.4 2.4 泊松分布泊松分布泊松分布随机变量的期望和方差为: 2.42.4 泊松分布泊松分布(实例)(实例)(实例)(实例)【例例例例】假假定定某某企企业业的的职职工工中中在在周周一一请请假假的的人人数数X X服服从从泊泊松松分分布布,且且设设周周一一请请事事假假的的平平均均人人数数为为2.52.5人。求人。求 (1 1)X X 的均值及标准差的均值及标准差 (2 2)在给定的某周一正好请事假是)在给定的某周一正好请事假是5 5人的概率人的概率 解解解解:(1) (1) E E( (X X)=)= =2.5=2.5;D D( (X X) =
37、 ) = 2.5=1.5812.5=1.581 (2) (2)2.4 2.4 泊松分布泊松分布(作为二项分布的近似)(作为二项分布的近似)(作为二项分布的近似)(作为二项分布的近似)1.当试验的次数 n 很大,成功的概率 p 很小时,可用泊松分布来近似地计算二项分布的概率,即2.实际应用中,当 P0.25,n20,np5时,近似效果良好3 3 连续变量的概率分布连续变量的概率分布1.连续型随机变量可以取某一区间或整个实数轴上的任意一个值2.它取任何一个特定的值的概率都等于03.不能列出每一个值及其相应的概率4.通常研究它取某一区间值的概率5.用数学函数的形式和分布函数的形式来描述概率密度函数概
38、率密度函数1.设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件2. f(x)不是概率概率密度函数概率密度函数 密度函数 f(x)表示X 的所有取值 x 及其频数f(x)值值( (值值, , 频数频数) )频数频数f f( (x x) )a ab bx x概率密度函数概率密度函数 在平面直角坐标系中画出f(x)的图形,则对于任何实数 a b,P(a X b)是该曲线下从a 到 b的面积f(x)xab概率是曲线下的面积分布函数分布函数1.连续型随机变量的概率也可以用分布函数F(x)来表示2.分布函数定义为3.根据分布函数,P(aXb)可以写为分布函数与密度函数的关系
39、分布函数与密度函数的关系1.密度函数曲线下的面积等于12.分布函数是曲线下小于 x0 的面积f(x)xx0F F ( ( x x0 0 ) )连续型随机变量的期望和方差连续型随机变量的期望和方差1.连续型随机变量的数学期望为2.方差为3 3 连续变量的概率分布连续变量的概率分布几种主要的连续变量的概率分布几种主要的连续变量的概率分布3.1 3.1 均匀分布均匀分布3.2 3.2 正态分布正态分布 3.3 3.3 正态分布衍生的几个重要分布正态分布衍生的几个重要分布3.1 3.1 均匀分布均匀分布当连续型随机变量X的概率密度值为常数,即 都相同,则X服从均匀分布。设所有可能的取值从a到b,由 ,
40、得X的概率密度函数为:称X服从在区间 的均匀分布。 xf(x)ba3.1 3.1 均匀分布均匀分布分布函数为:数学期望和方差为: 3.2 3.2 正态分布正态分布正态(正态(normalnormal)分布)分布是描述连续型随机变量最重要的分布。服从正态分布的随机变量X,其概率密度函数为:分布函数为:其中, 为均值, 为标准差, , 。 正态分布的重要性正态分布的重要性1. 正态(正态(normalnormal)分布)分布: :描述连续型随机变量的最重要的分布2. 可用于近似离散型随机变量的分布例如: 二项分布3. 经典统计推断的基础x xf f ( (x x) )概率密度函数概率密度函数f(x
41、) = 随机变量 X 的频数 = 总体方差 =3.14159; e = 2.71828x = 随机变量的取值 (- x ) = 总体均值3.2 3.2 正态分布正态分布若随机变量X服从期望为方差为的正态分布,记作:只要有均值 与标准差 ,就可以构成一个正态分布。因此,每一对均值和标准差就有一个正态分布。并有:3.2 3.2 正态分布正态分布特征特征(1)每一对与都可以形成一条曲线,这意味着正态曲线可以看成是一族曲线,在编制曲线时需要并且只需要与2。(2)曲线为钟形,而且对称。 期望期望为变量取值的中间点和对称为变量取值的中间点和对称点。方差点。方差2 2反映了变量的离散程度,反映了变量的离散程
42、度,2越小曲线越尖,2越大曲线越扁平。(3)在正态分布中,变量的均值、中位数Me和众数Mo都是相等相等的。(4)概率密度值在对称点概率密度值在对称点取到最大值取到最大值,越往两边值越小,直至无限趋近于0,在理论上永不相交。(5)正态分布的随机变量,大部分取值在中间点附近,极大极小值的个数都较少。实际上几乎所有的数值位于均值加减三个标准差之间,也就是说全距离为6。(6)曲线下总面积为1。曲线从对称点往右或往左的面积都是0.5。 和和 对对正态曲线的影响正态曲线的影响xf(x)CAB正态分布的概率正态分布的概率概率是曲线下的概率是曲线下的面积面积! !a ab bx xf f( (x x) )标准
43、正态分布的重要性标准正态分布的重要性1.一般的正态分布取决于均值和标准差 2.计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的3.若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表3.2 3.2 正态分布正态分布为了得到更加一般意义和标准的正态分布,我们可以采取标准化处理,把所有均值为 方差为 的正态分布,都转化为均值为0方差为1的正态分布,即通过线性变换的标准化处理,把正态分布转化为标准正态分布。设 ,标准化处理为:并有: 标准正态分布标准正态分布x 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布 11Z标准正态分布标准正态
44、分布标准正态分布标准正态分布标准正态分布标准正态分布 3.2 3.2 正态分布正态分布便得到了服从标准正态分布的Z变量,有:Z变量的概率密度函数为:Z变量的分布函数为:标准正态分布的概率密度函数和分布函数是唯一的。概率密度函数 一般用 表示,分布函数 一般用 表示。 3.2 3.2 正态分布正态分布对于一般的正态分布 ,有: 3.2 3.2 正态分布正态分布标准正态分布表的注意事项有:标准正态分布表的注意事项有: (1)标准化处理为(2)查标准正态分布表即得概率 。其中 , (3)对于负的z,可由 得到。(4)(5)标准化的例子标准化的例子P P(5 (5 X X 6.2) 6.2) x 55
45、 11一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布6.2 11Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 0.12.0478.0478.0478标准化的例子标准化的例子P P(2.9 (2.9 X X 7.1) 7.1) 一般正态分布一般正态分布一般正态分布一般正态分布.1664.1664.1664.0832.0832.0832.0832标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布正态分布正态分布(实例)(实例)(实例)(实例)【例例例例】设设X X N N(0(0,1)1),求以下概率:求以下概率: (1
46、) (1) P P( (X X 1.5) 2)2); (3) (3) P P(-1(-1X X 3) 3) ; (4) (4) P P(| (| X X | | 2)2) 解解解解:(1) (1) P P( (X X 1.5) = 2)=1- 2)=1- P P(2 (2 X X)=1-0.9973=0.0227)=1-0.9973=0.0227 (3) (3) P P(-1(-1X X 3)= 3)= P P( (X X 3)- 3)- P P( (X X -1)-1) = = (3)- (3)- (-1)= (-1)= (3) 1-(3) 1-(1)(1) = 0.9987-(1-0.84
47、13)=0.8354 = 0.9987-(1-0.8413)=0.8354 (4) (4) P P(| (| X X | | 2) = 2) = P P(-2(-2 X X | | 2)= 2)= (2)- (2)- (-2)(-2) = = (2)- 1-(2)- 1-(2)=2 (2)=2 (2)- 1=0.9545(2)- 1=0.9545正态分布正态分布(实例)(实例)(实例)(实例)【例例例例】设设X X N N(5(5,3 32 2) ),求以下概率求以下概率 (1) (1) P P( (X X 10) 10) ; (2) (2) P P(2(2X X 1010) ) 解解解解:
48、(1) (1) (2)(2)二项分布的正态近似二项分布的正态近似*1.当n 很大时,二项随机变量X近似服从正态分布Nnp , np(1-p)2.对于一个二项随机变量X,当n很大时,求 P(x1Xx2)时可用正态分布近似为为什么概率是近似的为什么概率是近似的*.0.1.2.30246810xP(x)正态曲线增加的概率正态曲线增加的概率 正态曲线减少的概率正态曲线减少的概率 二项概率:矩形的面积二项概率:矩形的面积正态概率:曲线下正态概率:曲线下从从3.53.5到到4.54.5的面积的面积增加的部分与减少增加的部分与减少增加的部分与减少的部分不一定相等的部分不一定相等的部分不一定相等3.3 3.3
49、 正态分布衍生的几个重要分布正态分布衍生的几个重要分布正态分布衍生的几个重要分布正态分布衍生的几个重要分布 *3.3.1 3.3.1 卡方分布卡方分布 常应用于拟合优度检验中。设 个随机变量 相互独立,且都服从标准正态分布 ,则它们的平方和服从自由度为 的卡方分布。记作: 卡方分布的期望为: 卡方分布的方差为: 卡方分布具有可加性 即 若 , ,且 与 独立,则:3.3 3.3 正态分布衍生的几个重要分布正态分布衍生的几个重要分布*3.3.2 t3.3.2 t分布分布t分布与正态分布相似,但适用于小样本中。设随机变量 服从标准正态分布,即 ,随机变量 服从自由度为 的卡方分布,即 ,且 与 独
50、立,则随机变量 服从自由度为 的 分布。记作: t分布的自由度越大,则该t分布的曲线就越接近标准正态分布。 当自由度大于30时,很难看出t分布与标准正态分布的差别。 当自由度大于50时,两者几乎完全相同。3.3 3.3 正态分布衍生的几个重要分布正态分布衍生的几个重要分布*当 时,t分布的期望为:当 时,t分布的方差为:关于t分布,还有一种较复杂的情况。设 个随机变量 相互独立,且都服从正态分布 ,得到 , 则随机变量 服从自由度为 的 分布。记作:3.3 3.3 正态分布衍生的几个重要分布正态分布衍生的几个重要分布*3.3.3 F3.3.3 F分布分布 设随机变量 和 分别服从自由度为 和
51、的卡方分布,且 与 独立,则随机变量 服从自由度为 的F分布。记作: F分布有两个自由度,第一自由度即为分子卡方分布的自由度,第二 自由度即为分母中卡方分布的自由度。 当 时,F分布的期望为: 当 时,F分布的方差为:4 4 抽样分布抽样分布4.1 4.1 统计量统计量 4.2 4.2 样本均值的抽样分布样本均值的抽样分布 4.3 4.3 中心极限定理中心极限定理4.1 4.1 统计量统计量 设 是从总体中抽取的容量从总体中抽取的容量 为的一个样本为的一个样本,根据样本构造一个函数 ,该函数便是一个统计量,也称为样本统计量。当调查得到样本数据的值 时,代入 ,计算出 的数值,就得到了一个具体的
52、统计量值。在这里,大写的 表示变量,小写的 表示变量的具体取值,相应的, 表示统计量,而 则表示统计量的一个具体结果。4.1 4.1 统计量统计量设 是从总体中抽取得到一个样本,则:样本均值为样本方差为样本均值和方差是最常见的统计量。4.2 4.2 样本均值的抽样分布样本均值的抽样分布设总体 服从正态分布 , 为 个互相独立且与总体同分布的随机变量,则样本均值 服从期望为 ,方差为 的正态分布。记作: 上面的结果表明,样本均值的期望与总体均值相同,而方差则变为原来的 ,这说明用样本均值去估计总体均值,平均来说没有偏差(因为期望相等),当样本量 增加时,样本均值的方差变小,即用样本均值 估计总体
53、均值 会更加精确。4.3 4.3 中心极限定理中心极限定理设总体 的分布未知,但已知均值为 ,方差为 ,抽取得到一个容量为 的样本,当 足够大(我们通常要求 )时,则样本均值近似服从期望为 ,方差为 的正态分布。中心极限定理中心极限定理告诉我们:不管总体服从什么样的分布,只要样本量足够大,样本均值都近似服从正态分布。本章小结本章小结1.定义试验、结果、事件、样本空间、概率定义试验、结果、事件、样本空间、概率2.描述和使用概率的运算法则描述和使用概率的运算法则3.定义和解释随机变量及其分布定义和解释随机变量及其分布4.计算随机变量的数学期望和方差计算随机变量的数学期望和方差5.计算离散型随机变量的概率和概率分布计算离散型随机变量的概率和概率分布6.计算连续型随机变量的概率计算连续型随机变量的概率7.用正态分布近似二项分布用正态分布近似二项分布8.8.抽样分布抽样分布结结 束束