《概率与数理统计21》由会员分享,可在线阅读,更多相关《概率与数理统计21(75页珍藏版)》请在金锄头文库上搜索。
1、概概 率率 论论 与与 数数 理理 统统 计计随机变量离散型随机变量连续型随机变量概率分布函数随机变量函数的分布第二章 随机变量及其分布概概 率率 论论 与与 数数 理理 统统 计计1.1 随机变量一随机变量的概念 为了更深入地研究随机现象, 就要建立数学模型,随机变量是随机现象的最基本的数学模型. 引入了随机变量,我们就可以用随机变量的值表示随机试验的结果概概 率率 论论 与与 数数 理理 统统 计计 在实际问题中,随机试验的结果可以用在实际问题中,随机试验的结果可以用数量来表示,由此引入了随机变量的概念数量来表示,由此引入了随机变量的概念 1 1、有些试验结果本身与数值有关(本身、有些试验
2、结果本身与数值有关(本身就是一个数)就是一个数)例如例如 掷一颗骰子,观察出现的点数;掷一颗骰子,观察出现的点数; 观察某天从北京下火车的人数;观察某天从北京下火车的人数; 观察昆虫的产卵数观察昆虫的产卵数概概 率率 论论 与与 数数 理理 统统 计计 2 2、此外,还有些试验结果看来与数值无、此外,还有些试验结果看来与数值无关,但我们可以引进一个变量来表示它的各关,但我们可以引进一个变量来表示它的各种结果种结果. . 也就是说,可以也就是说,可以将试验结果数值化将试验结果数值化 正如正如裁判员在运动场裁判员在运动场上不叫运动员的名字而叫上不叫运动员的名字而叫运动员的运动员的号码一样,二者号码
3、一样,二者之间建立了一种对应关系之间建立了一种对应关系. . 这种对应关系在数学上理这种对应关系在数学上理解为定义了一种实值函数解为定义了一种实值函数 概概 率率 论论 与与 数数 理理 统统 计计例例1 1 掷一颗骰子掷一颗骰子, , 样本空间是样本空间是用用X 表示掷出的点数表示掷出的点数, , 称称X 是随机变量是随机变量表示掷出的点数不超过表示掷出的点数不超过3是事件是事件并且并且再看两个例子再看两个例子概概 率率 论论 与与 数数 理理 统统 计计将将X 视为视为 上的函数上的函数则则是事件是事件例例1 1(续)(续)概概 率率 论论 与与 数数 理理 统统 计计例例2 2 在一副扑
4、克的在一副扑克的52 张中任取一张张中任取一张 样本空间的每个样本点表示一张扑克样本空间的每个样本点表示一张扑克用用X 表示所取扑克的大小表示所取扑克的大小称称X 是随机变量是随机变量表示所取到的扑克是表示所取到的扑克是3 概概 率率 论论 与与 数数 理理 统统 计计=草花草花3, 黑桃黑桃3, 红桃红桃3, 方块方块3 是事件是事件将将X 视为样本空间上的函数视为样本空间上的函数则则例例2 2(续)(续)概概 率率 论论 与与 数数 理理 统统 计计 可以看出,上述随机试验的每一个结果都对应着变量X 的一个确定的取值,因此变量X 是样本空间 上的实值函数: 并且定义了随机变量后,就可以用随
5、机变量的取值情况来刻划随机事件W W概概 率率 论论 与与 数数 理理 统统 计计 由此看到,随机试验的结果可以用数量来表示,因此引入随机变量的概念定义定义1.11.1通常将随机变量通常将随机变量 简记为简记为X 一般用一般用X,Y,Z, 等表示随机变量等表示随机变量 随机变量随机变量X 是定义在样本空间是定义在样本空间 上的上的 实值函数实值函数: : 对每一个样本点对每一个样本点 一个实数一个实数, 是是 概概 率率 论论 与与 数数 理理 统统 计计 1 1、 随机变量随机变量X 随试验结果的不同而取不随试验结果的不同而取不同的值,因而在试验之前只知道它可能取值同的值,因而在试验之前只知
6、道它可能取值的范围,而不能预先肯定它将取哪个值的范围,而不能预先肯定它将取哪个值 2 2、 由于试验结果的出现具有一定的概率,由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确定范围内于是这种实值函数取每个值和每个确定范围内的值也有一定的概率的值也有一定的概率说 明概概 率率 论论 与与 数数 理理 统统 计计说 明3 3、我们用我们用 表示事件表示事件 表示事件表示事件 对于实数的集合对于实数的集合A, ,我们用我们用 即即概概 率率 论论 与与 数数 理理 统统 计计 4 4、 在许多实际问题中在许多实际问题中, , 一个随机变量一个随机变量X 的的含义是十分清楚的含义是十
7、分清楚的, , 所以一般不再关心随机变所以一般不再关心随机变量量X 在样本空间在样本空间上是如何定义的上是如何定义的. 可以认为可以认为X的所有取值就是我们的样本空间的所有取值就是我们的样本空间. 只是在必要只是在必要的时候才将自变元的时候才将自变元 写出来写出来说 明概概 率率 论论 与与 数数 理理 统统 计计 引入了随机变量引入了随机变量, , 随机试验中的各种事件,随机试验中的各种事件,就可以通过随机变量的关系式表达出来就可以通过随机变量的关系式表达出来 可见,随机事件这个概念实际上是包容在可见,随机事件这个概念实际上是包容在随机变量这个更广的概念内随机变量这个更广的概念内. . 也可
8、以说,也可以说,随机随机事件是从静态的观点来研究随机现象,而随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点变量则是一种动态的观点. . 就象数学分析中常就象数学分析中常量与变量的区别那样量与变量的区别那样二随机变量的意义概概 率率 论论 与与 数数 理理 统统 计计 随机变量概念的产生是概率论发展史上的随机变量概念的产生是概率论发展史上的重大事件重大事件. . 引入随机变量后,对随机现象统计引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究大为对随机变量及其取值规律的研究概概 率率
9、论论 与与 数数 理理 统统 计计 例3 一批产品有50 件,其中有8件次品,42 件正品,现从中取出 6 件 X 表示取出6 件产品中的次品数 则X 就是一个随机变量 它的取值为 0,1,2,6表示取出的产品全是正品这一随机事件 表示取出的产品至少有一件是次品这一随机事件概概 率率 论论 与与 数数 理理 统统 计计 例4 上午 8:009:00 在某路口观察 Y 表示该时间间隔内通过的汽车数 则Y 就是一个随机变量 它的取值为 0,1,表示通过的汽车数小于100辆这一随机事件注意 Y 的取值是可列无穷个!表示通过的汽车数大于50 辆但不超过100辆这一随机事件概概 率率 论论 与与 数数
10、理理 统统 计计 例5 观察某生物的寿命(单位:小时) Z 表示该生物的寿命 则Z 就是一个随机变量 它的取值为所有非负实数表示该生物的寿命大于 3000小时这一随机事件表示该生物的寿命不超过1500小时这一随机事件注意注意 Z 的取值是的取值是不可列无穷个不可列无穷个概概 率率 论论 与与 数数 理理 统统 计计例6 掷一枚硬币,令则X 是一个随机变量注意在同一个样本空间上可以定义不同的随机变量概概 率率 论论 与与 数数 理理 统统 计计 例7 掷一枚骰子,在例1中,我们定义了随机变量 X 表示出现的点数.我们还可以定义其它的随机变量,例如我们可以定义等等概概 率率 论论 与与 数数 理理
11、 统统 计计一. 离散型随机变量的概念与性质2.2 2.2 离散型随机变量离散型随机变量 有些随机变量只能取有些随机变量只能取有限个有限个或或可列个可列个值值,比如,被访问者的性别、年龄、职业比如,被访问者的性别、年龄、职业; ; 一批一批产品中次品个数产品中次品个数; ; 一个医学试样中白细胞个一个医学试样中白细胞个数数; ; 掷两个骰子第一次得到掷两个骰子第一次得到12点的次数点的次数; ;等等等等 概概 率率 论论 与与 数数 理理 统统 计计定义定义 2.12.1如果随机变量如果随机变量 X 只取有限个值只取有限个值或可列个值或可列个值则称则称 X 是是离散型随机变量离散型随机变量,
12、,简称为简称为离散随机离散随机变量变量离散型随机变量的定义离散型随机变量的定义概概 率率 论论 与与 数数 理理 统统 计计设X 是离散型随机变量,称离散型随机变量的概率分布离散型随机变量的概率分布定义定义 2.22.2为为X 的的概率分布概率分布; ; 称称 是是概率分布列概率分布列, , 简称为简称为分布列分布列 概概 率率 论论 与与 数数 理理 统统 计计离散型随机变量的离散型随机变量的概率分布概率分布也常常用也常常用如下方式表达如下方式表达概概 率率 论论 与与 数数 理理 统统 计计说 明 离散型随机变量可完全由其分布列来刻划. 即离散型随机变量可完全由其可能取值以及取这些值的概率
13、唯一确定分布列具有如下性质用这两条性质判断用这两条性质判断一个函数是否是一个函数是否是概率分布概率分布概概 率率 论论 与与 数数 理理 统统 计计例1 从110这10个数字中随机取出5个数字,X 表示取出的5个数字中的最大值. 试求X 的分布列即 X 的分布列为解: X 的取值为5,6,7,8,9,10. 并且概概 率率 论论 与与 数数 理理 统统 计计例2 将 1枚硬币掷 3次,X 表示出现的正面次数与反面次数之差. 试求X 的分布列解: X 的取值为-3,-1,1,3则 X 的分布列为概概 率率 论论 与与 数数 理理 统统 计计例3 设离散型随机变量 X 的分布列为 则概概 率率 论
14、论 与与 数数 理理 统统 计计例3(续)概概 率率 论论 与与 数数 理理 统统 计计例4 设随机变量 X 的分布列为解: 由分布列的性质,得该级数为等比级数,故有所以试求常数c概概 率率 论论 与与 数数 理理 统统 计计例例5 5 设一汽车在开往目的地的道路上需经过四设一汽车在开往目的地的道路上需经过四盏信号灯,每盏信号灯以盏信号灯,每盏信号灯以 1/2 的概率允许或禁的概率允许或禁止汽车通过止汽车通过. . 以以X 表示汽车首次停下时,它已表示汽车首次停下时,它已通过的信号灯的盏数,求通过的信号灯的盏数,求 X 的分布列的分布列. (. (信号信号灯的工作是相互独立的灯的工作是相互独立
15、的) )PX=3=(1-p)3p概概 率率 论论 与与 数数 理理 统统 计计解解: : 以以 p 表示每盏信号灯禁止汽车通过的表示每盏信号灯禁止汽车通过的 概率,则概率,则 X 的分布列为的分布列为 0 1 2 3 4 Xpk p (1-p)p (1-p)2p (1-p)3p (1-p)4 或写成或写成 PX= k = (1- p)k p, k = 0,1,2,3 PX= 4 = (1-p)4 例例5 (5 (续续) )概概 率率 论论 与与 数数 理理 统统 计计以以 p = 1/2 代入,得代入,得Xpk 0 1 2 3 4 0.5 0.25 0.125 0.0625 0.0625例例5
16、 (5 (续续) )概概 率率 论论 与与 数数 理理 统统 计计二. 几种常用的离散型随机变量如果X 只取 0或 1,概率分布是或 则称随机变量 X 服从参数为 p的两点分布 1.两点分布 (Bernoulli分布) 记作 概概 率率 论论 与与 数数 理理 统统 计计两点分布的应用X 表示在一次试验中事件A 发生的次数令记则 任何一次试验,当只考虑两个互逆的结果A与 时,或者形象地把两个互逆结果叫做“成功”和“失败”.就可以用两点分布来描述概概 率率 论论 与与 数数 理理 统统 计计例6 15件产品中有4件次品,11件正品,从中任取1件.X 表示取出的一件产品中的次品数.则X 的取值为
17、0 或者 1,并且概概 率率 论论 与与 数数 理理 统统 计计如果随机变量 X 有如下的概率分布2.二项分布 (Binomial分布)则称则称X 服从服从参数为参数为 n和和 p的的二项分布二项分布, , 记作记作 概概 率率 论论 与与 数数 理理 统统 计计二项分布的二项分布的概率分布示意图概率分布示意图概概 率率 论论 与与 数数 理理 统统 计计说 明1.显然,当 n = 1 时此时,此时,X 服从两点分布服从两点分布这说明,两点分布是二项分布的一个特例这说明,两点分布是二项分布的一个特例第第k+1项项 2.2.称为二项分布的原因是称为二项分布的原因是 为为 二项展开式二项展开式概概
18、 率率 论论 与与 数数 理理 统统 计计二项分布的应用进行n重贝努里试验,设在每次试验中X 表示在 n 重贝努里试验中事件 A 发生的次数则概概 率率 论论 与与 数数 理理 统统 计计 一般地,设在一次试验中我们只考虑两个一般地,设在一次试验中我们只考虑两个互逆的结果互逆的结果 A或或 ,或者形象地把两个互逆结,或者形象地把两个互逆结果叫做果叫做“成功成功”和和“失败失败” 再设我们重复地进行再设我们重复地进行 n 次独立试验次独立试验 ( “( “重复重复” ” 是指这个试验中各次试验条件相同是指这个试验中各次试验条件相同 ) ) 每次试验成功的概率都是每次试验成功的概率都是 p,失败的
19、概率失败的概率都是都是 q = 1- p 这样的这样的n次独立重复试验次独立重复试验称作称作 n 重贝努里重贝努里试验试验,简称贝努里试验或,简称贝努里试验或贝努里概型贝努里概型n重贝努里试验重贝努里试验概概 率率 论论 与与 数数 理理 统统 计计 对同一目标进行 n 次射击,若每次射击只关心“击中目标”与“未击中目标” 两种情况n重贝努里试验的例子 掷 n 次硬币,只关心“出现正面”与“出现反面”这两种情况; 掷 n 颗骰子,如果我们对每颗骰子只关心“出现六点”与“不出现六点”这两种情况;概概 率率 论论 与与 数数 理理 统统 计计注注: : 贝努里概型对试验结果没有等可能的贝努里概型对
20、试验结果没有等可能的要求,但有下述要求要求,但有下述要求(1 1)每次试验条件相同;)每次试验条件相同;二项分布描述的是二项分布描述的是n重贝努里试验中出现重贝努里试验中出现“成功成功”次数次数 X 的概率分布的概率分布(2 2)每次试验只考虑两个互逆结果)每次试验只考虑两个互逆结果A或或 , 且且 P (A) = p , (3 3)各次试验相互独立)各次试验相互独立. .概概 率率 论论 与与 数数 理理 统统 计计设在n重贝努里试验中每一个样本点可记作现考虑事件现考虑事件n 重贝努里试验中事件重贝努里试验中事件A 恰好发生恰好发生k 次次,Bkn= =其中每一个 只取 A 或 ,个个( (
21、) ): :现求概率现求概率,knBP分析概概 率率 论论 与与 数数 理理 统统 计计在在 n 次试验中,指定次试验中,指定 k 次出现次出现 A( (成功成功) ),其余其余 n k 次出现次出现 ( (失败失败) ),这种指定的,这种指定的方法有方法有 种种 而对于每一种指定好的方法,有概概 率率 论论 与与 数数 理理 统统 计计 因此概概 率率 论论 与与 数数 理理 统统 计计 用用X 表示表示 n重贝努里试验中事件重贝努里试验中事件 A(成功)出现的次数成功)出现的次数,则,则称称X 服从参数为服从参数为 n和和 p的二项分布,记作的二项分布,记作 X B ( n , p )概概
22、 率率 论论 与与 数数 理理 统统 计计二项分布的图形二项分布的图形二项分布随机数二项分布随机数演示演示概概 率率 论论 与与 数数 理理 统统 计计例7 一张考卷上有5 道选择题,每道题列出4个可能答案,其中只有一个答案是正确的.某学生靠猜测至少能答对4 道题的概率是多少?则答 5 道题相当于做 5 重贝努里试验解: 每答一道题相当于做一次试验则令 X 表示该学生靠猜测能答对的题数概概 率率 论论 与与 数数 理理 统统 计计例7(续)所以P 至少能答对4 道题概概 率率 论论 与与 数数 理理 统统 计计2.泊松分布(Poisson 分布)如果随机变量 X 有如下的概率分布记作记作 其中
23、 是常数.则称X 服从参数是 的Poisson分布,概概 率率 论论 与与 数数 理理 统统 计计泊松分布的图形泊松分布的图形泊松分布随机数泊松分布随机数演示演示概概 率率 论论 与与 数数 理理 统统 计计泊松分布的应用电话总机在某一时间间隔内收到的呼叫次数;放射物在某一时间间隔内发射的粒子数;容器在某一时间间隔内产生的细菌数,等等.在一定条件下,都是服从Poisson分布的Poisson分布是概率论中重要的分布之一自然界及工程技术中的许多随机指标都服从Poisson分布,例如概概 率率 论论 与与 数数 理理 统统 计计例8 1910年, 著名科学家Rutherford(罗瑟福) 和 Ge
24、iger (盖克) 观察了放射性物质钋放射 粒子的情况他们进行了N=2608次观测, 每次观测7.5秒,一共观测到10094个 粒子放出,下面的表是观测记录概概 率率 论论 与与 数数 理理 统统 计计观测到的粒子数 k观测到k 个粒子的次数 发生的频率 0 570.0220.021 12030.0780.081 23830.1470.156 35250.2010.201 45320.2040.195 54080.1560.151 62730.1050.097 71390.0530.054 8 450.0170.026 9 270.0100.01110+ 160.0060.007 总计 260
25、8 0.999 1.00 概概 率率 论论 与与 数数 理理 统统 计计用用Y 表示这块放射性钋在表示这块放射性钋在7.5秒内放射出的秒内放射出的 粒子数粒子数 在在 N = 2608 次重复观测中发生的次重复观测中发生的频率频率和和 基本相同基本相同. . 见书见书p42图图表的最后两列表明表的最后两列表明, ,事件事件 其中的Y 是服从 分布的随机变量, 是7.5秒中放射出 粒子的平均数概概 率率 论论 与与 数数 理理 统统 计计 设在n重贝努里试验中,以 代表事件 A 在一次试验中发生的概率 ,它与试验总数n 有关. 若 Poisson定理则证明: 令则概概 率率 论论 与与 数数 理
26、理 统统 计计Poisson定理的证明(续)对于固定的 k,有得由概概 率率 论论 与与 数数 理理 统统 计计Poisson定理的证明(续)所以概概 率率 论论 与与 数数 理理 统统 计计Poisson定理的应用 二项分布与泊松分布关系 由 Poisson 定理,可知有令则当 n比较大,p 比较小时概概 率率 论论 与与 数数 理理 统统 计计上面我们提到上面我们提到单击图形播放单击图形播放/ /暂停暂停ESCESC键退出键退出二项二项分布分布 泊松分布泊松分布概概 率率 论论 与与 数数 理理 统统 计计例例9 9 为了保证设备正常工作,需配备适量的维为了保证设备正常工作,需配备适量的维
27、修工人,现有同类型设备修工人,现有同类型设备 300台,各台工作是台,各台工作是相互独立的,发生故障的概率都是相互独立的,发生故障的概率都是 0.01. . 在通在通常情况下,一台设备的故障可有一人来处理常情况下,一台设备的故障可有一人来处理. . 问至少需配备多少工人,才能保证当设备发生问至少需配备多少工人,才能保证当设备发生故障但不能及时维修的概率小于故障但不能及时维修的概率小于0.01 ?解解: : 设需配备设需配备 N 人,记同一时刻发生故障的人,记同一时刻发生故障的 设备台数为设备台数为X, 则则 X B ( 300,0.01) 欲确定最小的欲确定最小的 N 的取值,使得的取值,使得
28、概概 率率 论论 与与 数数 理理 统统 计计查表可知,满足上式的最小的查表可知,满足上式的最小的 N是是 8, , 因此因此至少需配备至少需配备 8 个工人个工人例例9 (9 (续续) )概概 率率 论论 与与 数数 理理 统统 计计例例1010 设有设有 80 台同类型的设备,各台工作是台同类型的设备,各台工作是相互独立的,发生故障的概率都是相互独立的,发生故障的概率都是 0.01,且,且一台设备的故障能由一个人处理。考虑两种一台设备的故障能由一个人处理。考虑两种配备维修工人的方法配备维修工人的方法: :其一,由其一,由 4人维护,每人负责人维护,每人负责 20 台台其二,由其二,由 3
29、人,共同维护人,共同维护 80 台台试比较这两种方法试比较这两种方法在设备发生故障时不能及在设备发生故障时不能及时维修的概率的大小时维修的概率的大小概概 率率 论论 与与 数数 理理 统统 计计 解解: : 按第一种方法按第一种方法. . 以以 X 记记“第第1人负责人负责 的的20台中同一时刻发生故障的台数台中同一时刻发生故障的台数” 则则 X B ( 20,0.01)以以 Ai 表示事件表示事件 “ “第第 i 人负责的台中人负责的台中发生故障不能及时维修发生故障不能及时维修”则则 80 台中发生故障而不能及时维修台中发生故障而不能及时维修的概率为的概率为例例10 (10 (续续) )概概
30、 率率 论论 与与 数数 理理 统统 计计按第二种方法按第二种方法. . 以以 Y 记记 80 台中同一台中同一时刻发生故障的台数时刻发生故障的台数则则 Y B ( 80 , 0.01)故故 80 台中发生故障而不能及时维修的台中发生故障而不能及时维修的概率为概率为第二种方法中发生故障而不能及时维修第二种方法中发生故障而不能及时维修的概率小,且维修工人减少一人。的概率小,且维修工人减少一人。运用运用概率论讨论国民经济问题,可以有效地概率论讨论国民经济问题,可以有效地使用人力、物力资源使用人力、物力资源例例10 (10 (续续) )概概 率率 论论 与与 数数 理理 统统 计计解: 随机变量 X
31、 的分布律为由已知 试求试求 例11 设随机变量X 服从参数为 的Poisson分布, 且已知概概 率率 论论 与与 数数 理理 统统 计计例11(续)得由此得方程得解所以(另一个解 不合题意,舍去) 概概 率率 论论 与与 数数 理理 统统 计计4.超几何分布(Hypergeometric分布)H(n, M, N)如果随机变量 X 有如下的概率分布则称则称 X 服从超几何分布服从超几何分布记作记作 概概 率率 论论 与与 数数 理理 统统 计计超几何分布的应用 一批产品有 N 件,其中有 M 件次品,其余 N-M件为正品现从中取出 n 件, X 表示取出 n 件产品中的次品数 则 X 的分布
32、列为概概 率率 论论 与与 数数 理理 统统 计计如果随机变量 X 有如下的概率分布5.几何分布(Geometric分布)则称则称 X 服从参数是服从参数是 p 的几何分布的几何分布概概 率率 论论 与与 数数 理理 统统 计计几何分布的应用 设某试验成功概率为设某试验成功概率为 p,独立地重复独立地重复此试验此试验直到第一次成功直到第一次成功,则第一次成功需,则第一次成功需要的试验次数分布为参数要的试验次数分布为参数 p 的几何分布的几何分布概概 率率 论论 与与 数数 理理 统统 计计 例12 对同一目标进行射击,设每次射击时的命中率为0.64,射击进行到击中目标时为止,X 表示所需射击次数试求随机变量 X 的分布列,并求至少进行2次射击才能击中目标的概率解: X 的取值为 1,2, n= P 前 n-1次射击均未击中, 第 n次射击时击中目标= P 前 n-1次射击均未击中 P 第 n次射击时击中目标概概 率率 论论 与与 数数 理理 统统 计计例12(续)由独立性,得 X 的分布列为概概 率率 论论 与与 数数 理理 统统 计计 作业 2.1; 2.2; 2.19; 2.22