《王学民概率论与数理统计》由会员分享,可在线阅读,更多相关《王学民概率论与数理统计(55页珍藏版)》请在金锄头文库上搜索。
1、第二章 随机变量及其分布v2.1 随机变量v2.2 离散型随机变量及其分布律v2.3 随机变量的分布函数v2.4 连续型随机变量及其概率密度v2.5 随机变量函数的分布王学民概率论与数理统计2.1 随机变量v定义2.1.1 设E是随机试验,它的样本空间为=。如果对任意样本点,都有惟一确定的实数X()与之对应,则称X=X()为定义在样本空间上的随机变量。v随机变量常用大写字母X,Y,Z等表示,它们的取值常用小写字母x,y,z等表示。v常用的随机变量有离散型随机变量和连续型随机变量两种。v随机变量具有如下两个特点:(1)取值的随机性,即事先不能确定X取哪个值;(2)取值的统计规律性,即完全可以确定
2、X取某个值或X在某一个区间内取值的概率。王学民概率论与数理统计2.2 离散型随机变量及其分布律v一、分布律v二、几个常见的离散型分布王学民概率论与数理统计一、分布律v定义2.2.1 设离散型随机变量X的可能取值为x1,x2,xn,,取这些值的概率分别为p1,p2,pn,,则P(X=xk)=pk,k=1,2,称为离散型随机变量X的概率分布或分布律或分布列。v有时也用如下表格来表示X的分布律:Xx1x2xnPp1p2pn王学民概率论与数理统计v分布律具有下述两个性质:(1)pk0,k=1,2,;(2)。v例2.2.1 掷一颗均匀的骰子出现的点数X为一个离散型随机变量,其分布律为王学民概率论与数理统
3、计v例2.2.2 设某产品分为四种等级:一、二、三等品及废品,这四种等级的产品所占的比例分别为50%,25%,15%,10%,现任取一件产品,并令则离散型随机变量X的分布律为X0123P0.10.500.250.15王学民概率论与数理统计二、几个常见的离散型分布v1.二项分布v2.泊松分布v3.超几何分布v4.几何分布王学民概率论与数理统计1.二项分布v所谓贝努里(Bernoulli)试验,是指只有两个可能结果的随机试验。v我们把其中的一个感兴趣的结果称为“成功”(或称为事件A发生),另一个则称为“失败”(或称为事件A不发生)。v如果将一贝努里试验在相同的条件下重复n次,并且各次的试验相互独立
4、(即试验结果互不影响),则这样的系列试验称为n重贝努里试验。王学民概率论与数理统计v在每一特定的n重贝努里试验中,设每次试验成功的概率为p(p值不变),失败的概率为q=1p,则成功次数X的分布律为:称X服从参数为n,p的二项分布,记作XB(n,p)。图2.2.1 二项分布B(n,p)的分布律王学民概率论与数理统计v例2.2.4 某种商品的不合格率为0.3,一顾客从商店买了6件这种商品,试求下列事件的概率:(1)恰有4件商品不合格;(2)不合格件数不超过一半;(3)至少有一件不合格品。v例2.2.5 某营业员根据以往的经验发现,接待一位顾客能做成一笔生意的概率是0.25。如果某天他接待了10位顾
5、客,试求以下几种情况的概率:(1)做成的生意至多三笔;(2)做成的生意至少三笔;(3)恰好做成两笔生意。王学民概率论与数理统计vn=1时的二项分布B(1,p)称为二点分布,它只含一个参数p。v在一次贝努里试验的实际应用中,我们常常将其中的一个结果对应于“1”,而将另一个结果对应于“0”,即令X的概率分布即为二点分布。王学民概率论与数理统计2.泊松分布v若随机变量X具有如下分布律:其中0是个常数,则称X服从参数为的泊松分布,记作XP()。v容易验证:(1)P(X=k)0,k=0,1,2,;(2)。王学民概率论与数理统计v在=np恒定的情况下,当n趋向无穷,同时p趋向于0时,二项分布趋向于泊松分布
6、。通常当n20,p0.05时,有如下的近似公式:v近似的效果可以从表2.2.1中有所认识。图2.2.2 泊松分布P()的分布律王学民概率论与数理统计k 二项分布 泊松分布n=10p=0.1n=20p=0.05n=40p=0.025n=100p=0.01=1(=np)00.3490.3580.3630.3660.36810.3850.3770.3720.3700.36820.1940.1890.1860.1850.18430.0570.0600.0600.0610.06140.0110.0130.0140.0150.015表2.2.1 二项分布的泊松分布近似王学民概率论与数理统计v例2.2.6
7、已知某厂有5%的产品有缺陷。随机抽选50件,试分别求出缺陷产品数属于以下各种情况的概率:(1)至多2件;(2)至少1件;(3)恰好3件;(4)在1件和5件之间(包括1件和5件)。解 设产品缺陷数为X,则XB(50,0.05)。由于n=50很大,p=0.05很小,故可以认为X近似服从参数为=500.05=2.5的泊松分布。查(累积)泊松分布表得如下结果:(1)P(X2)=0.5438;(2)P(X1)=1P(X=0)=10.0821=0.9179;(3)P(X=3)=P(X3)P(X2)=0.75760.5438=0.2138;(4)P(1X5)=P(X5)P(X=0)=0.95800.0821
8、=0.8759。王学民概率论与数理统计v例2.2.7 某商店每月销售某种商品的件数服从参数为4.6的泊松分布,试问在月初应购进多少此种商品,才能保证不脱销的概率至少为0.99。解 设该商店当月的顾客需求数为X件,月初的进货为a件,则当Xa时就不会脱销,按题意要求P(Xa)0.99查泊松分布表得:P(X9)=0.9805,P(X10)=0.9922故在月初应进10件此种商品,才能以99%以上的把握保证当月不脱销。王学民概率论与数理统计3.超几何分布v设一批产品共N件,其中有M件为不合格品,从中任意取出n(NM)件,其中不合格品数X的分布律为:该概率分布称为超几何分布。它含有三个参数M,N和n,记
9、作H(M,N,n)。王学民概率论与数理统计v例2.2.8 某人计划从由新上市公司发行的10只股票中选择4只,但是他并不知道这10只股票中有3只将使购买者获厚利,而其余7只则将使购买者亏损。试求:(1)该购买者能选中的获厚利股票数目X的概率分布;(2)至少能选中一只能获厚利股票的概率。v通常当n/N5%时,超几何分布可用二项分布近似,即其中p=M/N为产品的不合格品率,q=1p。王学民概率论与数理统计4.几何分布v如果将贝努里试验独立地重复进行,直至“成功”出现为止,则所需的试验次数X具有如下分布律:P(X=k)=pqk1,k=1,2,其中p为一次贝努里试验中“成功”出现的概率,q=1p,称X服
10、从参数为p的几何分布,记作XG(p)。v例2.2.9 一名制造商在某个电子系统使用电保险丝,保险丝大批量购进后就连续不断地测试,直至观察到第一个次品时为止。假定每批保险丝含5%次品,试求:(1)需测试次数X的概率分布;(2)测试次数不超过5次的概率。王学民概率论与数理统计2.3 随机变量的分布函数v定义2.3.1 设X是一个随机变量,对任何实数x,令F(x)=P(Xx),x则称F(x)为随机变量X的累积概率分布函数,简称分布函数。王学民概率论与数理统计分布函数的性质v(1)0F(x)1,x;v(2)F(x)是x的非降函数,即若x1x2,则有F(x1)F(x2)v(3);v(4)F(x+0)=F
11、(x),即F(x)在每一点x处都是右连续的。王学民概率论与数理统计v离散型随机变量X的分布函数为v例2.3.1 在例2.2.1中,随机变量X的分布函数为王学民概率论与数理统计图2.3.1 X的分布函数曲线王学民概率论与数理统计v例2.3.2 设随机变量X的分布函数为试求:(1)常数a,b,c,d的值;(2)X落在区间(2,3内的概率。王学民概率论与数理统计2.4 连续型随机变量及其概率密度v一、概率密度函数v二、几个常见的连续型分布王学民概率论与数理统计一、概率密度函数图2.4.1 女大学生身高的频率直方图王学民概率论与数理统计v定义2.4.1 设随机变量X的分布函数为F(x),如果存在非负函
12、数f(x),使得对任意实数x,有则称X为连续型随机变量,同时称f(x)为X的概率密度函数,简称密度函数或概率密度。v概率密度函数f(x)具有下述两个性质:(1)f(x)0;(2);(3);(4)若f(x)在点x处连续,则 。王学民概率论与数理统计v连续型的分布函数F(x)是一个连续函数,并可由此推知,对任一实数c,有P(X=c)=0。v对任意的实数a,b(ab),有v例2.4.1 设某种元件的寿命X(单位:千小时)具有密度函数(1)确定常数k;(2)求寿命超过1(千小时)的概率。王学民概率论与数理统计v例2.4.3 设随机变量X的密度函数为试求X的分布函数F(x),并画出f(x)及F(x)的图
13、形。图2.4.2 X的密度曲线 图2.4.3 X的分布函数曲线王学民概率论与数理统计二、几个常见的连续型分布v1.均匀分布v2.正态分布v3.指数分布王学民概率论与数理统计1.均匀分布v如果连续型随机变量X具有如下的概率密度函数则称X服从a,b上的均匀分布,记作XUa,b。X的分布函数为王学民概率论与数理统计图2.4.4 均匀分布Ua,b的密度曲线 图2.4.5 均匀分布Ua,b的分布函数曲线 王学民概率论与数理统计v均匀分布具有下述意义的等可能性。若XUa,b,则X落在a,b内任一子区间c,d上的概率:只与区间c,d的长度有关,而与它的位置无关。v例2.4.4 假定某线路的公共汽车每隔10分
14、钟到某车站一次,那么乘客来到该车站候车的时间X就服从0,10上的均匀分布,由此可计算出他等候的时间不超过l(0l10)分钟的概率为v例2.4.5 在数值计算中,设由于四舍五入引起的误差为随机变量X,如果小数点后面第三位按四舍五入处理,试求:(1)X的密度函数和分布函数;(2)P(0.002X0为常数,则称X服从参数为,2的正态分布,且称X为正态变量,记作XN(,2)。v正态分布最早是由法国数学家德莫弗(De Moivre,16671754)于1733年提出的。德国数学家高斯(C.F.Gauss,17771855)在研究误差理论时曾用它来刻画误差,因此有时也称为高斯分布。王学民概率论与数理统计图
15、2.4.6 正态分布的密度曲线图2.4.7 不同的正态密度曲线王学民概率论与数理统计图2.4.8 不同参数2的正态分布密度曲线王学民概率论与数理统计v正态分布的分布函数为图2.4.9 正态分布的分布函数曲线王学民概率论与数理统计v=0,=1的正态分布,称为标准正态分布。其密度函数和分布函数分别为:图2.4.10 (x)值王学民概率论与数理统计图2.4.11 (x)=1(x)图2.4.12 (b)(a)王学民概率论与数理统计v若XN(,2),则 服从标准正态分布,即UN(0,1)。于是,v例2.4.7 已知某种蔬菜的单棵重量服从正态分布,为140克,为12.2克。今随机抽出一棵,试问其重量不小于
16、130克的概率是多少?标准化变换王学民概率论与数理统计v例2.4.8 设XN(,2),试求X落在区间(k,+k)内的概率,其中k=1,2,3,4。解 对k=1,2,3,4分别得 P(|X|)=2(1)1=0.6826 P(|X|2)=2(2)1=0.9545 P(|X|3)=2(3)1=0.9973P(|X|4)=2(4)1=0.99994王学民概率论与数理统计v例2.4.9 在某年举行的高等教育大专文凭认定考试中,已知某科的考生成绩XN(,2),及格率为40%,80分以上的占5%,试确定参数和。v设XN(0,1),对于给定的正数,00为常数,则称X服从参数为的指数分布,记为XE()。X的分布函数为王学民概率论与数理统计图2.4.14 指数分布E()的密度曲线图2.4.15 指数分布E()的分布函数曲线王学民概率论与数理统计v指数分布常用来描述完成一项任务所花费的时间。例如,某些电子元器件的寿命、电话的通话时间、排队等候服务的时间、到达一洗车处的两辆车间隔时间等都常假定服从指数分布。v连续型的指数分布与离散型的泊松分布之间有着密切的关系。如果在规定的时间间隔内某种产品受到外界的随机冲击