第三章_几种常见的概率分布律b剖析.

上传人:今*** 文档编号:107555027 上传时间:2019-10-20 格式:PPT 页数:52 大小:2.10MB
返回 下载 相关 举报
第三章_几种常见的概率分布律b剖析._第1页
第1页 / 共52页
第三章_几种常见的概率分布律b剖析._第2页
第2页 / 共52页
第三章_几种常见的概率分布律b剖析._第3页
第3页 / 共52页
第三章_几种常见的概率分布律b剖析._第4页
第4页 / 共52页
第三章_几种常见的概率分布律b剖析._第5页
第5页 / 共52页
点击查看更多>>
资源描述

《第三章_几种常见的概率分布律b剖析.》由会员分享,可在线阅读,更多相关《第三章_几种常见的概率分布律b剖析.(52页珍藏版)》请在金锄头文库上搜索。

1、第三章 几种常见的概率分布律,回顾一下,在上一章里讲了变量及其概率分布的一般概念。,离散变量用概率函数来研究,概率函数定义了这个变量取每个值的概率;,连续变量用密度函数(一条曲线)来研究,通过这条曲线我们可以求得变量在某个特定区间取值的概率。,在这一章里,我们将介绍一些在实际研究中应用最广的变量类型及其概率分布。,离散变量,连续变量,二项分布,泊松分布,超几何分布,负二项分布,指数分布,正态分布,标准正态分布,第一节 二项分布 (Binomial Distribution),1.贝努利试验和在什么情形下应用二项分布,贝努利试验(Bernoulli trial):试验只有两种可能的结果,并且发生

2、每种结果的概率是一定的。,例如:抛一枚硬币,看得到正面还是反面;掷一次骰子,看得到6还是没有得到6;随机抽查一名婴儿的性别,看是男是女,在贝努利试验里,两种结果可分别称为“成功”和“失败”,或者“事件A发生”和“事件A没有发生”。,什么情形时应用二项分布:实验中进行了n次独立的贝努利试验,统计在这n次试验中总共获得了多少次“成功”。“成功”的次数,记为变量X;X称为二项分布变量,X的概率分布称为二项分布。,(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。,X的可能取值为0,1,2,n。所以X是个离散型变量。,二项分布变量的一些例子:,(2)调查250名新生婴儿的性别,记男

3、婴的总数为X,则X服从二项分布。,(3)调查n枚种蛋的出雏数,出雏数X服从二项分布。,(4)n头病畜治疗后的治愈数X,X服从二项分布。,(5)n尾鱼苗的成活数X,X服从二项分布。,2. 二项分布的常用记号,3. 二项分布的概率函数P(x),怎样得到P(x)?,以n4,x2为例,欲求P(x2)?。,每种方式发生的概率为:,其它5种方式发生的概率也是如此。,例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为3:1。求产仔10头,有7头白猪的概率。,所以,窝产仔10头,有7头白猪的概率是0.2503。,例二,有一批玉米种子,出苗率为0.67。现任取6粒种子种1穴中,问这穴至

4、少有1粒种子出苗的概率是多少?,这说明每穴种6粒种子,几乎肯定出苗。,4 二项分布的概率分布表和概率分布图,除以P(x)表示,二项分布也可通过表或图来直观显示。,例如,抛硬币4次,获得的正面数记为X,则X服从二项分布。X的概率分布表为,X的概率分布图为,注意:,5 二项分布变量的平均数和标准差,平均数,方差和标准差,例三,某树种幼苗成材率为70,现种植2000株,问成材幼苗数的平均值和标准差是多少?,第二节 泊松分布 (Poisson Distribution),1. 在什么情形下应用泊松分布,泊松分布是一种用来描述一定的空间或时间里稀有事件发生次数的概率分布。,服从泊松分布的变量的一些例子:

5、,一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。,畜群中遗传的畸形怪胎数,单位空间内某些野生动物或昆虫数,每升饮水中的大肠杆菌数,2. 泊松分布的概率函数与特征数,泊松分布变量X只取零和正整数:0,1,2,其概率函数为,泊松分布的平均数,泊松分布的方差和标准差,例一,显微镜下观察一种悬浮液中的某种颗粒,据前人报告,平均每张样片可以观察到3个微粒,问在一次观察中看到3个微粒的概率是多大?少于3个微粒的概率是多少?若观察100张片子,大约有多少张片子看到的微粒数少于3个?,第三节 正态分布 (Normal Distribution),正态分布是一种最重要的连续型变量的概率分布。,在生物科学

6、研究里,有许多变量是服从或近似服从正态分布的,如水稻产量、小麦株高、玉米百粒重等;,许多统计分析方法是以正态分布为基础的。,不少随机变量的概率分布在样本容量增大时趋于正态分布。,因此,在统计学里,正态分布无论在理论研究上还是在实际应用中均占有重要的地位。,1 正态分布的定义与主要特征,定义:变量X的概率分布的密度函数为,f(x)的曲线为,X的积累分布函数,没有更简化的形式,正态分布的主要特征:,(1)曲线是单峰、对称的“悬钟”形曲线,对称轴是 x=,(2)曲线是非负函数,以x轴为渐近线,分布从到,(3)曲线在x=处各有一个拐点,即在-, +范围内是上凸,其余是下凸。,(4)曲线有两个参数:和。

7、 代表平均数,代表标准差, 和一起决定曲线的位置和形状。 越大,则曲线沿x轴越向右移动;反之向左。 是变异度参数, 愈大则曲线愈“胖”;反之则愈瘦。,(5)曲线下和x轴所夹的总面积为1,=0.5,=1,=2,2 标准正态分布,定义:=0,=1时的正态分布称为标准正态分布。标准正态分布变量记为U,写作 UN(0,1)。,普通正态分布与标准正态分布,X,Z,(Z),(Z),标准正态分布曲线,标准正态分布的累积分布曲线,累积分布函数,标准正态分布有以下特性:,1、在u0时(u)达到最大值。 2、当u不论向哪个方向远离0时,(u)的值都减小。 3、曲线两侧对称。 4、曲线在u1和u1处有两个拐点。 5

8、、曲线与横轴所夹面积等于1。 6、累积分布曲线围绕点(0,0.5)对称。,标准正态分布概率密度曲线在-1+1的区间内占总面积的68.27%,在-1.96+1.96的区间内占总面积的95%;在-2.58 +2.58的区间内占总面积的99%。,标准正态分布的累积概率函数,曲线下面积分布规律,标准正态分布的三个常用概率,99.74%,65.26%,95.46%,3 标准正态分布的概率计算,查表法:表2(253页)列出了标准正态变量的累积分布函数值,即U小于某个值u的概率:P(Uu),关系式:,4 一般正态分布的概率计算,通过如下定理,将一般正态分布变量转化成标准正态分布变量来求。,对于服从N(,2)

9、的随机变量X,首先要进行标准化变换,使之变为标准正态分布,再按上述方法查表。变换的方法是:,定理:,关于一般的正态分布,以下的一些概率经常用到:变量X落在的不同倍数区间的概率。,这些结论可以用一个实例来印证:,以第一章里的120头母羊的体重资料为例:,由表可见,实际频率与理论概率相当接近,说明120头基础母羊体重资料的频率分布接近正态分布,从而可推断基础母羊体重这一随机变量很可能是服从正态分布的。,5 正态分布的单侧、双侧临界值(分位数),附表2列出了概率的数值,即对于给定的u,列出了曲线下u左边的面积。,在以后的统计推断中,我们经常需要做与上面相反的工作:即已知曲线下右侧尾区的一定面积 ,求

10、对应的临界值u ,注意:这些临界值在第五章假设检验时经常用到,双侧概率或单侧概率,【例】已知猪血红蛋白含量x服从正态分布 N (12.86,1.332 ),若P(xl1) =0.03,P(xl2)=0.03,求l1,l2 。 依题意 2=0.03,=0.06又因为 故 P(xl1)+ P(xl2) = P(u-u) + P(uu),=1- P(-uuu)=0.06= 由附表2查得:u0.06=1.880794 , 所以 (l1 -12.86)/1.33=-1.880794 (l2 -12.86)/1.33=1.880794 即l1 15.36, l2 15.36。,6 中心极限定理 (cent

11、ral limit theorem),中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,1. 若 随 机 变 量 x 服 从 正 态 分 布N(2) ; 、 、 ,是由x 总体得来的随机样本,则统计量 =xn的概率分布也是正态分布, 且有 =, , 即服从 正态分布N(,2n)。 2. 若随机变量x服从平均数是 ,方差是2的分布(不是正态分布); , , 是由此总体得来的随机样本,则 统 计 量 =xn的概率分布,当n相当大时逼近正态分布N(,2n)。这就是中心极限定理。,中心极限定理 (central limit theorem),x 的分布趋于正态分布的过程,中心极限定理告诉我们:不论x变量是连续型还是离散型,也无论x服从何种分布,一般只要n30,就可认为 的分布是正态的。 若 的分布不很偏倚,在n20时 , 的分布就近似于正态分布了。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号