第三章理论分布和抽样分布课件

上传人:我*** 文档编号:141006746 上传时间:2020-08-03 格式:PPT 页数:111 大小:605.50KB
返回 下载 相关 举报
第三章理论分布和抽样分布课件_第1页
第1页 / 共111页
第三章理论分布和抽样分布课件_第2页
第2页 / 共111页
第三章理论分布和抽样分布课件_第3页
第3页 / 共111页
第三章理论分布和抽样分布课件_第4页
第4页 / 共111页
第三章理论分布和抽样分布课件_第5页
第5页 / 共111页
点击查看更多>>
资源描述

《第三章理论分布和抽样分布课件》由会员分享,可在线阅读,更多相关《第三章理论分布和抽样分布课件(111页珍藏版)》请在金锄头文库上搜索。

1、第三章 理论分布和抽样分布,第一节:概率及其计算 概率论:研究随机现象规律性的科学。 统计学:基于实际观测结果,利用概率论得出的规律,解释偶然性中所寄寓的必然性。,两者都是研究随机现象,概率论是统计学的基础,统计学是概率论得出规律在各领域中的实际应用。,一、事件与概率 事件是指某一事物的每一个现象,或某项试验的每一结果。(试验中所发生的现象)。 分类: 、必然事件:在一定条件组下,必然要发生的事件。 例:在标准大气压下,水加热到100这一组条件实现, 则水沸腾是必然事件。,、不可能事件:在一定条件组下,一定不能发生的事件。 例:在以上条件实现,水结冰这一事件,就是不可能事件。 、随机事件:在一

2、定条件组实现下,可能发生也可能不发生的事件。 例:一粒种子播种后发芽与否。 红花豌豆与白花豌豆杂交,2是红花。,概率的统计定义: 假定在相似条件下,重复进行同一类试验,事件发生的次数a 与总试验次数n的比数称为频率a/n,在试验总次数n逐渐增大时, 事件的频率愈来愈稳定地接近定值p,于是定义事件的概率为p,并记为 P(A)=p,一个总体的概率值在理论上是存在的,但在一般情况下,无法得到这个数值,只有通过样本的频率来推断总体概率。因此便以n在充分大时事件的频率作为该事件概率p的近似值,即 (A)=p(a/n),概率的表示: 小数 分数 0p(A)1 P(A)=1 时为必然事件 P(A)=0 时为

3、不可能事件,二、事件间的关系 基本事件:就是不可能再分的事件。 复合事件:由若干个基本事件组合而成的事件。,以“事件”一词代表随机事件,并以字母A, B, C. 等表示,以U表示必然事件,以V代表不可能事件。 1.事件A与事件B至少有一件发生而构成的新事件称为事件A与事件B的和事件。 记作:A+B读作“或A发生,或B发生”,和事件可以推广到个事件:A+B+C+.+N表示N个事件至少有一个发生。,2.两个事件A与B同时发生而构成的新事件称为事件A与事件B的积事件。 记作: A.B,读作“AB同时发生”,积事件可以推广到多个事件的情形: A.B.C.N表示N个事件同时发生。,3.两个事件A与B如果

4、不能同时发生,即A.B=V,那么称A和B是互斥事件。 例:任一玉米株高2.5m以上(A) 任一玉米株高2.0-2.5m(B) A.B:任一玉米株高既高于2.5m又在2.0-2.5m之间。 抛硬币: A:正面朝上B:反面朝上,4.如果事件A与事件必发生其一,但又不可能同时发生,即:A+B=u,A.B=V, 那么B是A的对立事件,可用表示。,5.如果事件A1、A2.An两两互斥,且每次试验必发生其一,则称A1、A2.An为完全事件系。 例:袋中有红、黄、黑、白四种颜色的球,每次取一个,“取到红球”、“取到黄球”、“取到黑球”、“取到白球”构成完全事件系。,、如果事件的发生与否不影响事件的发生,则称

5、其相互独立。 例:A:第一粒种子发芽 B:第二粒种子发芽,三、计算概率的法则 法则一: 对立事件的概率: 若事件A的概率为P( A),那么其对立事件的概率为 P()=1-P(A) 例:小麦播种后发芽的概率为0.9,那么,不发芽的概率为(1-0.9)=0.1,法则二: 互斥事件概率的加法: 若事件A与事件B是互斥的,概率各为P(A)和P(B),那么“A+B ”事件的概率为 P(A+B)=P(A)+P(B),法则三:独立事件概率的乘法: 若确定事件A的概率时不受到事件B的影响,反之亦然,那么,这两个事件是互相独立,称独立事件。对于这类事件,同时出现这一新事件的概率必为每个事件概率的积。 P(A.B

6、)=p(A).P(B),法则四:完全事件系的概率 若A1,A2.An是完全事件系,则这n个事件的概率之和为1,即 P(A1+A2+A3+.+An)=P(A1)+P(A2)+.+P(An)=1 如果n个事件出现的概率是相等的,那么 P(Ai)=1/n,第二节总体分布 一、二项分布(binomial distribution) (一)二项分布的概率函数 二项总体:有非此即彼事件组成的总体。 二项分布:以容量n从二项总体中抽样,共有n+1种可能的结果,每种结果都有一个固定的概率,这种变量取值及其概率构成的分布称为二项分布.,种子发芽试验: 一粒种子:发芽概率p、不发芽概率q 概率相加得(p+q) 两

7、粒种子: 甲乙均发芽:概率为p2 甲发乙不发:概率为p(1-p)pq 乙发甲不发:qp 甲乙均不发:q2 概率相加得p2+pq+qp+q2=(p+q)2,依此类推,独立地对n粒种子进行实验,一种结果出现x次的概率是: 称为二项分布律或二项概率函数,是(p+q)n展开后含有p(x)的一项这一分布律也称为贝努里分布,其中,x=0,1,2,n, 为某事件出现次数。 n为样本含量,即事件发生总数.,二项分布是说明结果只有两种情况的n次独立实验中发生某种结果为x次的概率分布。,因为(p+q),所以,二项分布的累积函数: 二项分布中某结果最多发生k次的概率为发生0次、1次、.、直至k次的概率之和:,(二)

8、二项分布的应用条件: (1) 每次实验只有两类对立的结果; (2) n次事件相互独立; (3) 每次实验某类结果的发生的概率是一个常数。,(三)二项分布的参数 二项分布总体的平均数和标准差为:,二项分布常表示为:B(n,p) 即:二项分布是由n和p两个参数据定的。,(四)二项分布的形状 二项分布的形状有如下特征: (1)二项分布图形的形状取决于P 和n 的大小; (2) 当P=0.5时,无论n的大小,均为对称分布; (3)当p0.5 ,n较小时为偏态分布,n较大时逼近正态分布。,一般来说,当n大于,而p或q又不过小(例如不接近于),且np及nq不小于时,可将其看作正态分布,可用正态公式求其概率

9、。,(五)二项分布的应用实例 、一批种子的发芽率为0.8,现每穴播粒,问每穴出三棵苗的概率?平均每穴出苗几棵? 本例中,每穴出苗数为随机变量X,它服从B(5,0.8),故:,若计算每穴出苗数低于4棵的概率,则计算累积概率: P(X3)=P(X=0)+P(X=1)+P(X=2)+P(X=3) 平均每穴出苗数:=np=50.8=4,、两个纯合亲本杂交(RRrr),F1自交,F2的基因型分离比。 F2中,R基因出现的概率p=0.5,r基因出现的概率q=0.5,一对因子:,两对因子:YYRRyyrr F2中显:显:显:显:显,3、两对基因分离: bbRRBBrr F1 BbRr F2 9B-R-:3B

10、-rr:3bbR-:1bbrr 问:样本容量多大时,才能以99的概率至少得到一个bbrr个体?,解:bbrr的概率q=1/16,非bbrr出现概率p=15/16。得到bbrr的概率99%,则非bbrr为,所以: pn=(15/16)n=0.01 n(lg15-lg16)=lg0.01 n=71.4 因此:要以的可能获得一个bbrr个体,样本容量只少为。,二、Poisson分布 1. Poisson分布的概念: 二项分布n很大而P很小时的特殊形式。其概率函数 x=0,1,2.n,其中e为自然对数的底,为总体均数,x为事件发生的次数。,主要描述大量实验中随机稀疏现象,如:单位面积内的昆虫数、病斑数

11、、植物种类、细胞计数、田间杂草分布等。,2. Poisson分布的应用条件: (1) 两类结果要相互对立; (2) n次试验相互独立; (3) n应很大, P应很小。,3. Poisson分布的参数 方差与平均数相等,只有一个参数。,4. Poisson分布的性质: (1) 均数与方差相等; (2) 均数较小时呈偏态,20时近似正态; (3) n很大, p很小,np=为常数时二项分布趋近于Poisson分布; (4) n个独立的Poisson分布相加仍符合Poisson分布,5、形状 由决定:很小时分布很偏,增大后逐渐对称,趋近于正态分布,三、正态分布(normal distribution)

12、 (一)正态分布的密度函数和分布函数 是连续性变数的一种理论分布。 许多生物学产生的数据都服从正态分布。 正态分布是生物统计学的重要基础,对于平均数为,标准差为的正态分布,其概率密度函数为: -x ,其中: 平均数,是曲线最高值的横坐标,曲线以其为对称; 标准差,表示曲线展开程度,越大,曲线展开度越大,数据越分散;越小,曲线展开度越小,数据越集中;有了和,曲线形状就可以确定下来。,,标准差为的正态分布称为标准正态分布(standard normal distribution)。以N(,2)表示平均数为,标准差为的正态分布;以N(,)表示标准正态分布。,累积分布函数:,(二)正态分布曲线的特性

13、、以为原点左右对称; 、x=处f(x)具有最大值,且算术平均数、中数、众数合于这一点; 、是一个曲线簇,由和确定:确定在x轴上的位置,确定其变异度;,以平均数和标准差不同的正态分布系列曲线,、在x=1有拐点; 、x取值范围是,,但多数集中在附近,离其越远,次数越少;且在 x- 相等处具有相等次数。 、曲线的总面积等于。曲线下任何定值之间的面积等于这两个定值间面积占总面积的成数,或者说变量落入这个区间内的概率。,几个常用区间与其相应的面积或概率 区间面积或概率 0.6827 2 0.9545 3 0.9973 1.960 0.9500 2.576 0.9900,正态分布,(三)标准正态分布 将x

14、离其平均数的差数以为单位进行转换,于是: u为正态离差。可将一般方程转为标准正态分布方程。,概率密度函数: -u,(四)正态分布区间概率的计算方法 随机变量落在某区间(a,b)内的概率,可以从标准正态分布累积分布函数表中查出。对于一般的正态分布,先将其化为标准正态分布再查表 .,例:u=-0.82, (0.82)0.2061 u=1.15 (u)=0.8749 例:随机变量U服从N (0,1),求其落在0,1.21间的概率: P(0U1.21)= (1.21)(0)=0.88690.5000=0.3869 落在-1.96和1.96之间的概率: P(|U|u)=1-2(-u)=1-2(-1.96

15、) 1-0.0500=0.9500,正态分布,例:变量X服从N (156.2,4.822),求:(1)X164; (3)152X162的概率,(1) (161-156.2)/4.82=1 P(X164)=1-P(X164)= P(X-164) =(-u)=(-1.62)=0.0526,(3) u1=(152-156.2)/4.82= -0.87 u2=(162-156.2)/4.82=1.2 P(152P162)= (u2)-(u1) =(1.2)-(-0.87) =0.8849-0.1921=0.6928,(五)正态分布的单侧分位数/临界值 上面介绍了正态分布区间概率的计算方法。即对于给定的u,通过正态分布累积函数表查Uu的曲线下的面积。反过来,若要求曲线右侧尾区一定面积()下,所对应的u值u,则可以利用正态离差u值表查出。,该表有单、双尾之分:对于单尾,给出了满足P(Uu)= 时的u值。u称为的上侧分位数。 对于左侧尾区,满足:P(Uu/2)= 时的u/2称为的双侧分位数。,对于单尾表(上侧分位): 对于双尾表:,第三节 抽样分布(sampling distribution) 可从两个方向研究总体与样本的关系:一是总体到样本,即由已知的总体研究样本的分布规律;二是从样本到总体的方向,即由样本推断未知的总体。抽样分布是研究第一个方向的问题,是统计推断的基础。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号