统计学之概率分布与抽样分布

上传人:luobi****88888 文档编号:94012993 上传时间:2019-07-31 格式:PPT 页数:54 大小:975KB
返回 下载 相关 举报
统计学之概率分布与抽样分布_第1页
第1页 / 共54页
统计学之概率分布与抽样分布_第2页
第2页 / 共54页
统计学之概率分布与抽样分布_第3页
第3页 / 共54页
统计学之概率分布与抽样分布_第4页
第4页 / 共54页
统计学之概率分布与抽样分布_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《统计学之概率分布与抽样分布》由会员分享,可在线阅读,更多相关《统计学之概率分布与抽样分布(54页珍藏版)》请在金锄头文库上搜索。

1、1,本资料来源,2,第四章 概率、概率 分布与抽样分布,厦门大学经济学院计统系,游家兴,3,例1:掷铜板,当你掷铜板的时候,结果只有两种可能,正面或者反面。下图显示掷铜板1000次的结果。,4,掷铜板的人,法国自然主义者布方伯爵(Count Buffon, 1707-1788)把铜板掷了4040次,结果:2048个正面,或者说正面比例是2048/4040=0.5069。 大约1900年时,英国统计学家皮尔逊(Karl Pearson,1857-1936)很神勇地掷一个铜板 24000次。结果:12012次正面,比例0.5005。 南非数学家柯瑞屈(John Kerrich)在第二次世界大战被德

2、国人关在牢里的时候,掷了铜板 10000次。结果:5067次正面,比例0.5067。,5,例2:中两次头彩,1986年时,亚当斯(Adams)第二度赢得新泽西州彩券,前一次亚当斯赢到了累积奖金390万美元,这次又赢得了150万美元。 纽约时报(1986年2月14日)宣称:同一个赢得两次大奖的机会,差不是每170亿次中有一次。 两星期后,纽约时报刊登了两位统计学家的来信,说这是胡说八道。,6,亚当斯在一生中赢两次大奖的机会诚然很小,但是几乎可以确定:在美国几百万经常买彩券的人当中,会有人赢得两次头奖。 两位统计学家估计:7年内再有人赢到两次大奖的机会是一半一半。 果其不然,在1988年5月,汉弗

3、莱斯(Humphri -es)赢得了他的第二个宾州彩券累积奖金(总计680万美元)。,7,本章我们首先学习: 什么是概率? 什么是概率分布?,8,第一节 随机事件与概率,一、随机事件与概率 (一)随机试验与事件 随机现象的特点是: 在条件不变的情况下,一系列的试验或观测会得到不同的结果; 在试验或观测前不能预见何种结果将出现。,9,对随机现象的试验或观测称为随机试验,它必须满足以下的性质: (1)每次试验的可能结果不是唯一的; (2)每次试验之前不能确定何种结果会出现; (3)试验可在相同条件下重复进行。,10,在随机试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。 试验的结果可

4、能是一个简单事件,也可能是一个复杂事件。 简单事件就是不可以再分解的事件,又称为基本事件。 复杂事件是由简单事件组合而成的事件。,11,基本事件还可称为样本点,设试验有n个基本事件,分别记为 (i=1,2,,n)。 集合=1 ,2 , ,n称为样本空间,中的元素就是样本点。,12,例:投掷一粒均匀的六面体骰子,出现的点数有可能是1、2、3、4、5、6共六种。这六种结果是基本结果,不可以再分解成更简单的结果了,所以=1,2,3,4,5,6为该试验的样本空间。 “出现点数是奇数”这一事件就不是简单事件,它是由基本事件1,3和5组合而成的。,13,我们通常用大写字母A,B,C,来表示随机事件,例如,

5、设A表示“出现点数是奇数”,则A=1,3,5;设B表示“出现点数是偶数”,则B=2,4,6。,14,(二)概率 1.概率的定义 概率是指随机事件发生的可能性,或称为机率,是对随机事件发生可能性的度量。 概率的古典定义:假设事件A在等可能的n种方式中可以以m种方式发生,则事件发生的概率表示为: p=p(A)=m/n,15,古典概率有两个特点: 1、结果有限,即基本空间中只含有限个元素。如掷铜板,只能出现“正面朝上”和“反面朝上”两种结果。 2、各个结果出现的可能性被认为是相同的。如掷铜板,出现正面或反面的机会被认为是相等的。,16,概率的古典定义有所缺陷,“等可能”这一词模糊不清。事实上,这一词

6、看上去与“等概率”是同义的,那么我们实质上是用概率来定义自己,形成循环定义。 概率的统计定义:在相同条件下随机试验n次,某事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数p上下波动,且波动的幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率,记为:,17,例:设一个袋子中装有白球2个,黑球3个。 (1)从中随机摸出1只球,问刚好是白球的概率有多大? 解:摸出的任何1只球形成一个基本事件,样本点总数为n=5。 用A表示摸出的是白球事件,则A由两个基本点组成,即A=白球,白球,有利场合数m=2。因此,刚好摸出白球的概率为: P(A)=m/n=2/5=0.4,

7、18,(2) 从中随机摸出2只球,一问2只球都是白球的概率有多大? 二问2只球一白一黑的概率有多大? 三问2只球都是黑球的概率有多大? 解:由于摸出2只球才成一个基本事件,所以样本点总数为 ,故 P(A)=P(2只球都是白球)=1/ =1/10 P(B)=P(2只球一白一黑)=23/10=6/10 P(C)=P(2只球都是黑球)=3/10,19,2. 概率的基本性质 性质1 1P(A)0。 性质2 P()=1。 性质3 若事件A与事件B互不相容,即AB=,则P(AB)=P(A)+P(B)。,20,例,从一副纸牌中抽牌一次(抽完放回),如果E1为事件“抽到A”,E2为事件“抽到K”,则: P(E

8、1)=4/52=1/13 P(E2)=4/52=1/13 因为不可能同时抽到A和K,所以它们是互不相容的,则抽到A或K的概率为:,21,重新定义,E1为事件“抽到A”,E2为事件“抽到黑桃”,因为有可能抽到黑桃A,所以E1和E2不是互不相容的,那么抽到A或黑桃的概率为:,22,推论1:不可能事件的概率为0,即: P()=0 推论2 :P( )=1-P(A), 表示A的对立事件,即它们二者必有一事件发生但又不能同时发生。 3. 事件的独立性 定义:对事件A与B,若p(AB)=p(A)p(B),则称它们是统计独立的,简称相互独立,即两个事件中不论哪一个事件发生与否都不影响另一个事件发生的概率。,2

9、3,例:已知袋中有6只红球, 4只白球。从袋中有放回地取两次球,每次都取1球。设 表示第i次取到红球。那么, 因为 也就是说,B1,B2相互独立。 题目将有放回改为无放回,则B1和B2相互独立吗?,24,第二节 随机变量及概率分布,随机变量是指随机事件的量的表现。 例如:投掷骰子,点数1、2、3、4、5、6是可能出现的随机变量。 随机变量的概率分布是一个函数,它把随机变量的每一个值与一个实数(概率)相对应。 概率分布反映了随机变量的取值或随机事件中各种结果的分布状况和分布特征。,25,离散型随机变量,当随机变量所有可能取值的集合只包含有限个元素时,就称为离散型随机变量。 设离散型随机变量X的所

10、有可能取值为x1,x2,,xn, ,相应的概率为p(x1),p(x2), p(xn),。用表格统一表示出来是:,26,如:,骰子各个点数的概率分布表,27,离散型概率分布的性质 (1) 0p(xi)1 (i=1,2, ) (2),28,随机变量的期望值,随机变量的期望值(E)也称为平均值,是随机变量分布的集中趋势,即分布的中心位置。 离散型随机变量的期望值: 性质: 其中X1,X2都是随机变量,是任意常数。,29,有这样的一个投资项目(如下表),试问它的预期回报是多少?,该投资项目的期望收益率是6.9%。,例题,30,随机变量的方差,定义:离散型随机变量X的方差为 方差的平方根称为标准差。 方

11、差2或标准差反映随机变量X相对其期望值的离散程度,2或越小, 说明期望值的代表性越好;2或越大,说明期望值的代表性越差。 性质:对于任意常数a,2(ax)=a22(x)成立。,31,二项分布,二项分布是离散型随机变量的一个重要的概率分布。 在一些问题中,我们只对试验中某事件A是否出现感兴趣,如调查消费者对某种品牌是否喜欢,调查某地区住户是否脱贫等等。,32,这些例子所具有的共同性质概括如下: 试验包含了n个相同的试验; 每个试验只有两个可能的结果; 每一次试验出现“是”或“否”的概率是相同的。 试验是互相独立的。 通常称具有上述特征的n次重复试验为n次贝努里试验,简称贝努里试验(Bernoul

12、li trials)。,33,以Bk表示n重贝努里试验中事件A正好出现k次这一事件,则: (k=0,1,2,,n),34,连续型随机变量,当一个随机变量可能取值的集合为无穷不可数集合时,就称为连续型随机变量。 由于连续型随机变量可以取某一区间或整个实数轴上的任意一个值,无法一一列举。一般用概率密度函数来表示连续型随机变量的概率分布。,35,概率密度函数反映概率分布在某一区间的密集程度。 它不直接给出随机变量取某一特定值的概率值,而通过密度函数图下相应给定区间的面积表示连续型随机变量在那一区间取值的概率。,36,概率密度函数,设p(x)为概率密度函数,它是分布函数的导数,满足下述两个条件: (1

13、) p(x)0 (2),37,连续型随机变量的概率是计算随机变量落在某区域的可能性,也即通过对密度函数进行积分获得相应的概率值。 如计算随机变量X落在a, b区间内的概率:,概率密度曲线,38,如:,39,例子,一个连续型随机变量只在0, 4范围内取值,其概率密度函数为 ,a是常数。 计算a; 求p(1X2) 解:根据 ,可知 , 进一步, 求积分:,40,0,1,2,3,4,1/4,1/2,3/4,1,P(X),X,意味着整个三角形的面积为1,p(1X2),求点X落入1至2区间的概率,即求梯形(阴影部分)的面积:,41,课堂练习,设随机变量X的概率密度函数服从: (1)已知P(X1)=7/8

14、,求 的值; (2)求随机变量落入0.5,1区间的概率。,42,随机变量的期望值与方差,定义: 连续型随机变量X的期望值为 方差为 性质:,43,离散型与连续型随机变量的区别,44,正态分布,正态分布是最重要的一种连续型随机变量分布。 如果连续型随机变量X的密度函数为: 则称该变量X服从均值为,方差为2的正态分布,记为XN(,2)。,45,如果一个正态分布的=0,=1,则称该正态分布为标准正态分布,相应的随机变量称为标准正态随机变量,用Z表示,即ZN(0,1),相应的分布密度函数为,46,一般正态分布与标准正态分布的关系: 若随机变量X服从正态分布N (,2),则随机变量 Z = 服从标准正态

15、分布,即ZN(0,1)。,47,z值 概率 1.00 0.6827 1.65 0.9000 1.96 0.9500 2.00 0.9545 2.58 0.9900 3.00 0.9973,例:p(-1Z1)表示变量Z落入(-1,1)的概率,等于0.6827,48,3准则,3准则在产品质量控制中有着重要的应用。由标准正态分布表可求得: 当 时,有: 这说明,X的取值几乎全部集中在-3,3区间内,超过这个范围的可能不到0.3%。,49,这些结论推广到一般正态分布,即 , 有: 显然, 的概率很小,因此可以认为X的值几乎一定落在区间 内,这在统计学上称做“3准则”。,50,例题:课本P85第17题,解题步骤: 1、算出均值; 2、算出标准差; 3、计算两个标准差的变动区间: 均值-2个标准差,均值+2个标准差 4、判断。,51,学会查正态分布概率表 P305 ; 学会运用正态分布的对称性进行分割计算; 学会将正态分布化为标准正态分布,再计算其概率。 例如:求p(1Z1.25)? 解:原式=0.5p(-1.25Z1.25)-p(-1Z1) =0.5(0.7887-0.6827) =0.053,52,例1:某大学英语考试成

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号