概率统计建模讲义概要

上传人:今*** 文档编号:108103926 上传时间:2019-10-22 格式:DOC 页数:34 大小:1.06MB
返回 下载 相关 举报
概率统计建模讲义概要_第1页
第1页 / 共34页
概率统计建模讲义概要_第2页
第2页 / 共34页
概率统计建模讲义概要_第3页
第3页 / 共34页
概率统计建模讲义概要_第4页
第4页 / 共34页
概率统计建模讲义概要_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《概率统计建模讲义概要》由会员分享,可在线阅读,更多相关《概率统计建模讲义概要(34页珍藏版)》请在金锄头文库上搜索。

1、数理统计例举王晓谦南京师范大学2014年4月 主要内容随机变量及其分布 经验分布函数和频率直方图 参数估计 假设检验 相关分析与回归分析简介 MATLAB例题例1能量供应问题 例2 放射性 例3正态分布 例4指数分布 例5 多元随机变量例6经验分布函数 例7超市问题 例8区间估计 例9 拟合检验1 例10拟合检验2 例11概率纸检验法 例12道德 例13肠癌 例14 J效应 Back Next 随机变量及其分布例1、能量供应问题(二项分布)假定有个工人间歇性地使用电力,估计所需要的总负荷。首先我们要知道,或者是假定,每个工人彼此独立工作,而每一时刻每个工人都以相同的概率p需要一个单位的电力。那

2、么,同时使用电力的人数就是一个随机变量,它服从所谓的二项分布。用X表示这个随机变量,记做,且有 这是非常重要的一类概率分布。其中E(X)np, D(X)=np(1-p)。 其次,要根据经验来估计出,p值是多少?例如,一个工人在一个小时里有12分钟在使用电力,那么应该有。最后,利用公式我们求出随机变量X的概率分布表如下:X012345678910P0.1073740.2684350.301990.2013270.088080.0264240.0055050.0007860.0000740.0000040.000000累积概率0.1073740.375810.67780.8791260.96720

3、70.9936310.9991360.9999220.99999611为直观计,我们给出如下概率分布图:可以看出,也就是说,如果供应6个单位的电力,则超负荷工作的概率只有0.000864,即每中,才可能有一分钟电力不够用。还可以算出,八个或八个以上工人同时使用电力的概率就更小了,比上面概率的还要小。问题:二项分布是一个重要的用来计数的分布。什么样的随机变量会服从二项分布?进行n次独立观测,在每次观测中所关心的事件出现的概率都是p,那么在这n次观测中事件A出现的总次数是一个服从二项分布B(n,p)。作业:用MATLAB计算本题。binopdf(x,n,p) 计算x中每个值对应的二项分布概率bin

4、ocdf(x,n,p) 计算x中每个值对应的分布函数值 binoinv(y,n,p) 计算使得分布函数值大于等于y的最小整数x:P(X=y binornd(n,p, mm, nn) 产生二项分布随机数,mm行nn列。再如,产生两行五列的随机数用binornd(10,0.2,2,5)例如binopdf(0:10,10,0.2), binoinv(0.9,10,0.2)=4,binoinv(0:10)/10,10,0.2)binornd(10,0.2,1,5)ans = 2 2 1 1 4例2、Rutherford 对裂变物质的观测 (Poisson分布)英国著名物理学家 Rutherford(1

5、8711937)在其放射性物质试验中,观测在时间间隔T内放射性物质放射出的粒子数。实际试验时,取时间间隔为T=7.5秒,观测了N2608次,将每次观测到的粒子数记录下来,列在下表中第1,2行:粒子数X012345678910频数n57203383525532408273139452716频率f0.0218560.0778370.1468560.2013040.2039880.1564420.1046780.0532980.0172550.0103530.006135概率p0.0208580.0807220.1561970.2014940.1949450.1508880.0973230.0538

6、050.0260280.0111920.006547我们用X表示T=7.5秒内观测到的粒子数,它是一个随机变量,服从什么分布呢?在2608次观测中,共观测到10094个粒子数,平均每次观测到=MN1009426083.87个粒子数,用参数为=3.87的Poisson分布P计算一下: 将计算结果列在上表中最后一行,与列在第3行的实际频率比较,比较的图示在下图中。(Excel)可以看出,认为X服从参数为3.87的Poisson分布还是非常合理的。在后面统计部分,我们会用Pearson拟合检验法来证明这种合理性。 目录 Back Next作业:用MATLAB计算本题。poisspdf(x,),计算p

7、oisson概率,poisscdf, poissinv, poissrnd例如,poisspdf(0:9,3.87)问题:Poisson分布是又一类非常重要的用来计数的离散型分布,它依赖于一个参数。什么样的随机变量会服从Poisson分布呢? 目录 Back Next在给定的观测范围内(例如给定时间内,给定区域内,等等),事件会发生多少次?把观测范围分成n个小范围:1、 给定事件在每个小范围内可能发生,也可能不发生,发生多少次取决于小范围的大小;2、 在不同的小范围内发生多少事件相互独立;3、 在小范围里发生的事件数多于一个的概率,和小范围的大小相比可以忽略不计,用表示在小范围内事件发生一次的

8、概率。那么在给定范围内发生的总事件数X近似服从,为给定范围内事件发生次数的近似平均值。令,则为给定范围内事件发生次数的准确平均值,这时这正是Poisson分布,其中参数。 例3、正态分布随机变量X如果有密度函数则称此随机变量服从参数为的正态分布,记做,其中都是给定的参数,。称为标准正态分布,用表示其分布函数,其密度函数为时,我们有 目录 Back Next大量连续型随机变量服从正态分布,所以正态分布在处理数据时是非常有用处的。我们在统计部分会大量用到它。Matlab中用norm表示正态分布,参数是数学期望和标准差。下面是正态分布的密度函数图像:(正态密度图像)例4、指数分布称随机变量X服从参数

9、为1的指数分布或标准指数分布,若它有密度函数它的分布函数为 设是给定常数,则Y的分布函数为其密度函数为这是一般的指数分布。b0的指数分布的密度函数图像如下所示(指数密度):可见,随着的减小,随机变量取到较大值的概率增加。事实上,是随机变量的数学期望。 指数随机变量经常用来刻画寿命。 目录 Back Next例5、 多元随机变量我们经常需要考虑量与量之间的关系,如果这些量是随机变量,那么就需要把多个随机变量放在一起,考虑多元随机变量。设是n元随机变量,它的分布函数是一个n元函数:利用这个分布函数就可以讨论这n个随机变量之间各种各样的关系。1、 边际分布与独立性相互独立当且仅当2、 相关系数两个随

10、机变量之间的相关系数定义为其中相关系数刻画了随机变量之间的线性相关程度,越接近于0,线性相关关系越弱。 定理:设二维随机变量(X,Y)的相关系数为,则(1)、(2)、在(X,Y)服从二元正态分布的条件下,X与Y独立的充要条件是;(3)、若,则几乎必然有其中是确定的常数;若,则几乎必然有其中是确定的常数。3、 条件分布在已知其中某些随机变量的取值的情况下,可以进一步确定其他随机变量的条件分布。例如,在有密度函数的情况下,我们还可以求条件密度函数,甚至利用Bayes定理,解决许多重要问题。目录 Back Next综上所述,我们知道在概率论里学过许多分布,当然,还有许多分布我们没有学过。但是,在实践

11、中我们可能会遇到各种各样的分布,甚至还有没被发现的分布。在处理数据的时候,我们要搞清楚:1、 数据是哪个或哪些指标的取值?2、 这个或这些指标是不是随机变量或随机向量? 3、 如果是,那么它服从什么分布?4、 用统计方法确定分布;5、 分布确定后,用概率方法求出问题的解。下面我们就讨论用统计方法确定分布的问题。经验分布函数和频率直方图当我们确定讨论的指标的确是随机变量后,剩下的关键任务就是确定它的分布。那么它的观测数据就是我们赖以解决问题的基本资料,叫做样本,而这个随机变量就叫做总体。这些数据反映了该随机变量分布的基本特征。我们可以利用这些数据构造一个分布函数,理论上可以证明它很接近于那个未知

12、分布。这个分布函数就叫做经验分布函数。例6、例2续(经验分布函数)在例2,我们确定所讨论的指标在时间间隔T秒内放射出的粒子数X,是一个随机变量。且有该随机变量的n2608个观测值,这就是一个容量为2608的样本。在没有其他信息的情况下,首先应该给出该样本的经验分布函数:在这里我们可求出这个经验分布函数如下:这个函数的图像如下(Poisson2):如果熟悉Poisson分布的分布函数图像的话,就可以从这个图像判断出,X可能服从参数为3.87的Poisson分布。从这个经验分布函数容易解决概率计算问题:当然,由于是离散型的随机变量,我们可能更熟悉如下频率分布图像:也就是说,对于离散型随机变量,我们

13、更常用的方法是绘制这种频率分布图。为了判断分布的类型,对于离散型随机变量,要绘制频率分布图!作业:用MATLAB计算本例。例7、超市问题(频率直方图)随机抽取某大学超市137位顾客的购买金额的实际记录(单位:元),数据如下。请问购买金额服从什么分布?65.209.9029.7261.1016.9214.3824.1316.9929.33 4.399.8085.9622.5037.1932.318.4035.0341.706.084.906.2820.401.807.902.5015.0529.2711.1011.0826.1017.5023.0523.123.0012.8813.189.0044.094.0045.4533.6921.9217.003.4016.306.6011.3

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号