第五章 概率统计模型 本章重点: 初等概率模型 随机性决策模型 随机型存储模型 排队模型复习要求:1.会建立简单的初等概率模型2.掌握随机性决策模型的建立与求解方法,了解随机性存储模型3.了解排队模型,会用排队模型中的简单结论求解相关问题一、初等概率模型 初等概率模型主要介绍了可靠性模型、传染病流行估计、常染色体遗传模型等三类问题,下面复习遗传模型1.问题分析 所谓常染色体遗传,是指后代从每个亲体的基因中各继承一个基因从而形成自己的基因型.如果所考虑的遗传特征是由两个基因A和B控制的,那么就有三种可能的基因型:AA,AB和BB.例如,金鱼草是由两个遗传基因决定它开花的颜色,AA型开红花,AB型的开粉花,而BB型的开白花.这里的AA型和AB型表示了同一外部特征(红色),则人们认为基因A支配基因B,也说成基因B对于A是隐性的.当一个亲体的基因型为AB,另一个亲体的基因型为BB,那么后代便可从BB型中得到基因B,从AB型中得到A或B,且是等可能性地得到.问题:某植物园中一种植物的基因型为AA,AB和BB.现计划采用AA型植物与每种基因型植物相结合的方案培育植物后代,试预测,若干年后,这种植物的任一代的三种基因型分布情况. 2.模型假设(1)按问题分析,后代从上一代亲体中继承基因A或B是等可能的,即有双亲体基因型的所有可能结合使其后代形成每种基因型的概率分布情况如表5-1.表5-1下一代基因型(n代)上一代父-母基因型(n-1代)AA-AAAA-ABAA-BBAB-ABAB-BBBB-BBAA11/201/400AB01/211/21/20BB0001/41/21(2) 以和分别表示第n代植物中基因型为AA,AB和BB的植物总数的百分率,表示第n代植物的基因型分布,即有 (5 .1)特别当n=0时,表示植物基因型的初始分布(培育开始时所选取各种基因型分布),显然有3.模型建立注意到原问题是采用AA型与每种基因型相结合,因此这里只考虑遗传分布表的前三列.首先考虑第n代中的AA型,按上表所给数据,第n代AA型所占百分率为即第n-1代的AA与AA型结合全部进入第n代的AA型,第n-1代的AB型与AA型结合只有一半进入第n代AA型,第n-1代的BB型与AA型结合没有一个成为AA型而进入第n代AA型,故有 (5 .2)同理,第n代的AB型和BB型所占有比率分别为 (5 .3) (5 .4)将(5.2)、(5.3)、(5.4) 式联立,并用矩阵形式表示,得到 (5 .5)其中利用(5 .5)进行递推,便可获得第n代基因型分布的数学模型 (5 .6)(5.6)式明确表示了历代基因型分布均可由初始分布与矩阵M确定.4.模型求解这里的关键是计算.为计算简便,将M对角化,即求出可逆阵P,使,即有从而可计算 其中为对角阵,其对角元素为M的特征值,P为M的特征值所对应的特征向量.分别为 ,故有即得于是 或写为由上式可见,当时,有即当繁殖代数很大时,所培育出的植物基本上呈现的是AA型,AB型的极少,BB型不存在.5.模型分析 (1)完全类似地,可以选用AB型和BB型植物与每一个其它基因型植物相结合从而给出类似的结果.特别是将具有相同基因植物相结合,并利用前表的第1、4、6列数据使用类似模型及解法而得到以下结果:这就是说,如果用基因型相同的植物培育后代,在极限情形下,后代仅具有基因AA与BB,而AB消失了.(2)本例巧妙地利用了矩阵来表示概率分布,从而充分利用特征值与特征向量,通过对角化方法解决了矩阵n次幂的计算问题,可算得上高等代数方法应用于解决实际的一个范例.例2 血友病也是一种遗传疾病,得这种病的人由于体内没有能力生产血凝块因子而不能使出血停止.很有意思的是,虽然男人及女人都会得这种病,但只有女人才有通过遗传传递这种缺损的能力.若已知某时刻的男人和女人的比例为1:1.2,试建立一个预测这种遗传疾病逐代扩散的数学模型.解 假设有a%的人患有血友病,并假设下一代与上一代虽人数可能不等,但所生男女比例一样.基于这样一个假设,不妨设下一代男女与上一代相同,设初始第一代男女分别占总人数的比例占总人数的比例为 a0,b0,由题设,a0:b0=1:1.2.注意到只有女人遗传血友病,由此,第一代将有个女人及个男人有血友病,血友病占总人数的百分比为 同理,第二代将有个女人及个男人有血友病,血友病占总人数的百分比为 依次类推,第n代将有个女人及个男人有血友病,血友病占总人数的百分比为 令,则.二、随机性决策模型决策是人们在政治、经济、军事和日常生活等多方面普遍存在的一种选择方案的行为. 决策按环境而言,可以分为确定型,不确定型和风险型,其中风险型决策的决策类型是最常见的,.所谓风险型决策是指在作出决策时,往往有某些随机性的因素影响,而决策者对于这些因素的了解不足,但是对各种因素发生的概率已知或者可估算出来,因此这种决策因存在一定的风险.1.风险决策模型的基本要素(1) 决策者 进行决策的个人、委员会或某个组织.在问题比较重大和严肃时,通常应以后者形式出现.(2) 方案或策略 参谋人员为决策者提供的各种可行计划和谋略. 如渔民要决定出海打鱼与否便是两个方案或称两个策略.(3) 准则 衡量所选方案正确性的标准.作为风险型决策,采用的比较多的准则是期望效益值准则,也即根据每个方案的数学期望值作出判断.对收益讲,期望效益值越大的方案越好;反之对于损失来讲,期望效益值越小的方案越好. (4) 事件或状态 不为决策者可控制的客观存在的且将发生的自然状态称为状态(事件),如下小雨,下大雨和下暴雨即为三个事件或称三种状态,均为人所不可控因素.(5) 结果 某事件(状态)发生带来的收益或损失值.2.风险决策方法(1)利用树形图法表示决策过程具有直观简便的特点,将其称为决策树的方法.(2) 充分利用灵敏度分析(即优化后分析)方法对决策结果作进一步的推广和分析.其中的决策树概念先以一实例说明如下:例3 某渔船要对下个月是否出海打鱼作出决策.如果出海后是好天,可获收益5000元,若出海后天气变坏,将损失2000元;若不出海,无论天气好坏都要承担1000元损失费.据预测下月好天的概率为0.6,天气变坏的概率为0.4,应如何选择最佳方案?这里使用决策树方法进行决策. 先来说明决策树的画法 .先画一方块“囗”称为决策结点,由决策结点向右引出若干条直线表示不同的策略(方案)--称为策略分枝,策略分枝的右端画一个圆圈“○”称为状态结点,由它引出表示不同状态及其发生的概率的分枝称为概率分枝,最后在概率分枝的终点画“△”符号表示这一分枝的最终结果的效益值(期望值),正值表收益,负值表示损失.本例对应的决策树如图5-1.图5-1值得指出的是,画决策树是从左向右画出,画的过程中将各种已知数据标于相应的位置上. 但在决策树上进行决策计算却是从右向左进行的:先计算最右端每个状态结点的期望值. 由于本例仅有两个从决策结点A发出的状态结点——称为一级决策问题,故只需利用结果点效益值计算各状态结点的期望效益值即可. 当有两级以上决策时则需从右向左逐级计算.关于期望值的计算:将出海收益作为随机变量,其概率分布为x5000-2000p0.60.4故其期望为将此结果标记在状态结点B的上方.同理,将不出海的效益值作为随机变量,可算得期望值为-1000,将其标记在结点C的上方,便得到图5-2.图5-2比较这两个值,显然出海收益的数学期望值大.从而剪去不出海决策枝(见图5-2)而选择出海作为最终决策,效益期望值为2200元.实际中常会遇到多阶段决策. 例4 假设有一笔1000万元的资金于依次三年年初分别用于工程A和B的投资.每年初如果投资工程A,则年末以0.4的概率回收本利2000万元或以0.6的概率分文不收;如果投资工程B,则年末以0.1的概率回收2000万元或以0.9的概率回收1000万元.假定每年只允许投资一次,每次只投1000万元;试确定第3年末期望资金总数为最大的投资策略.解 建立决策树(如图3).132678410511投资A8000.4 成功投资A2000投资B0投资B情况同7投资A1000180020000.6 失败0.6 80000.6 0.4 2000300011000.1 0.9 100012投资A200028000.60.4 40000.4 13投资B400031000.1 0.9 300030000.1 21009200014投资A100018000.6 0.4 30000.9 15投资B300021000.1 0.9 2000 图3 在投资A的决策树中,第一年投资A,第二年投资B,第三年投资B的期望值最大. 在投资B的决策树中(只在A的决策树中②节点中的0.4,0.6分别换成0.1,0.9即可),可算得第一年投资B,第二年投资B,第三年投资B的期望值是两个决策树中的最大者.三、随机型存储模型存储问题的数学模型涉及以下的主要经济变量:1.需求量:某种物资在单位时间内的需求量,以D表示,如年需求量、月需求量、日需求量.需求量有时是常量,而在许多情况下则是随机变量,这时它的变化规律应当是能够掌握的.对需求量进行科学地预测和估计是解决存储问题的重要依据.2.批量:为补充存储而供应一批物资的数量称为批量,以表示.由外部订货供应的批量称为订货批量;由内部生产供应的批量称为生产批量.3. 货点;为补充存储而发生订货时的存储水平,以R表示.4.备运期:发生订货的时间与实际收到订货入库的时间的间隔.5.存储费:保管存货的费用,包括存储所占用资金的利息、仓库和场地费用、物资的存储损耗费用、物资的税金、保险费用等,以表示.6.订货费:为补充存储而订货所支付的费用,包括准备和发出订货单的费用、货物的堆放和装运的费用等,以K表示.7.缺货损失费:发生需求时,存储不能提供而引起的费用,包括利润的损失、信誉的损失、停工待料的损失以及没有履行交货合同的罚款等,以表示.存储费、订货费和缺货损失费构成了库存的总费用,即总费用=存储费+订货费+缺货损失费. 使总费用最小是建立和求解存储模型的主要目标.为实现该目标,需要确定批量和订货点,这就是所谓存储决策.批量与订货点即决策变量.因而存储模型的主要形式有:总费用=(批量)或总。