数学建模案例分析--最优化方法建模6动态规划模型举例

上传人:wt****50 文档编号:35446760 上传时间:2018-03-15 格式:DOC 页数:6 大小:327KB
返回 下载 相关 举报
数学建模案例分析--最优化方法建模6动态规划模型举例_第1页
第1页 / 共6页
数学建模案例分析--最优化方法建模6动态规划模型举例_第2页
第2页 / 共6页
数学建模案例分析--最优化方法建模6动态规划模型举例_第3页
第3页 / 共6页
数学建模案例分析--最优化方法建模6动态规划模型举例_第4页
第4页 / 共6页
数学建模案例分析--最优化方法建模6动态规划模型举例_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《数学建模案例分析--最优化方法建模6动态规划模型举例》由会员分享,可在线阅读,更多相关《数学建模案例分析--最优化方法建模6动态规划模型举例(6页珍藏版)》请在金锄头文库上搜索。

1、6 动态规划模型举例以上讨论的优化问题属于静态的,即不必考虑时间的变化,建立的模型线性规划、非线性规划、整数规划等,都属于静态规划。多阶段决策属于动态优化问题,即在每个阶段(通常以时间或空间为标志)根据过程的演变情况确定一个决策,使全过程的某个指标达到最优。例如:(1)化工生产过程中包含一系列的过程设备,如反应器、蒸馏塔、吸收器等,前一设备的输出为后一设备的输入。因此,应该如何控制生产过程中各个设备的输入和输出,使总产量最大。(2)发射一枚导弹去击中运动的目标,由于目标的行动是不断改变的,因此应当如何根据目标运动的情况,不断地决定导弹飞行的方向和速度,使之最快地命中目标。(3)汽车刚买来时故障

2、少、耗油低,出车时间长,处理价值和经济效益高。随着使用时间的增加则变得故障多,油耗高,维修费用增加,经济效益差。使用时间俞长,处理价值也俞低。另外,每次更新都要付出更新费用。因此,应当如何决定它每年的使用时间,使总的效益最佳。动态规划模型是解决这类问题的有力工具,下面介绍相关的基本概念及其数学描述。(1)阶段 整个问题的解决可分为若干个相互联系的阶段依次进行。通常按时间或空间划分阶段,描述阶段的变量称为阶段变量阶段变量,记为。k(2)状态 状态表示每个阶段开始时所处的自然状况或客观条件,它描述了研究过程的状况。各阶段的状态通常用状态变量状态变量描述。常用表示第阶段的状态变量。个阶段的决策过程有

3、kxkn个状态。用动态规划方法解决多阶段决策问题时,要求整个过程具有无后效性无后效性。即:如果1n某阶段的状态给定,则此阶段以后过程的发展不受以前状态的影响,未来状态只依赖于当前状态。(3)决策 某一阶段的状态确定后,可以作出各种选择从而演变到下一阶段某一状态,这种选择手段称为决策决策。描述决策的变量称为决策变量决策变量。决策变量限制的取值范围称为允许决策集合允许决策集合。用表示第阶段处于状态时的决策变量,它是的函数,用表示的允许)(kkxukkxkx)(kkxDkx决策集合。(4)策略 一个由每个阶段的决策按顺序排列组成的集合称为策略策略。由第阶段的状态开始kkx到终止状态的后部子过程的策略

4、记为。在实际问题中,)(,),(),()(11nnkkkkkkxuxuxuxpL可供选择的策略有一定范围,称为允许策略集合允许策略集合。其中达到最优效果的策略称为最优策略最优策略。 (5)状态转移方程 如果第个阶段状态变量为,作出的决策为,那么第阶段的状kkxku1k态变量也被完全确定。用状态转移方程表示这种演变规律,写作,1kx(1kkTxkx)ku(6)最优值函数 指标函数是系统执行某一策略所产生结果的数量表示,是用来衡量策略优劣的数量指标,它定义在全过程和所有后部子过程上。指标函数的最优值称为最优值函数最优值函数。下面的方程在动态规划逆序求解中起着本质的作用。1 , 1,),(,0)()

5、,()(,(min)(11111)(LnnkuxTxxfxfxuxvxfkkkknnkkkkkkxDukk kkk称此为动态规划逆序求解的基本方程(贝尔曼方程) 。可以把建立动态规划模型归纳成以下几个步骤:(1)将问题恰当地划分为若干个阶段;(2)正确选择状态变量,使它既能描述过程的演变,又满足无后效性;(3)规定决策变量,确定每个阶段的允许决策集合;(4)写出状态转移方程;(5)确定各阶段各种决策的阶段指标,列出计算各阶段最优后部策略指标的基本方程。下面结合具体例子阐述建立动态规划模型的思路。例例13 生产计划问题。公司要对某产品制定n周的生产计划,产品每周的需求量、生产和贮存费用、生产能力

6、的限制、初始库存量等都是已知的,试在满足需求的条件下,确定每周的生产量,使n周的总费用最少。决策变量是第周的生产量,记作。已知下列数据及函数关系:第周的k), 2 , 1(nkukLk需求量:第周产量为时的生产费为;第周初贮存量为kx时这一周的贮存费kdkku)(kkuck为)(kkxh;第周的生产能力限制为;初始()及终结()时贮存量均为零。kkU0knk 按照最短路问题的思路,设从第周初贮存量为到(周末)过程结束的最小费用函数为kkxn,则下列逆向递推公式成立。)(kkxf 0)(1 , 2,)()()(min)(11110nnkkkkkkkkUukkxfnkXxxfxhucxfkk,(1

7、)而kx与满足1kx(2) 012,111nkkkk xxnkduxx,这里贮存量是状态变量, (2)式给出了相邻阶段的状态在决策变量作用下的转移规律,kx称为状态转移规律。在用(1)式计算时,的取值范围允许状态集合由(2)式及允kxkX许决策集合决定。)0(kkUu 在实际问题中,为简单起见,生产费用常取,;,)(kkuc0kukkkcuauc)(,其中是单位产品生产费,而是生产准备费。贮存费用常取,是单0kucakkkhxxh)(h位产品(一周的)贮存费。最优方程(1)和状态转移方程(2)构成了这个多阶段决策问题的动态规划模型。实际上,多阶段决策问题有时也可用静态规划方法求解,如例2的生产

8、计划问题。例例14 资源分配问题。总量为的资源A和总量为的资源B同时分配给n个用户,已知第1m2m用户利用数量的资源A和数量的资源B时,产生的效益为,问如何分配现有资kkukv),(kkkvug源使总效益最大。这本来是个典型的静态规划问题:(1) nkkkkvugZMax1),( nkkkumuts110,. .(2) nkkkvmv120,(3)但是当比较复杂及n较大时,用非线性规划求解是困难的,特别是,若是用表格或图形给kgkg出而无解析表达式时,则难以求解。而这种情况下,将其转化为动态规划,是一种可行的方法。资源A,B每分配给一个用户划分为一个阶段,分配给第用户的数量是二维决策变量k,而

9、把向第用户分配之前,分配者手中掌握的资源数量作为二维状态变量,记作),(kkvuk,这样,状态转移方程应为),(kkyx kkkkkk vyyuxx11(4) 最优值函数定义为将数量的资源分配给第至第n用户时能获得的最大效益,),(kkkyxf),(kkyxk它满足最优方程0)0 , 0(1 , 2 ,0 ,0),(),(max),(12111100nkkkkkkkkyvxukkkfnkmymxyxfvugyxfkkkk(5) 对于由(4) , (5)式构成的动态规划模型,不需要,的解析表达式,完全),(kkkvug),(kkkyxf可以求数值解。例例15 系统可靠性问题。一个系统由若干部件串

10、联而成,只要有一个部件故障,系统就不能正常运行。为提高系统的可靠性,每个部件都装置备用件,一旦原部件故障,备用件就自动进入系统。显然,备用件越多,系统可靠性越高,但费用也越大,那么在一定的总费用限制下,如何配置各部件的备用件,使系统的可靠性最高呢?设系统有n个部件,当部件装置个备用件时,这个部件正常工作的概率为。而kku)(kkup每个备用件的费用为,另外设总费用不应超过。kcC这个优化问题的目标函数是系统正常运行的概率,它等于n个串联部件正常工作的概率的乘积。约束条件是备用件费用之和不应超过,决策变量是各部件的备用件数量,于是问题归结C为CnkkkupZMax1)((1)为非负整数 nkkk

11、kuCucts1,. .(2)这个非线性规划转化为动态规划求解比较方便。按照对n个部件装置备用件的次序划分阶段,决策变量仍为部件的备用件数量,而状kku态变量选取装配部件之前所容许使用的费用,记作,于是状态转移方程为kkxkkkkucxx1(3)最优值函数定义为状态下,由部件到部件n组成的子系统的最大正常工作概率,它)(kkxfkxk满足)()()(11)(kkkkxUukkxfupMaxxfkkk(4)且为正整数, , /c, 0)(kkxuuxUkkkk12,0, nkCxk1)(11nnxf(5)注意,这个动态规划模型的最优方程(4)中,阶段指标与最优值函数之)(kkup)(11kkxf

12、间的关系是相乘,而不是例1315中的相加,这是由“两事件之交的概率等于两事件概率之积”这一性质决定的。与此相应,最优值函数的初始条件等于1。1)(11nnxf例例16 任务均衡问题。一批任务由若干设备完成,问题是如何均衡地向每个设备分配各项任务,使这批任务尽早地完成。例如一高层(设层)办公大楼有n部性能相同的电梯,为了在早高N峰期间尽快地将乘客送到各层的办公室,决定各部电梯分段运行,即每部电梯服务一定的层段。假定根据统计资料,已知一部电梯从第 层次开始服务层所需要的时间为,问如何安排这些ijijt电梯服务的层段,使送完全部乘客的时间最短。按照由下而上安排电梯服务层次的序号划分阶段。第部电梯(即

13、第阶段)nk, 2 , 1Lkk开始服务的层次为状态,它服务的层数为决策,满足kxkukkkuxx1(1)当,时,已知第部电梯服务的时间为。因为对于第两部电梯ixkjukkijkkktuxv),(lk,而言,总的服务时间为,所以最优值函数(即从第部到第),(),(lllkkkuxvuxvMax)(kkxfkn部电梯总的最短服务时间)满足)(),(maxmin)(11)(kkkkkxUukkxfuxvxfkkk1)(, 2 , 1|)(knxNuuxUkkkkk1 , 2 , 3 , 2LLnkNxk(2)0) 1(1nfn(3)这里我们假定每部电梯至少服务1层,且从第2层起开始服务。应用动态规

14、划方法求解多阶段决策问题分为两个步骤。第一是应用动态规划基本方程,逆序地求出条件最优目标函数值集合和条件最优决策集合。第二是顺序地求出最优决策序列。下面以一个例子加以说明。例例1717 机器负荷分配问题。某种机器可以在高低两种不同的负荷下进行生产。在高负荷下生产时,每台机器生产产品的年产量为7吨,年折损率(即若年初完好的机器有台,则年终完7 . 0au好的机器数为台) ,在低负荷下生产时,每台机器生产产品的年产量为5吨,年折损率au。若开始时完好的机器数有台,要求制定一个三年计划,在每年开始时,决9 . 0b10001x定如何重新分配在两种不同的负荷下生产的完好机器数,使在三年内产品的总产量达

15、到最大。设第年初完好的机器数为,分配给高负荷下生产的机器数为,即在低负荷下生产的kkxku机器数为-。这里、可取非负实数,如表示第年度一台机器正常工作时间kxkukukx7 . 0kxk只占。于是第年初完好的机器数7 . 01kkkkkkkuxuxux2 . 09 . 0)(9 . 07 . 01第年度的产量kkkkkkkkkuxuxuuxv25)(57),(设三年总产量为,则问题即求解下面的线性规划问题:V 31)25(kkkuxVMax1000. .1xts3 , 2 , 1,0,2 . 09 . 01kxuuxxkkkkk现用动态规划来解。本题要求的是已知第一年度初拥有的完好机器数台,用最优方案10001x到第三年度末这段期间的产品产量,将它记为。为此先求:已知第年度初拥有的完好机)(11xfj器数,用最优方案到第三年末这段期间的产品产量,将它记为,列出动态jx3 , 2),(jxfjj规划的基本方程0)(3 , 2 , 1,2 . 09 . 0)(),()(441110xfkuxxxfuxvMaxxfkkkkkkkkxukk kk求解过程如下:)(),()(4

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号