[教育]第10章 动态规划20分钟

上传人:油条 文档编号:49712904 上传时间:2018-08-01 格式:PPT 页数:38 大小:863.50KB
返回 下载 相关 举报
[教育]第10章  动态规划20分钟_第1页
第1页 / 共38页
[教育]第10章  动态规划20分钟_第2页
第2页 / 共38页
[教育]第10章  动态规划20分钟_第3页
第3页 / 共38页
[教育]第10章  动态规划20分钟_第4页
第4页 / 共38页
[教育]第10章  动态规划20分钟_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《[教育]第10章 动态规划20分钟》由会员分享,可在线阅读,更多相关《[教育]第10章 动态规划20分钟(38页珍藏版)》请在金锄头文库上搜索。

1、管 理 运 筹 学第十章 动态规划1 多阶段决策过程最优化问题举例2 基本概念、基本方程与最优化原理3 动态规划的应用1管 理 运 筹 学1 多阶段决策过程最优化问题举例例1 最短路径问题下图表示从起点A到终点E之间各点的距离。求A到E的最短路径。BACBDBCDEC4123123123221 6472483867561106375 12管 理 运 筹 学1 多阶段决策过程最优化问题举例(一)用穷举法的计算量:l 如果从A到E的站点有k=4个,除A、E之外每 站有3个位置则总共有3k-1条路径;l 计算各路径长度总共要进行 3k-1次加法以及3k-1-1次比较。随着 k 的值增加时,需要进行的

2、加法和比较的次数将迅速增加。3管 理 运 筹 学1 多阶段决策过程最优化问题举例(二)用动态规划解法以上求从A到E的最短路径问题,可以转化为四个性质完全相同,但规模较小的子问题,即分别从Di 、Ci、Bi、A到E的最短路径问题。第四阶段:两个始点D1和D2,终点只有一个;表10-1分析得知:从D1和D2到E的最短路径唯一。阶段4 本阶段始点 (状态)本阶段各终点(决策)到E的最短距离本阶段最优终点 (最优决策) ED1D210*6106EE4管 理 运 筹 学第三阶段:有三个始点C1,C2,C3,终点有D1,D2,对始 点和终点进行分析和讨论分别求C1,C2,C3到D1,D2 的最短 路径问题

3、:表10-2分析得知:如果经过C1,则最短路为C1-D2-E;如果经过C2,则最短路为C2-D2-E;如果经过C3,则最短路为C3-D1-E。阶段3 本阶段始点 (状态)本阶段各终点(决策)到E的最短距离本阶段最优终点 (最优决策) D1 D2C1C2C38+10=187+10=171+10=116+6=125+6=116+6=12121111D2D2D11 多阶段决策过程最优化问题举例5管 理 运 筹 学第二阶段:有4个始点B1,B2,B3,B4,终点有C1,C2,C3。对始点和终点进行 分析和讨论分别求B1,B2,B3,B4到C1,C2,C3 的最短路径问题:表10-3 分析得知:如果经过

4、B1,则走B1-C2-D2-E;如果经过B2,则走B2-C3-D1-E;如果经过B3,则走B3-C3-D1-E;如果经过B4,则走B4-C3-D1-E。1 多阶段决策过程最优化问题举例阶段2本阶段始点 (状态)本阶段各终点(决策)到E的最 短距离本阶段最优 终点(最优 决策) C1 C2 C3B1B2B3B42+12=144+12=164+12=167+12=191+11=127+11=188+11=195+11=166+11=172+11=133+11=141+11=1212131412C2C3C3C36管 理 运 筹 学第一阶段:只有1个始点A,终点有B1,B2,B3,B4 。对始点和 终

5、点进行分析和讨论分别求A到B1,B2,B3,B4的最短路径问题:表10-4最后,可以得到:从A到E的最短路径为A B4 C3 D1 E1 多阶段决策过程最优化问题举例阶段1本阶段始 点(状态)本阶段各终点(决策)到E的最 短距离本阶段最优 终点(最优决 策)B1 B2 B3 B4A 4+12=16 3+13=163+14=172+12=14 12 C27管 理 运 筹 学以上计算过程及结果,可用图2表示,可以看到,以上方法不仅 得到了从A到D的最短路径,同时,也得到了从图中任一点到E的最 短路径。以上过程,仅用了22次加法,计算效率远高于穷举法。BCBBCDC413ADE21231233216

6、4 7248 38675161060106121111121314141275121 多阶段决策过程最优化问题举例8管 理 运 筹 学一、基本概念:1、阶段k:表示决策顺序的离散的量,阶段可以按时间或空间划分。2、状态sk:能确定地表示决策过程当前特征的量。状态可以是数量,也可以是字符,数量状态可以是连续的,也可以是离散的。3、决策xk:从某一状态向下一状态过渡时所做的选择。决策是所 在状态的函数,记为xk(sk)。决策允许集合Dk(sk):在状态sk下,允许采取决策的全体。4、策略Pk,n(sk):从第k阶段开始到最后第n阶段的决策序列,称k 子策略。P1,n(s1)即为全过程策略。5、状态

7、转移方程 sk+1=Tk(sk, xk):某一状态以及该状态下的决策,与下一状态之间的函数关系。2 基本概念、基本方程与最优化原理9管 理 运 筹 学6、阶段指标函数vk(sk, xk):从状态sk出发,选择决策xk所产生的第k阶段指标。过程指标函数Vk,n(sk, xk, xk+1, xn):从状态sk出发,选择决策 xk,xk+1, , xn所产生的过程指标。动态规划要求过程指标具有可分离性,即 Vk,n(sk, xk, xk+1, , xn) = vk(sk, xk)+Vk+1(sk+1, xk+1, , xn)称指标具有可加性,或 Vk,n(sk, xk, xk+1, , xn) =

8、vk(sk, xk)Vk+1(sk+1,xk+1, , xn)称指标具有可乘性。二、基本方程:最优指标函数fk(sk):从状态sk出发,对所有的策略Pk,n,过程指标Vk,n的最优值,即2 基本概念、基本方程与最优化原理10管 理 运 筹 学对于可加性指标函数,上式可以写为上式中“opt”表示“max”或“min”。对于可乘性指标函数,上式可以写为以上式子称为动态规划最优指标的递推方程,是动态规划的基本方程。终端条件:为了使以上的递推方程有递推的起点,必须要设定最优指标的终端条件,一般最后一个状态n+1下最优指标fn+1(sn+1) = 0。2 基本概念、基本方程与最优化原理11管 理 运 筹

9、 学三、最优化原理作为整个过程的最优策略具有如下性质:不管在此最优策略上的某个状态以前的状态和决策如何,对该状态来说,以后的所有决策必定构成最优子策略。就是说,最优策略的任意子策略都是最优的。2 基本概念、基本方程与最优化原理12管 理 运 筹 学一、资源分配问题例2. 某公司拟将某种设备5台,分配给所属的甲、乙、丙三个工厂。各工厂获得此设备后,预测可创造的利润如表10-5所示,问这5台设备应如何分配给这3个工厂,使得所创造的总利润为最大?表10-5盈利 工厂 设备台数甲 厂 乙 厂 丙 厂0 0 0 01 3 5 42 7 10 63 9 11 114 12 11 125 13 11 123

10、 动态规划的应用13管 理 运 筹 学解:将问题按工厂分为三个阶段,甲、乙、丙三个厂分 别编号为1、2、3厂。设sk= 分配给第k个厂至第3个厂的设备台数(k=1、2、 3)。xk=分配给第k个设备台数。已知s1=5,并有从 与 的定义,可知3 动态规划的应用14管 理 运 筹 学55423100542310s1s2s3s4-x1-x2-x315管 理 运 筹 学第三阶段:显然将 台设备都分配给第3工厂时,也就是 时,第3阶段的指标值(即第3厂的盈利)为最大,即由于第3阶段是最后的阶段,故有其中 可取值为0,1,2,3,4,5。其数值计算见表106。3 动态规划的应用16管 理 运 筹 学表1

11、060 1 2 3 4 50 0 001 4 412 6 623 11 1134 12 1245 121253 动态规划的应用17管 理 运 筹 学其中 表示取3子过程上最优指标值 时的 决策,例如在表10-6中可知当 =4时,有 有此时 ,即当 时,此时取 (把4台设备分配给第3厂)是最优决策,此时阶段指标值 (盈利)为12,最优3子过程最优指标值也为12。第二阶段:当把 台设备分配给第2工厂和第3工 厂时,则对每个 值,有一种最优分配方案,使最大盈利 即最优2子过程最优指标函数值为3 动态规划的应用18管 理 运 筹 学因为 上式也可写成其数值计算如表107所示。表1070 1 2 3 4

12、 5 0 00104 51206 54 1023011 56 110 1424012 114 110 161,25012 512 116 114 1102123 动态规划的应用19管 理 运 筹 学其中在 的这一行里,当 时,这里 从表105中可知,把1台设备交给乙厂所得盈 利数即可,知 ,这里 从表106查即可知 =11。同样可知当 时,可知; 当 时, ;当 时,;当 时, ;由于 ,不可能分2厂5 台设备,故 时, 栏空着不填。从 这些数值中取得最大即得 ,即有 =16。在此行中 我们在取最大值的 上面加一横以示 区别,也可知这时 的最优决策为1或2。3 动态规划的应用20管 理 运 筹

13、 学第一阶段:把 台设备分配给第1,第2,第3厂时,最大 盈利为 其中 可取值0,1,2,3,4,5. 数值计算见表108表10-8然后按计算表格的顺序推算,可知最优分配方案有两个:1.由于 ,根据 ,查表107可 知 ,再由 ,求得 。即分配 给甲厂0台,乙厂2台,丙厂3台。2.由于 ,根据 ,查表107可0 1 2 3 4 55316 9+10 12+5 13+0 21 0,23 动态规划的应用21管 理 运 筹 学知 ,再由 ,求得 ,即分配给甲厂2台,乙厂2台,丙厂1台。这两种分配方案都能得到最高的总盈利21万元。 3 动态规划的应用22管 理 运 筹 学二、背包问题设有n种物品,每一种物品数量无限。第i种物品每件重量为wi公斤,每件价值ci元。现有一只可装载重量为W公斤的背包,求各种物品应各取多少件放入背包,使背包中物品的价值最高。这个问题可以用整数规划模型来描述。设xi为第i种物品装入背包的件数(i =1, 2, , n),背包中物品的总价值为z,则Max z = c1x1+c2x2+ +cnxns.t. w1x1+w2x2+wnxnWx1, x2, , xn0 且为整数。3 动态规划的应用23管 理 运 筹 学下面用动态规划逆序解法求解它。设 阶段变量k:第k次装载第k种物

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号