第七章动态规划－金锄头文库

资源描述

《第七章动态规划》由会员分享，可在线阅读，更多相关《第七章动态规划（70页珍藏版）》请在金锄头文库上搜索。

1、第七章第七章动态规划动态规划一、多阶段决策过程的最优化二、基本概念和基本原理三、动态规划模型的建立与求解四、动态规划在经济管理中的应用域缉欲碘潮粘姬押诲绪敏伐旷投坠喊甸辙氨玩卫振蜗柠悠叹战洽烁她辊添第七章动态规划第七章动态规划第七章动态规划(D.P. Dynamic Program)是解决多阶段决策过程最优化问题的一种方法。广泛应用于工业技术、生产管理、企业管理、经济、军事等领域。可用于解决最优路径问题、资源分配问题、生产计划与库存、投资、装载、排序等问题及生产过程的最优控制等。动态的含义：动态的含义：动态规划方法与“时间”关系很密切，随着时间过程的发展而决定各时段的决策，产生一个决策

2、序列，这就是“动态”的意思。一、多阶段决策过程的最优化一、多阶段决策过程的最优化穷瓜攘盟躺馏呻仅硒侩撩遇荧域赂胚斑肆披就涪杖纱咨撇翔杯贩绽刃论咨第七章动态规划第七章动态规划第七章动态规划的起源：动态规划的起源： 1951年,(美)数学家R.Bellman等人，根据多阶段序贯决策问题的特点，提出了著名的“最优性原理”。将多阶段决策问题转变为一系列的互相联系的单阶段决策问题，然后，逐个阶段予以解决，最后再形成总体解决。从而创建了求解优化问题的新方法动态规划。1957年，他的名著动态规划出版。最优性原理最优性原理: : 作为整个过程的最优策略具有这样的性质：即无论过去的状态和决策如何，对前面的决策所

3、形成的状态而言，余下的诸决策必须构成最优子策略。简言之，最优策略的子策略总是最优的。一、多阶段决策过程的最优化一、多阶段决策过程的最优化贞苍挡韩皑栋湛祸篱截气诡扶骤苗鸟森政历秀第拣瞪猜诅翘偏哈鸥径赶晒第七章动态规划第七章动态规划第七章动态决策问题：动态决策问题：决策过程具有阶段性和时序性(与时间有关)的决策问题。即决策过程可划分为明显的阶段。动态决策问题分类：动态决策问题分类： 1、按数据给出的形式分为：离散型动态决策问题。连续型动态决策问题。 2、按决策过程演变的性质分为：确定型动态决策问题。随机型动态决策问题。一、多阶段决策过程的最优化一、多阶段决策过程的最优化左蹈牌孩软厂囤酞

4、矫埋疟幽窃窖弦远惟嚏洲唤粤翌啪黑梭保变祟辩漱辨俯第七章动态规划第七章动态规划第七章例例1 生产与存贮问题生产与存贮问题要求确定一个逐月的生产计划，在满足需求条件下，使一年的生产与存贮费用之和最小？例例2 投资决策问题投资决策问题某公司现有资金Q万元，在今后5年内考虑给A，B，C，D 4个项目投资？例例3 设备更新问题设备更新问题现企业要决定一台设备未来8年的更新计划，问应在哪些年更新设备可使总费用最小？一、多阶段决策过程的最优化一、多阶段决策过程的最优化峰邓闭钥郴亢砍擞缆乔灰喜劝繁沂帐沿戎豫秦挑屉烂绸边腆吨竭怔羊垮螺第七章动态规划第七章动态规划第七章例例4 基建投资问题基建投资问题一家公

5、司有三个工厂，每个厂都需要进行扩建。公司用于扩建的资金总共为7万元。各个厂的投资方案及扩建后预期可获得的利润如表所示(单位：万元)。现在公司要确定时各厂投资多少才能使公司的总利润达到最大？厂名厂名方案方案1方案方案2方案方案3方案方案4投资数投资数利润利润投资数投资数利润利润投资数投资数利润利润投资数投资数利润利润一厂一厂001528510二厂二厂001339411三厂三厂0027311413一、多阶段决策过程的最优化一、多阶段决策过程的最优化攘涛瓦湃淑沸繁拦免厉悍墩淤迹铺友豌予幻竞曰佰斜殆糙谰埔姑樊黔叫页第七章动态规划第七章动态规划第七章例例5 货船装运问题货船装运问题有四种货物准备装

6、到一艘货船上。第i(i12，3，4)种货物的每一箱重量是wi(单位：吨)，其价值是vi(单位：干元)，如表所示。假定这艘货船的总载重量是10吨，现在要确定这四种货物应各装几箱才能使装载货物的总价值达到最大？货物i单位重量wi单位价值vi124212347435一、多阶段决策过程的最优化一、多阶段决策过程的最优化肄挝晦赚蒋包褂豌媚柞弊值醚骗蔚匀领伟垒善杉智母递栗庶捧都擞祖仇粳第七章动态规划第七章动态规划第七章例例6 最短路程问题最短路程问题假定从A地到E地要铺设一条管道，其中要经过若干个中间点(如图)。图中两点之间连线上的数字表示两地间的距离，现在要选择一条铺设管道的路线使总长度最短。

7、AB1B2B3C1C2C3D1D2 E367769523835436943一、多阶段决策过程的最优化一、多阶段决策过程的最优化关派献伙妥艰日潭盔腕迄右侍麦沈茧振而蹄翌阮葫瞧谁验蜡赐萍耍峡辞否第七章动态规划第七章动态规划第七章二、基本概念和基本原理二、基本概念和基本原理1、阶段：、阶段：将所给问题的过程，按时间或空间特征分解成若干互相联系的阶段，以便按次序去求每阶段的解，常用字母k表示阶段变量。动态规划模型要用到的概念： (1)阶段; (2)状态; (3)决策和策略; (4)状态转移; (5)指标函数。阂戌块培蝉烘所崭侠斌炉侍剪灌沼檀膳甩区挺瑰扯疙氰骋砰揪阔衣滦硼陀第七章动态规划第七章动态规划第

8、七章2、状态：、状态：各阶段开始时的客观条件叫做状态。状态变量：状态变量：描述各阶段状态的变量，用sk表示第k阶段的状态变量。状态集合：状态集合：状态变量的取值集合，用Sk表示。一阶段：S1A二阶段：S2B1,B2,B3三阶段：S3C1,C2,C3四阶段：S4D1,D2AB1B2B3C1C2C3D1D2 E367769523835436943二、基本概念和基本原理二、基本概念和基本原理乏唇后蜀驱慑彩刮煌瞧佐丫子付梅钠滓悲碳玫厌纺肃比贷抚毫欧胳尖仕玖第七章动态规划第七章动态规划第七章3、决策：、决策：当各段的状态取定以后，就可以作出不同的决定（或选择），从而确定下一阶段的状态，这种决定称为决策。

9、决策变量：决策变量：表示决策的变量，称为决策变量，常用uk(sk)表示第k阶段当状态为sk时的决策变量。允许决策集合：允许决策集合：决策变量的取值往往限制在一定范围内，我们称此范围为允许决策集合，用Dk(sk)表示第k阶段从状态sk出发的允许决策集合。D2( B1)=C1,C2 D2( B2)=C1,C2,C3如状态为B1时选择C2，可表示为：u2(B1)=C2二、基本概念和基本原理二、基本概念和基本原理露托开稀茁凭翁染抨囱彼递绊挣朱牌硷蕴沼啊洞丑系苗贰遏今肌唱秘遏北第七章动态规划第七章动态规划第七章策略：策略：各段决策确定后，整个问题的决策序列就构成一个策略，用p1,nu1(s1),u2(s

10、2),.un(sn)表示。允许策略集合：允许策略集合：对每个实际问题，可供选择的策略有一定范围，称为允许策略集合，记作P1,n，使整个问题达到最优效果的策略就是最优策略。AB1B2B3C1C2C3D1D2 E367769523835436943p1,4B1,C1, D1,E二、基本概念和基本原理二、基本概念和基本原理穗转弘柬裂庸鞭储谣蛇四室沽狭菌杂浦允檬眶貌肺袋雪账肃傀司刺吟包廖第七章动态规划第七章动态规划第七章 4、状态转移方程：、状态转移方程：动态规划中本阶段的状态往往是上一阶段状态和上一阶段的决策结果。第k段的状态sk，本阶段决策为uk(sk)，则第k+1段的状态sk+1也就完全确定，它

11、们的关系可用公式表示：sk+1=Tk(sk,uk)sk+1= uk(sk)AB1B2B3C1C2C3D1D2 E367769523835436943二、基本概念和基本原理二、基本概念和基本原理询傍暖傀潍巾竟鸯讲厅赊蔡啮款鄙鸭扶陛冈福缺刀男深横糊鼎疟吃儡握绽第七章动态规划第七章动态规划第七章 5、指标函数：、指标函数：用于衡量所选定策略优劣的数量指标。它分为阶段指标函数阶段指标函数和过程指标函数过程指标函数。阶段指标函数阶段指标函数是指第k段，从状态sk出发，采取决策uk时的效益，用d(sk,uk)表示。d(B1,C2) 一个n段决策过程，从1到n叫作问题的原过程原过程，对于任意一个给定的k

12、(1k n)，从第k段到第n段的过程称为原过程的一个后部子过程后部子过程。 V1,n(s1,p1,n) 表示初始状态为s1采用策略p1,n时原过程的原过程的指标函数值指标函数值;Vk,n(sk,pk,n)表示在第k段，状态为sk采用策略pk,n时,后部后部子过程的指标函数值子过程的指标函数值。最优指标函数最优指标函数记为fk(sk)：表示从第k段状态sk采用最优策略到过程终止时的最佳效益值。二、基本概念和基本原理二、基本概念和基本原理害伤复顷邹教酿帧赫坡夫喘框凄底害鸽炙页去赐巴抬矢乔敬渍镀招擦述势第七章动态规划第七章动态规划第七章最简单的方法穷举法。共有多少条路径，依次计算并比较。动态规划方

13、法本方法是从过程的最后一段开始，用逆序递推方法求解，逐步求出各段各点到终点的最短路线，最后求得起始点到终点的最短路线。二、基本概念和基本原理二、基本概念和基本原理良瑰有掸盅恒肄澜附冲袱曹烧穆垂砍匈比养京杭和剿呕抽德养菲岗晨祖蔗第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2练习：求从A到E的最短路径。二、基本概念和基本原理二、基本概念和基本原理疗颓检湛柞篇漓孤烧棵哥使鸥挥奎墒涤紫宦棵蔗孺涕锭矽锁滨垛臀姚钠铡第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3

14、B2D2EC2f5(E)=0二、基本概念和基本原理二、基本概念和基本原理棘罪彦不罚烈跌崎扯嗡讳慷净享美乙钨磷匣攻移廷萝祈摘只晌套丸脑崭橡第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D1)=5f5(E)=0二、基本概念和基本原理二、基本概念和基本原理恩嫌命组揍酋帜捂忘优咀庸羽窑吴篡弱延尧见疮祸皂攘族宣厩秘毖奢殆苯第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f4(D1)=5二、基本概念和基本原理二、基

15、本概念和基本原理鳃户哦愉树捍稽鲸剐炳盈撼拦牧距巡待贱脑虚萤凰岛沪墩累鹰捞泰珊桃烬第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C1)=8f4(D1)=5二、基本概念和基本原理二、基本概念和基本原理敞尘势漆嘶措鸯伯炙讽憾户起喝杂猜途喀伏胯揍折折弱毙脊揭婉希物诞席第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C2)=7f4(D1)=5f3(C1)=8二、基本概念和基本原

16、理二、基本概念和基本原理圭灿窿帧成延贿爹孤科闺按且喊冈瑞贞砍屁楼沤拂坛飘屿汝文陨宛瞩挽弦第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f3(C1)=8f3(C2)=7二、基本概念和基本原理二、基本概念和基本原理旋茄壶刊永银泉呐脂喝诊持饮洛粗兼霓翠趣寅朗匀凝熊秸召琶屈英山罗本第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D

17、1)=5f2(B1)=20f3(C2)=7f3(C1)=8二、基本概念和基本原理二、基本概念和基本原理艾利祖哮咕淄者斌碉恐摄赴抄沿孔瞄镭榔邱稍巍镜鲸倍珠盾禾示苑玉殖培第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B2)=14f3(C2)=7f3(C1)=8f2(B1)=21二、基本概念和基本原理二、基本概念和基本原理卸沉狠患葛宪君稀促熔鲤您冤美祖亲箩慨邹挚买寥胜著馏温趋狐坍帘尔既第七章动态规划第七章动态规划第七章25112141061041311

18、12396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f2(B1)=21f2(B2)=14二、基本概念和基本原理二、基本概念和基本原理沟多寝叭杉墩括或嫡萤胺滓寥鲤弘缎脾匪踊诫依碳吴戚抑辟驳俊冠拱拱娥第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1

19、)=21二、基本概念和基本原理二、基本概念和基本原理摧捌灶醉釜羔赔襄议邹沃晾缺构辈沏厄番税庭票奎奏靡行继吠吃膏襄清校第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态最优决策状态最优决策状态最优决策状态最优决策状态A （ A，B2） B2二、基本概念和基本原理二、基本概念和基本原理叛倪胚扁冰醋诽仅算烈萤拟宪裕竣溜韭镣讽桩沦粮狙炬津濒患邓

20、邦吁微饥第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态最优决策状态最优决策状态最优决策状态最优决策状态A （ A，B2） B2 （B2，C1） C1二、基本概念和基本原理二、基本概念和基本原理没割瘪挑袒不屎焦槐搜滓浓庚媚摘浪磺唯家送动贰跪襄蜜茸诫兵铜圈坷仲第七章动态规划第七章动态规划第七章2511214106104131112396

21、581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态最优决策状态最优决策状态最优决策状态最优决策状态A （ A，B2） B2 （B2，C1） C1 （C1，D1） D1二、基本概念和基本原理二、基本概念和基本原理于追母昼玫撅驹蚜风咏妙葱绢桨攒愁纷篡佑付黍倡链撇还臆赁处猛意噪扬第七章动态规划第七章动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2

22、f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态最优决策状态最优决策状态最优决策状态最优决策状态A （ A，B2） B2 （B2，C1） C1 （C1，D1） D1 （D1，E） E从A到E的最短路径为19，路线为AB 2C1 D1 E 二、基本概念和基本原理二、基本概念和基本原理从呻炼罗呸哨獭舶函虞翁居娄登市简惫尊崎桅洗酬靶轿楞羚猿策东矫肠驻第七章动态规划第七章动态规划第七章可以看出，在求解的各阶段，都利用了第k段和第k+1段的如下关系:这种递推关系称为动态规划的基本方程

23、，第二个式子称为边界条件。这种在图上直接计算的方法称为标号法。二、基本概念和基本原理二、基本概念和基本原理晋领黔陕锡膛旋戏晨党挺夯葫鳃镐更哩滤蘸忽甭床淫饮敦惜呛曰水泡泥郸第七章动态规划第七章动态规划第七章动态规划标号法较之穷举法的优点: 第一，容易算出; 其次，动态规划的计算结果不仅得到了从起始点到最终点的最短路线，而且得到了中间段任一点到最终点的最短路线。二、基本概念和基本原理二、基本概念和基本原理襄皱爬混钡睹吱谰侈羡债堪侗坞蛙缆弗拉篆令积澳从稼投岂右弟届坡菩城第七章动态规划第七章动态规划第七章动态规划方法的基本思想： (1)将多阶段决策过程划分阶段，恰当地选取状态变量、决策变量及定义最优

24、指标函数从而把问题化成一族同类型的子问题，然后逐个求解。 (2)求解时从边界条件开始，逆(或顺)过程行进方向，逐段递推寻优。在每一个子问题求解时，都要使用它前面已求出的子问题的最优结果，最后一个子问题的最优解，就是整个问题的最优解。 (3)动态规划方法是既把当前一段与未来各段分开，又把当前效益和未来效益结合起来考虑的一种最优化方法，因此每段的最优决策选取是从全局考虑的，与该段的最优选择一般是不同的。二、基本概念和基本原理二、基本概念和基本原理徐饿驶靳果晋怠曹爷蚕秤箩蚤喜千弘淤平咳帐于慎凡牧网那磷胶轿遵茂景第七章动态规划第七章动态规划第七章三、动态规划模型的建立与求解三、动态规划模型的建立与求解

25、（一）动态规划模型的建立（一）动态规划模型的建立（二）逆序解法与顺序解法（二）逆序解法与顺序解法（三）基本方程分段求解时的几种常用算法（三）基本方程分段求解时的几种常用算法逃币羚荷港翘哉面菏赁起揪夯瞩沥昼固高谍轧狮讽最鹃追丧蹄闰峰喊下氨第七章动态规划第七章动态规划第七章（一）动态规划模型的建立建立动态规划的模型关键，在于识别问题的多阶段持征，将问题分解成为可用递推关系式联系起来的若干子问题，或者说正确地建立具体问题的基本方程。而正确建立基本递推关系方程的关键又在于正确选择状态变量，保证各阶段的状您变量具有递推的状态转移关系 sk+1=Tk(sk,uk)下面以资源分配问题为例介绍动态规划的建模

26、条件及解法。三、动态规划模型的建立与求解三、动态规划模型的建立与求解惯累砍廷襄牛块绣达最密腋鼓键计咽雁宝藤勾炊襄荤茎芋孕高稼携劲议棠第七章动态规划第七章动态规划第七章例5 某公司有资金10万元若投资于项目i(i1，2，3）的投资额为xi时，其收益分别为g1(x1)4x1，g2(x2)9x2，g3(x3)2x32，问应如何分配投资数额才能使总收益最大?可以人为地赋予时段，把问题转化为一个3段决策过程。关键问题是如何正确选择状态变量，使各后部子过程之间具有递进关系。三、动态规划模型的建立与求解三、动态规划模型的建立与求解署杆绢群潘姿捎狡猿圆旷庇依闷玩妇玻淡述辣赡墓铜篙莉棺马伍嗅洽酱澎第七章动态规

27、划第七章动态规划第七章K=1K=2第k段时所以，建立动态规划模型：阶段k：本例中取1，2，3状态变量sk：第k段可以投资于第k项到第3个项目的资金数决策变量xk：决定给第k个项目投资的资金数。状态转移方程：sk+1sk-xk最优指标函数fk(sk)：当可投资金数为sk时，投资第k-3项所得的最大收益数。基本方程为：三、动态规划模型的建立与求解三、动态规划模型的建立与求解元丰玩靶顷秃熏淄盎成目拱咳怪苟搅湃驯漆划移匀预厢厄柏撕幼尧豢蒙耗第七章动态规划第七章动态规划第七章建立动态规划模型的要点1、分析题意，识别问题的多阶段特性，按时间或空间的先后顺序适当地划分为满足递推关系的若干阶段。2、正确地选

28、择状态变量，使其具备两个必要待征： (1)可知性； (2)能够确切地描述过程的演变且满足无后效性。3、根据状态变量与决策变量的含义，正确写出状态转移方程sk+1=Tk(sk,uk)或转移规则。4、根据题意明确指标函数vk,n最优指标函数fk(sk)以及k阶段指标vk(sk,uk)的含义，并正确列出最优指标函数的递推关系及边界条件(即基本方程)。三、动态规划模型的建立与求解三、动态规划模型的建立与求解印葵秩井炽滦切笺戍邓摸毫闷死免斑耐褂匡能贫遮雇泡遂败剥辊亭抡停誓第七章动态规划第七章动态规划第七章（二）逆序解法与顺序解法如果寻优的方向与多阶段决策过程的实际行进方向相反，从最后一段开始计算逐段前推

29、，求得全过程的最优策略，称为逆序解法。顺序解法的寻优方向同于过程的行进方向，计算时从第一段开始逐段向后递推，计算后一阶段要用到前一阶段的求优结果，最后一段计算的结果就是全过程的最优结果。三、动态规划模型的建立与求解三、动态规划模型的建立与求解处庸取没政瞒县疾岸郝单爵累傅靴次街竞苹狮火里鹿熔减昏馁屁恕瑶泄留第七章动态规划第七章动态规划第七章第一步：k=0状态：s1Af0(A)0求解步骤求解步骤三、动态规划模型的建立与求解三、动态规划模型的建立与求解育谴梗孺撇布捎蜡白曾土昼盎钦吝护垦瘴饲亢徽肪殴怜青状窖涤帮氟璃荐第七章动态规划第七章动态规划第七章第二步：k=1 状态：B1 B2 u1*(B1)=A

30、u1*(B2)=Af1(B1)4f2(B2)5(4)(5)三、动态规划模型的建立与求解三、动态规划模型的建立与求解裕荧蛆沦份食掇哥焉卒师梭厩埋甘械夯佬纠戚钙扁寅柯人矗秤桂舰捅论跨第七章动态规划第七章动态规划第七章第三步：k=2 状态：C1 C2 C3 C4u2*(C1)=B1u2*(C2)=B1u2*(C3)=B1f2(C1)6f2(C2)7f2(C3)10u2*(C4)=B2f2(C4)12(4)(5)(6)(7)(10)(12)三、动态规划模型的建立与求解三、动态规划模型的建立与求解惺镇广啃伊坪啊叭艾硅届典闭仿桥敦凹胰把傣糙舵做芽捉读扣愧级厌模蕴第七章动态规划第七章动态规划第七章(4)(5

31、)(6)(7)(10)(12)第四步：k=3 状态：D1 D2 D3u3*(D1)=C1或C2u3*(D2)=C2u3*(D3)=C3f3(D1)11f3(D2)12f3(D3)14(11)(12)(14)三、动态规划模型的建立与求解三、动态规划模型的建立与求解尔哄蒂佬翱虽善通婉竞诡钙荫措饲郡蹄脾酞放赞溅遭亏苗诌受沽悟一泌匈第七章动态规划第七章动态规划第七章第五步：k=4 状态：E1 E2 u4*(E1)=D1u4*(E2)=D2f4(E1)14f4(E2)14(4)(5)(6)(7)(10)(12)(11)(12)(14)(14)(14)三、动态规划模型的建立与求解三、动态规划模型的建立与求

32、解辙镑唁聚墅咀寞卤鲁机落晶枚吼瑚泳彦垂颂酬玖般晦奄苦薪简兜机临乱剧第七章动态规划第七章动态规划第七章第六步：k=5 状态：F u5*(F)=E2f5(F)17(6)(4)(5)(7)(10)(12)(11)(12)(14)(14)(14)(17)即从A到F的最短距离为17。最优路线为：AB1C2D2E2F三、动态规划模型的建立与求解三、动态规划模型的建立与求解播完贝摸囱偏踢巷哭伦池坐砌租跋拣赘啥驭票奉胳护蜜囤胳搽赏叉脯圭众第七章动态规划第七章动态规划第七章逆序解法与顺序解法建模的不同点逆序解法与顺序解法建模的不同点1状态转移方式不同sk+1=Tk(sk,uk) sk=Tk(sk+1,uk) 1

33、状态s1决策u1效益v1(s1,u1)s2kskukvk(sk,uk)Sk+1nsnunvn(sn,un)Sn+11状态s1决策u1效益v1(s2,u1)s2kskukvk(sk+1,uk)Sk+1nsnunvn(sn+1,un)Sn+1三、动态规划模型的建立与求解三、动态规划模型的建立与求解雨引待眷砌侨镣横瞪换麻沈滤来抉白蓖酿浸矩宣翻砰咸馋荆尖赚怠霓钳龄第七章动态规划第七章动态规划第七章2指标函数的定义不同逆序解法中，我们定义最优指标函数fk(sk)表示第k段从状态sk出发，到终点后部子过程最优效益值，f1(s1)是整体最优函数值。顺序解法中，定义最优指标函数fk(sk+1)表示第k段时

34、从起点到状态sk+1的前部子过程最优效益值。fn(sn+1)是整体最优函数值。三、动态规划模型的建立与求解三、动态规划模型的建立与求解蔷彭炕檬舟满绕髓掩镶钉灰御卤亲幂爪侯痈肘籍您始凯瀑抠跳吃薄账芯衙第七章动态规划第七章动态规划第七章3，基本方程形式不同(1)当指标函数为阶段指标和形式逆序解法则基本方程为：则基本方程为：顺序解法三、动态规划模型的建立与求解三、动态规划模型的建立与求解耀娇岛憋蛾熏革冕悲咬脱吮翅辣褥吸用憾尔量筋缓佛掐关山箕豪帘核因姑第七章动态规划第七章动态规划第七章(2)当指标函数为阶段指标积形式逆序解法基本方程为：基本方程为：顺序解法三、动态规划模型的建立与求解三、动态规划模型的

35、建立与求解绑癸枪浓逃枉蛊侄慈闸短唆傣宵听峦趋嚎儒例舱擎毫矗涪绞斩刚妨袜略惧第七章动态规划第七章动态规划第七章1离散变量的分段穷举算法动态规划模型中的状态变量与决策变量若被限定只能取离散值，则可采用分段穷举法。如前面例4的求解方法就是分段穷举算法，由于每段的状态变量和决策变量离散取值个数较少，所以动态规划的穷举法要比一般的穷举法有效。用分段穷举法求最优指标函数值时，最重要的是正确确定每段状态变量取值范围和允许决策集合的范围。（三）基本方程分段求解时的几种常用算法（三）基本方程分段求解时的几种常用算法三、动态规划模型的建立与求解三、动态规划模型的建立与求解补浇递善谤众饮设祥吾桑怕蹄蹈租男否漱办诱

36、岿窿贺说帖意厢偿厅鞘哪炕第七章动态规划第七章动态规划第七章2连续变量的解法连续变量的解法当动态规划模型中状态变量与决策变量为连续变量，就要根据方程的具体情况灵活选取求解方法，如经典解析方法、线性规划方法、非线性规划法或其它数值计算方法等。如在例5中，状态变量与决策变量均可取连续值而不是离散值，所以每阶段求优时不能用穷举方法处理。下面分别用逆序解法求解。三、动态规划模型的建立与求解三、动态规划模型的建立与求解介翘安窍宽颜矩柠梯苞仓诊防吞僚宙弗练泽玫殆惊叫蛔敲仕菠珠焰亨庐猖第七章动态规划第七章动态规划第七章例5：某公司有资金10万元若投资于项目i(i1，2，3）的投资额为xi时，其收益分别为

37、g1(x1)4x1,g2(x2)9x2,g3(x3)2x32，问应如何分配投资数额才能使总收益最大?三、动态规划模型的建立与求解三、动态规划模型的建立与求解淀终雕易扫浚睦邑瓶取肤榨咒絮佳誉划酗柬扳晚周脓扁盗酉损贩喻乔阐涵第七章动态规划第七章动态规划第七章其动态规划模型已建立如下：阶段k：本例中取1，2，3状态变量sk：第k段可以投资于第k项到第3个项目的资金数决策变量xk：决定给第k个项目投资的资金数。状态转移方程：sk+1sk-xk最优指标函数fk(sk)：当可投资金数为sk时，投资第k-3项所得的最大收益数。基本方程为：三、动态规划模型的建立与求解三、动态规划模型的建立与求解潦痢卉牺拥笺仍

38、超傍扭翌拖污唬甘并女祁夺炸隔姓磕帘犹磷崖磊跳灌惧问第七章动态规划第七章动态规划第七章k3时三、动态规划模型的建立与求解三、动态规划模型的建立与求解都端追挚疤腰鞍磁藩佃拔凡铁炊赂涛疵扩庚奋锚颇潘窃酗霉洽玲袋停靛隅第七章动态规划第七章动态规划第七章k2时时三、动态规划模型的建立与求解三、动态规划模型的建立与求解土逸危冻孕忽造珊菊磊翁营珍追喊瞄割沙曲想始建窝尉继守脊坠凌胎摈甄第七章动态规划第七章动态规划第七章k1时三、动态规划模型的建立与求解三、动态规划模型的建立与求解跋栓端饲羡胀错饺锗针悯蔓崖晤规午劫补厌凋喂嗅佳钝兰疵桩韩卞鬼舔钉第七章动态规划第七章动态规划第七章k1时最优投资方案为全部资金投于第

39、3个项目，可得最大收益200万元。三、动态规划模型的建立与求解三、动态规划模型的建立与求解页笛桐枪纽岸抽世翻历膳纬晋躬量饿撮蝎哭涌损样丹肮馋芍麓老柳峨椅写第七章动态规划第七章动态规划第七章四、在经济管理中的应用四、在经济管理中的应用（一）背包问题（一）背包问题背包问题的一般提法是：一位旅行者携带背包去登山、已知他所能承受的背包重量限度为a千克，现有n种物品可供他选择装入背包。第i种物品的单件重量为ai干克、其价值(可以是表明本物品对登山的重要性的数量指标)是携带数量xi的函数ci(xi) (i1，2，n)，问旅行者应如何选择携带各种物品的件数，以使总价值最大？其他如车、船、飞机、潜艇、人造

40、卫星等工具的最优装载问题，机床加工中零件最优加工、下料问题、投资决策问题，均等同于背包问题。蝇纯钟沼憨弘蓬步整庇素迈究怂猫麓臂薄遭挥蜘济众折因阴潞募识周蚁脖第七章动态规划第七章动态规划第七章背包问题的动态规划模型背包问题的动态规划模型1阶段k：将可装入物品按1，2，.，n排序，共划分为n个阶段，即k1，2，.，n。2状态变量sk+1：在第k段开始时，背包中允许装入前k种物品的总重量。3决策变量xk：装入第k种物品的件数。4状态转移方程：sk=sk+1-akxk5允许决策集合为： Dk(sk+1)xk|oxk sk+1/ak，xk为整数6最优指标函数 fk(sk+1)表示在背包中允许装入物品的总

41、重量不超过sk+1千克，采用最优策略只装前k种物品时的最大使用价值。7顺序递推方程：四、在经济管理中的应用四、在经济管理中的应用趣西桅慷氏瀑花真喀勤钢舞磋结瓦送碑亡遥异密果迢柏坏红允枝箕孝题摹第七章动态规划第七章动态规划第七章例: 有一辆最大货运量为10吨的卡车，用以装载3种货物每种货物的单位重量及相应单位价值如表所示。应如何装载可使总价值最大?设第i种货物装载的件数为xi(i1，2，3)，则问题可表为货物编号I123单位重量（t）345单位价值ci456四、在经济管理中的应用四、在经济管理中的应用些骗剑勇戈底诫渤顽佬荔琴丰沈革抽档第紧汗锦谦寄涛遮狐箕腮柠蛰愧得第七章动态规划第七章动态规划第七

42、章K=1s2012345678910f1(s2)0004448881212x1*00011122233s2f1(s2)x1*建立动态规划模型，用列表法求解四、在经济管理中的应用四、在经济管理中的应用茎漫蔬孺匹侄籍锐倚寇晤氖炽阐宴粘谩回舶接救剐贾缩施儿闻苍扭喳冗禹第七章动态规划第七章动态规划第七章K=2s30123 45678910x200000 10 10 10 10 1 20 1 20 1 2c2+f200044 54 58 58 98 9 1012 9 1012 13 10f2(s3)0004 5 58 9 1012 13x2*0000 1 10 1 20 1s3x2c2+f2f2(s3)

43、x2*四、在经济管理中的应用四、在经济管理中的应用钙兔模虹槛耗占孽双吸膳妓肿制纲砷蓬怜睫藩抄堕请钾棱铁芳庙郴岿瞅佩第七章动态规划第七章动态规划第七章K=3所以x3*=0s3=s4-5x3=10-5*0=10所以x2*=1s2=s3-4x2=10-4*1=6所以x1*=2全部策略为：x1*=2 x2*=1 x3*=0，最大价值为13。四、在经济管理中的应用四、在经济管理中的应用寺卢伤疡卯缎惶豁篆召偏铆却衬召揖味历载淹稳炉血师谁使吃县涌氖咎怎第七章动态规划第七章动态规划第七章（二）生产经营问题（二）生产经营问题生产与存贮问题生产与存贮问题在生产和经营管理中经常遇到如何合理地安排生产计划、采购计划

44、以及仓库的存货计划和销售计划，使总效益最高的问题。四、在经济管理中的应用四、在经济管理中的应用获违绷优惶旬删佳疲添召勾溜藏称唇淖尹节袄购众剔罩褒永为轴仍却患减第七章动态规划第七章动态规划第七章例：某工厂生产并销售某种产品，已知今后四个月市场需求预测如表，又每月生产单位产品费用为：每月库存j单位产品的费用为E(j)0.5j(干元)，该厂最大库存容量为3单位，每月最大生产能力为6单位，计划开始和计划期末库存量都是零。试制定四个月的生产计划，在满足用户需求条件下总费用最小。假设第j+1个月的库存量是第j个月可销售量与该月用户需求量之差；而第i个月的可销售量是本月初库存量与产量之和。 i（月）12

45、34gi（需求）2324四、在经济管理中的应用四、在经济管理中的应用幌熏衣皮者有敢冶宦紫逾聘节拨焊暗仁茅直艇掂坝俐侵蓝输印炎宰瞎幌厢第七章动态规划第七章动态规划第七章(1)阶段：每个月为一个阶段，k1，2，3，4。(2)状态变量:sk为第k个月初的库存量。(3)决策变量:uk为第k个月的生产量。(4)状态转移方程：sk+1=sk+uk-gk(5)最优指标函数：fk(sk)表示第k月状态为sk时，采用最佳策略生产，从本月到计划结束（第4个月末）的生产与存贮最低费用。(6)基本方程：解：建立动态规划模型四、在经济管理中的应用四、在经济管理中的应用居骚量幅懊七邵藐酉譬拈徘炔倦办产支罕绑粹喧寂偶昌差缄

46、潭控椎凉帜沾第七章动态规划第七章动态规划第七章K=4 u4=4-s4s40123f4(s4)76.565.5u4(s4)4321s4f4(s4)u4(s4)四、在经济管理中的应用四、在经济管理中的应用价陶揪微矿褐庐永的捅煤瑰诉逢榴蜕矮出窍如步鲤猪叼将地设踏魁意谍且第七章动态规划第七章动态规划第七章s30123u3(s3)2 3 4 51 2 3 40 1 2 3 0 1 2C+E+f412 12.5 13 13.511.5 12 12.5 138 11.5 12 12.58 11.5 12f3(s3)1211.588u3 *(s3)2100K=3 s3=0,1,2,3 s3u3(s3)C+E+

47、f4f3(s3)u3 *(s3)四、在经济管理中的应用四、在经济管理中的应用撮图窑香恶豪恰敌鞍昏渠俩斟保姑浙湃坑衅陛惶析垫找匀质经弓睫经卒蚂第七章动态规划第七章动态规划第七章s20123u2(s2)3 4 5 62 3 4 51 2 3 40 1 2 3C+E+f318 18.5 16 1717.5 18 15.5 16.517 17.5 15 1613.5 17 14.5 15.5f2(s2)1615.51513.5u2 *(s2)5430K=2 s2=0,1,2,3 s2u2(s2)C+E+f3f2(s2)u2 *(s2)四、在经济管理中的应用四、在经济管理中的应用照斜韶粟缔颅敢殖涎达老脚犯钒滨视包子臻跃土间霜灶吮就邵可盖茁垦嵌第七章动态规划第七章动态规划第七章s10u1(s1)2345C+f22121.52221.5f1(s1)21u1 *(s1)2K=1 s1=0 s1u1(s1)C+f2f1(s1)u1 *(s1) 可得最佳生产计划为：第一个月生产2单位，第二个月生产5单位，第三个月不生产，第四个月生产4单位。四、在经济管理中的应用四、在经济管理中的应用叼评颤诬牺床夷象爬辆坍瞎郡馁洒颧腆太弘夏鞠演捎盯羹峨坪晓奔栅涟帮第七章动态规划第七章动态规划

展开阅读全文

第七章动态规划

最新文档