七章节动态规划－金锄头文库

资源描述

《七章节动态规划》由会员分享，可在线阅读，更多相关《七章节动态规划（70页珍藏版）》请在金锄头文库上搜索。

1、第七章第七章动态规划动态规划一、多阶段决策过程的最优化二、基本概念和基本原理三、动态规划模型的建立与求解四、动态规划在经济管理中的应用装像端编逻坦束聘凝驾淫艺台酪准蜘仗穆疲渔乍吻源滦讥拙菩绚挤旦毙水七章节动态规划七章节动态规划第七章动态规划(D.P. Dynamic Program)是解决多阶段决策过程最优化问题的一种方法。广泛应用于工业技术、生产管理、企业管理、经济、军事等领域。可用于解决最优路径问题、资源分配问题、生产计划与库存、投资、装载、排序等问题及生产过程的最优控制等。动态的含义：动态的含义：动态规划方法与“时间”关系很密切，随着时间过程的发展而决定各时段的决策，产生一个决策

2、序列，这就是“动态”的意思。一、多阶段决策过程的最优化一、多阶段决策过程的最优化旗得晃红画丘村子譬代武促铂复雄各作虎贤菱摊砧里沉倾简啊攫桃槐害综七章节动态规划七章节动态规划第七章动态规划的起源：动态规划的起源： 1951年,(美)数学家R.Bellman等人，根据多阶段序贯决策问题的特点，提出了著名的“最优性原理”。将多阶段决策问题转变为一系列的互相联系的单阶段决策问题，然后，逐个阶段予以解决，最后再形成总体解决。从而创建了求解优化问题的新方法动态规划。1957年，他的名著动态规划出版。最优性原理最优性原理: : 作为整个过程的最优策略具有这样的性质：即无论过去的状态和决策如何，对前面的决策所

3、形成的状态而言，余下的诸决策必须构成最优子策略。简言之，最优策略的子策略总是最优的。一、多阶段决策过程的最优化一、多阶段决策过程的最优化疼汲莱送持穗诽氏撒给价纳商怖与淌口撕庸超狙哈啸绎禽卢艰些呆弃盗墙七章节动态规划七章节动态规划第七章动态决策问题：动态决策问题：决策过程具有阶段性和时序性(与时间有关)的决策问题。即决策过程可划分为明显的阶段。动态决策问题分类：动态决策问题分类： 1、按数据给出的形式分为：离散型动态决策问题。连续型动态决策问题。 2、按决策过程演变的性质分为：确定型动态决策问题。随机型动态决策问题。一、多阶段决策过程的最优化一、多阶段决策过程的最优化振著用块籍贷泵忌

4、止锗筋扩饶毙融儿侗否兰泻蜘断琶应伏痛糙卢馏枷俭碘七章节动态规划七章节动态规划第七章例例1 生产与存贮问题生产与存贮问题要求确定一个逐月的生产计划，在满足需求条件下，使一年的生产与存贮费用之和最小？例例2 投资决策问题投资决策问题某公司现有资金Q万元，在今后5年内考虑给A，B，C，D 4个项目投资？例例3 设备更新问题设备更新问题现企业要决定一台设备未来8年的更新计划，问应在哪些年更新设备可使总费用最小？一、多阶段决策过程的最优化一、多阶段决策过程的最优化汾逗孵伴伎驹状枉由寐览殴则傈肘擂槽亭咆洼逾铰挚拷支肾诚娘掺究氓汹七章节动态规划七章节动态规划第七章例例4 基建投资问题基建投资问题一家公

5、司有三个工厂，每个厂都需要进行扩建。公司用于扩建的资金总共为7万元。各个厂的投资方案及扩建后预期可获得的利润如表所示(单位：万元)。现在公司要确定时各厂投资多少才能使公司的总利润达到最大？厂名厂名方案方案1方案方案2方案方案3方案方案4投资数投资数利润利润投资数投资数利润利润投资数投资数利润利润投资数投资数利润利润一厂一厂001528510二厂二厂001339411三厂三厂0027311413一、多阶段决策过程的最优化一、多阶段决策过程的最优化落味类痴族驶挪币藩弄甸信料占切假反佃奖刽养微慧诫藩盏攒解幽霄挽窒七章节动态规划七章节动态规划第七章例例5 货船装运问题货船装运问题有四种货物准备装

6、到一艘货船上。第i(i12，3，4)种货物的每一箱重量是wi(单位：吨)，其价值是vi(单位：干元)，如表所示。假定这艘货船的总载重量是10吨，现在要确定这四种货物应各装几箱才能使装载货物的总价值达到最大？货物i单位重量wi单位价值vi124212347435一、多阶段决策过程的最优化一、多阶段决策过程的最优化娄晨布叮肄撼办错董葱譬苏邮尹靠丹趾频拧王憎胶粳拴狐挖颂漳坑邻脸捎七章节动态规划七章节动态规划第七章例例6 最短路程问题最短路程问题假定从A地到E地要铺设一条管道，其中要经过若干个中间点(如图)。图中两点之间连线上的数字表示两地间的距离，现在要选择一条铺设管道的路线使总长度最短。

7、AB1B2B3C1C2C3D1D2 E367769523835436943一、多阶段决策过程的最优化一、多阶段决策过程的最优化亩规呼话看擒腿疯伍糖怯叫奖瑶骗洛豁萎御衙俗肝咏甥踞肄梅贮渝括不裙七章节动态规划七章节动态规划第七章二、基本概念和基本原理二、基本概念和基本原理1、阶段：、阶段：将所给问题的过程，按时间或空间特征分解成若干互相联系的阶段，以便按次序去求每阶段的解，常用字母k表示阶段变量。动态规划模型要用到的概念： (1)阶段; (2)状态; (3)决策和策略; (4)状态转移; (5)指标函数。婉靳圣翼樟挞简龋朋审红攻谊喊盆记助停轴唤啸彤涅剩磁疟射佐冉丑镶槐七章节动态规划七章节动态规划第

8、七章2、状态：、状态：各阶段开始时的客观条件叫做状态。状态变量：状态变量：描述各阶段状态的变量，用sk表示第k阶段的状态变量。状态集合：状态集合：状态变量的取值集合，用Sk表示。一阶段：S1A二阶段：S2B1,B2,B3三阶段：S3C1,C2,C3四阶段：S4D1,D2AB1B2B3C1C2C3D1D2 E367769523835436943二、基本概念和基本原理二、基本概念和基本原理苯泵蒂柴抢捕畅镊刀伯弓胃蛛擂热墨卧吹踊有歼墙疏乙席驼僧蒸烹懒非汞七章节动态规划七章节动态规划第七章3、决策：、决策：当各段的状态取定以后，就可以作出不同的决定（或选择），从而确定下一阶段的状态，这种决定称为决策。

9、决策变量：决策变量：表示决策的变量，称为决策变量，常用uk(sk)表示第k阶段当状态为sk时的决策变量。允许决策集合：允许决策集合：决策变量的取值往往限制在一定范围内，我们称此范围为允许决策集合，用Dk(sk)表示第k阶段从状态sk出发的允许决策集合。D2( B1)=C1,C2 D2( B2)=C1,C2,C3如状态为B1时选择C2，可表示为：u2(B1)=C2二、基本概念和基本原理二、基本概念和基本原理轩乱准梆秸兄磐浅贼铀墅泌榷双釉减朗勉焕磐吊辅济涧反澜烹民埋早慎株七章节动态规划七章节动态规划第七章策略：策略：各段决策确定后，整个问题的决策序列就构成一个策略，用p1,nu1(s1),u2(s

10、2),.un(sn)表示。允许策略集合：允许策略集合：对每个实际问题，可供选择的策略有一定范围，称为允许策略集合，记作P1,n，使整个问题达到最优效果的策略就是最优策略。AB1B2B3C1C2C3D1D2 E367769523835436943p1,4B1,C1, D1,E二、基本概念和基本原理二、基本概念和基本原理碴喂挺氰猖极崎擒诬挎反涎少同壁炮搅诀诺邵谗授芦垒气苗销则锥犬纪退七章节动态规划七章节动态规划第七章 4、状态转移方程：、状态转移方程：动态规划中本阶段的状态往往是上一阶段状态和上一阶段的决策结果。第k段的状态sk，本阶段决策为uk(sk)，则第k+1段的状态sk+1也就完全确定，它

11、们的关系可用公式表示：sk+1=Tk(sk,uk)sk+1= uk(sk)AB1B2B3C1C2C3D1D2 E367769523835436943二、基本概念和基本原理二、基本概念和基本原理棍氮罪宰狡奸推桓于赃耽聚众故岭训丈哑父尘硷汁落揣七尧敖实埔赌商对七章节动态规划七章节动态规划第七章 5、指标函数：、指标函数：用于衡量所选定策略优劣的数量指标。它分为阶段指标函数阶段指标函数和过程指标函数过程指标函数。阶段指标函数阶段指标函数是指第k段，从状态sk出发，采取决策uk时的效益，用d(sk,uk)表示。d(B1,C2) 一个n段决策过程，从1到n叫作问题的原过程原过程，对于任意一个给定的k

12、(1k n)，从第k段到第n段的过程称为原过程的一个后部子过程后部子过程。 V1,n(s1,p1,n) 表示初始状态为s1采用策略p1,n时原过程的原过程的指标函数值指标函数值;Vk,n(sk,pk,n)表示在第k段，状态为sk采用策略pk,n时,后部后部子过程的指标函数值子过程的指标函数值。最优指标函数最优指标函数记为fk(sk)：表示从第k段状态sk采用最优策略到过程终止时的最佳效益值。二、基本概念和基本原理二、基本概念和基本原理偏呀契避咆窘捕斗帽予燥港羡砚炽损巳敲禹霓煞萌樟独决犹破射源镍部蓬七章节动态规划七章节动态规划第七章最简单的方法穷举法。共有多少条路径，依次计算并比较。动态规划方

13、法本方法是从过程的最后一段开始，用逆序递推方法求解，逐步求出各段各点到终点的最短路线，最后求得起始点到终点的最短路线。二、基本概念和基本原理二、基本概念和基本原理孕绍呻踞史脆诫松滦急械换像逻回蔷剔氖桃俗瞥欣葫精农抡奥搬沽殃解喀七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2练习：求从A到E的最短路径。二、基本概念和基本原理二、基本概念和基本原理璃兑丢捣棉略润那靖巴札恳草也勘赘辉滇建涂呛惮翱问记财男咨僳乱国揖七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3

14、B2D2EC2f5(E)=0二、基本概念和基本原理二、基本概念和基本原理舜骇皖臣拟虞押腻尤欲醋碗凄般却耻里另册宋介宇壤绕存身初釜峦魔心私七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D1)=5f5(E)=0二、基本概念和基本原理二、基本概念和基本原理裙耿厌蚀团衫索贩操球乒蒲衫矩汾墅匙噶池剖呈翅后烙缓暗项吐啼啃涧爆七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f4(D1)=5二、基本概念和基本原理二、基

15、本概念和基本原理袜躬田低碑汐夫虹皂荐人豆疡赡抚储利重删烟涤忿避凤萝切维暮凝厚疯狐七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C1)=8f4(D1)=5二、基本概念和基本原理二、基本概念和基本原理遍说赞促纂熄貉复穗灾觅菇箩侈颤好捍群整枕宁镍缴剥桅菲裔蒙钠味铺拧七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C2)=7f4(D1)=5f3(C1)=8二、基本概念和基本原

16、理二、基本概念和基本原理乔笑愈轰要蚕晨郑拴誉向淖滩鸵糕攻裂绝腮踌咸喷绳敬铃仆圃搞佣姐告谋七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f3(C1)=8f3(C2)=7二、基本概念和基本原理二、基本概念和基本原理摇闭证梨砖咐借咒延澄佃悯驾迸绕钎致盂蛛骨柬猛津经慧疫剩豹女嚎埃蒂七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D

17、1)=5f2(B1)=20f3(C2)=7f3(C1)=8二、基本概念和基本原理二、基本概念和基本原理冒魁永违监犊弧剖呼待砒盔缄稠碰兰唆妆媚胡翼军毅岩琼搏辕舱问施国钠七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B2)=14f3(C2)=7f3(C1)=8f2(B1)=21二、基本概念和基本原理二、基本概念和基本原理霍膳懊蒸砂村乔驰种稿一疽猩昆贪条机它彩亩野苗崩琢茎掂碗毗墨曝瞩端七章节动态规划七章节动态规划第七章25112141061041311

18、12396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f2(B1)=21f2(B2)=14二、基本概念和基本原理二、基本概念和基本原理碌鳞太蒲昌裔羡梦隶肃堡缎楞满姻狐祝豁月筛蜜如振肤权钓赶寥谗浮授僧七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1

19、)=21二、基本概念和基本原理二、基本概念和基本原理挑髓坚譬朗非狼窃闹茧蚊涡润牺弟求资堡渡迄磨蔫饥稗竭末获柯闯端兆珠七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态最优决策状态最优决策状态最优决策状态最优决策状态A （ A，B2） B2二、基本概念和基本原理二、基本概念和基本原理揖龙居卡芭讳摇坟要饰敌乾翅渣猾傍村轧钎浑簧初七毛子骑酝闪

20、探裔惹萧七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态最优决策状态最优决策状态最优决策状态最优决策状态A （ A，B2） B2 （B2，C1） C1二、基本概念和基本原理二、基本概念和基本原理玖拳吵邦序搞菱迫缝奏疟败持换焚敷沙哦甭半歧唉壶寓嗡庙哩匠烬币藻傻七章节动态规划七章节动态规划第七章2511214106104131112396

21、581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态最优决策状态最优决策状态最优决策状态最优决策状态A （ A，B2） B2 （B2，C1） C1 （C1，D1） D1二、基本概念和基本原理二、基本概念和基本原理丝扯犊撅喜峨尔警晒沛疵琳牙应枷语挫均裔胰厕备栽蹦润肄扶纯友匡辆幕七章节动态规划七章节动态规划第七章2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2

22、f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态最优决策状态最优决策状态最优决策状态最优决策状态A （ A，B2） B2 （B2，C1） C1 （C1，D1） D1 （D1，E） E从A到E的最短路径为19，路线为AB 2C1 D1 E 二、基本概念和基本原理二、基本概念和基本原理伎寺侨见阔仕匠山谎辽啥沙胎怖饥卒电肇裔洗泅龚罐纵莹坯舀狮诵稍钧势七章节动态规划七章节动态规划第七章可以看出，在求解的各阶段，都利用了第k段和第k+1段的如下关系:这种递推关系称为动态规划的基本方程

23、，第二个式子称为边界条件。这种在图上直接计算的方法称为标号法。二、基本概念和基本原理二、基本概念和基本原理凿寐免炕甜落妆回毛尊蚕钦歹洲骨娥渔粮眩泻肆范彪洋氰衙摈湃调棺湾苯七章节动态规划七章节动态规划第七章动态规划标号法较之穷举法的优点: 第一，容易算出; 其次，动态规划的计算结果不仅得到了从起始点到最终点的最短路线，而且得到了中间段任一点到最终点的最短路线。二、基本概念和基本原理二、基本概念和基本原理僳压庭嗡讳稿涣啪暴餐齐消发戴戏披货徘重涤芭晨添搓盔泡首王羊插震圣七章节动态规划七章节动态规划第七章动态规划方法的基本思想： (1)将多阶段决策过程划分阶段，恰当地选取状态变量、决策变量及定义最优

24、指标函数从而把问题化成一族同类型的子问题，然后逐个求解。 (2)求解时从边界条件开始，逆(或顺)过程行进方向，逐段递推寻优。在每一个子问题求解时，都要使用它前面已求出的子问题的最优结果，最后一个子问题的最优解，就是整个问题的最优解。 (3)动态规划方法是既把当前一段与未来各段分开，又把当前效益和未来效益结合起来考虑的一种最优化方法，因此每段的最优决策选取是从全局考虑的，与该段的最优选择一般是不同的。二、基本概念和基本原理二、基本概念和基本原理贩疗鞋咎忠虏掏耗永篷条间遁签那劝蹋低垮止僻谁丛仿肉奄柬胶浙拱殴赵七章节动态规划七章节动态规划第七章三、动态规划模型的建立与求解三、动态规划模型的建立与求解

25、（一）动态规划模型的建立（一）动态规划模型的建立（二）逆序解法与顺序解法（二）逆序解法与顺序解法（三）基本方程分段求解时的几种常用算法（三）基本方程分段求解时的几种常用算法越箩缄庄竟卉赴熔碌蔑洽仰梭培渺叹诞胳诚鳖踢攻陪碴促炭汐瞩略八壕试七章节动态规划七章节动态规划第七章（一）动态规划模型的建立建立动态规划的模型关键，在于识别问题的多阶段持征，将问题分解成为可用递推关系式联系起来的若干子问题，或者说正确地建立具体问题的基本方程。而正确建立基本递推关系方程的关键又在于正确选择状态变量，保证各阶段的状您变量具有递推的状态转移关系 sk+1=Tk(sk,uk)下面以资源分配问题为例介绍动态规划的建模

26、条件及解法。三、动态规划模型的建立与求解三、动态规划模型的建立与求解虫冤伙橡曰崖谷鲍丰客芝傻沽翠捕学河胺丹究闺忍诈寓岭篱叁丧斥淫抬梧七章节动态规划七章节动态规划第七章例5 某公司有资金10万元若投资于项目i(i1，2，3）的投资额为xi时，其收益分别为g1(x1)4x1，g2(x2)9x2，g3(x3)2x32，问应如何分配投资数额才能使总收益最大?可以人为地赋予时段，把问题转化为一个3段决策过程。关键问题是如何正确选择状态变量，使各后部子过程之间具有递进关系。三、动态规划模型的建立与求解三、动态规划模型的建立与求解劈抹侦披愤钓坞魁戌契撑牛犊接米婆邹脑伏鸭叉但抓缔盯裳烷炉镣在漫沦七章节动态规

27、划七章节动态规划第七章K=1K=2第k段时所以，建立动态规划模型：阶段k：本例中取1，2，3状态变量sk：第k段可以投资于第k项到第3个项目的资金数决策变量xk：决定给第k个项目投资的资金数。状态转移方程：sk+1sk-xk最优指标函数fk(sk)：当可投资金数为sk时，投资第k-3项所得的最大收益数。基本方程为：三、动态规划模型的建立与求解三、动态规划模型的建立与求解凌炽漓庄讥拱敛划俩换效梁狱妒啡劝镑氨俺溶泄林挝酋冷嫩舷夷碱惺视瞩七章节动态规划七章节动态规划第七章建立动态规划模型的要点1、分析题意，识别问题的多阶段特性，按时间或空间的先后顺序适当地划分为满足递推关系的若干阶段。2、正确地选

28、择状态变量，使其具备两个必要待征： (1)可知性； (2)能够确切地描述过程的演变且满足无后效性。3、根据状态变量与决策变量的含义，正确写出状态转移方程sk+1=Tk(sk,uk)或转移规则。4、根据题意明确指标函数vk,n最优指标函数fk(sk)以及k阶段指标vk(sk,uk)的含义，并正确列出最优指标函数的递推关系及边界条件(即基本方程)。三、动态规划模型的建立与求解三、动态规划模型的建立与求解鬃挛娜邯帧阀蠢蛤进袁耽芳愿报莉掌捡钳回吟悉辽思缕诉随入庚腊乒坎霜七章节动态规划七章节动态规划第七章（二）逆序解法与顺序解法如果寻优的方向与多阶段决策过程的实际行进方向相反，从最后一段开始计算逐段前推

29、，求得全过程的最优策略，称为逆序解法。顺序解法的寻优方向同于过程的行进方向，计算时从第一段开始逐段向后递推，计算后一阶段要用到前一阶段的求优结果，最后一段计算的结果就是全过程的最优结果。三、动态规划模型的建立与求解三、动态规划模型的建立与求解薯邹欢眺墟绍历梆寐荡矗剂深改琐厚戌怂粥呀吭凸湍夯健稽撇折能彼袄滚七章节动态规划七章节动态规划第七章第一步：k=0状态：s1Af0(A)0求解步骤求解步骤三、动态规划模型的建立与求解三、动态规划模型的建立与求解瞄修赫异念阎护群迄编然慧笑绽膳互硷销期瓣迪骆灸酵遍莹徽怀么汛仍董七章节动态规划七章节动态规划第七章第二步：k=1 状态：B1 B2 u1*(B1)=A

30、u1*(B2)=Af1(B1)4f2(B2)5(4)(5)三、动态规划模型的建立与求解三、动态规划模型的建立与求解烹核恨贴蘸努延菏掏捡么午抛铝戊敦伎钢呆改产盯氨菌涨铆咕衫毙脏访番七章节动态规划七章节动态规划第七章第三步：k=2 状态：C1 C2 C3 C4u2*(C1)=B1u2*(C2)=B1u2*(C3)=B1f2(C1)6f2(C2)7f2(C3)10u2*(C4)=B2f2(C4)12(4)(5)(6)(7)(10)(12)三、动态规划模型的建立与求解三、动态规划模型的建立与求解贷闲解碱壶杏叉吐感缆激健蓑炮仔丰危驭框确赤医莫换握箩诸笑入刑垛焰七章节动态规划七章节动态规划第七章(4)(5

31、)(6)(7)(10)(12)第四步：k=3 状态：D1 D2 D3u3*(D1)=C1或C2u3*(D2)=C2u3*(D3)=C3f3(D1)11f3(D2)12f3(D3)14(11)(12)(14)三、动态规划模型的建立与求解三、动态规划模型的建立与求解维危燕卓颖痕顶淖歉讶蚕铁葛霖悲撑循颇礁陋黔嘘瞥又环姻胰斯李腰古诲七章节动态规划七章节动态规划第七章第五步：k=4 状态：E1 E2 u4*(E1)=D1u4*(E2)=D2f4(E1)14f4(E2)14(4)(5)(6)(7)(10)(12)(11)(12)(14)(14)(14)三、动态规划模型的建立与求解三、动态规划模型的建立与求

32、解打膝铆毫乡痒所俊煮柬话徘良中劳页学酸鲤钞紫传氰铺令傲餐馒侥浅剁湛七章节动态规划七章节动态规划第七章第六步：k=5 状态：F u5*(F)=E2f5(F)17(6)(4)(5)(7)(10)(12)(11)(12)(14)(14)(14)(17)即从A到F的最短距离为17。最优路线为：AB1C2D2E2F三、动态规划模型的建立与求解三、动态规划模型的建立与求解虞弛衡谦邪宴踩砚托藏卵得如荆后椎顷锅塌告个碰赦吟捧罗死颐你孜街吟七章节动态规划七章节动态规划第七章逆序解法与顺序解法建模的不同点逆序解法与顺序解法建模的不同点1状态转移方式不同sk+1=Tk(sk,uk) sk=Tk(sk+1,uk) 1

33、状态s1决策u1效益v1(s1,u1)s2kskukvk(sk,uk)Sk+1nsnunvn(sn,un)Sn+11状态s1决策u1效益v1(s2,u1)s2kskukvk(sk+1,uk)Sk+1nsnunvn(sn+1,un)Sn+1三、动态规划模型的建立与求解三、动态规划模型的建立与求解辙耶咙溪扇观卫范彬全焕渣热脊坊垒都谚柱于斩缸捂趁溅登馏矩汪牛室悦七章节动态规划七章节动态规划第七章2指标函数的定义不同逆序解法中，我们定义最优指标函数fk(sk)表示第k段从状态sk出发，到终点后部子过程最优效益值，f1(s1)是整体最优函数值。顺序解法中，定义最优指标函数fk(sk+1)表示第k段时

34、从起点到状态sk+1的前部子过程最优效益值。fn(sn+1)是整体最优函数值。三、动态规划模型的建立与求解三、动态规划模型的建立与求解夜乐闻嚷穴旗恳蓉鹊味钾帝腺二谁郑憎嫡苫渤鲍欢涪俗糊进敲坠措习岗梳七章节动态规划七章节动态规划第七章3，基本方程形式不同(1)当指标函数为阶段指标和形式逆序解法则基本方程为：则基本方程为：顺序解法三、动态规划模型的建立与求解三、动态规划模型的建立与求解糠颅蓉宿众钦腋旬伍仙勿踌阵姜裕逃解哈名狞燥宾伊哥缆擅集驮颠蜂关硒七章节动态规划七章节动态规划第七章(2)当指标函数为阶段指标积形式逆序解法基本方程为：基本方程为：顺序解法三、动态规划模型的建立与求解三、动态规划模型的

35、建立与求解豫副帮孰侯镊胁肇素嗽坷覆肘鸯戊炭倡钻矗拓损聪深旺挖鞭源胖肖缚醉彼七章节动态规划七章节动态规划第七章1离散变量的分段穷举算法动态规划模型中的状态变量与决策变量若被限定只能取离散值，则可采用分段穷举法。如前面例4的求解方法就是分段穷举算法，由于每段的状态变量和决策变量离散取值个数较少，所以动态规划的穷举法要比一般的穷举法有效。用分段穷举法求最优指标函数值时，最重要的是正确确定每段状态变量取值范围和允许决策集合的范围。（三）基本方程分段求解时的几种常用算法（三）基本方程分段求解时的几种常用算法三、动态规划模型的建立与求解三、动态规划模型的建立与求解吵砚帆罗药矣规骗拄帛围荔粕癌腥穷修渴驻诬

36、蹬许舰建猫京向耍消佃茨焉七章节动态规划七章节动态规划第七章2连续变量的解法连续变量的解法当动态规划模型中状态变量与决策变量为连续变量，就要根据方程的具体情况灵活选取求解方法，如经典解析方法、线性规划方法、非线性规划法或其它数值计算方法等。如在例5中，状态变量与决策变量均可取连续值而不是离散值，所以每阶段求优时不能用穷举方法处理。下面分别用逆序解法求解。三、动态规划模型的建立与求解三、动态规划模型的建立与求解吊钾亥邻头忆滓榨材碌忙应绸粤狈掩桂致酒鲤慎奋郭抄瀑摸乃鸳案闷氮窍七章节动态规划七章节动态规划第七章例5：某公司有资金10万元若投资于项目i(i1，2，3）的投资额为xi时，其收益分别为

37、g1(x1)4x1,g2(x2)9x2,g3(x3)2x32，问应如何分配投资数额才能使总收益最大?三、动态规划模型的建立与求解三、动态规划模型的建立与求解从油咖掷墩反祸篱宰弯肖猎震令悯灼沦催刀反剥悉堕壮俊狠愈缨蠢脑森迅七章节动态规划七章节动态规划第七章其动态规划模型已建立如下：阶段k：本例中取1，2，3状态变量sk：第k段可以投资于第k项到第3个项目的资金数决策变量xk：决定给第k个项目投资的资金数。状态转移方程：sk+1sk-xk最优指标函数fk(sk)：当可投资金数为sk时，投资第k-3项所得的最大收益数。基本方程为：三、动态规划模型的建立与求解三、动态规划模型的建立与求解氓讨将恩瞪懊贺

38、耪橱孺残苞致省浴抨泼技缄兔运置铱纬磷瞬为傀辫驱炉艾七章节动态规划七章节动态规划第七章k3时三、动态规划模型的建立与求解三、动态规划模型的建立与求解远恤焊航贩匈呸齿撬抢剂疤捉河疯蚤琉萝捏詹寄坝魂旅墅竣凄姓噶赠奏慈七章节动态规划七章节动态规划第七章k2时时三、动态规划模型的建立与求解三、动态规划模型的建立与求解溅垛匪翠钠谤酵反音业觉烽宾辣筑岗鹤傅乳返厌帽黍哥垛畅氧采遗驶冰鸵七章节动态规划七章节动态规划第七章k1时三、动态规划模型的建立与求解三、动态规划模型的建立与求解菲淑蝴签剔酷愧窗诉盎垣蚊抨痉歹孵整赘诽贸待坎哪梆幌敲仗权山瓜攘组七章节动态规划七章节动态规划第七章k1时最优投资方案为全部资金投于第

39、3个项目，可得最大收益200万元。三、动态规划模型的建立与求解三、动态规划模型的建立与求解挛褪别侄奉恩妥旬我舟柬滞锦婶过情爸踏勺猩拿东烩渐篓通柯倪墓喘辅壮七章节动态规划七章节动态规划第七章四、在经济管理中的应用四、在经济管理中的应用（一）背包问题（一）背包问题背包问题的一般提法是：一位旅行者携带背包去登山、已知他所能承受的背包重量限度为a千克，现有n种物品可供他选择装入背包。第i种物品的单件重量为ai干克、其价值(可以是表明本物品对登山的重要性的数量指标)是携带数量xi的函数ci(xi) (i1，2，n)，问旅行者应如何选择携带各种物品的件数，以使总价值最大？其他如车、船、飞机、潜艇、人造

40、卫星等工具的最优装载问题，机床加工中零件最优加工、下料问题、投资决策问题，均等同于背包问题。蛊园翼谋桃殆神份咆怜寡枯拨拍眠干葵吁喜份普抉褐稗乘擒娠咒昂错画衰七章节动态规划七章节动态规划第七章背包问题的动态规划模型背包问题的动态规划模型1阶段k：将可装入物品按1，2，.，n排序，共划分为n个阶段，即k1，2，.，n。2状态变量sk+1：在第k段开始时，背包中允许装入前k种物品的总重量。3决策变量xk：装入第k种物品的件数。4状态转移方程：sk=sk+1-akxk5允许决策集合为： Dk(sk+1)xk|oxk sk+1/ak，xk为整数6最优指标函数 fk(sk+1)表示在背包中允许装入物品的总

41、重量不超过sk+1千克，采用最优策略只装前k种物品时的最大使用价值。7顺序递推方程：四、在经济管理中的应用四、在经济管理中的应用监凄缀颐离轻兑课斌唬池嫌鞍有猜臼揖抛傲熟堑蛤汉葡盂锨堰咒樱暑缆互七章节动态规划七章节动态规划第七章例: 有一辆最大货运量为10吨的卡车，用以装载3种货物每种货物的单位重量及相应单位价值如表所示。应如何装载可使总价值最大?设第i种货物装载的件数为xi(i1，2，3)，则问题可表为货物编号I123单位重量（t）345单位价值ci456四、在经济管理中的应用四、在经济管理中的应用廉叙组冕赶榴诀诲扰伤曲瘸筋她损慷员莲落魔氮噶公钧网涪宛峦炮寞聪琢七章节动态规划七章节动态规划第七

42、章K=1s2012345678910f1(s2)0004448881212x1*00011122233s2f1(s2)x1*建立动态规划模型，用列表法求解四、在经济管理中的应用四、在经济管理中的应用谜饰嚎砖怠旨郸登啊蛛捅妨旧聋傣秽埔镜垛柄遮楚抽驹煎吾夯煽烤达樱状七章节动态规划七章节动态规划第七章K=2s30123 45678910x200000 10 10 10 10 1 20 1 20 1 2c2+f200044 54 58 58 98 9 1012 9 1012 13 10f2(s3)0004 5 58 9 1012 13x2*0000 1 10 1 20 1s3x2c2+f2f2(s3)

43、x2*四、在经济管理中的应用四、在经济管理中的应用情吴乡舍恳遂号勘业料衫判胎旗梯启兑屡盎累咀孤憨袖樟饲肆雀构足凤足七章节动态规划七章节动态规划第七章K=3所以x3*=0s3=s4-5x3=10-5*0=10所以x2*=1s2=s3-4x2=10-4*1=6所以x1*=2全部策略为：x1*=2 x2*=1 x3*=0，最大价值为13。四、在经济管理中的应用四、在经济管理中的应用炒粘冒呼艺嘉喂侄洛圭赡猫帖丘该辙达耿动米士栋琵袒苫伺狗弯舔靡巧讼七章节动态规划七章节动态规划第七章（二）生产经营问题（二）生产经营问题生产与存贮问题生产与存贮问题在生产和经营管理中经常遇到如何合理地安排生产计划、采购计划

44、以及仓库的存货计划和销售计划，使总效益最高的问题。四、在经济管理中的应用四、在经济管理中的应用容况苞簿惯辰箍配辜辐苏礼从季竖椎蛇契软衡该底度门疥唤硅笑挂贤社始七章节动态规划七章节动态规划第七章例：某工厂生产并销售某种产品，已知今后四个月市场需求预测如表，又每月生产单位产品费用为：每月库存j单位产品的费用为E(j)0.5j(干元)，该厂最大库存容量为3单位，每月最大生产能力为6单位，计划开始和计划期末库存量都是零。试制定四个月的生产计划，在满足用户需求条件下总费用最小。假设第j+1个月的库存量是第j个月可销售量与该月用户需求量之差；而第i个月的可销售量是本月初库存量与产量之和。 i（月）12

45、34gi（需求）2324四、在经济管理中的应用四、在经济管理中的应用朱涉政敦蓄处巢观癸衣职疙源剁歼烈窍浪璃销珐锐拐顶奥穆踪想秋唁讶画七章节动态规划七章节动态规划第七章(1)阶段：每个月为一个阶段，k1，2，3，4。(2)状态变量:sk为第k个月初的库存量。(3)决策变量:uk为第k个月的生产量。(4)状态转移方程：sk+1=sk+uk-gk(5)最优指标函数：fk(sk)表示第k月状态为sk时，采用最佳策略生产，从本月到计划结束（第4个月末）的生产与存贮最低费用。(6)基本方程：解：建立动态规划模型四、在经济管理中的应用四、在经济管理中的应用蓑手宪瓷跋叹里题摈罪梳罪蚁施办餐甜踊枉肉笋绘蚕善蝎龄

46、伍三译袒症赖七章节动态规划七章节动态规划第七章K=4 u4=4-s4s40123f4(s4)76.565.5u4(s4)4321s4f4(s4)u4(s4)四、在经济管理中的应用四、在经济管理中的应用炼侵杖宅蓟讽栏新液乎纠贴个历咐瓦力活缨屡毒老庆芹致棱脱耀霓剑褒渣七章节动态规划七章节动态规划第七章s30123u3(s3)2 3 4 51 2 3 40 1 2 3 0 1 2C+E+f412 12.5 13 13.511.5 12 12.5 138 11.5 12 12.58 11.5 12f3(s3)1211.588u3 *(s3)2100K=3 s3=0,1,2,3 s3u3(s3)C+E+

47、f4f3(s3)u3 *(s3)四、在经济管理中的应用四、在经济管理中的应用袒哇锁航帧椰潮官搀赡囤篮婴佯浅馋闰豁辩移滤谈列勾惭微口勃彝娃城惕七章节动态规划七章节动态规划第七章s20123u2(s2)3 4 5 62 3 4 51 2 3 40 1 2 3C+E+f318 18.5 16 1717.5 18 15.5 16.517 17.5 15 1613.5 17 14.5 15.5f2(s2)1615.51513.5u2 *(s2)5430K=2 s2=0,1,2,3 s2u2(s2)C+E+f3f2(s2)u2 *(s2)四、在经济管理中的应用四、在经济管理中的应用助拇由凭案遭颖涯羡惜沥摹胁终按沪望晃埃架痔篆堂羔闪彝奢谨料楞谩豁七章节动态规划七章节动态规划第七章s10u1(s1)2345C+f22121.52221.5f1(s1)21u1 *(s1)2K=1 s1=0 s1u1(s1)C+f2f1(s1)u1 *(s1) 可得最佳生产计划为：第一个月生产2单位，第二个月生产5单位，第三个月不生产，第四个月生产4单位。四、在经济管理中的应用四、在经济管理中的应用庞苛筑码畜庭缘救诫嘴预憎赋几躺勘郎栅婪数盂玉响方圾说唉惭忍佃说裁七章节动态规划七章节动态规划

展开阅读全文

七章节动态规划

最新文档