《系统工程硕士动态规划例子》由会员分享,可在线阅读,更多相关《系统工程硕士动态规划例子(13页珍藏版)》请在金锄头文库上搜索。
1、3.5 动态规划动态规划 50年代初,由美国数学家年代初,由美国数学家Bellman提出。提出。 将将系系统统运运行行过过程程分分为为若若干干相相继继的的阶阶段段,而而在在每每个个阶阶段段都都要要做做出出决决策策的的过过程程,就就叫叫做做多多段段决决策策过过程程。多多段段决决策过程的每一段的结束状态,就是下一段的初始状态。策过程的每一段的结束状态,就是下一段的初始状态。 动动态态规规划划是是研研究究多多段段决决策策而而提提出出来来的的一一种种数数学学方方法法,它它的的中中心心思思想想是是所所谓谓的的“最最优优性性原原理理”,这这个个原原理理归归结结为为一一个个基基本本递递推推关关系系式式,从从
2、整整个个过过程程的的终终点点出出发发,由由后后向向前前,使使过过程程连连续续地地转转移移,一一步步一一步步地地推推到到始始点点,找找到到最优解最优解。 系系统统动动态态最最优优化化习习惯惯称称为为最最优优控控制制,它它与与系系统统静静态态最最优优化化的的区区别别在在于于其其自自变变量量是是时时间间的的函函数数,实实质质上上属属于于泛函极值的范畴。泛函极值的范畴。2511214106104131112396581052C1C3D1AB1B3B2D2EC2例例 求从求从A到到E的最短路径的最短路径2511214106104131112396581052C1C3D1AB1B3B2D2EC2f5(E)
3、=02511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D1)=5f5(E)=02511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f4(D1)=52511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C1)=8f4(D1)=52511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C2)=7f4(D1)=5f3(C1)=8251121
4、4106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f3(C1)=8f3(C2)=72511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B1)=20f3(C2)=7f3(C1)=82511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B2)=14f3(C2)=7f3(C1)=8f2(B1)
5、=212511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f2(B1)=21f2(B2)=142511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=212511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B3)=19f3(C2)=7f3(C1)=8f1(A)=19f2(B2)=14f2(B1)=21状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态 最优决策最优决策 状态状态A ( A,B2) B2 (B2,C1) C1 (C1,D1) D1 (D1,E) E从从A到到E的最短路径为的最短路径为19,路线为,路线为AB 2C1 D1 E