最优控制求解停车问题

上传人:第*** 文档编号:34077725 上传时间:2018-02-20 格式:DOCX 页数:11 大小:399.61KB
返回 下载 相关 举报
最优控制求解停车问题_第1页
第1页 / 共11页
最优控制求解停车问题_第2页
第2页 / 共11页
最优控制求解停车问题_第3页
第3页 / 共11页
最优控制求解停车问题_第4页
第4页 / 共11页
最优控制求解停车问题_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《最优控制求解停车问题》由会员分享,可在线阅读,更多相关《最优控制求解停车问题(11页珍藏版)》请在金锄头文库上搜索。

1、停车问题1 问题描述如下图所示,考虑一个 10m*7m 大小的停车场,将车从如下初始位置停到停车场中任意位置,如图停车位置 14 所示。-5 -4 -3 -2 -1 0 1 2 3 4 5-10123456位 位 位 位位 位 位 位 1位 位 位 位 2位 位 位 位 3位 位 位 位 4x(m)y(m)图 1 问题描述示意图2 数学模型车的模型示意图如下所示,则可以得到如下数学模型方程式:(1)15323544152cosintaxtxxut&x2x1x3x4x5图 2 车的模型示意图3 问题求解3.1 变分法求解最优控制定义如下性能指标函数:(2)021tdftJu通过构建 Hamilt

2、onian 求解,并采用数值法求解两点边值问题。(1)停车位置 1:-5 -4 -3 -2 -1 0 1 2 3 4 5-10123456x(m)y(m)0 1 2 3 4 5 6 7 8-1-0.500.511.52t(s) x3-位位位x4-位位位位位x5-位位0 1 2 3 4 5 6 7 8-1-0.500.511.5t(s) u1u2图 3 变分法求解结果(停车位置 1)(2)停车位置 3-5 -4 -3 -2 -1 0 1 2 3 4 5-10123456x(m)y(m)0 1 2 3 4 5 6 7-1-0.500.511.52t(s) x3-位位位x4-位位位位位x5-位位0

3、1 2 3 4 5 6-1-0.500.511.52t(s) u1u2图 4 变分法求解结果(停车位置 3)3.2 动态规划法求解最优控制定义如下性能指标函数:(3)0221tdftffbJxtu采用离散动态规划求解,分别将时间、状态量、控制量、状态方程和性能指标函数离散化。分别尝试不同的离散化程度。(1 )第一次离散化求解:运行时间(1120s)离散化后的维度为:时间(150) ;状态(4*10*2*3*6) ;控制(6*6 )-0.12 -0.1 -0.08 -0.06 -0.04 -0.02 0 0.0200.511.50 20 40 60 80 100 120 140 16000.20

4、.40.60.811.21.41.61.8x3x4x50 50 100 150-1-0.8-0.6-0.4-0.200.20.40.60.81u1u2图 5 动态规划求解结果(第一次离散化)(2 )第二次离散化求解: 运行时间( 70291s)离散化后的维度为:时间(30) ;状态(10*25*12*16*15) ;控制(15*15)图 6 动态规划求解结果(第二次离散化)3.3 直接打靶法求解最优控制定义如下性能指标函数:(4)021tdftJu采用 SQP 方法求解,结果如下:(1 )停车位置 1-5 -4 -3 -2 -1 0 1 2 3 4 5-10123456x(m)y(m)0 1

5、2 3 4 5 6 7 8-0.4-0.200.20.40.60.811.21.41.6t(s) x3-位位位x4-位位位位位x5-位位0 1 2 3 4 5 6 7 8-0.8-0.6-0.4-0.200.20.40.6t(s) u1u2图 7 直接打靶法求解结果(停车位置 1)(2 )停车位置 3-5 -4 -3 -2 -1 0 1 2 3 4 5-10123456x(m)y(m)0 1 2 3 4 5 6 7-0.4-0.200.20.40.60.811.21.41.6t(s) x3-位位位x4-位位位位位x5-位位0 1 2 3 4 5 6-0.8-0.6-0.4-0.200.20.4

6、0.60.8t(s) u1u2图 8 直接打靶法求解结果(停车位置 3)3.4 模型预测控制求解最优控制定义如下性能指标函数: 5 221 1:1: :12ipirefpjpRQi jq rJxkNxkNukN (5)预测步长 ,控制步长 。=0pc(1)停车位置 1-5 -4 -3 -2 -1 0 1 2 3 4 5-10123456x(m)y(m)0 2 4 6 8 10 12 14 16-0.4-0.200.20.40.60.811.21.41.6t(s) x3-位位位x4-位位位位位x5-位位0 2 4 6 8 10 12 14 16-1-0.500.511.5t(s) u1u2图 9

7、 模型预测控制求解结果(停车位置 1)(2 )停车位置 3-5 -4 -3 -2 -1 0 1 2 3 4 5-10123456x(m)y(m)0 2 4 6 8 10 12 14-0.500.511.52t(s) x3-位位位x4-位位位位位x5-位位0 2 4 6 8 10 12 14-1-0.500.511.52t(s) u1u2图 10 模型预测控制求解结果(停车位置 3)3.5 自适应动态规划求解最优控制(尝试)首先采用经典的 HDP92 方法进行尝试,但多次试验的效果都不好;之后尝试每次用数值法求解最优的控制量,但效果依旧很差;然后采用值迭代的方法,并尝试用二次型近似值函数和神经网

8、络近似值函数两种方式,但是最后的效果依旧很差(包括一般值迭代和广义值迭代) 。 (上述方法对 PPT 上的例子,效果还不错)4 结果分析变分法求解最优控制:针对本问题这样一个相对复杂的模型,变分法无法很好地处理控制量和状态量的约束。而且在求解过程中,由于无法得到解析解,因而需要采用数值法求解一个两点边值问题。而在采用 BVP4C 求解时,需要经过多次初值选择试凑,才能保证可解,否则 BVP4C 无法求解。因此只能采用自己编写打靶法程序求解,致使最后的求解结果不是特别好(速度在刚开始一下增加到很大,即加速度过大;针对停车位置 3,路径曲线不是很光滑) 。另外,所得结果是一个开环控制。离散动态规划

9、求解最优控制:如果对时间、状态、控制的离散化程度太低,则求解结果很差;当增加离散化程度,求解结果有一定的改善,但还远远不够,需要继续提高离散化程度。然而,由于本问题状态量的维数较大,此时将导致维数灾难问题。第二次离散化求解的运行时间为 70291s(19 个多小时) ,如果继续增加离散化程度,虽然求解结果会更加好,但求解时间会更长。而针对本问题,如此长的求解时间是没有太多价值的。直接打靶法求解最优控制:相比变分法,求解结果更加好。而且可以比较好地处理控制量和状态量的约束。但是,最后时刻的控制并不是 0,而在实际停车过程中最后时刻控制应该为 0。另外,所得结果是一个开环控制。模型预测控制求解最优

10、控制:同样可以比较好地处理控制量和状态量的约束。而且相比直接打靶法求解,最后时刻的控制能缓慢变为 0。另外,所得结果是一个近似闭环控制,这在实际停车过程中是很有必要的,因为车的每一步运动都会有误差。自适应动态规划求解最优控制:我们尝试了几种自适应动态规划的方法,但效果都不是很好。针对 PPT 上的例子,这些方法的效果还可以。在这些例子中,系统最后的稳定状态都是 0,而且控制的目标是要使状态尽可能快得到 0。然后,停车问题和这些例子不太相同,并不是使车一下停到终点,状态应该缓慢变化。所以,可能这些方法不能直接应用于本问题,需要将问题和方法都进行一定的修改,但限于时间因素和自身水平有限,我们没能尝试成功。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号