文章信息
- 姚鹏, 綦声波, 解则晓. 2018.
- YAO Peng, QI Sheng-bo, XIE Ze-xiao. 2018.
- 面向海上目标搜索任务的多无人机协同航路优化
- Cooperative path optimization of multi-UAVs when searching for maritime targets
- 海洋科学, 42(1): 147-152
- Marina Sciences, 42(1): 147-152.
- http://dx.doi.org/10.11759/hykx20171011014
-
文章历史
- 收稿日期:2017-10-11
- 修回日期:2017-12-23
无人机(unmanned aerial vehicle, UAV)因其使用灵活、性价比高、可执行高风险任务等优势, 已广泛应用于各类军用或民用领域。相比于船舶监控等技术手段, 利用无人机实现海上各类突发事件的应急空中监控具有成本低、效率高、灵活性强等显著优点, 正逐步成为国内外学术界与海洋管理部门关注的热点。本文以海上目标搜索为应用背景, 针对多无人机协同航路优化问题展开研究。该问题是指针对海上目标所在的疑似海域, 如何规划各无人机的最优搜索航路, 从而有效地引导各无人机尽早发现目标[1]。
如果区域搜索图信息完全未知或完全均等, 可采取几何类方法或随机法规划无人机搜索航路, 实现对任务区域的遍历覆盖。例如, 轩永波等[2]提出了运动目标垂线搜索与运动目标斜线搜索方式, 给出多无人机的平行覆盖航路。Lin等[3]在传统螺旋线法的基础上提出Top2与TopN算法, 即在各个子区域内同时规划螺旋线, 使得无人机航路满足终端时间约束与终端位置约束。此外, 为将几何类方法应用于多无人机搜索问题, 可采用区域分割、任务分配与单机规划相结合的思路[4-6]。随机法引导无人机在搜索区域内随机飞行, 随着时间累积将逐渐覆盖任务区域[7]。例如, Englot等[8]将机器人采样配置点(即顺序搜索点)进行更新, 从各配置区域内选择具有相同覆盖效果但路径长度更短的配置点。文献[9]定义无人机以一定角度沿直线飞行, 到达边界后转弯, 当再次进入搜索区域后以新角度继续沿直线飞行。
如果区域内搜索图信息已知, 可采取基于搜索图的方法:首先将待搜索区域离散化为一系列单元如正方形或六边形栅格, 然后基于各单元实时更新的搜索图信息(如基于贝叶斯规则的目标概率图、基于环境不确定度的认知图、基于信息素交换机制的信息素图等), 定义各类任务指标(如最大化搜索累积概率、最小化搜索所需时间、最大化信息素势差等), 进而采取优化策略寻找最优航路, 引导无人机向最有希望的方向运动[10-13]。Hu等[10]采取了覆盖控制策略, 利用Voronoi图相关性质, 控制无人机向代价函数的梯度下降方向运动, 从而实现对目标的近似最优搜索。文献[12]提出了一种基于分布式模型预测控制(distributed model predictive control, DMPC)框架的多无人机协同搜索方法。
当已知任务区域信息时, 基于搜索图的方法利用了任务区域的搜索图信息, 可灵活处理各类复杂情况, 具有较高的搜索效率。然而, 该类方法仍存在局部最优等缺陷, 即无人机可能会长时间徘徊于局部区域而忽视其他高价值区域。因此, 本文为进一步提高搜索效率, 研究了面向多无人机协同目标搜索任务的航路优化问题。利用状态预测一致性算法实现各无人机间的信息融合, 进而采用考虑了未来收益的DMPC方法规划各无人机搜索航路。本研究提出的方法具有较高的搜索效率, 尤其适用于时间敏感目标(简称时敏目标, 其生存概率或探测价值随着时间流逝而迅速降低)的快速搜索任务, 具有重要的应用价值。
1 面向海上目标搜索任务的多无人机协同航路优化问题描述本文将任务海域简化为标准矩形并将其离散化为
假设
$\begin{gathered} {{\dot x}_i} = {v_i}\cos {\psi _i} \hfill \\ {{\dot y}_i} = {v_i}\cos {\psi _i} \hfill \\ {{\dot \psi }_i} = \frac{{{\rm{g}}\tan {\phi _i}}}{{{v_i}}} \hfill \\ \end{gathered} $ | (1) |
其中,
$\left| {{\phi _i}} \right| \leqslant {\phi _{\max }}$ | (2) |
假设无人机视觉传感器对海面的观测区域可等效为如图 1a所示的扇形区域。此外, 引入关于距离
$p({z_k} = D|\boldsymbol{x}_k^m){\rm{ = }}\alpha \left( {{\rm{1}} - \frac{1}{{1{\rm{ + }}\exp \left( { - \beta (d - {d_{\rm{s}}})} \right)}}} \right)$ | (3) |
其中,
观测事件发生后, 可根据Bayes公式更新各无人机维护的目标概率图:
$p(\boldsymbol{x}_k^m\left| {z_{1:k}^{}} \right.) = \lambda p\left( {\boldsymbol{x}_{k - 1}^m\left| {z_{1:k - 1}^{}} \right.} \right)p\left( {z_k^{}\left| {\boldsymbol{x}_k^m} \right.} \right)$ | (4) |
其中,
由于各无人机的探测历史互不相同, 其独立维护的目标概率图也不一致, 因此需进行信息融合。本文在传统一致性理论的基础上引入状态预测器, 实现目标概率图的分布式融合, 使得无人机各自维护的目标概率图能更快地趋于一致(相等)。
首先给出状态预测一致性算法的定义。假设系统内各节点状态满足一阶动态方程
$\begin{gathered} {u_i} = - \sum\limits_{j = 1}^{{N_{\rm{u}}}} {{a_{ij}}({s_i} - {s_j})} + \gamma \sum\limits_{j = 1}^{{N_{\rm{u}}}} {{a_{ij}}(\dot s_i^p - \dot s_j^p)} = - \sum\limits_{j = 1}^{{N_{\rm{u}}}} {{a_{ij}}({s_i} - {s_j})} - \hfill \\ \;\;\;\;\;\;\gamma (\sum\limits_{j = 1}^{{N_{\rm{u}}}} {\sum\limits_{k = 1}^{{N_{\rm{u}}}} {{a_{ij}}{a_{ik}}({s_i} - {s_k})} } - \sum\limits_{j = 1}^{{N_{\rm{u}}}} {\sum\limits_{p = 1}^{{N_{\rm{u}}}} {{a_{ij}}{a_{jp}}({s_j} - {s_p})} } ) \hfill \\ \end{gathered} $ | (5) |
其中, 右式第二部分即为状态预测器。最终各节点状态可快速趋于一致(相等)[14]。
然后将状态预测一致性算法应用于目标概率图的信息融合。构造包含上述状态量且符合一阶动态方程形式的系统方程, 假设无人机i独立维护的目标概率为
$Q(\boldsymbol{x}_k^m\left| {z_{1:k}^{}} \right.){\rm{ = }}\\ \left( {1 - \frac{{{N_{i, k}}}}{{{N_{\rm{u}}}}} - \gamma \frac{{{N_{i, k}}^2}}{{{N_{\rm{u}}}^2}}} \right)p(\boldsymbol{x}_k^m\left| {z_{1:k}^{}} \right.) + \sum\limits_{j \in {\rm{\{ }}{V_{i, k}}{\rm{\} }}} {\left( {(\frac{1}{{{N_{\rm{u}}}}}{\rm{ + }}\gamma \frac{{{N_{i, k}}}}{{{N_{\rm{u}}}^2}})p(\boldsymbol{x}_k^m\left| {z_{1:k}^{}} \right.)} \right)} $ | (6) |
其中,
考虑到海域环境是动态未知的, 各无人机需分布式决策各自的搜索行为即确定搜索点。由于全局优化无法满足实时性需求, 因此本项目采取基于边探测边决策思路的DMPC方法:各无人机基于目标函数与约束条件规划各自有限时域内的最优搜索点, 并依据决策结果执行任务, 同时进行状态更新; 上述过程采用滚动时域的方法迭代决策, 直至任务结束。
以无人机i为例, k时刻控制输入与状态量为
$\boldsymbol{u}_i^*[k:k + N-1]{\rm{ = arg max }}{J_i}$ | (7) |
本文引入局部搜索收益
${\rm{ }}{J_i}{\rm{ = }}{\lambda _{\rm{m}}}{J_{\rm{m}}} + {\lambda _{\rm{f}}}{J_{\rm{f}}} + {\lambda _{\rm{u}}}{J_{\rm{u}}}$ | (8) |
假设各时刻无人机观测事件互相独立, k时刻前的搜索收益
${D_{1:k}}{\rm{ = }}1 - \prod\limits_{t = 1}^k {{{\bar D}_t}} $ | (9) |
其中,
${\bar D_k}{\rm{ = }}\sum\limits_{m = 1}^M {\left( {Q(\boldsymbol{x}_k^m|{z_{1:k}})(1 - p({z_k}|\boldsymbol{x}_k^m))} \right)} $ | (10) |
因此局部搜索收益
${J_{\rm{m}}}{\rm{ = }}{D_{1:k + N}} - {D_{1:k}}$ | (11) |
由于时域长度N的选取有限, 因此本项目还将引入未来搜索收益, 即N步之后大范围区域内的预计收益。定义
${J_{\rm{f}}}{\rm{ = }}\sum\limits_{\forall \boldsymbol{x}_k^m \in S}^{} {\left( {Q(\boldsymbol{x}_k^m\left| {z_{1:k}^{}} \right.)p(z_k^{}\left| {\boldsymbol{x}_k^m} \right.)} \right)} $ | (12) |
控制输入代价
${J_{\rm{u}}}{\rm{ = }}{\lambda _{\rm{u}}}\sum\limits_{t = k}^{k + N - 1} {\left\| {u(t) - u(t - 1)} \right\|} $ | (13) |
然后, 求解公式(7), 获得最优控制输入。考虑到预测精度等原因, 仅执行第一步控制输入
本文在MATLAB软件上进行仿真验证, 每组试验运行50次, 并对搜索收益等统计结果进行分析。假设任务海域大小为5 000 m×5 000 m, 并离散化为100×100个栅格, 目标分布概率图由5个随机的指数函数叠加而成, 如图 3所示。具体仿真参数如下:任务时间
假设3架无人机的初始位置分别为
采用传统DMPC算法的规划结果如图 5所示, 由于仅以局部搜索收益为指标, 因此无人机会陷入局部区域而忽略右下角区域, 大大降低了搜索效率。此外, 图 6给出了采用本文方法、传统DMPC法、平行线法的搜索收益曲线, 本文方法具有最高的搜索收益, 传统DMPC次之, 而由于平行线法未利用目标概率图信息, 因此搜索收益最低。
5 结论
本文研究了面向海上目标搜索任务的多无人机协同航路优化问题。在对目标概率图信息进行状态预测一致性融合的基础上, 考虑局部搜索收益与未来搜索收益, 利用DMPC方法优化各无人机搜索航路。仿真结果表明, 本文提出的方法具有较高的搜索效率, 且在一定程度上避免了传统方法的局部最优缺陷。
[1] |
Galceran E, Carreras M. A survey on coverage path planning for robotics[J]. Robotics and Autonomous Systems, 2013, 61(12): 1258-1276. DOI:10.1016/j.robot.2013.09.004 |
[2] |
轩永波, 黄长强, 吴文超, 等. 运动目标的多无人机编队覆盖搜索决策[J]. 系统工程与电子技术, 2013, 35(3): 539-544. Xuan Yongbo, Huang Changqiang, Wu Wenchao, et al. Coverage search strategies for moving targets using multiple unmanned aerial vehicle teams[J]. Systems Engineering and Electronics, 2013, 35(3): 539-544. |
[3] |
Lin L, Goodrich M A. Hierarchical heuristic search using a Gaussian mixture model for UAV coverage planning[J]. IEEE Transactions on Cybernetics, 2014, 44(12): 2532-2544. DOI:10.1109/TCYB.2014.2309898 |
[4] |
陈海, 何开锋, 钱炜祺. 多无人机协同覆盖路径规划[J]. 航空学报, 2016, 37(3): 928-935. Chen Hai, He Kaifeng, Qian Weiqi. Cooperative coverage path planning for multiple UAVs[J]. Acta Aeronautica et Astronautica Sinica, 2016, 37(3): 928-935. |
[5] |
Li Y, Chen H, Er M J, et al. Coverage path planning for UAVs based on enhanced exact cellular decomposition method[J]. Mechatronics, 2011, 21(5): 876-885. DOI:10.1016/j.mechatronics.2010.10.009 |
[6] |
Torres M, Pelta D A, Verdegay J L, et al. Coverage path planning with unmanned aerial vehicles for 3D terrain reconstruction[J]. Expert Systems with Applications, 2016, 55: 441-451. DOI:10.1016/j.eswa.2016.02.007 |
[7] |
Sutantyo D, Levi P, Möslinger C, et al. Collective- adaptive lévy flight for underwater multi-robot exploration[C]// IEEE. 2013 IEEE International Conference on Mechatronics and Automation. Karlsruhe: IEEE, 2013: 456-462.
|
[8] |
Englot B J. Sampling-based coverage path planning for complex 3D structures[D]. Massachusetts: Massachusetts Institute of Technology, 2012.
|
[9] |
符小卫, 李建, 高晓光. 带通信约束的多无人机协同搜索中的目标分配[J]. 航空学报, 2014, 35(5): 1347-1356. Fu Xiaowei, Li Jian, Gao Xiaoguang. Target allocation in multi-UAV cooperative search with communication constraints[J]. Acta Aeronautica et Astronautica Sinica, 2014, 35(5): 1347-1356. |
[10] |
Hu J, Xie L, Lum K Y, et al. Multiagent Information Fusion and Cooperative Control in Target Search[J]. IEEE Transactions on Control Systems Technology, 2013, 21(4): 1223-1235. DOI:10.1109/TCST.2012.2198650 |
[11] |
Berger J, Lo N. An innovative multi-agent search-and- rescue path planning approach[J]. Computers & Operations Research, 2015, 53: 24-31. |
[12] |
彭辉, 沈林成, 朱华勇. 基于分布式模型预测控制的多UAV协同区域搜索[J]. 航空学报, 2010, 31(3): 593-601. Peng Hui, Shen Lincheng, Zhu Huayong. Multiple UAV cooperative area search based on distributed model predictive control[J]. Acta Aeronautica et Astronautica Sinica, 2010, 31(3): 593-601. |
[13] |
Yao P, Wang H, Ji H. Gaussian mixture model and receding horizon control for multiple UAV search in complex environment[J]. Nonlinear Dynamics, 2017, 88(2): 903-919. DOI:10.1007/s11071-016-3284-1 |
[14] |
席裕庚, 黄维, 李晓丽. 具有状态预测器的多智能体系统一致性研究[J]. 控制与决策, 2010, 25(5): 769-772. Xi Yugeng, Huang Wei, Li Xiaoli. Consensus of multi- agent system with state predictor[J]. Control and Decision, 2010, 25(5): 769-772. |