-
题名一种新的基于强化学习改进SAR的无人机路径规划
被引量:2
- 1
-
-
作者
周文娟
张超群
汤卫东
易云恒
刘文武
秦唯栋
-
机构
广西民族大学人工智能学院
广西混杂计算与集成电路设计分析重点实验室
-
出处
《控制与决策》
EI
CSCD
北大核心
2024年第4期1203-1211,共9页
-
基金
国家自然科学基金项目(62062011)
广西民族大学研究生创新计划项目(gxun-chxs2021057)。
-
文摘
搜索和救援优化算法(SAR)是2020年提出的模拟搜救行为的一种元启发式优化算法,用来解决工程中的约束优化问题.但是,SAR存在收敛慢、个体不能自适应选择操作等问题,鉴于此,提出一种新的基于强化学习改进的SAR算法(即RLSAR).该算法重新设计SAR的局部搜索和全局搜索操作,并增加路径调整操作,采用异步优势演员评论家算法(A3C)训练强化学习模型使得SAR个体获得自适应选择算子的能力.所有智能体在威胁区数量、位置和大小均随机生成的动态环境中训练,进而从每个动作的贡献、不同威胁区下规划出的路径长度和每个个体的执行操作序列3个方面对训练好的模型进行探索性实验.实验结果表明,RLSAR比标准SAR、差分进化算法、松鼠搜索算法具有更高的收敛速度,能够在随机生成的三维动态环境中成功地为无人机规划出更加经济且安全有效的可行路径,表明所提出算法可作为一种有效的无人机路径规划方法.
-
关键词
强化学习
搜索与救援优化算法
异步优势演员-评论家算法
路径规划
路径调整
无人机
-
Keywords
reinforcement learning
search and rescue optimization algorithm
asynchronous advantage actor-critic algorithm
path planning
path adjustment
unmanned aerial vehicle
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-