期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
无人艇集群自组织协同围捕控制算法研究
1
作者 夏桂华 朱文序 +2 位作者 刘浩岩 刘兴 姜享利 《智能系统学报》 北大核心 2025年第1期162-171,共10页
无人艇(unmanned surface vessel,USV)集群协同围捕是无人艇的重要应用场景之一,文章针对无人艇集群协同围捕任务设计了一种自组织控制算法。考虑到被围对象的加速度未知且仅部分集群成员可对其测量的情况,文章设计了分布式目标状态观测... 无人艇(unmanned surface vessel,USV)集群协同围捕是无人艇的重要应用场景之一,文章针对无人艇集群协同围捕任务设计了一种自组织控制算法。考虑到被围对象的加速度未知且仅部分集群成员可对其测量的情况,文章设计了分布式目标状态观测器(distributed target state observer,DTSO),实现围捕过程中各成员对被捕对象状态的一致性观测。设计了一种自组织围捕引导律,解决了围捕算法需要为成员预分配期望位置的问题。设计了分布式非线性模型预测控制(distributed nonlinear model predictive control,DNMPC),解决了执行器饱和与艇间距离约束的问题,实现了满足避碰安全的协同围捕控制。文章分析了控制系统的输入-状态稳定性(input-to-state stability,ISS),并通过多组不同初始状态和改变成员数量的仿真实验,验证了围捕算法的有效性。 展开更多
关键词 无人艇 集群控制 协同围捕 多智能体 模型预测控制 输入-状态稳定性 状态观测器 图论
在线阅读 下载PDF
基于融合蛇优化算法的多AUV协同围捕算法
2
作者 陈浩 张美燕 蔡文郁 《传感技术学报》 CAS CSCD 北大核心 2024年第11期1911-1920,共10页
为了提高围捕系统的围捕效率,提出一种基于融合蛇优化算法的多AUV协同围捕算法(Multi-AUV Cooperative Hunting Algorithm based on Fusion Snake Optimization algorithm,MACHA_FSO)。MACHA_FSO改进随机目标搜索策略,采用莱维飞行策略... 为了提高围捕系统的围捕效率,提出一种基于融合蛇优化算法的多AUV协同围捕算法(Multi-AUV Cooperative Hunting Algorithm based on Fusion Snake Optimization algorithm,MACHA_FSO)。MACHA_FSO改进随机目标搜索策略,采用莱维飞行策略设置搜索目标,就近原则变更围捕AUV工作区域,保证围捕AUV的搜索效率。MACHA_FSO构建围捕系统的整体能耗模型,采用最小化围捕距离策略建立围捕联盟,提出融合蛇优化算法合理规划围捕AUV的围捕路径,有效降低围捕AUV能耗。仿真结果表明:相较于CPGBNN,RIGBNN和PRACO围捕算法,MACHA_FSO能够合理设置围捕AUV的搜索目标与围捕路径,且围捕系统平均能量消耗降低41%,围捕逃逸目标平均用时降低32%,围捕逃逸目标平均数量提高1倍,围捕系统平均生存时间提高15%。 展开更多
关键词 多AUV协同围捕 路径规划 能源消耗 蛇优化算法
在线阅读 下载PDF
基于逃逸角的多ASV微分博弈协同围捕方法
3
作者 杨惠珍 李建国 +2 位作者 吴天宇 王子江 杨钧 《水下无人系统学报》 2024年第4期730-738,共9页
针对多个自主水面航行器(ASV)围捕单个主动逃逸的对抗性目标问题,利用微分博弈理论建立了多ASV协同围捕问题博弈模型,在含有距离项的支付函数中引入由逃逸角构成的合围项,从而降低目标中途逃逸的概率;然后将围捕问题转换为求解可实现策... 针对多个自主水面航行器(ASV)围捕单个主动逃逸的对抗性目标问题,利用微分博弈理论建立了多ASV协同围捕问题博弈模型,在含有距离项的支付函数中引入由逃逸角构成的合围项,从而降低目标中途逃逸的概率;然后将围捕问题转换为求解可实现策略的优化问题,利用粒子群优化(PSO)算法求解满足纳什均衡的最优策略,仿真和湖上试验结果均证明了基于PSO的微分博弈围捕算法的有效性。 展开更多
关键词 自主水面航行器 微分博弈 协同围捕 粒子群优化
在线阅读 下载PDF
基于改进混合粒子群优化算法的多无人机协同围捕方法研究 被引量:1
4
作者 许诺 朱黔 +3 位作者 谢晓阳 喻涛 刘佳 刘思帆 《电光与控制》 CSCD 北大核心 2024年第9期1-5,共5页
针对多无人机协同围捕问题,在无人机运动学约束基础上,考虑各无人机应同时到达围捕位置,提出了多机协同围捕任务规划两层求解架构。在任务协调层通过改进混合粒子群优化方法,以各无人机同时到达指定围捕位置的最小时间为目标,优化调度... 针对多无人机协同围捕问题,在无人机运动学约束基础上,考虑各无人机应同时到达围捕位置,提出了多机协同围捕任务规划两层求解架构。在任务协调层通过改进混合粒子群优化方法,以各无人机同时到达指定围捕位置的最小时间为目标,优化调度给出多目标围捕方案;在航路规划层考虑无人机初始状态及运动学约束,通过Dubins曲线调整实现各无人机同时到达围捕位置。仿真结果表明了所提方法的有效性。 展开更多
关键词 多无人机 协同围捕 改进混合粒子群优化
在线阅读 下载PDF
基于覆盖理论的高速强机动目标协同围捕策略 被引量:2
5
作者 江涌 王林波 +3 位作者 王蒙一 宋勋 安鹏飞 于江龙 《工程科学学报》 EI CSCD 北大核心 2024年第7期1169-1178,共10页
为了应对进攻性高超声速飞行器带来的威胁与挑战,基于覆盖理论提出了一种针对高速强机动目标的分布式协同围捕策略.首先,考虑飞行器与目标的机动特性,包括速度关系、最大过载比等参数,引入阿波罗尼奥斯圆的概念对围捕区域进行分析.然后... 为了应对进攻性高超声速飞行器带来的威胁与挑战,基于覆盖理论提出了一种针对高速强机动目标的分布式协同围捕策略.首先,考虑飞行器与目标的机动特性,包括速度关系、最大过载比等参数,引入阿波罗尼奥斯圆的概念对围捕区域进行分析.然后,基于重叠角概念提出冗余覆盖策略,根据目标的逃逸边界给出初始飞行器最优数量,设计围捕队形使多飞行器的围捕区域能够对目标逃逸边界完全覆盖,在此基础上考虑多种约束设计围捕高速强机动目标的分布式协同制导律,使多飞行器能够完成所设计的围捕队形,达到目标被飞行器合围后无法逃脱的效果.最后,将上述覆盖策略分别在二维平面和三维空间进行数值仿真,验证了一致性协同制导律能够实现期望的围捕队形,所设计的围捕队形在目标作最大常值机动逃逸以及随机机动两种情况下均能捕获目标,证明了围捕队形和制导律的有效性和优越性. 展开更多
关键词 覆盖理论 协同围捕 高速强机动目标 阿波罗尼奥斯圆 围捕区域
在线阅读 下载PDF
基于强化学习的多无人车协同围捕方法 被引量:1
6
作者 苏牧青 王寅 +1 位作者 濮锐敏 余萌 《工程科学学报》 EI CSCD 北大核心 2024年第7期1237-1250,共14页
本文面向无人车协同围捕问题开展研究,提出了一种基于柔性执行者-评论家(SAC)算法框架的协同围捕算法.针对多无人车之间的协同性差的问题,在网络结构中加入长短期记忆(LSTM)构建记忆功能,帮助无人车利用历史观测序列进行更稳健的决策;... 本文面向无人车协同围捕问题开展研究,提出了一种基于柔性执行者-评论家(SAC)算法框架的协同围捕算法.针对多无人车之间的协同性差的问题,在网络结构中加入长短期记忆(LSTM)构建记忆功能,帮助无人车利用历史观测序列进行更稳健的决策;针对网络结构中引入LSTM所导致的状态空间维度增大、效率低的问题,提出引入注意力机制,通过对状态空间进行注意力权重的计算和选择,将注意力集中在与任务相关的关键状态上,从而约束状态空间维度并保证网络的稳定性,实现多无人车之间稳定高效的合作并提高算法的训练效率.为解决协同围捕任务中奖励稀疏的问题,提出通过混合奖励函数将奖励函数分为个体奖励和协同奖励,通过引入个体奖励和协同奖励,无人车在围捕过程中可以获得更频繁的奖励信号.个体奖励通过引导无人车向目标靠近来激励其运动行为,而协同奖励则激励群体无人车共同完成围捕任务,从而进一步提高算法的收敛速度.最后,通过仿真和实验表明,该方法具有更快的收敛速度,相较于SAC算法,围捕时间缩短15.1%,成功率提升7.6%. 展开更多
关键词 无人车 协同围捕 柔性执行者-评论家算法 注意力机制 奖励函数设计
在线阅读 下载PDF
多机器人协同围捕方法综述
7
作者 周萌 李建宇 +2 位作者 王昶 王晶 王力 《自动化学报》 EI CAS CSCD 北大核心 2024年第12期2325-2358,共34页
多机协同围捕作为多机器人协同领域的一项重要分支,着重研究多个机器人通过相互协作对动态可疑目标实现有效的追踪与围捕,在军事侦查、紧急救援、协同探测等领域具有重要的研究意义与实际应用价值.首先通过国内外科学引文数据库对多机... 多机协同围捕作为多机器人协同领域的一项重要分支,着重研究多个机器人通过相互协作对动态可疑目标实现有效的追踪与围捕,在军事侦查、紧急救援、协同探测等领域具有重要的研究意义与实际应用价值.首先通过国内外科学引文数据库对多机协同围捕领域相关的文献进行全面检索,深入剖析目前该领域前沿技术的发展现状与研究热点.接下来从理论与技术层面分别针对多机协同围捕领域中的目标协同搜索、多机任务分配、协同围捕控制等方面进行全面总结,重点阐述各研究内容常用方法与技术的工作原理、优缺点及适用范围等.最后对该领域的发展现状进行总结,并分析探讨目前尚未解决的难点,对未来的发展方向提出展望. 展开更多
关键词 多机协同围捕 协同目标搜索 任务分配 围捕控制
在线阅读 下载PDF
无人车集群协同围捕发展现状分析 被引量:1
8
作者 徐友春 郭宏达 +2 位作者 娄静涛 叶鹏 苏致远 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期456-471,共16页
无人车集群具有成本低、安全性好、自主程度高等优点,已成为无人驾驶领域的研究热点。基于无人车集群,研究人员提出多种不同协同策略以完成各类任务,其中协同围捕作为重要的应用方向,无论是在军用还是民用领域都受到了广泛关注。针对此... 无人车集群具有成本低、安全性好、自主程度高等优点,已成为无人驾驶领域的研究热点。基于无人车集群,研究人员提出多种不同协同策略以完成各类任务,其中协同围捕作为重要的应用方向,无论是在军用还是民用领域都受到了广泛关注。针对此问题,该文首先基于无人车集群的相关应用和架构,对协同围捕的策略机理进行了系统分析,并将协同围捕策略划分为搜索、追踪和围堵3个子模式。然后,从博弈论、概率分析和机器学习等角度梳理了协同围捕的关键方法,并对这些算法的优缺点进行了比较。最后,对未来研究提出了意见建议,为进一步提高无人车集群协同围捕的效率和性能提供参考和思路。 展开更多
关键词 无人车集群 协同围捕 策略机理 搜索 追踪 围堵
在线阅读 下载PDF
基于状态相关黎卡提方程的集群航天器协同围捕非合作目标最优控制策略
9
作者 程毅 赵坤 +2 位作者 吴明帅 尹卓 刘源 《上海航天(中英文)》 CSCD 2024年第5期121-129,共9页
随着航天技术的大力发展,空间安全日益成为航天领域的焦点问题。空间围捕在轨目标也将由单航天器的追捕向集群航天器协同围捕的趋势发展。本文针对多个航天器协同围捕空间非合作目标的典型场景,提出一种基于状态相关黎卡提方程的集群航... 随着航天技术的大力发展,空间安全日益成为航天领域的焦点问题。空间围捕在轨目标也将由单航天器的追捕向集群航天器协同围捕的趋势发展。本文针对多个航天器协同围捕空间非合作目标的典型场景,提出一种基于状态相关黎卡提方程的集群航天器协同围捕非合作目标的策略与方法。首先,基于航天器非线性相对运动模型,建立空间集群航天器协同围捕非合作目标运动学模型,并据此设计双方的二次型目标函数(相对距离与燃料消耗),将围捕问题转化成微分对策的纳什均衡问题。其次,通过求解状态黎卡提方程,获取集群航天器对单一非合作目标航天器的最优策略。在此基础上利用零空间投影方法,设计一种与距离相关的基于优先级的任务规划方案,以获得非合作目标航天器面对集群航天器时的逃逸策略,避免其对于集群多个航天器的逃逸策略冲突。最终通过数值仿真结果验证了所提协同围捕策略与方法的有效性。 展开更多
关键词 集群航天器 协同围捕 状态相关黎卡提方程 零空间投影
在线阅读 下载PDF
基于群体意志统一的无人机协同围捕策略 被引量:6
10
作者 刘峰 魏瑞轩 +1 位作者 周凯 丁超 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第11期2241-2249,共9页
针对无人机(UAV)协同围捕问题,提出一种基于群体意志统一的围捕策略。受人类在协作任务中的认知机理启发,引入“群体意志”定义无人机的协作认知,并构建双回路认知模型,借助图卷积网络对围捕无人机获取的局部态势进行融合认知,有效减轻... 针对无人机(UAV)协同围捕问题,提出一种基于群体意志统一的围捕策略。受人类在协作任务中的认知机理启发,引入“群体意志”定义无人机的协作认知,并构建双回路认知模型,借助图卷积网络对围捕无人机获取的局部态势进行融合认知,有效减轻无人机系统的计算负载。依靠变分推断原理和生成式自动编码器对围捕无人机进行群体意志趋同学习,依据Apollonius圆实现协同围捕,使无人机集群涌现出更加智能化的围捕效果。通过对比仿真验证了所提策略的有效性和智能性。 展开更多
关键词 协同围捕 群体意志统一 融合认知 趋同学习 Apollonius圆
在线阅读 下载PDF
一种改进博弈学习的无人机集群协同围捕方法 被引量:1
11
作者 刘菁 华翔 张金金 《西安工业大学学报》 CAS 2023年第3期277-286,共10页
针对无人机集群对单智能化目标协同围捕问题,文中提出一种改进博弈学习的无人机集群协同围捕方法。根据集群和目标的运动学关系,建立了一种结合博弈论与阿波罗尼斯圆的协同围捕模型;依据集群之间的相互合作关系和追逃双方的博弈关系,基... 针对无人机集群对单智能化目标协同围捕问题,文中提出一种改进博弈学习的无人机集群协同围捕方法。根据集群和目标的运动学关系,建立了一种结合博弈论与阿波罗尼斯圆的协同围捕模型;依据集群之间的相互合作关系和追逃双方的博弈关系,基于Q Learning算法和学习到的奖赏均值动态调整贪婪因子以构建和完善状态动作矩阵;根据状态动作矩阵求解支付矩阵的纳什均衡解,完成集群对单目标的协同围捕。研究结果表明:通过该协同围捕方法各围捕无人机获得的平均奖赏值较传统Q Learning算法分别提高了48%,32.4%,50.8%,完成围捕任务所需的平均行走步数减少了58.7%,能够有效对单目标进行围捕,且围捕时效性更强。 展开更多
关键词 无人机集群 协同围捕 博弈论 阿波罗尼斯圆 Q Learning
在线阅读 下载PDF
多无人艇协同围捕智能逃跑目标方法研究 被引量:4
12
作者 宋利飞 徐凯凯 +3 位作者 史晓骞 孙昊 柴威 郭荣 《中国舰船研究》 CSCD 北大核心 2023年第1期52-59,共8页
[目的]针对无人艇协同围捕过程中逃跑目标具备智能性,现有无人艇策略难以围捕成功的问题,提出一种基于双层切换策略的多无人艇协同围捕算法。[方法]第1层围捕策略采用改进势点法,以无人艇与势点的总直线距离最小为优化目标,采用匈牙利... [目的]针对无人艇协同围捕过程中逃跑目标具备智能性,现有无人艇策略难以围捕成功的问题,提出一种基于双层切换策略的多无人艇协同围捕算法。[方法]第1层围捕策略采用改进势点法,以无人艇与势点的总直线距离最小为优化目标,采用匈牙利算法为无人艇动态分配势点,并采用人工势场法实现无人艇的协同避碰;第2层围捕策略利用了阿波罗尼奥斯圆的性质,在两艘无人艇前往逃跑目标的目标点进行拦截,剩余无人艇运动方向保持与逃跑目标相同,以不断缩紧包围区域;为应对逃跑目标不同的逃跑方式,第1层围捕策略和第2层围捕策略可互相转化。[结果]仿真实验表明,该算法相较于顺序分配势点算法和极角分配势点算法,围捕时间更少或持平,证明了该算法的有效性和先进性。[结论]该多无人艇协同双层围捕算法,对具备典型智能性的逃跑目标具有围捕效果。 展开更多
关键词 无人艇 协同围捕算法 势点法 匈牙利算法 阿波罗尼奥斯圆
在线阅读 下载PDF
基于概率图模型的多机器人自组织协同围捕方法 被引量:2
13
作者 黄依新 相晓嘉 +3 位作者 周晗 闫超 常远 孙懿豪 《控制理论与应用》 EI CAS CSCD 北大核心 2023年第12期2225-2235,共11页
多机器人协同围捕是群体智能在对抗环境下的典型运用.在感知能力受限、环境结构未知、目标状态不确定的真实环境中,多机器人协同围捕面临环境适应性、任务可扩展性等多方面挑战.针对这一问题,本文提出一种基于概率图模型的自组织协同围... 多机器人协同围捕是群体智能在对抗环境下的典型运用.在感知能力受限、环境结构未知、目标状态不确定的真实环境中,多机器人协同围捕面临环境适应性、任务可扩展性等多方面挑战.针对这一问题,本文提出一种基于概率图模型的自组织协同围捕方法.首先,建立围捕机器人和围捕对象的运动学模型,并给出围捕任务的数学描述.在此基础上,构建可扩展的协同围捕“感知–决策”概率图模型结构,并为模型中各节点状态设计概率分布参数估计方法;同时,将围捕任务阶段化,设计狼群狩猎行为启发的围捕策略,以提高围捕效率.最后,开展数值仿真和软件在环实验,验证了所提方法的节点可扩展性、环境适应性、系统抗风险性和模型可迁移性. 展开更多
关键词 概率图模型 自组织 协同围捕 多机器人 未知环境
在线阅读 下载PDF
水下自主潜航器集群协同围捕技术
14
作者 王景璟 魏维 +2 位作者 王永越 侯向往 任勇 《指挥与控制学报》 CSCD 2023年第6期637-650,共14页
水下自主潜航器(autonomous underwater vehicle,AUV)集群协作围捕技术是国际前沿的研究热点,研究了AUV集群水下协同围捕技术的应用,并归纳总结了5种典型的围捕场景;提出了一个全面的AUV集群协同围捕任务的系统框架,并基于该框架详细归... 水下自主潜航器(autonomous underwater vehicle,AUV)集群协作围捕技术是国际前沿的研究热点,研究了AUV集群水下协同围捕技术的应用,并归纳总结了5种典型的围捕场景;提出了一个全面的AUV集群协同围捕任务的系统框架,并基于该框架详细归纳分析了AUV围捕技术的研究进展,指出了一些有前景的研究方向. 展开更多
关键词 水下自主潜航器 集群智能 协同围捕 任务分配
在线阅读 下载PDF
基于HAPPO2的多无人车协同围捕策略
15
作者 郭宏达 周虹藩 +1 位作者 侯飞 郭永强 《军事交通学报》 2023年第4期83-90,共8页
针对多无人车协同算法存在动作输出不连续、训练收敛困难等问题,提出一种基于深度强化学习的混合编队围捕动态目标算法,以达到快速搜索、围捕目标,防止目标逃逸的目的。首先,分析无人车、目标的位置,缩小搜索范围,锁定目标;其次,将近端... 针对多无人车协同算法存在动作输出不连续、训练收敛困难等问题,提出一种基于深度强化学习的混合编队围捕动态目标算法,以达到快速搜索、围捕目标,防止目标逃逸的目的。首先,分析无人车、目标的位置,缩小搜索范围,锁定目标;其次,将近端策略优化算法应用于多无人车环境,提出异构多智能体近端策略优化算法(heterogeneous agent pxoximal policy opimization 2,HAPP02)以规划最优路径;最后,根据无人车不同的角色,结合HAPP02算法,制定不同的围捕策略。通过仿真实验,验证所提出算法的时效性和稳定性。 展开更多
关键词 深度强化学习 多无人车 协同围捕 路径规划
在线阅读 下载PDF
多无人艇协同围捕算法设计与仿真
16
作者 黄培灿 吴焯标 +2 位作者 傅嘉锐 杨培才 邓鸿鹏 《工业控制计算机》 2023年第7期110-111,119,共3页
为了实现对水面目标进行围捕的功能,提出了一种基于多无人艇的协同围捕算法。算法根据围捕无人艇的数量分配不同的目标相位,把整个围捕过程划分为编队前行、实施包围和靠近合拢三个阶段进行全局路径规划。算法设计简单实用,支持任意数... 为了实现对水面目标进行围捕的功能,提出了一种基于多无人艇的协同围捕算法。算法根据围捕无人艇的数量分配不同的目标相位,把整个围捕过程划分为编队前行、实施包围和靠近合拢三个阶段进行全局路径规划。算法设计简单实用,支持任意数量的围捕无人艇,路径节点数可调整,速度计算简单,具有防碰撞的特点。仿真实验验证了该算法的有效性。 展开更多
关键词 无人艇 协同围捕 多机器人系统 路径规划
在线阅读 下载PDF
基于阶段诱导学习的多无人艇协同目标围捕策略
17
作者 曲星儒 江雨泽 +2 位作者 龙飞飞 张汝波 高颖 《中国舰船研究》 北大核心 2025年第1期162-171,共10页
[目的]针对海上目标无人艇智能逃逸问题,提出一种基于阶段诱导学习的多无人艇协同目标围捕策略。[方法]首先构建针对无人艇围捕逃逸的马尔科夫博弈模型,明确基于距离和角度的围捕成功判定条件。为提升智能逃逸下多无人艇的目标围捕性能... [目的]针对海上目标无人艇智能逃逸问题,提出一种基于阶段诱导学习的多无人艇协同目标围捕策略。[方法]首先构建针对无人艇围捕逃逸的马尔科夫博弈模型,明确基于距离和角度的围捕成功判定条件。为提升智能逃逸下多无人艇的目标围捕性能,采用集中式训练-分布式执行框架和长短时记忆网络相结合的方法,基于多智能体柔性行动-评判(MASAC)算法开展协同围捕训练。同时,设计基于阶段诱导的协同围捕奖励机制,依据双方当前状态来优化训练进程,避免“惰性围捕艇”现象,提高围捕成功率,引导无人艇由易到难地完成围捕任务。[结果]仿真结果表明,与仅采用阶段诱导奖励的MASAC、仅采用长短时记忆网络的MASAC和MASAC围捕策略相比,所提策略的围捕成功率分别提高3.3%,6.1%和24.4%,验证了其可行性和有效性。[结论]所提策略为无人艇攻防对抗提供了有价值的技术参考,有助于推动无人艇技术在相关领域的应用与发展。 展开更多
关键词 无人艇 协同目标围捕 多智能体柔性行动-评判 阶段诱导奖励
在线阅读 下载PDF
面向多机协同的Att-MADDPG围捕控制方法设计 被引量:4
18
作者 刘峰 魏瑞轩 +2 位作者 丁超 姜龙亭 李天 《空军工程大学学报(自然科学版)》 CSCD 北大核心 2021年第3期9-14,共6页
多无人机对动态目标的围捕是无人机集群作战中的重要问题。针对面向动态目标的集群围捕问题,通过分析基于MADDPG算法的围捕机制的不足,借鉴Google机器翻译团队使用的注意力机制,将注意力机制引入围捕过程,设计基于注意力机制的协同围捕... 多无人机对动态目标的围捕是无人机集群作战中的重要问题。针对面向动态目标的集群围捕问题,通过分析基于MADDPG算法的围捕机制的不足,借鉴Google机器翻译团队使用的注意力机制,将注意力机制引入围捕过程,设计基于注意力机制的协同围捕策略,构建了相应的围捕算法。基于AC框架对MADDPG进行改进,首先,在Critic网络加入Attention模块,依据不同注意力权重对所有围捕无人机进行信息处理;然后,在Actor网络加入Attention模块,促使其他无人机进行协同围捕。仿真实验表明,Att-MADDPG算法较MADDPG算法的训练稳定性提高8.9%,任务完成耗时减少19.12%,经学习后的围捕无人机通过协作配合使集群涌现出更具智能化围捕行为。 展开更多
关键词 协同围捕 强化学习 MADDPG 智能性涌现
在线阅读 下载PDF
基于多智能体强化学习的无人艇协同围捕方法 被引量:12
19
作者 夏家伟 朱旭芳 +2 位作者 张建强 罗亚松 刘忠 《控制与决策》 EI CSCD 北大核心 2023年第5期1438-1447,共10页
针对多无人艇对海上逃逸目标的围捕问题,提出一种基于多智能体强化学习的围捕算法.首先,以无人艇协同进攻为背景建立无边界围捕问题的环境和运动学模型,并针对快速性和合围性的需求给出围捕成功的判定条件;然后,基于多智能体近端策略优... 针对多无人艇对海上逃逸目标的围捕问题,提出一种基于多智能体强化学习的围捕算法.首先,以无人艇协同进攻为背景建立无边界围捕问题的环境和运动学模型,并针对快速性和合围性的需求给出围捕成功的判定条件;然后,基于多智能体近端策略优化(MAPPO)算法建立马尔可夫决策过程框架,结合围捕任务需求分别设计兼具伸缩性和排列不变性的状态空间,围捕距离、方位解耦的动作空间,捕获奖励与步长奖励相结合的奖励函数;最后,采用集中式训练、分布式执行的架构完成对围捕策略的训练,训练时采用课程式学习训练技巧,无人艇群共享相同的策略并独立执行动作.仿真实验表明,在无人艇起始数量不同的测试条件下,所提出方法在围捕成功率和时效性上相较于其他算法更具优势.此外,当无人艇节点损毁时,剩余无人艇仍然具备继续执行围捕任务的能力,所提出方法鲁棒性强,具有在真实环境中部署应用的潜力. 展开更多
关键词 无人艇 多智能体 强化学习 深度学习 协同围捕 近端策略优化
原文传递
基于动态围捕点的多机器人协同策略 被引量:23
20
作者 李瑞珍 杨惠珍 萧丛杉 《控制工程》 CSCD 北大核心 2019年第3期510-514,共5页
为使机器人有效地围捕移动目标,提出了一种基于动态围捕点的多机器人协同围捕策略。根据目标的位置,动态设置围捕点,采用协商法为围捕机器人分配最佳围捕点,建立了一个综合描述围捕路径损耗和有效包围效果的目标函数,通过优化该目标函... 为使机器人有效地围捕移动目标,提出了一种基于动态围捕点的多机器人协同围捕策略。根据目标的位置,动态设置围捕点,采用协商法为围捕机器人分配最佳围捕点,建立了一个综合描述围捕路径损耗和有效包围效果的目标函数,通过优化该目标函数获得围捕机器人的最优航向角,从而实现了围捕机器人的在线路径规划。仿真结果表明了该算法的有效性。 展开更多
关键词 协同围捕 动态围捕 协商法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部