期刊文献+
共找到3,031篇文章
< 1 2 152 >
每页显示 20 50 100
计及气网延时的电-气综合能源系统近端策略优化双智能体安全校正方法
1
作者 彭寒梅 颜飞 +2 位作者 谭貌 苏永新 李辉 《电力自动化设备》 北大核心 2025年第2期51-60,共10页
电-气区域综合能源系统(EGRIES)中的电、气能源耦合且电力与天然气传输速率存在差异性,使得其安全校正的控制变量多且调整时间尺度不同。为此,提出一种基于双智能体深度强化学习的EGRIES多时间尺度安全校正控制方法。基于EGRIES多能流... 电-气区域综合能源系统(EGRIES)中的电、气能源耦合且电力与天然气传输速率存在差异性,使得其安全校正的控制变量多且调整时间尺度不同。为此,提出一种基于双智能体深度强化学习的EGRIES多时间尺度安全校正控制方法。基于EGRIES多能流模型和天然气网络调节较慢的特性,进行控制变量的调整时间尺度分类;构建基于双智能体强化学习的安全校正控制框架,采用合作型双智能体分别进行长时间和短时间尺度控制变量调整量的决策,设计基于近端策略优化(PPO)算法的智能体1和智能体2模型;在此基础上,离线训练PPO双智能体,当系统进入紧急状态时,双智能体相互合作在线产生可靠的安全校正控制策略,使系统恢复到正常状态。算例仿真结果验证了所提方法的有效性。 展开更多
关键词 电-气区域综合能源系统 安全校正控制 智能 PPO算法 调整时间尺度
在线阅读 下载PDF
基于AI智能体的儿童安全教育虚拟现实系统设计与实现
2
作者 熊海东 胡静 《移动信息》 2025年第1期113-115,共3页
儿童安全至关重要,但传统插画、视频等安全教育方式存在情境不逼真的问题,“AI智能体+虚拟现实”技术为儿童安全教育带来新可能,文中探讨了创新该系统的相关内容。首先,介绍了系统涉及的AI智能体和虚拟现实相关技术,包括AI智能体的学习... 儿童安全至关重要,但传统插画、视频等安全教育方式存在情境不逼真的问题,“AI智能体+虚拟现实”技术为儿童安全教育带来新可能,文中探讨了创新该系统的相关内容。首先,介绍了系统涉及的AI智能体和虚拟现实相关技术,包括AI智能体的学习、推理与决策能力及实现技术,虚拟现实的技术原理和应用优势。其次,阐述了系统设计,涵盖AI智能体的构建、知识库搭建,虚拟现实的教学内容与环境设计,以及系统整体架构。最后,重点论述了系统实现部分,如虚拟现实交互实现、AI智能体与虚拟现实资源整合、人机交互实现等。通过该系统,将突破传统教育瓶颈,为儿童提供生动、有趣、高效的安全教育环境,提升安全教育质量和效果。 展开更多
关键词 儿童安全教育 AI智能 虚拟现实 系统设计 交互实现
在线阅读 下载PDF
有向图下基于速度估计器的多智能体系统目标拦截控制
3
作者 王圆妹 李世豪 +2 位作者 李涛 惠英文 韩静 《长江大学学报(自然科学版)》 2025年第1期119-126,共8页
论文针对有向图下目标速度未知的多智能体系统目标拦截控制问题进行了深入研究,利用邻居智能体之间的相对位置信息设计跟随者的编队跟踪误差并构造滑膜量。使用编队跟踪误差和滑膜面对每个跟随者设计分布式编队跟踪控制协议,证明了多智... 论文针对有向图下目标速度未知的多智能体系统目标拦截控制问题进行了深入研究,利用邻居智能体之间的相对位置信息设计跟随者的编队跟踪误差并构造滑膜量。使用编队跟踪误差和滑膜面对每个跟随者设计分布式编队跟踪控制协议,证明了多智能体系统在该控制协议作用下能实现编队控制,并消除了队形模糊的问题。根据领导者与目标之间的位置误差设计目标的速度估计器,实现动态预测目标的未知速度,并结合分布式编队跟踪控制协议和速度估计器设计目标拦截控制协议。基于代数图论和李雅普诺夫稳定性理论分析得到了实现目标拦截控制的充分条件,详细讨论并证明了该系统的稳定性,由仿真实验结果验证了理论结果的有效性。 展开更多
关键词 多智能系统 目标拦截 有向图 速度估计器 积分滑膜
在线阅读 下载PDF
通信时延约束下的多智能体系统动态事件触发编队方法
4
作者 杨自钦 夏长清 +2 位作者 刘玉奇 金曦 许驰 《控制工程》 北大核心 2025年第1期126-134,共9页
针对智能体通信时延和能源损耗问题,研究了带有时延和切换拓扑的二阶多智能体系统动态事件触发编队控制方法。在考虑通信时延的基础上,设计了一种动态事件触发机制,通过动态调整事件触发条件,使系统能够根据实时状态进行控制。根据该控... 针对智能体通信时延和能源损耗问题,研究了带有时延和切换拓扑的二阶多智能体系统动态事件触发编队控制方法。在考虑通信时延的基础上,设计了一种动态事件触发机制,通过动态调整事件触发条件,使系统能够根据实时状态进行控制。根据该控制方法,建立了时延控制输入、切换拓扑和动态事件触发下闭环控制系统的数学模型,并利用李雅普诺夫稳定性理论和线性矩阵不等式理论证明了其稳定性。仿真结果表明,与现有方法相比,所提方法可以避免大量的触发,节约了网络资源,并提高了多智能体系统的收敛性能。 展开更多
关键词 多智能系统 切换拓扑 时延 领导者 动态事件触发
在线阅读 下载PDF
控制方向未知的受限多智能体系统的预设时间模糊控制
5
作者 李菲 周超 +1 位作者 范利蓉 王芳 《工程科学学报》 EI 北大核心 2025年第1期121-129,共9页
综合考虑受控制方向未知、输入受限和状态时延影响的有领导者多智能体系统的编队控制问题,设计基于模糊逻辑系统的预设时间一致性控制策略.为了保证编队输出误差在预设时间内满足预定的约束范围要求,引入预设时间性能函数,构造Lyapunov-... 综合考虑受控制方向未知、输入受限和状态时延影响的有领导者多智能体系统的编队控制问题,设计基于模糊逻辑系统的预设时间一致性控制策略.为了保证编队输出误差在预设时间内满足预定的约束范围要求,引入预设时间性能函数,构造Lyapunov-Krasovskii(L-K)泛函解决状态时延问题,将外界干扰和L-K泛函的导数中的部分项定义为未知非线性函数,并利用模糊逻辑系统对其进行估计,利用Nussbaum函数和均值定理分别处理控制方向未知和输入受限问题,基于以上设计,提出预设时间模糊控制策略,并通过Lyapunov稳定性理论,分析闭环系统的有界稳定性,数值对比仿真和两级化学反应器应用仿真说明控制方法的有效性. 展开更多
关键词 多智能系统 状态时延 输出误差约束 输入受限 控制方向未知
在线阅读 下载PDF
含有等容胞腔的多智能体系统的能控性
6
作者 刘萌萌 纪志坚 +1 位作者 刘允刚 林崇 《复杂系统与复杂性科学》 北大核心 2025年第1期97-103,112,共8页
为研究含有等容胞腔的多智能体系统的能控性问题,基于等容胞腔中的等势节点,区分了等势节点与自同构节点,发现等势节点是自同构节点的扩展。通过选取等势节点和非等势节点作为领导者,分析了系统的能控性,并提出了一种根据等容胞腔数量... 为研究含有等容胞腔的多智能体系统的能控性问题,基于等容胞腔中的等势节点,区分了等势节点与自同构节点,发现等势节点是自同构节点的扩展。通过选取等势节点和非等势节点作为领导者,分析了系统的能控性,并提出了一种根据等容胞腔数量决定领导者数量的新方法。最后通过分析拉普拉斯矩阵,揭示了其秩与拓扑结构的之间的关系。研究结果表明,提出的领导者选择方式能有效提升系统的能控性。 展开更多
关键词 多智能系统 等价划分 能控性 领导者选择方法
在线阅读 下载PDF
大模型驱动的教育多智能体系统应用研究——技术架构、发展现状、实践路径与未来展望
7
作者 刘石奇 刘智 +2 位作者 段会敏 粟柱 彭晛 《远程教育杂志》 北大核心 2025年第1期33-45,共13页
随着生成式大模型技术的快速发展,大模型驱动的单智能体在教育领域已获得广泛应用。然而,在处理需要多角色协作的教育任务时,如教育资源开发、模拟协作学习等复杂场景,单智能体仍面临认知视角单一和角色定位固定等局限,难以满足教育领... 随着生成式大模型技术的快速发展,大模型驱动的单智能体在教育领域已获得广泛应用。然而,在处理需要多角色协作的教育任务时,如教育资源开发、模拟协作学习等复杂场景,单智能体仍面临认知视角单一和角色定位固定等局限,难以满足教育领域深层次的发展需求。本研究系统探讨了大模型驱动的教育多智能体系统的应用现状与发展前景。首先,构建了教育多智能体的多层次应用技术架构体系,为相关研究奠定理论基础;其次,从教学辅助、学习支持、教育评价和教育研究四个维度,深入分析了教育多智能体系统的应用现状与典型案例;再次,从应用机制、技术实现和教育效果三个层面,系统阐释了多智能体系统赋能教育的内在机理,并提出“机制设计-系统建模-效果评估”的闭环实践路径;最后,探讨了教育多智能体系统的未来发展趋势、面临的挑战及其应对策略。研究成果对推动多智能体技术与教育深度融合、促进智能教育创新发展具有重要的理论指导意义与实践价值。 展开更多
关键词 大模型 多智能系统 生成式人工智能 教育应用 教育变革 智能教育
在线阅读 下载PDF
基于PI结构的多智能体系统容错一致性控制
8
作者 郜晨 何潇 周东华 《自动化学报》 北大核心 2025年第3期570-576,共7页
针对无领航者多智能体系统(Multi-agent systems,MASs)以及领航-跟随多智能体系统执行器故障问题,设计基于PI结构的容错控制律.考虑到传统的比例型控制律无法消除加性干扰影响下的稳态误差,引入积分环节,在一致性控制律中融入状态的积分... 针对无领航者多智能体系统(Multi-agent systems,MASs)以及领航-跟随多智能体系统执行器故障问题,设计基于PI结构的容错控制律.考虑到传统的比例型控制律无法消除加性干扰影响下的稳态误差,引入积分环节,在一致性控制律中融入状态的积分项,用于改善多智能体系统一致性过程的稳态性能.针对领航者输入不为零的情况,设计非线性的一致性控制律,并借助黎卡提方程以及Lyapunov函数,进行多智能体系统在故障情况下的一致性分析和控制律设计.最后,通过一系列对比仿真,说明了所设计控制律在改善系统稳态性能方面的优势. 展开更多
关键词 多智能系统 容错一致性 PI控制 执行器故障
在线阅读 下载PDF
时滞和干扰下多智能体系统动态事件触发固定时间一致性
9
作者 宁小刚 李宗刚 +1 位作者 陈引娟 杜亚江 《控制理论与应用》 北大核心 2025年第2期323-334,共12页
针对具有输入时滞、未知干扰和切换拓扑的一阶多智能体系统,本文设计了基于个体的分布式控制器.在两种不同动态事件触发控制协议下,分别给出了系统可解实际固定时间平均一致性问题的充分性条件,且系统均不存在Zeno行为.其中,所提连续通... 针对具有输入时滞、未知干扰和切换拓扑的一阶多智能体系统,本文设计了基于个体的分布式控制器.在两种不同动态事件触发控制协议下,分别给出了系统可解实际固定时间平均一致性问题的充分性条件,且系统均不存在Zeno行为.其中,所提连续通信动态事件触发控制协议通过引入内部动态变量,使得触发条件能够实时变化,显著减少了个体触发的次数,降低了控制器更新频次和系统整体能耗,所提间歇通信动态事件触发控制协议仅需利用触发时刻的邻居信息,以及对内部动态变量的估计值,避免了个体间的连续通信,有效减少了系统的通信负担,节省了通信资源.数值仿真结果验证了所提控制协议的有效性. 展开更多
关键词 多智能系统 动态事件触发控制 固定时间一致性 切换拓扑 输入时滞 未知干扰
在线阅读 下载PDF
基于多智能体系统的城市极端暴雨内涝风险动态评估
10
作者 李孟泽 褚俊英 +4 位作者 周祖昊 唐明 原康琦 许文斌 唐佐槐 《水资源保护》 北大核心 2025年第2期95-105,共11页
为有效识别和评估城市内涝风险,提出了针对人类、车辆、普通建筑物、基础设施等不同个体的风险计算与评级方法,构建了基于危险性、暴露性与脆弱性的多层次动态评估模型,该模型集成了包括风险、人类、车辆、建筑和政府的五大智能体系统,... 为有效识别和评估城市内涝风险,提出了针对人类、车辆、普通建筑物、基础设施等不同个体的风险计算与评级方法,构建了基于危险性、暴露性与脆弱性的多层次动态评估模型,该模型集成了包括风险、人类、车辆、建筑和政府的五大智能体系统,并应用于南昌市乌沙河流域。结果表明:南昌市乌沙河流域的地形条件和排水系统特征是影响内涝风险的主要因素;人员和车辆的时空分布进一步影响了内涝风险等级,其中凤凰洲排水区和新建区排水区的风险等级较高;内涝风险的时间分布呈现明显的双峰特征,风险值的峰值在工作日主要集中在早、晚高峰期,节假日则在午间达到峰值,政府预警可有效调节研究区内涝风险水平。 展开更多
关键词 城市内涝 极端暴雨 多智能系统 内涝风险值 动态评估 乌沙河流域
在线阅读 下载PDF
离散时间多智能体系统间歇事件触发输出一致性
11
作者 赵娟 徐承杰 +1 位作者 刘琛 张荣强 《湖南工业大学学报》 2025年第2期97-102,共6页
对离散时间多智能体系统间歇事件触发输出一致性进行了研究。首先,结合间歇控制和事件触发机制,针对离散多智能体系统提出一个输出一致性控制协议。然后,构造误差系统,基于Lyapunov稳定性理论得到了依赖于网络的Laplacian矩阵和系统增... 对离散时间多智能体系统间歇事件触发输出一致性进行了研究。首先,结合间歇控制和事件触发机制,针对离散多智能体系统提出一个输出一致性控制协议。然后,构造误差系统,基于Lyapunov稳定性理论得到了依赖于网络的Laplacian矩阵和系统增益的输出一致性条件,实现离散时间多智能体系统间歇事件触发输出一致性。最后,利用具体的仿真例子对结果的有效性进行分析验证。 展开更多
关键词 离散时间多智能系统 间歇事件触发控制 输出一致性
在线阅读 下载PDF
异构非线性多智能体系统无模型输出一致性控制
12
作者 孙一仆 陈鑫 +2 位作者 贺文朋 佘锦华 吴敏 《自动化学报》 北大核心 2025年第3期604-616,共13页
针对异构非线性多智能体系统(Multi-agent system,MAS)的输出一致性控制难题,设计了一种基于同胚分布式控制协议的无模型方法.通过将输出反馈线性化理论与自适应动态规划相结合,可以在不需要精确系统模型的情况下实现非线性智能体的线性... 针对异构非线性多智能体系统(Multi-agent system,MAS)的输出一致性控制难题,设计了一种基于同胚分布式控制协议的无模型方法.通过将输出反馈线性化理论与自适应动态规划相结合,可以在不需要精确系统模型的情况下实现非线性智能体的线性化,简化分布式控制器的设计复杂性.具体而言,设计一种双层分布式控制结构,在物理空间层通过无模型反馈线性化方法实现未知系统线性化,在微分同构空间层利用线性控制技术进行分布式共识控制.通过两个实验验证了所提方法在处理未知异构非线性多智能体系统中的有效性,将传统的线性分布式控制方法扩展到未知非线性多智能体系统的控制器设计. 展开更多
关键词 非线性多智能系统 无模型输出共识控制 微分同胚 输入输出反馈线性化 自适应动态规划
在线阅读 下载PDF
多智能体系统专刊序言
13
作者 孙长银 孙健 +1 位作者 杨涛 易新蕾 《自动化学报》 北大核心 2025年第3期485-488,共4页
近年来,随着互联网技术、通信技术和传感技术的快速发展,多智能体系统逐渐成形.多智能体系统是指由多个具有自主决策能力的智能体通过分布式网络架构组成的协同系统.每个智能体既是独立的功能单元,具备局部感知、计算和执行能力,又能通... 近年来,随着互联网技术、通信技术和传感技术的快速发展,多智能体系统逐渐成形.多智能体系统是指由多个具有自主决策能力的智能体通过分布式网络架构组成的协同系统.每个智能体既是独立的功能单元,具备局部感知、计算和执行能力,又能通过特定通信协议与相邻节点进行信息交互,最终通过分布式协调机制实现全局优化目标.该方向仍面临许多挑战,迫切需要融合跨学科理论、设计新型分布式算法,并通过虚实结合的验证平台推动技术落地,最终实现从“机械协同”到“自主认知”的跨越.因此,《自动化学报》组织“多智能体系统”专刊,旨在促进控制、优化、学习理论与多智能体系统的融合发展,为科研人员和其他相关从业者提供一个展示最新理论和实践成果的平台.本专刊包括综述、多智能体系统控制、多智能体系统协同优化和学习,经同行评议录用共计28篇,部分文章将在下期发表. 展开更多
关键词 多智能系统 分布式算法 智能 协同系统 传感技术 相邻节点 科研人员 协同优化
在线阅读 下载PDF
基于分布式自适应内模的多智能体系统协同最优输出调节
14
作者 董昱辰 高伟男 姜钟平 《自动化学报》 北大核心 2025年第3期678-691,共14页
针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最... 针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最优控制器,实现多智能体系统的协同输出调节.考虑到跟随者只能访问领导者的估计值进行在线学习,对闭环系统的稳定性和学习算法的收敛性进行严格的理论分析,证明所学习的控制增益可以收敛到最优控制增益.仿真结果验证了所提控制方法的有效性. 展开更多
关键词 自适应动态规划 分布式自适应内模 强化学习 协同输出调节 多智能系统
在线阅读 下载PDF
基于事件触发γ滑模的多智能体系统一致性控制
15
作者 李小萌 郑柏超 《南京信息工程大学学报》 北大核心 2025年第1期98-107,共10页
针对存在未知非线性函数的二阶领导-跟随者多智能体系统,提出一种基于事件触发γ滑模控制设计方案.首先,选择一种基于反双曲正弦函数的新型滑模趋近律,以保证多智能体系统在有限时间内达到一致性.其次,设计带有增益缩放因子γ的滑模函数... 针对存在未知非线性函数的二阶领导-跟随者多智能体系统,提出一种基于事件触发γ滑模控制设计方案.首先,选择一种基于反双曲正弦函数的新型滑模趋近律,以保证多智能体系统在有限时间内达到一致性.其次,设计带有增益缩放因子γ的滑模函数,并引入事件触发机制.通过Lyapunov稳定性分析,证明了提出的控制方法是有效的.该方法不仅可以消除系统中的抖振还可以降低控制过程的采样频率.此外,还证明了触发时间间隔的最小下界,排除了芝诺现象.最后,通过Matlab/Simulink仿真实验,验证了该方法的有效性. 展开更多
关键词 事件触发 γ滑模控制 多智能系统 一致性
在线阅读 下载PDF
基于半分布式中间观测器的多智能体系统故障估计
16
作者 盛洁 牟宗磊 王友清 《控制工程》 北大核心 2025年第3期527-534,共8页
针对一类带有时滞、同源故障和非同源故障的异构多智能体系统,设计了半分布式中间观测器,以同时估计系统的状态和故障。首先,定义了相对输出估计误差和绝对输出估计误差作为观测器的反馈项,并建立了半分布式中间观测器。其次,利用李雅... 针对一类带有时滞、同源故障和非同源故障的异构多智能体系统,设计了半分布式中间观测器,以同时估计系统的状态和故障。首先,定义了相对输出估计误差和绝对输出估计误差作为观测器的反馈项,并建立了半分布式中间观测器。其次,利用李雅普诺夫稳定性理论,得出状态估计误差和故障估计误差一致最终有界的充分条件。再次,采用线性矩阵不等式(linear matrix inequality,LMI)计算出观测器的参数矩阵。最后,基于MATLAB仿真结果验证了该方法的有效性和可靠性。 展开更多
关键词 多智能系统 故障估计 同源故障 中间观测器
在线阅读 下载PDF
基于比例积分调节的严格反馈多智能体系统最优一致性
17
作者 武文强 王庆领 《自动化学报》 北大核心 2025年第3期577-589,共13页
本文研究了严格反馈多智能体系统的最优一致性问题,旨在局部信息交互的条件下,使所有智能体收敛至全局代价函数的最优解.首先,针对权重非平衡有向图,提出一种新的分布式比例积分(Proportional-integral,PI)变量,将最优一致性问题转化为P... 本文研究了严格反馈多智能体系统的最优一致性问题,旨在局部信息交互的条件下,使所有智能体收敛至全局代价函数的最优解.首先,针对权重非平衡有向图,提出一种新的分布式比例积分(Proportional-integral,PI)变量,将最优一致性问题转化为PI调节问题,使得经典的控制技术能够通过调节PI变量的方式来处理更加复杂的多智能体系统.然后,结合所提出的分布式PI变量和预设性能控制,设计一类基于PI调节的分布式控制算法,使得带有死区输入非线性和有界扰动的严格反馈多智能体系统实现近似最优一致性.最后,通过仿真实验验证了所设计算法的有效性. 展开更多
关键词 比例积分调节 最优一致性 严格反馈系统 多智能系统 预设性能控制
在线阅读 下载PDF
网络攻击下具有Markov切换拓扑的多智能体系统的一致性
18
作者 高钰博 叶钊显 +2 位作者 黄帅 周霞 成军 《广西师范大学学报(自然科学版)》 北大核心 2025年第2期168-178,共11页
本文研究非线性多智能体系统在遭受欺骗攻击或重放攻击,并且通信拓扑为Markov切换拓扑时的领导-跟随一致性问题。引入Bernoulli随机变量描述系统遭受欺骗攻击或重放攻击的随机发生。网络攻击导致多智能体系统的通讯拓扑发生随机改变,将... 本文研究非线性多智能体系统在遭受欺骗攻击或重放攻击,并且通信拓扑为Markov切换拓扑时的领导-跟随一致性问题。引入Bernoulli随机变量描述系统遭受欺骗攻击或重放攻击的随机发生。网络攻击导致多智能体系统的通讯拓扑发生随机改变,将其建模为Markov切换拓扑。基于稳定性理论、图论、矩阵理论,利用随机分析方法、Lyapunov方法、无穷小算法等,获得系统实现一致性的充分条件,并给出数值仿真实例,验证结果的正确性和方法的有效性。 展开更多
关键词 多智能系统 欺骗攻击 重放攻击 Markov切换拓扑 领导-跟随一致性
在线阅读 下载PDF
基于ODE-PDE的大规模多智能体系统有限时间编队
19
作者 满景涛 曾志刚 +1 位作者 盛银 来金钢 《自动化学报》 北大核心 2025年第3期631-642,共12页
现有基于偏微分方程(Partial differential equation,PDE)的多智能体系统(Multi-agent system,MAS)编队控制方法要求智能体必须是密集分布的,为打破这一限制,提出一种新的基于常微分−偏微分方程(Ordinary differential equation-partial... 现有基于偏微分方程(Partial differential equation,PDE)的多智能体系统(Multi-agent system,MAS)编队控制方法要求智能体必须是密集分布的,为打破这一限制,提出一种新的基于常微分−偏微分方程(Ordinary differential equation-partial differential equation,ODE-PDE)的分析方法,以解决稀疏−密集混合分布的大规模异构MAS编队问题.首先,通过设计特定的通信协议,并基于空间离散系统部分连续化方法,将原始大量的异构MAS的ODE动力学模型转化为由一个PDE和少数几个ODE耦合而成的ODE-PDE模型.为更符合实际复杂场景,将拓扑权值规定为半马尔科夫切换的,且稀疏分布和密集分布智能体遵循不一致的切换规则.其次,针对无时滞和有时滞两种情形,设计两种异步边界控制策略,利用Lyapunov方法得到保证误差系统实际有限时间稳定的充分条件,并得到停息时间和稳定阈值的计算规则.最后,两个广义的数值仿真进一步验证了所提方法的有效性. 展开更多
关键词 大规模异构多智能系统 常微分−偏微分方程 实际有限时间编队 半马尔科夫切换拓扑 异步边界控制
在线阅读 下载PDF
基于强化学习的异构多智能体系统最优输出调节
20
作者 熊春萍 马倩 《控制理论与应用》 北大核心 2025年第3期491-498,共8页
本文研究了异构多智能体系统的最优输出调节问题.通信网络拓扑含有向生成树.首先,设计了外部系统状态补偿器和状态反馈控制器,应用图论和Lyapunov稳定性理论证明了所设计的补偿器和控制器可以解决一般输出调节问题.然后,通过最小化预定... 本文研究了异构多智能体系统的最优输出调节问题.通信网络拓扑含有向生成树.首先,设计了外部系统状态补偿器和状态反馈控制器,应用图论和Lyapunov稳定性理论证明了所设计的补偿器和控制器可以解决一般输出调节问题.然后,通过最小化预定义的成本方程,解决最优输出调节问题.结合最优控制理论和强化学习技术,提出了两种求解最优控制器的算法,即基于模型的策略迭代算法和无模型off-policy算法.利用无模型算法获取最优控制器的过程既不需要求解输出调节方程也不需要使用系统动态信息.最后,通过数值仿真验证了本文所提出的算法的有效性. 展开更多
关键词 异构多智能系统 最优输出调节 策略迭代 无模型算法 强化学习
在线阅读 下载PDF
上一页 1 2 152 下一页 到第
使用帮助 返回顶部