期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
模糊强化学习型的图像矢量量化算法 被引量:1
1
作者 姜来 许文焕 +1 位作者 纪震 张基宏 《电子学报》 EI CAS CSCD 北大核心 2006年第9期1738-1741,共4页
本文给出了一种新的图像矢量量化码书的优化设计方法.传统矢量量化方法只考虑了码字与训练矢量之间的吸引影响,所以约束了最优解的寻解空间.本文提出了一种新的学习机理———模糊强化学习机制,该机制在传统的吸引因子基础上,引入新的... 本文给出了一种新的图像矢量量化码书的优化设计方法.传统矢量量化方法只考虑了码字与训练矢量之间的吸引影响,所以约束了最优解的寻解空间.本文提出了一种新的学习机理———模糊强化学习机制,该机制在传统的吸引因子基础上,引入新的排斥因子,极大地释放了吸引因子对最优解的寻解空间的约束.新的模糊强化学习机制没有采用引入随机扰动的方法来避免陷入局部最优码书,而是通过吸引因子和排斥因子的合力作用,较准确地确定了每个码字的最佳移动方向,从而使整体码书向全局最优解靠近.实验结果表明,基于模糊强化学习机制的矢量量化算法始终稳定地取得显著优于模糊K-means算法的性能,较好地解决了矢量量化中的码书设计容易陷入局部极小和初始码书影响优化结果的问题. 展开更多
关键词 矢量量化 图像编码 模糊强化学习 吸引因子 排斥因子
在线阅读 下载PDF
基于模糊强化学习的多柔性梁振动控制仿真 被引量:2
2
作者 邱志成 杜佳豪 《空间控制技术与应用》 CSCD 北大核心 2021年第1期29-39,共11页
空间机械结构趋向大型化、复杂化、柔性化特点,容易导致残余振动,且残余振动频率低,振动时间长.针对多柔性梁耦合结构残余振动问题,通过有限元法建立了动力学模型,分析了振动特性,呈现密频特性,拍频特征.对于残余振动问题,结合模糊强化... 空间机械结构趋向大型化、复杂化、柔性化特点,容易导致残余振动,且残余振动频率低,振动时间长.针对多柔性梁耦合结构残余振动问题,通过有限元法建立了动力学模型,分析了振动特性,呈现密频特性,拍频特征.对于残余振动问题,结合模糊强化学习控制算法,构建模糊规则表,使用ε-贪婪法选择每条规则中的动作,进而生成最终的控制电压,与环境交互后获得回报,利用时序差分误差对状态动作价值进行反馈学习.经过训练,控制器收敛于一个模糊控制规则.仿真结果显示模糊强化学习控制器对多柔性梁残余振动快速抑制,验证了模糊强化学习控制算法的有效性. 展开更多
关键词 多柔性梁 振动控制 有限元建模 模糊强化学习
在线阅读 下载PDF
基于模糊强化学习的双轮机器人姿态平衡控制 被引量:10
3
作者 闫安 陈章 +1 位作者 董朝阳 何康辉 《系统工程与电子技术》 EI CSCD 北大核心 2021年第4期1036-1043,共8页
针对单轨双轮机器人在静止情况下存在的固有静态不稳定问题,提出一种基于模糊强化学习(简称为Fuzzy-Q)的控制方法。首先,运用拉格朗日法建立带控制力矩陀螺的系统动力学模型。然后,在此基础上设计表格型强化学习算法,实现机器人的稳定... 针对单轨双轮机器人在静止情况下存在的固有静态不稳定问题,提出一种基于模糊强化学习(简称为Fuzzy-Q)的控制方法。首先,运用拉格朗日法建立带控制力矩陀螺的系统动力学模型。然后,在此基础上设计表格型强化学习算法,实现机器人的稳定平衡控制。最后,针对算法存在的控制精度不高和控制器输出离散等问题,采用模糊理论泛化动作空间,改善控制精度,并使控制输出连续。仿真实验表明,相较于传统强化学习方法,所提方法能够显著提高控制精度,且可以有效抑制外界干扰力矩对系统的影响,保证系统具有一定的抗干扰能力。 展开更多
关键词 强化学习 模糊强化学习 模糊算法 控制力矩陀螺 单轨双轮机器人
在线阅读 下载PDF
基于模糊强化学习和果蝇优化的WSN数据聚合算法 被引量:2
4
作者 阎峻 黄建德 +2 位作者 孙鹏玉 蒋池剑 陆靓 《计算机系统应用》 2021年第8期219-224,共6页
在无线传感器网络中,传感器的能量时有限的,如果传感器的能量耗尽,那么无线传感网络的鲁棒性和寿命就会大大降低.因此,提出了基于模糊强化学习和果蝇优化的数据聚合机制,以最大限度地延长网络寿命,并进行高效数据聚合.首先,网格聚类用... 在无线传感器网络中,传感器的能量时有限的,如果传感器的能量耗尽,那么无线传感网络的鲁棒性和寿命就会大大降低.因此,提出了基于模糊强化学习和果蝇优化的数据聚合机制,以最大限度地延长网络寿命,并进行高效数据聚合.首先,网格聚类用于簇的形成和簇头的选择,接着评估各个网格簇所有可能的数据聚合节点,然后采用模糊强化学习选取最佳数据聚合节点,最后利用果蝇优化算法动态定位整个无线传感网络的数据汇聚节点.仿真结果表明,提出的数据聚合方案在能耗和网络鲁棒性方面优于对比方案. 展开更多
关键词 无线传感网络 网格聚类 模糊强化学习 果蝇优化算法 数据聚合
在线阅读 下载PDF
基于模糊强化学习的空气压缩机群组协调预测控制 被引量:1
5
作者 王伟 仲璐璐 +2 位作者 刘洋 赵珺 王霖青 《控制与决策》 EI CSCD 北大核心 2023年第8期2183-2191,共9页
空气压缩机在提供动力的同时消耗着大量的电力能源,其节能增效备受关注.空气负荷需求受生产节奏、计划排程等影响呈现阶段性、间歇性的特点,导致空气压缩机组在大范围内变工况运行,人工调节速度慢,机组能耗高.针对此问题,以国内工业园... 空气压缩机在提供动力的同时消耗着大量的电力能源,其节能增效备受关注.空气负荷需求受生产节奏、计划排程等影响呈现阶段性、间歇性的特点,导致空气压缩机组在大范围内变工况运行,人工调节速度慢,机组能耗高.针对此问题,以国内工业园区空气压缩机群组系统为背景,提出一种基于模糊强化学习的空气压缩机群组协调预测控制方法.首先利用工业现场的历史数据和设备运行机理建立基于模糊辨识的空气压缩机群组多工况模型;在此基础上,以最小化生产过程能耗为目标,结合生产工艺条件、设备安全等约束条件,建立基于模糊强化学习的空气压缩机组变负荷协调预测控制方法,保证系统在复杂工况下安全稳定运行;最后,将所提出方法应用于工业园区空气压缩仿真系统进行性能测试,取得较好的控制效果. 展开更多
关键词 空气压缩机群组 协调控制 模糊强化学习 预测控制
原文传递
移动机器人模糊Sarsa(λ)学习导航研究
6
作者 陈卫东 关永贞 +1 位作者 朱奇光 赵成龙 《小型微型计算机系统》 CSCD 北大核心 2013年第11期2599-2602,共4页
针对复杂未知环境下难以获得完善的模糊导航控制规则以及传统的强化学习算法不能解决连续状态空间和连续动作空间的学习问题,提出了一种模糊强化学习算法.通过将模糊推理系统和强化学习算法相结合,设计了一种模糊强化学习系统,一方面,... 针对复杂未知环境下难以获得完善的模糊导航控制规则以及传统的强化学习算法不能解决连续状态空间和连续动作空间的学习问题,提出了一种模糊强化学习算法.通过将模糊推理系统和强化学习算法相结合,设计了一种模糊强化学习系统,一方面,在缺乏专家经验的情况下,利用强化学习中的Sarsa(λ)学习算法来获取模糊逻辑控制器的模糊规则库,另一方面,利用模糊推理系统所具有的广泛逼近性,使机器人在学习时可以遍历到每一个状态动作对.同时将有限的专家经验引入到模糊推理系统,使Sarsa(λ)学习具备一定的先验知识,从而加快学习速度.仿真实验表明,该方法具有较好的实时性和鲁棒性,能够有效解决移动机器人在未知复杂环境中的导航问题. 展开更多
关键词 Sarsa(λ)学习 模糊强化学习算法 模糊推理系统 机器人导航
在线阅读 下载PDF
考虑个体习惯的轮椅机器人人机共享避障方法
7
作者 王义娜 曹晨 +3 位作者 杨佳琪 俞彦军 傅国强 王硕玉 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第11期2299-2308,共10页
为了避免个体操作习惯对智能轮椅机器人(WR)人机共享运动控制的影响,引入动态强化学习策略,基于三重奖励系统建立个体操作习惯与碰撞风险的关联特性,提出能够自适应用户行为及保证安全性的模糊强化学习状态融合式共享控制策略.为了实现... 为了避免个体操作习惯对智能轮椅机器人(WR)人机共享运动控制的影响,引入动态强化学习策略,基于三重奖励系统建立个体操作习惯与碰撞风险的关联特性,提出能够自适应用户行为及保证安全性的模糊强化学习状态融合式共享控制策略.为了实现机器人的智能操控,采用距离型模糊推理算法建立基于座椅压力的方向意图识别模型和机器人人机共享控制框架.面向用户意图方向与机器人实际方向的偏差度,分别基于高斯函数与偏差率建立当前奖励函数与预测奖励函数,以估计用户操作习惯.基于边界距离建立任务奖励函数,以估计人机安全性.基于模糊强化学习策略,利用三重奖励函数构建用户操作习惯与安全性的关联性,以动态调整共享控制中的用户控制权重,适应个体习惯,提高人机共享的操控精度和安全性.在实验室搭建试验环境,验证了所提算法的有效性. 展开更多
关键词 智能轮椅机器人 距离型模糊推理算法 模糊强化学习 个体习惯 人机共享控制
在线阅读 下载PDF
基于蚁群优化的模糊Sarsa学习算法
8
作者 陈学松 杨宜民 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第S2期340-343,共4页
提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定... 提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定义变化的学习率,这样既缩小了搜索空间,又提高了学习效率.整个模糊推理模块被看作是蚂蚁觅食的过程,利用蚁群算法优良的随机搜索性能求解该组合优化问题.给出了该算法的设计方法和流程.小车爬山问题的仿真实验结果表明:提出的ACO-FSL算法相比FSL具有较好的学习性能. 展开更多
关键词 强化学习 模糊强化学习 模糊Sarsa学习 蚁群优化 学习 小车爬山问题
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部