期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
改进的模糊Sarsa学习
1
作者 陈学松 杨宜民 《北京邮电大学学报》 EI CAS CSCD 北大核心 2011年第2期31-34,44,共5页
为了解决模糊Sarsa学习(FSL)无法在线自适应调节学习因子和不能处理学习过程中探索与利用的平衡问题,提出了一种改进的模糊Sarsa学习(IFSL)算法.在FSL基础上,引入自适应学习率产生器来在线调节学习因子,增加模糊平衡器控制探索和利用的... 为了解决模糊Sarsa学习(FSL)无法在线自适应调节学习因子和不能处理学习过程中探索与利用的平衡问题,提出了一种改进的模糊Sarsa学习(IFSL)算法.在FSL基础上,引入自适应学习率产生器来在线调节学习因子,增加模糊平衡器控制探索和利用的程度.给出了IFSL的结构框图,证明了IFSL中可调节权向量具有平衡不动点.仿真结果表明,与FSL相比,IFSL能加快系统的学习收敛速度,具有较好的学习性能. 展开更多
关键词 强化学习 模糊控制 模糊sarsa学习 探索 利用
原文传递
基于蚁群优化的模糊Sarsa学习算法
2
作者 陈学松 杨宜民 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第S2期340-343,共4页
提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定... 提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定义变化的学习率,这样既缩小了搜索空间,又提高了学习效率.整个模糊推理模块被看作是蚂蚁觅食的过程,利用蚁群算法优良的随机搜索性能求解该组合优化问题.给出了该算法的设计方法和流程.小车爬山问题的仿真实验结果表明:提出的ACO-FSL算法相比FSL具有较好的学习性能. 展开更多
关键词 强化学习 模糊强化学习 模糊sarsa学习 蚁群优化 学习 小车爬山问题
原文传递
一种新的基于蚁群优化的模糊强化学习算法 被引量:2
3
作者 谢光强 陈学松 《计算机应用研究》 CSCD 北大核心 2011年第4期1266-1268,1271,共4页
模糊Sarsa学习(FSL)是基于Sarsa学习而提出的一种模糊强化学习算法,它是一种通过在线策略来逼近动作值函数的算法,其每条模糊规则中,动作的选择是按照Softmax公式选择下一个动作。对于连续空间的复杂学习任务,FSL不能较好平衡探索和利... 模糊Sarsa学习(FSL)是基于Sarsa学习而提出的一种模糊强化学习算法,它是一种通过在线策略来逼近动作值函数的算法,其每条模糊规则中,动作的选择是按照Softmax公式选择下一个动作。对于连续空间的复杂学习任务,FSL不能较好平衡探索和利用之间的关系,为此提出了一种新的基于蚁群优化的模糊强化学习算法(ACO-FSL),主要工作是把蚁群优化思想与传统的模糊强化学习算法结合起来形成一种新的算法。给出了算法的设计原理、方法和具体步骤,小车爬山问题的仿真实验表明,提出的ACO-FSL算法在学习速度和稳定性上优于FSL算法。 展开更多
关键词 强化学习 模糊sarsa学习 蚁群优化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部