检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

改进的模糊Sarsa学习: 1; 作者陈学松杨宜民《北京邮电大学学报》 EI CAS CSCD 北大核心 2011年第2期31-34,44,共5页; 为了解决模糊Sarsa学习(FSL)无法在线自适应调节学习因子和不能处理学习过程中探索与利用的平衡问题,提出了一种改进的模糊Sarsa学习(IFSL)算法.在FSL基础上,引入自适应学习率产生器来在线调节学习因子,增加模糊平衡器控制探索和利用的... 展开更多; 关键词强化学习模糊控制模糊sarsa学习探索利用; 原文传递

基于蚁群优化的模糊Sarsa学习算法: 2; 作者陈学松杨宜民《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2011年第S2期340-343,共4页; 提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定... 展开更多; 关键词强化学习模糊强化学习模糊sarsa学习蚁群优化变学习率小车爬山问题; 原文传递

一种新的基于蚁群优化的模糊强化学习算法被引量：2: 3; 作者谢光强陈学松《计算机应用研究》 CSCD 北大核心 2011年第4期1266-1268,1271,共4页; 模糊Sarsa学习(FSL)是基于Sarsa学习而提出的一种模糊强化学习算法,它是一种通过在线策略来逼近动作值函数的算法,其每条模糊规则中,动作的选择是按照Softmax公式选择下一个动作。对于连续空间的复杂学习任务,FSL不能较好平衡探索和利... 展开更多; 关键词强化学习模糊sarsa学习蚁群优化; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部