期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
改进的模糊Sarsa学习
1
作者
陈学松
杨宜民
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2011年第2期31-34,44,共5页
为了解决模糊Sarsa学习(FSL)无法在线自适应调节学习因子和不能处理学习过程中探索与利用的平衡问题,提出了一种改进的模糊Sarsa学习(IFSL)算法.在FSL基础上,引入自适应学习率产生器来在线调节学习因子,增加模糊平衡器控制探索和利用的...
为了解决模糊Sarsa学习(FSL)无法在线自适应调节学习因子和不能处理学习过程中探索与利用的平衡问题,提出了一种改进的模糊Sarsa学习(IFSL)算法.在FSL基础上,引入自适应学习率产生器来在线调节学习因子,增加模糊平衡器控制探索和利用的程度.给出了IFSL的结构框图,证明了IFSL中可调节权向量具有平衡不动点.仿真结果表明,与FSL相比,IFSL能加快系统的学习收敛速度,具有较好的学习性能.
展开更多
关键词
强化
学习
模糊
控制
模糊sarsa学习
探索
利用
原文传递
基于蚁群优化的模糊Sarsa学习算法
2
作者
陈学松
杨宜民
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第S2期340-343,共4页
提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定...
提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定义变化的学习率,这样既缩小了搜索空间,又提高了学习效率.整个模糊推理模块被看作是蚂蚁觅食的过程,利用蚁群算法优良的随机搜索性能求解该组合优化问题.给出了该算法的设计方法和流程.小车爬山问题的仿真实验结果表明:提出的ACO-FSL算法相比FSL具有较好的学习性能.
展开更多
关键词
强化
学习
模糊
强化
学习
模糊sarsa学习
蚁群优化
变
学习
率
小车爬山问题
原文传递
一种新的基于蚁群优化的模糊强化学习算法
被引量:
2
3
作者
谢光强
陈学松
《计算机应用研究》
CSCD
北大核心
2011年第4期1266-1268,1271,共4页
模糊Sarsa学习(FSL)是基于Sarsa学习而提出的一种模糊强化学习算法,它是一种通过在线策略来逼近动作值函数的算法,其每条模糊规则中,动作的选择是按照Softmax公式选择下一个动作。对于连续空间的复杂学习任务,FSL不能较好平衡探索和利...
模糊Sarsa学习(FSL)是基于Sarsa学习而提出的一种模糊强化学习算法,它是一种通过在线策略来逼近动作值函数的算法,其每条模糊规则中,动作的选择是按照Softmax公式选择下一个动作。对于连续空间的复杂学习任务,FSL不能较好平衡探索和利用之间的关系,为此提出了一种新的基于蚁群优化的模糊强化学习算法(ACO-FSL),主要工作是把蚁群优化思想与传统的模糊强化学习算法结合起来形成一种新的算法。给出了算法的设计原理、方法和具体步骤,小车爬山问题的仿真实验表明,提出的ACO-FSL算法在学习速度和稳定性上优于FSL算法。
展开更多
关键词
强化
学习
模糊sarsa学习
蚁群优化
在线阅读
下载PDF
职称材料
题名
改进的模糊Sarsa学习
1
作者
陈学松
杨宜民
机构
广东工业大学应用数学学院
广东工业大学自动化学院
出处
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2011年第2期31-34,44,共5页
基金
国家自然科学基金项目(60974019)
广东省自然科学基金项目(9451009001002686)
文摘
为了解决模糊Sarsa学习(FSL)无法在线自适应调节学习因子和不能处理学习过程中探索与利用的平衡问题,提出了一种改进的模糊Sarsa学习(IFSL)算法.在FSL基础上,引入自适应学习率产生器来在线调节学习因子,增加模糊平衡器控制探索和利用的程度.给出了IFSL的结构框图,证明了IFSL中可调节权向量具有平衡不动点.仿真结果表明,与FSL相比,IFSL能加快系统的学习收敛速度,具有较好的学习性能.
关键词
强化
学习
模糊
控制
模糊sarsa学习
探索
利用
Keywords
reinforcement learning
fuzzy control
fuzzy
sarsa
learning
exploration
exploitation
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
原文传递
题名
基于蚁群优化的模糊Sarsa学习算法
2
作者
陈学松
杨宜民
机构
广东工业大学应用数学学院
广东工业大学自动化学院
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第S2期340-343,共4页
文摘
提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定义变化的学习率,这样既缩小了搜索空间,又提高了学习效率.整个模糊推理模块被看作是蚂蚁觅食的过程,利用蚁群算法优良的随机搜索性能求解该组合优化问题.给出了该算法的设计方法和流程.小车爬山问题的仿真实验结果表明:提出的ACO-FSL算法相比FSL具有较好的学习性能.
关键词
强化
学习
模糊
强化
学习
模糊sarsa学习
蚁群优化
变
学习
率
小车爬山问题
Keywords
reinforcement learning
fuzzy reinforcement learning
fuzzy
sarsa
learning(FSL)
ant colony optimization(ACO)
variable learning rate
mountain-car problem
分类号
N55 [自然科学总论]
原文传递
题名
一种新的基于蚁群优化的模糊强化学习算法
被引量:
2
3
作者
谢光强
陈学松
机构
广东工业大学自动化学院
广东工业大学计算机学院
广东工业大学应用数学学院
出处
《计算机应用研究》
CSCD
北大核心
2011年第4期1266-1268,1271,共4页
文摘
模糊Sarsa学习(FSL)是基于Sarsa学习而提出的一种模糊强化学习算法,它是一种通过在线策略来逼近动作值函数的算法,其每条模糊规则中,动作的选择是按照Softmax公式选择下一个动作。对于连续空间的复杂学习任务,FSL不能较好平衡探索和利用之间的关系,为此提出了一种新的基于蚁群优化的模糊强化学习算法(ACO-FSL),主要工作是把蚁群优化思想与传统的模糊强化学习算法结合起来形成一种新的算法。给出了算法的设计原理、方法和具体步骤,小车爬山问题的仿真实验表明,提出的ACO-FSL算法在学习速度和稳定性上优于FSL算法。
关键词
强化
学习
模糊sarsa学习
蚁群优化
Keywords
reinforcement learning
fuzzy
sarsa
learning
ant colony optimization
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
改进的模糊Sarsa学习
陈学松
杨宜民
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2011
0
原文传递
2
基于蚁群优化的模糊Sarsa学习算法
陈学松
杨宜民
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011
0
原文传递
3
一种新的基于蚁群优化的模糊强化学习算法
谢光强
陈学松
《计算机应用研究》
CSCD
北大核心
2011
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部