期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于蚁群优化的模糊Sarsa学习算法
1
作者
陈学松
杨宜民
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第S2期340-343,共4页
提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定...
提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定义变化的学习率,这样既缩小了搜索空间,又提高了学习效率.整个模糊推理模块被看作是蚂蚁觅食的过程,利用蚁群算法优良的随机搜索性能求解该组合优化问题.给出了该算法的设计方法和流程.小车爬山问题的仿真实验结果表明:提出的ACO-FSL算法相比FSL具有较好的学习性能.
展开更多
关键词
强化学习
模糊强化学习
模糊Sarsa学习
蚁群优化
变学习率
小车爬山问题
原文传递
题名
基于蚁群优化的模糊Sarsa学习算法
1
作者
陈学松
杨宜民
机构
广东工业大学应用数学学院
广东工业大学自动化学院
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第S2期340-343,共4页
文摘
提出了一种基于蚁群优化的模糊Sarsa学习(ACO-FSL)算法,在该算法中,首先把模糊系统按照模糊规则进行划分,对于每条模糊规则,有若干个候选动作可被选择,动作选择的概率依赖于实时的值函数;然后在每个动作选择的同时根据蚁群优化的思想定义变化的学习率,这样既缩小了搜索空间,又提高了学习效率.整个模糊推理模块被看作是蚂蚁觅食的过程,利用蚁群算法优良的随机搜索性能求解该组合优化问题.给出了该算法的设计方法和流程.小车爬山问题的仿真实验结果表明:提出的ACO-FSL算法相比FSL具有较好的学习性能.
关键词
强化学习
模糊强化学习
模糊Sarsa学习
蚁群优化
变学习率
小车爬山问题
Keywords
reinforcement learning
fuzzy reinforcement learning
fuzzy Sarsa learning(FSL)
ant colony optimization(ACO)
variable learning rate
mountain-car problem
分类号
N55 [自然科学总论]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于蚁群优化的模糊Sarsa学习算法
陈学松
杨宜民
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部