期刊文献+

从知识的表达和运用综述强化学习研究 被引量:15

Overview of reinforcement learning from knowledge expression and handling
在线阅读 下载PDF
导出
摘要 为推进强化学习研究的进一步深入和扩大其实际应用范围,从强化学习研究的理论基础——知识表示和运用的角度对强化学习进行分类,并就经典随机强化学习、模糊强化学习、定性强化学习以及灰色强化学习作了较详细的探讨与比较.最后从知识表达和运用的角度对强化学习的发展进行了展望. In order to advance reinforement learning (RL) research and expand its practical application scope, it's necessary to classify RL from RL research theory base, knowledge expressed and the handling angle. Based on classical stochastic RL, fuzzy RL. qualitative RL and grey RL, the detailed discussion and comparions are given.Finally, RL development is forecasted from the knowledge expression and handling angle.
出处 《控制与决策》 EI CSCD 北大核心 2008年第9期961-968,975,共9页 Control and Decision
基金 国家自然科学基金项目(60575033) 国家863计划项目(2007AA04Z227)
关键词 强化学习 知识表示 模糊理论 定性推理 灰色系统理论 Reinforcement learning Knowledge representation Fuzzy theory Qualitative reasoning Grey systemtheory
  • 相关文献

参考文献36

  • 1Tom M Mitchell.曾华军 张银奎译.机器学习[M].北京:机械工业出版社,2003..
  • 2张汝波,顾国昌,刘照德,王醒策.强化学习理论、算法及应用[J].控制理论与应用,2000,17(5):637-642. 被引量:93
  • 3Barto A G, Sutton R S, Brouwer P S. Associative search network.. A reinforcement learning associative memory[J]. Biological Cybernetics, 1981, 40(2) : 201- 211.
  • 4Barto A G, Sutton R S, Anderson C W. Neuronlike adaptive elements that can solve difficult learning control problems [J]. IEEE Trans on Systems, Man and Cybernetics, 1983, 13(5): 834-846.
  • 5Sutton R S. Temporal credit assignment in reinforcement learning [D]. Amherst: University of Massachusetts, 1984.
  • 6Sutton R S. Learning to predict by the methods of temporal difference[J]. Machine Learning, 1988, 3(1) : 9-44.
  • 7Watkins J C H, Dayan P. Q-learning [J]. Machine Learning, 1992, 8(2): 279-292.
  • 8Sutton R S, Barto A G. Reinforcement learning: An introduetion[M]. Cambridge: MIT Press, 1998.
  • 9Chen C L, Dong D Y, Chen Z H. Grey reinforcement learning for incomplete information processing [ J ]. Lecture Notes in Computer Science, 2006, 3959.. 399- 407.
  • 10陈宗海,文锋.基于复杂过程简化模型的DHP学习控制[J].控制与决策,2006,21(10):1087-1091. 被引量:2

二级参考文献9

共引文献113

同被引文献240

引证文献15

二级引证文献177

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部