检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到6篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

Boundary Data Augmentation for Offline Reinforcement Learning: 1; 作者 SHEN Jiahao JIANG Ke TAN Xiaoyang 《ZTE Communications》 2023年第3期29-36,共8页; Offline reinforcement learning(ORL)aims to learn a rational agent purely from behavior data without any online interaction.One of the major challenges encountered in ORL is the problem of distribution shift,i.e.,the m... 展开更多; 关键词 offline reinforcement learning out‐of‐distribution state ROBUSTNESS UNCERTAINTY; 在线阅读下载PDF 职称材料

Offline Reinforcement Learning with Constrained Hybrid Action Implicit Representation Towards Wargaming Decision-Making: 2; 作者 Liwei Dong Ni Li +1 位作者 Guanghong Gong Xin Lin 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2024年第5期1422-1440,共19页; Reinforcement Learning(RL)has emerged as a promising data-driven solution for wargaming decision-making.However,two domain challenges still exist:(1)dealing with discrete-continuous hybrid wargaming control and(2)acce... 展开更多; 关键词 offline reinforcement learning(RL) WARGAMING DECISION-MAKING hybrid action space; 原文传递

OSCAR:OOD State-Conservative Offline Reinforcement Learning for Sequential Decision Making: 3; 作者 Yi Ma Chao Wang +4 位作者 Chen Chen Jinyi Liu Zhaopeng Meng Yan Zheng Jianye Hao 《CAAI Artificial Intelligence Research》 2023年第1期91-101,共11页; Offline reinforcement learning(RL)is a data-driven learning paradigm for sequential decision making.Mitigating the overestimation of values originating from out-of-distribution(OOD)states induced by the distribution s... 展开更多; 关键词 offline reinforcement learning out-of-distribution decision making; 原文传递

A Practical Reinforcement Learning Framework for Automatic Radar Detection: 4; 作者 YU Junpeng CHEN Yiyu 《ZTE Communications》 2023年第3期22-28,共7页; At present,the parameters of radar detection rely heavily on manual adjustment and empirical knowledge,resulting in low automation.Traditional manual adjustment methods cannot meet the requirements of modern radars fo... 展开更多; 关键词 meta-reinforcement learning radar detection reinforcement learning offline reinforcement learning; 在线阅读下载PDF 职称材料

Robust Offline Actor-Critic With On-policy Regularized Policy Evaluation: 5; 作者 Shuo Cao Xuesong Wang Yuhu Cheng 《IEEE/CAA Journal of Automatica Sinica》 CSCD 2024年第12期2497-2511,共15页; To alleviate the extrapolation error and instability inherent in Q-function directly learned by off-policy Q-learning(QL-style)on static datasets,this article utilizes the on-policy state-action-reward-state-action(SA... 展开更多; 关键词 offline reinforcement learning off-policy QL-style on-policy SARSA-style policy evaluation(PE) Q-value estimation; 在线阅读下载PDF 职称材料

Offline Pre-trained Multi-agent Decision Transformer 被引量：3: 6; 作者 Linghui Meng Muning Wen +8 位作者 Chenyang Le Xiyun Li Dengpeng Xing Weinan Zhang Ying Wen Haifeng Zhang Jun Wang Yaodong Yang Bo Xu 《Machine Intelligence Research》 EI CSCD 2023年第2期233-248,共16页; Offline reinforcement learning leverages previously collected offline datasets to learn optimal policies with no necessity to access the real environment.Such a paradigm is also desirable for multi-agent reinforcement... 展开更多; 关键词 Pre-training model multi-agent reinforcement learning(MARL) decision making TRANSFORMER offline reinforcement learning; 原文传递

	题名	作者	出处	发文年	被引量	操作
1	Boundary Data Augmentation for Offline Reinforcement Learning	SHEN Jiahao JIANG Ke TAN Xiaoyang	《ZTE Communications》	2023	0	在线阅读下载PDF 职称材料
2	Offline Reinforcement Learning with Constrained Hybrid Action Implicit Representation Towards Wargaming Decision-Making	Liwei Dong Ni Li Guanghong Gong Xin Lin	《Tsinghua Science and Technology》 SCIE EI CAS CSCD	2024	0	原文传递
3	OSCAR:OOD State-Conservative Offline Reinforcement Learning for Sequential Decision Making	Yi Ma Chao Wang Chen Chen Jinyi Liu Zhaopeng Meng Yan Zheng Jianye Hao	《CAAI Artificial Intelligence Research》	2023	0	原文传递
4	A Practical Reinforcement Learning Framework for Automatic Radar Detection	YU Junpeng CHEN Yiyu	《ZTE Communications》	2023	0	在线阅读下载PDF 职称材料
5	Robust Offline Actor-Critic With On-policy Regularized Policy Evaluation	Shuo Cao Xuesong Wang Yuhu Cheng	《IEEE/CAA Journal of Automatica Sinica》 CSCD	2024	0	在线阅读下载PDF 职称材料
6	Offline Pre-trained Multi-agent Decision Transformer	Linghui Meng Muning Wen Chenyang Le Xiyun Li Dengpeng Xing Weinan Zhang Ying Wen Haifeng Zhang Jun Wang Yaodong Yang Bo Xu	《Machine Intelligence Research》 EI CSCD	2023	3	原文传递

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部