期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于DDPG-LQR的高超声速飞行器时间协同再入制导
1
作者
宋志飞
吉月辉
+2 位作者
宋雨
刘俊杰
高强
《导弹与航天运载技术(中英文)》
北大核心
2025年第1期57-64,共8页
针对多高超声速飞行器协同作战的特点,提出一种基于深度策略性梯度和线性二次型调节器(Deep Deterministic Policy Gradient-Linear Quadratic Regulator,DDPG-LQR)的时间协同再入制导方案。首先,采用序列凸优化方法生成满足多个约束的...
针对多高超声速飞行器协同作战的特点,提出一种基于深度策略性梯度和线性二次型调节器(Deep Deterministic Policy Gradient-Linear Quadratic Regulator,DDPG-LQR)的时间协同再入制导方案。首先,采用序列凸优化方法生成满足多个约束的时间协同再入轨迹及其相应的稳态控制量,并且采用Radau伪谱法离散运动学方程,以提高轨迹优化离散精度。其次,采用线性二次型调节器(Linear Quadratic Regulator,LQR)跟踪时间协同再入轨迹。为了提高协同制导精度和制导效果,采用深度策略性梯度(Deep Deterministic Policy Gradient,DDPG)在线优化LQR的权重矩阵系数。在DDPG算法中,通过引入合适的奖励函数来提高算法的优化性能。仿真结果表明,在初始状态误差和不确定性的情况下,通过与传统的LQR控制器相比,本文所提出的协同制导方案具有更好的协同制导精度和制导效果。
展开更多
关键词
多高超声速飞行器
协同制导
序列凸优化
深度策略性梯度
线
性
二次型调节器
在线阅读
下载PDF
职称材料
基于深度强化学习的AGV智能导航系统设计
被引量:
9
2
作者
贺雪梅
匡胤
+1 位作者
杨志鹏
杨亚乔
《计算机应用研究》
CSCD
北大核心
2022年第5期1501-1504,1509,共5页
针对现有的AGV在大规模未知复杂环境中进行自主导航配送的问题,基于深度强化学习完成了AGV智能导航系统设计。首先,结合传感器对周围的障碍物进行探测感知,利用DDPG(deep deterministic policy gradient)算法实现AGV小车从环境的感知输...
针对现有的AGV在大规模未知复杂环境中进行自主导航配送的问题,基于深度强化学习完成了AGV智能导航系统设计。首先,结合传感器对周围的障碍物进行探测感知,利用DDPG(deep deterministic policy gradient)算法实现AGV小车从环境的感知输入到动作的直接输出控制,帮助AGV完成自主导航和避障任务。此外,针对训练样本易受环境干扰的问题,提出了一种新颖的DL(disturb learning)-DDPG算法,通过对学习样本中相关数据进行高斯噪声预处理,帮助智能体适应噪声状态下的训练环境,提升了AGV在真实环境中的鲁棒性。仿真实验表明,经改进后的DL-DDPG算法能够为AGV导航系统提供更高效的在线决策能力,使AGV小车完成自主导航与智能控制。
展开更多
关键词
自动导引车
深度
强化学习
深度策略性梯度
智能导航
在线阅读
下载PDF
职称材料
题名
基于DDPG-LQR的高超声速飞行器时间协同再入制导
1
作者
宋志飞
吉月辉
宋雨
刘俊杰
高强
机构
天津理工大学电气工程与自动化学院
天津市复杂系统控制理论与应用重点实验室
出处
《导弹与航天运载技术(中英文)》
北大核心
2025年第1期57-64,共8页
基金
国家自然科学基金(No.62203331)
天津理工大学研究生教育教学研究与改革项目(ZDXM2202,YBXM2204)。
文摘
针对多高超声速飞行器协同作战的特点,提出一种基于深度策略性梯度和线性二次型调节器(Deep Deterministic Policy Gradient-Linear Quadratic Regulator,DDPG-LQR)的时间协同再入制导方案。首先,采用序列凸优化方法生成满足多个约束的时间协同再入轨迹及其相应的稳态控制量,并且采用Radau伪谱法离散运动学方程,以提高轨迹优化离散精度。其次,采用线性二次型调节器(Linear Quadratic Regulator,LQR)跟踪时间协同再入轨迹。为了提高协同制导精度和制导效果,采用深度策略性梯度(Deep Deterministic Policy Gradient,DDPG)在线优化LQR的权重矩阵系数。在DDPG算法中,通过引入合适的奖励函数来提高算法的优化性能。仿真结果表明,在初始状态误差和不确定性的情况下,通过与传统的LQR控制器相比,本文所提出的协同制导方案具有更好的协同制导精度和制导效果。
关键词
多高超声速飞行器
协同制导
序列凸优化
深度策略性梯度
线
性
二次型调节器
Keywords
multiple hypersonic vehicles
cooperative guidance
sequential convex programming
deep deterministic policy gradient
linear quadratic regulator
分类号
V412 [航空宇航科学与技术—航空宇航推进理论与工程]
在线阅读
下载PDF
职称材料
题名
基于深度强化学习的AGV智能导航系统设计
被引量:
9
2
作者
贺雪梅
匡胤
杨志鹏
杨亚乔
机构
陕西科技大学设计与艺术学院
湖北航天技术研究院总体设计所
国网武汉市东西湖区供电公司
出处
《计算机应用研究》
CSCD
北大核心
2022年第5期1501-1504,1509,共5页
基金
陕西省科技厅资助项目(2019GY-077)
教育部人文社会科学研究规划基金资助项目(17YJAZH100)
陕西省教育厅人文社科一般专项项目(20JK0070)。
文摘
针对现有的AGV在大规模未知复杂环境中进行自主导航配送的问题,基于深度强化学习完成了AGV智能导航系统设计。首先,结合传感器对周围的障碍物进行探测感知,利用DDPG(deep deterministic policy gradient)算法实现AGV小车从环境的感知输入到动作的直接输出控制,帮助AGV完成自主导航和避障任务。此外,针对训练样本易受环境干扰的问题,提出了一种新颖的DL(disturb learning)-DDPG算法,通过对学习样本中相关数据进行高斯噪声预处理,帮助智能体适应噪声状态下的训练环境,提升了AGV在真实环境中的鲁棒性。仿真实验表明,经改进后的DL-DDPG算法能够为AGV导航系统提供更高效的在线决策能力,使AGV小车完成自主导航与智能控制。
关键词
自动导引车
深度
强化学习
深度策略性梯度
智能导航
Keywords
automatic guide vehicle
deep reinforcement learning
deep deterministic policy gradient
intelligent navigation
分类号
TP399 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于DDPG-LQR的高超声速飞行器时间协同再入制导
宋志飞
吉月辉
宋雨
刘俊杰
高强
《导弹与航天运载技术(中英文)》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于深度强化学习的AGV智能导航系统设计
贺雪梅
匡胤
杨志鹏
杨亚乔
《计算机应用研究》
CSCD
北大核心
2022
9
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部