期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于编-解码器结构的无人机群多任务联邦学习
1
作者 周敬轩 包卫东 +1 位作者 王吉 张大宇 《西南交通大学学报》 EI CSCD 北大核心 2024年第4期933-941,共9页
针对传统联邦学习在无人机群应用中的局限性——要求所有参与者执行相同任务并拥有相同的模型结构,本文探索一种适用于无人机群的多任务联邦学习方法,设计一种新的编-解码器架构,以加强执行不同任务的无人机之间的知识共享.首先,为执行... 针对传统联邦学习在无人机群应用中的局限性——要求所有参与者执行相同任务并拥有相同的模型结构,本文探索一种适用于无人机群的多任务联邦学习方法,设计一种新的编-解码器架构,以加强执行不同任务的无人机之间的知识共享.首先,为执行相同任务的无人机建立直接的知识分享机制,通过直接聚合方式实现同任务知识的有效融合;其次,对于执行不同任务的无人机,从所有无人机的编-解码器架构中提取编码器部分,构建一个全局编码器;最后,在训练环节,将本地编码器和全局编码器的信息整合到损失函数中,并通过迭代更新使本地解码器逐步逼近全局解码器,从而实现跨任务间的知识高效共享.实验结果表明:相较于传统方法,所提出的方法使无人机群在3个单任务上的性能分别提升1.79%、0.37%和2.78%,仅在1个任务上性能略微下降0.38%,但整体性能仍提升2.38%. 展开更多
关键词 多任务学习 无人机群 联邦学习 编-解码器结构
在线阅读 下载PDF
SW-SAN:基于Seq2Seq结合注意力机制与滑动窗口的车辆轨迹预测模型 被引量:1
2
作者 朱云鹤 刘明剑 +1 位作者 祝朗千 李沐阳 《现代电子技术》 北大核心 2024年第11期175-180,共6页
针对长时间内4~5 s车辆轨迹预测精度较差的问题,提出基于Seq2Seq结合注意力机制与滑动窗口的车辆轨迹预测模型(SW-SAN)。首先,使用滑动窗口的方法更新历史轨迹状态集合,利用编码器对目标车辆的历史轨迹数据编码,得到历史轨迹特征向量;其... 针对长时间内4~5 s车辆轨迹预测精度较差的问题,提出基于Seq2Seq结合注意力机制与滑动窗口的车辆轨迹预测模型(SW-SAN)。首先,使用滑动窗口的方法更新历史轨迹状态集合,利用编码器对目标车辆的历史轨迹数据编码,得到历史轨迹特征向量;其次,经过注意力机制计算历史时间内各时刻的关联性得分、时间注意力权重因子和历史时间相关性特征向量;最后,解码器将历史时间相关性特征向量作为输入,多次循环解码层,输出目标车辆的未来预测轨迹。实验结果表明,SW-SAN模型在4 s和5 s时预测轨迹的RMSE误差为1.99 m和1.94 m,SW-SAN模型在较长时间4~5 s的预测误差更低,在车辆轨迹预测问题上性能更强。 展开更多
关键词 交通工程 轨迹预测 深度学习 编-解码器结构 注意力机制 滑动窗口
在线阅读 下载PDF
多层级特征融合结构的单目图像深度估计网络 被引量:7
3
作者 贾瑞明 李阳 +2 位作者 李彤 崔家礼 王一丁 《计算机工程》 CAS CSCD 北大核心 2020年第12期207-214,共8页
采用卷积神经网络对单目图像的深度进行估计时,存在深度信息不精确、边缘模糊以及细节缺失等问题。为此,提出一种多层级特征融合结构的深度卷积网络。该网络采用端到端的编-解码器结构,编码器使用ResNet101网络结构将图像转换为高维特征... 采用卷积神经网络对单目图像的深度进行估计时,存在深度信息不精确、边缘模糊以及细节缺失等问题。为此,提出一种多层级特征融合结构的深度卷积网络。该网络采用端到端的编-解码器结构,编码器使用ResNet101网络结构将图像转换为高维特征图,解码器使用上采样卷积模块从高维特征图中重建出深度图像,并对编码器与解码器中的不同层级特征进行融合。基于NYUv2数据集与KITTI数据集的实验结果表明,相比其他先进网络,该网络不仅能预测出更加准确的深度信息,而且能保持预测深度图像的边缘信息。 展开更多
关键词 单目图像 深度估计 编-解码器结构 多层级融合 亚像素卷积
在线阅读 下载PDF
基于多尺度特征融合的单目深度估计算法
4
作者 周晓吉 《智能计算机与应用》 2024年第9期34-40,共7页
在当前的单目深度算法中,堆叠的卷积层和过度的下采样操作会造成特征图分辨率和高层信息的损失,影响了深度图整体的精度。针对这一问题,本文提出了一个基于多尺度特征融合的单目深度估计算法。采用了递进式的编-解码结构,由浅到深逐级... 在当前的单目深度算法中,堆叠的卷积层和过度的下采样操作会造成特征图分辨率和高层信息的损失,影响了深度图整体的精度。针对这一问题,本文提出了一个基于多尺度特征融合的单目深度估计算法。采用了递进式的编-解码结构,由浅到深逐级提取不同尺度的信息,不同层级不同分辨率的特征连接在一起,形成了多尺度特征融合结构;编码器采用U^(2)-Net的设计架构,内部通过Vision Transformer模块,使得模型能够在编码过程中拥有全局的感受野,并且避免了下采样操作,从而减少了特征图分辨率和高层信息的损失;解码器中设计了U型残差块,能更好地融合不同阶段内的多尺度特征。在KITTI和NYU-Depth V2数据集上进行了实验,实验结果表明本文所提算法在各项指标上优于大部分同类型算法。 展开更多
关键词 单目深度估计 编-解码器结构 Vision Transformer U^(2)-Net
在线阅读 下载PDF
Screen image sequence compression method utilizing adaptive block size coding and hierarchical GOP structure
5
作者 武星 梅亮 +2 位作者 袭奇 张申生 陈延伟 《Journal of Central South University》 SCIE EI CAS 2010年第4期786-794,共9页
To compress screen image sequence in real-time remote and interactive applications,a novel compression method is proposed.The proposed method is named as CABHG.CABHG employs hybrid coding schemes that consist of intra... To compress screen image sequence in real-time remote and interactive applications,a novel compression method is proposed.The proposed method is named as CABHG.CABHG employs hybrid coding schemes that consist of intra-frame and inter-frame coding modes.The intra-frame coding is a rate-distortion optimized adaptive block size that can be also used for the compression of a single screen image.The inter-frame coding utilizes hierarchical group of pictures(GOP) structure to improve system performance during random accesses and fast-backward scans.Experimental results demonstrate that the proposed CABHG method has approximately 47%-48% higher compression ratio and 46%-53% lower CPU utilization than professional screen image sequence codecs such as TechSmith Ensharpen codec and Sorenson 3 codec.Compared with general video codecs such as H.264 codec,XviD MPEG-4 codec and Apple's Animation codec,CABHG also shows 87%-88% higher compression ratio and 64%-81% lower CPU utilization than these general video codecs. 展开更多
关键词 screen image sequence compression adaptive block size hierarchical GOP structure intra-frame coding inter-frame coding
在线阅读 下载PDF
基于注意力Seq2Seq网络的高速公路交织区车辆变道轨迹预测 被引量:27
6
作者 韩皓 谢天 《中国公路学报》 EI CAS CSCD 北大核心 2020年第6期106-118,共13页
针对交通状态复杂的高速公路交织区域,经验丰富的驾驶人能够通过正确地推断周围车辆的未来运动进行及时的车道变换,这对于实现安全高效的自动驾驶至关重要,然而目前的自动驾驶车辆往往缺乏这种预测能力。为此,基于深度学习理论,提出了... 针对交通状态复杂的高速公路交织区域,经验丰富的驾驶人能够通过正确地推断周围车辆的未来运动进行及时的车道变换,这对于实现安全高效的自动驾驶至关重要,然而目前的自动驾驶车辆往往缺乏这种预测能力。为此,基于深度学习理论,提出了一种结合注意力机制和编-解码器结构的交织区车辆强制性变道轨迹预测方法,利用Next Generation Simulation(NGSIM)数据集提取车辆变道过程中的关键特征,并引入碰撞时间(Time to Collision,TTC)和避免碰撞减速度(Deceleration Rate to Avoid a Crash,DRAC)2种风险指标,将变道车辆及其周围车辆视为一个整体状态单元,同时补全状态单元内部不同车辆在横向和纵向上的时空状态特征,从而更有效地刻画车辆间的动态交互行为;然后将不同观测车辆的连续窗口序列输入基于长短期记忆网络(Long Short-term Memory,LSTM)的编-解码器,预测交织区车辆变道的未来运动轨迹,通过添加软注意力模块,使模型能够集中聚焦于影响车辆在不同时刻下位置变化的关键信息,再现了真实交通场景下车辆的变道行为。试验验证表明:基于注意力机制的编-解码器模型与当前流行的卷积长短期记忆网络、极限梯度提升树等模型相比具有更高的轨迹预测精度,在长时域的变道轨迹拟合上有显著的优越性,为辅助和自动驾驶领域的发展提供了新思路。 展开更多
关键词 交通工程 交织区变道 轨迹预测 注意力机制 编-解码器结构 车辆交互 长短期记忆网络
原文传递
基于残差卷积注意力网络的视网膜血管分割算法 被引量:5
7
作者 陈林 陈亚军 沈锐 《内江师范学院学报》 2021年第2期49-55,共7页
视网膜血管的分析可用于评估和监测各种眼科疾病,具有十分重要的临床意义.针对视网膜图像血管分割中信息遗失过大、分割效果有待提高等问题,构建了一种基于残差与卷积模块的注意力机制模块(convolutional block attention module,CBAM)... 视网膜血管的分析可用于评估和监测各种眼科疾病,具有十分重要的临床意义.针对视网膜图像血管分割中信息遗失过大、分割效果有待提高等问题,构建了一种基于残差与卷积模块的注意力机制模块(convolutional block attention module,CBAM)混合编-解码器结构的视网膜血管分割算法,提高了细小血管分割效果.并分别在DRIVE,STARE和CHASE_DB1数据集上进行实验对比.实验结果表明,该方法取得了较好的实验效果,尤其是特异性优于其他算法.特异性分别达到0.9828、0.9884、0.9881. 展开更多
关键词 视网膜血管 血管分割 残差 注意力 编-解码器结构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部