期刊文献+
共找到15,173篇文章
< 1 2 250 >
每页显示 20 50 100
基于Attention注意力机制下的鱼群韧性研究
1
作者 杜常金 刘磊 《智能计算机与应用》 2024年第4期209-214,共6页
生物集群运动可以自组织实现群体涌现行为,但是在外界因素的影响之下,生物集群是否能够保持韧性,单体是否能够根据当前信息重新交互仍然面临巨大的挑战。在攻击体的干扰之下,本文根据红鼻剪刀鱼的运动数据,设计Attention注意力模型。模... 生物集群运动可以自组织实现群体涌现行为,但是在外界因素的影响之下,生物集群是否能够保持韧性,单体是否能够根据当前信息重新交互仍然面临巨大的挑战。在攻击体的干扰之下,本文根据红鼻剪刀鱼的运动数据,设计Attention注意力模型。模型考虑到单体鱼与攻击体和周围邻居鱼之间的信息交互,预测下一时刻单体出现的具体位置,说明Attention注意力模型能够使生物的集群韧性与自组织运动保持一致。实验结果表明,所提的Attention注意力模型能够较好的解释生物集群韧性,增强生物集群韧性的鲁棒性和灵活性,为复杂系统解释内外部之间的联系提供了有力的支撑,该方法对生物控制领域的分布式管理也有很好的借鉴作用。 展开更多
关键词 复杂系统控制 attention注意力模型 生物集群韧性
在线阅读 下载PDF
Attention-YOLOv5s:引入注意力机制的YOLOv5s算法
2
作者 杨可帆 魏昕恺 +3 位作者 马妍 王佳玲 宋涛 韦艳芳 《现代信息科技》 2025年第5期25-32,38,共9页
为了提高图像目标检测的准确率,提出一种结合注意力机制的YOLOv5s目标检测算法。首先,针对局部遮挡以及小目标难以检测的问题,在YOLOv5s主干网络中引入注意力机制以提高目标检测算法对重要区域的特征提取能力;然后,为降低模型复杂度并... 为了提高图像目标检测的准确率,提出一种结合注意力机制的YOLOv5s目标检测算法。首先,针对局部遮挡以及小目标难以检测的问题,在YOLOv5s主干网络中引入注意力机制以提高目标检测算法对重要区域的特征提取能力;然后,为降低模型复杂度并加快网络收敛速度,使用SIoU损失函数替换YOLOv5s原有损失函数CIoU;最后,利用改进模型与人群检测算法进行对比试验,分析模型行人检测能力。在VOC2007数据集上的对比实验表明,改进后的YOLOv5s目标检测算法平均准确率达到了70.5%,有效改善了复杂背景下的行人检测效果,同时实现了网络的轻量化。 展开更多
关键词 YOLOv5s 目标检测 注意力机制 损失函数 行人检测
在线阅读 下载PDF
基于通道注意力机制增强DGNN的外骨骼机器人步态相位预测 被引量:1
3
作者 颜建军 许赢家 +2 位作者 林越 金理 江金林 《华东理工大学学报(自然科学版)》 北大核心 2025年第1期110-118,共9页
利用一种基于通道注意力机制增强的有向图神经网络(Channel Attention Enhanced Directed Graph Neural Network,CA-DGNN)的外骨骼机器人步态相位预测方法,提高了步态相位预测的准确性和可靠性。首先,研制了人体下肢姿态信息采集装置,... 利用一种基于通道注意力机制增强的有向图神经网络(Channel Attention Enhanced Directed Graph Neural Network,CA-DGNN)的外骨骼机器人步态相位预测方法,提高了步态相位预测的准确性和可靠性。首先,研制了人体下肢姿态信息采集装置,采集人体下肢的行走步态数据并构建人体下肢的骨架模型;之后,建立了基于CA-DGNN步态相位的预测模型,提取人体步态相位的运动特征,并基于当前时刻数据预测未来时刻的步态相位;最后,探讨了滑动窗口大小对算法性能的影响。本文提高了外骨骼机器人步态相位预测的准确性和鲁棒性,为此方向研究提供了一种新的思路和方法。 展开更多
关键词 步态相位预测 惯性传感器 骨架 时空图卷积网络 通道注意力机制
在线阅读 下载PDF
基于注意力机制的高光谱图像降维在纸质文物霉斑识别的研究
4
作者 汤斌 贺渝龙 +6 位作者 唐欢 龙邹荣 王建旭 谭博文 覃丹 罗希玲 赵明富 《光谱学与光谱分析》 SCIE EI CAS 北大核心 2025年第1期246-255,共10页
纸质文物作为文物传承的重要工具,用于记录不同时期人类历史及人文风貌,其在保存过程中极易受到霉菌等微生物的侵害。霉菌会加速纤维素的降解,在纸张表面生成霉斑,并且散落的孢子会随空气流动大范围传播,增加其他纸质文物发生霉变的风... 纸质文物作为文物传承的重要工具,用于记录不同时期人类历史及人文风貌,其在保存过程中极易受到霉菌等微生物的侵害。霉菌会加速纤维素的降解,在纸张表面生成霉斑,并且散落的孢子会随空气流动大范围传播,增加其他纸质文物发生霉变的风险。因此,定期对纸质文物进行霉斑检测对了解纸质文物现状和纸质文物修复至关重要。高光谱成像技术是一种非接触性、非破坏性的检测技术,能同时获得空间数据和光谱数据,与计算机技术结合可以实现纸质文物的大批次实时无损检测。针对黑曲霉这一广泛出现的霉菌,提出一种基于注意力机制的高光谱数据降维方法,通过采集其高光谱数据,实现了高光谱冗余数据的自适应预处理。采集了来自重庆中国三峡博物馆提供的20份纸质文物黑曲霉霉斑样本,使用ENVI软件分析得出在413~855 nm波段范围内,黑曲霉霉斑感染区域和健康区域的平均光谱曲线,平均反射率差异明显;在855~1021 nm波段范围内,黑曲霉霉斑感染区域和墨迹区域的平均光谱曲线,平均反射率差异明显。文中将所提出方法与传统主成分分析和独立成分分析预处理方法分别处理原始高光谱数据,并将结果在经典U-Net、SegNet、DeepLabV3+和PSPNet四个语义分割网络上进行了对比。结果表明,该算法预处理的数据在U-Net和SegNet经典网络中有明显优势,相较于主成分分析法和独立成分分析法,霉斑识别精度取得了较大提升达到89.49%和88.46%,验证了本文所提出算法的有效性,为文物保护领域提供有效的支撑和新的思路。 展开更多
关键词 高光谱数据预处理 霉斑识别 纸质文物 注意力机制 图像分割
在线阅读 下载PDF
基于Vondrak-Cepek组合滤波和注意力机制加权的时间比对融合算法
5
作者 刘强 孙浩冉 +1 位作者 胡邓华 张爽 《系统工程与电子技术》 北大核心 2025年第2期673-679,共7页
针对卫星双向时间频率传递(two-way satellite time and frequency transfer, TWSTFT)存在周日效应、短期稳定度不高的问题,通过引入基于注意力机制的Transformer权值矩阵,利用Vondrak-Cepek组合滤波的方法将中国科学院国家授时中心(Nat... 针对卫星双向时间频率传递(two-way satellite time and frequency transfer, TWSTFT)存在周日效应、短期稳定度不高的问题,通过引入基于注意力机制的Transformer权值矩阵,利用Vondrak-Cepek组合滤波的方法将中国科学院国家授时中心(National Time Service Center, NTSC)、德国物理技术研究院(Physikalisch-Technische Bundesanstalt, PTB)之间的TWSTFT和全球定位系统(Global Positioning System, GPS)P3码共视法的时间比对链路进行融合,分析融合前后链路的性能指标并与没有周日效应、短期稳定度高的GPS精密单点定位(GPS precise point positioning, GPS PPP)时间比对参考链路进行比较。结果表明,引入注意力机制权值的Vondrak-Cepek组合滤波融合方法与参考链路GPS PPP的标准差为0.310 9 ns,具有改善TWSTFT周日效应、提升链路整体稳定性的作用。 展开更多
关键词 Vondrak-Cepek组合滤波 注意力机制 时间比对 数据融合
在线阅读 下载PDF
基于上下文通道注意力机制的人脸属性估计与表情识别
6
作者 徐杰 钟勇 +2 位作者 王阳 张昌福 杨观赐 《计算机应用》 北大核心 2025年第1期253-260,共8页
人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先... 人脸特征蕴含诸多信息,在面部属性和情感分析任务中具有重要价值,而面部特征的多样性和复杂性使人脸分析任务变得困难。针对上述难题,从面部细粒度特征角度出发,提出基于上下文通道注意力机制的人脸属性估计和表情识别(FAER)模型。首先,构建基于ConvNext的局部特征编码骨干网络,并运用骨干网络编码局部特征的有效性来充分表征人脸局部特征之间的差异性;其次,提出上下文通道注意力(CC Attention)机制,通过动态自适应调整特征通道上的权重信息,表征深度特征的全局和局部特征,从而弥补骨干网络编码全局特征能力的不足;最后,设计不同分类策略,针对人脸属性估计(FAE)和面部表情识别(FER)任务,分别采用不同损失函数组合,以促使模型学习更多的面部细粒度特征。实验结果表明,所提FAER模型在人脸属性数据集CelebA(CelebFaces Attributes)上取得了91.87%的平均准确率,相较于次优模型SwinFace(Swin transformer for Face)高出0.55个百分点;在面部表情数据集RAF-DB和AffectNet上分别取得了91.75%和66.66%的准确率,相较于次优模型TransFER(Transformers for Facial Expression Recognition)分别高出0.84和0.43个百分点。 展开更多
关键词 人脸属性估计 面部表情识别 注意力机制 细粒度特征 特征差异
在线阅读 下载PDF
融合注意力机制与改进ResNet50的服装图像属性预测方法
7
作者 游小荣 李淑芳 邵红燕 《现代纺织技术》 北大核心 2025年第1期58-64,共7页
为了解决人工标注服装图像属性效率低下的问题,提出了一种融合注意力机制与改进ResNet50的服装图像属性预测方法。首先对传统多标签分类方法中的模型进行了改进,改进后的方法能更充分利用任务之间的相关性,并减少数据稀缺问题带来的影响... 为了解决人工标注服装图像属性效率低下的问题,提出了一种融合注意力机制与改进ResNet50的服装图像属性预测方法。首先对传统多标签分类方法中的模型进行了改进,改进后的方法能更充分利用任务之间的相关性,并减少数据稀缺问题带来的影响;接着引入CBAM注意力机制,用于捕捉服装属性上的细节特征。结果表明:在未引入注意力机制的情况下,基于改进ResNet50的方法在多项评价指标上均优于传统多标签分类方法,准确率提高了25.96%;与ResNet34、EfficientNet_V2、VGG16模型相比,ResNet50模型在服装图像属性预测方面整体表现更佳;引入CBAM注意力机制后,基于改进ResNet50的方法的准确率再提高了1.72%。所提的融合注意力机制与改进ResNet50的服装图像属性预测方法,能够有效预测服装图像属性,为实现服装图像属性的自动化标注提供了新的思路。 展开更多
关键词 服装图像 属性预测 注意力机制 ResNet50 深度学习
在线阅读 下载PDF
基于动态融合注意力机制的电力负荷缺失数据填充模型
8
作者 赵冬 李亚瑞 +1 位作者 王文相 宋伟 《郑州大学学报(工学版)》 北大核心 2025年第2期111-118,共8页
为了提高电力负荷数据的缺失值填充精度,保障后续数据分析与应用的高效进行,首先,提出一种基于动态融合注意力机制的填充模型(DFAIM),该模型由注意力机制模块和动态加权融合模块构成,通过注意力机制模块的两种不同注意力机制挖掘特征与... 为了提高电力负荷数据的缺失值填充精度,保障后续数据分析与应用的高效进行,首先,提出一种基于动态融合注意力机制的填充模型(DFAIM),该模型由注意力机制模块和动态加权融合模块构成,通过注意力机制模块的两种不同注意力机制挖掘特征与时间戳之间的深层关联;其次,通过动态加权融合模块将可学习的权重赋予注意力机制模块的两个输出以得到特征表示;最后,利用特征表示来替换缺失位置的值,从而得到准确的填充结果。使用纽约市某地区的气象及负荷数据集及UCI电力负荷数据集对提出的模型进行验证,实验结果表明:相较于统计学、机器学习和深度学习填充模型,DFAIM在评价指标MAE、RMSE和MRE上均具有一定优势。 展开更多
关键词 缺失值填充 注意力机制 电力负荷 时序特征
在线阅读 下载PDF
基于残差分组卷积神经网络和多级注意力机制的源荷极端场景辨识方法
9
作者 郭红霞 李渊 +2 位作者 陈凌轩 王建学 马骞 《电网技术》 北大核心 2025年第2期459-469,I0019-I0024,共17页
为应对极端天气事件给新型电力系统安全稳定运行带来的影响,在电网的生产模拟中需要考虑极端场景。然而极端场景历史样本数量少,传统场景生成方法无法直接生成极端场景,需要对场景进行辨识。为此,提出一种计及源荷双侧的极端场景辨识方... 为应对极端天气事件给新型电力系统安全稳定运行带来的影响,在电网的生产模拟中需要考虑极端场景。然而极端场景历史样本数量少,传统场景生成方法无法直接生成极端场景,需要对场景进行辨识。为此,提出一种计及源荷双侧的极端场景辨识方法。首先,将风电、光伏和负荷序列进行重塑,并在通道维度上拼接;然后,基于分组卷积和深度残差网络,提取场景的时序特征和源荷场景之间的耦合特征;其次,模型内部嵌入通道注意力机制和多头注意力机制,以赋予重要特征更大的权重,并对场景进行分类;此外,采用改进损失函数解决训练样本中数据集不均衡的问题;最后,基于历史数据集进行验证。验证结果表明,所提方法能够对场景进行有效的分类,可以从历史场景中识别出具有高保供或高消纳风险的源荷极端场景。 展开更多
关键词 极端场景辨识 残差神经网络 分组卷积 注意力机制 源荷不确定性
在线阅读 下载PDF
基于注意力机制和能量函数的动作识别算法
10
作者 王丽芳 吴荆双 +1 位作者 尹鹏亮 胡立华 《计算机应用》 北大核心 2025年第1期234-239,共6页
针对零样本动作识别(ZSAR)算法的框架缺乏结构性指导的问题,以基于能量的模型(EBM)指导框架设计,提出基于注意力机制和能量函数的动作识别算法(ARAAE)。首先,为了得到EBM的输入,设计了光流加3D卷积(C3D)架构的组合以提取视觉特征,从而... 针对零样本动作识别(ZSAR)算法的框架缺乏结构性指导的问题,以基于能量的模型(EBM)指导框架设计,提出基于注意力机制和能量函数的动作识别算法(ARAAE)。首先,为了得到EBM的输入,设计了光流加3D卷积(C3D)架构的组合以提取视觉特征,从而达到空间去冗余的效果;其次,将视觉Transformer(ViT)用于视觉特征的提取以减少时间冗余,同时利用ViT配合光流加C3D架构的组合以减少空间冗余,从而获得非冗余视觉空间;最后,为度量视觉空间和语义空间的相关性,实现能量评分评估机制,设计联合损失函数来进行优化实验。采用6个经典ZSAR算法及近年文献里的算法在两个数据集HMDB51和UCF101进行实验的结果表明:相较于CAGE(Coupling Adversarial Graph Embedding)、Bi-dir GAN(Bi-directional Generative Adversarial Network)和ETSAN(Energy-based Temporal Summarized Attentive Network)等算法,在平均分组的HMDB51数据集上,ARAAE平均识别准确率提升至(22.1±1.8)%,均明显优于对比算法;在平均分组的UCF101数据集上,ARAAE的平均识别准确率提升至(22.4±1.6)%,略优于对比算法;在以81/20为分割方式的UCF101数据集上,ARAAE的平均识别准确率提升至(40.2±2.6)%,均大于对比算法。可见,ARAAE在ZSAR中能有效提高识别性能。 展开更多
关键词 零样本动作识别 能量函数 注意力机制 光流法 视觉特征
在线阅读 下载PDF
融合注意力机制的多视图卷积网络癫痫智能辅助检测
11
作者 李奇 闫旭荣 +3 位作者 武岩 赵迪 常立娜 孙瀚琳 《科学技术与工程》 北大核心 2025年第5期1988-1995,共8页
针对单一视图网络癫痫检测识别精度低的问题,提出一种融合注意力机制的多视图卷积网络癫痫智能辅助检测模型(multi-view convolutional network with fused attention mechanism,FAM-MCNN)。该模型从时域、频域、时频域和非线性域提取... 针对单一视图网络癫痫检测识别精度低的问题,提出一种融合注意力机制的多视图卷积网络癫痫智能辅助检测模型(multi-view convolutional network with fused attention mechanism,FAM-MCNN)。该模型从时域、频域、时频域和非线性域提取多视图特征来全面表征脑电信号;采用多尺度卷积捕捉不同层次的细节信息;引入注意力机制分别从视图维度和单个特征向量维度对特征进行加权融合,从而提高对癫痫患者不同类别脑电信号的区分能力。在CHB-MIT癫痫数据集上进行的对比实验结果显示,与单一视图网络相比,FAM-MCNN模型的平均准确率、灵敏度、特异度分别提高了14.29%、16.13%、12.54%。此外,对该模型采用少量训练样本(25%)进行实验,结果显示其检测性能达到了拥有大量训练样本(80%~90%)的对比模型水平。 展开更多
关键词 脑电信号 多视图卷积 注意力机制 癫痫智能辅助检测
在线阅读 下载PDF
基于SE注意力机制与互信息量的解纠缠跨语种语音转换
12
作者 李燕萍 谭誌诚 +2 位作者 胡澄阳 杨露露 邵曦 《信号处理》 北大核心 2025年第1期183-192,共10页
在跨语种语音转换(Cross-Lingual Voice Conversion, CLVC)任务中,如何保留转换语音中的内容信息,同时有效地提高转换语音的相似度和自然度是目前的研究难题。传统的编码器-解码器模型应用于跨语种语音转换时,通常会对语音进行相互独立... 在跨语种语音转换(Cross-Lingual Voice Conversion, CLVC)任务中,如何保留转换语音中的内容信息,同时有效地提高转换语音的相似度和自然度是目前的研究难题。传统的编码器-解码器模型应用于跨语种语音转换时,通常会对语音进行相互独立的内容编码和说话人编码,导致得到的内容表征和说话人表征之间存在一定的信息泄露,从而使得转换语音的说话人个性相似度不够理想。为了解决上述存在的问题,本文提出一种基于SE注意力机制(Squeeze-and-Excitation Attention Mechanism, SE)与互信息量(Mutual Information, MI)的跨语种语音转换方法,实现有效的表征解纠缠,完成开集情形下高质量的跨语种语音转换。首先,在内容编码器中引入SE注意力机制以利用其对全局信息的提取能力,使得内容编码器可以提取包含全局上下文信息的内容表征;同时,在各个表征之间引入互信息量,并通过对其最小化来大幅减少各个表征之间存在的信息泄露问题,从而实现有效的表征解纠缠。在VCTK英文语料库和AISHELL-3中文语料库上的实验结果表明,本文提出的基于SE注意力机制与互信息量的跨语种语音转换模型(Squeeze-and-Excitation Attention Mechanism and Mutual Information, SEMI)具有更强的表征提取能力,相比于基准模型,其在客观评价中MCD值降低了10.89%,在主观评价中MOS值和ABX值分别提升了10.94%和12.06%,验证了SEMI模型在转换语音质量和说话人个性相似度方面都取得显著进展,实现了开集情形下高质量的跨语种语音转换。 展开更多
关键词 跨语种语音转换 SE注意力机制 互信息量 全局上下文信息
在线阅读 下载PDF
MDA-MIM:一种融合多尺度特征与双重注意力机制的雷达回波图预测模型
13
作者 胡强 高雅婷 +1 位作者 尹宾礼 渠连恩 《通信学报》 北大核心 2025年第3期248-257,共10页
为提升雷达回波图中时空特征的提取质量,提出了一种基于多尺度特征融合和双重注意力机制的MIM改进(MDA-MIM)模型。该模型基于空洞卷积实现多尺度特征提取与融合。通过在MIM模型中的非平稳模块集成自注意力机制,调整不同时间步长和空间... 为提升雷达回波图中时空特征的提取质量,提出了一种基于多尺度特征融合和双重注意力机制的MIM改进(MDA-MIM)模型。该模型基于空洞卷积实现多尺度特征提取与融合。通过在MIM模型中的非平稳模块集成自注意力机制,调整不同时间步长和空间位置的权重,更精确地捕捉雷达回波数据中的非平稳性特征。在平稳模块引入局部注意力机制,以聚焦于局部区域内的特征关联,增强对平稳性特征的捕捉能力。真实数据集上的实验结果表明,MDA-MIM具有优秀的预测性能,在MSE、MAE、SSIM和PSNR等指标上均优于对比模型。 展开更多
关键词 雷达回波图 时空预测 注意力机制 多尺度特征
在线阅读 下载PDF
基于双注意力机制LSTM的粮食价格预测与解释研究
14
作者 刘宏宇 《粮油食品科技》 北大核心 2025年第1期272-279,共8页
粮食价格波动复杂性增加,对政策制定、市场调控和粮农收益带来深远影响。传统预测方法难以有效捕捉复杂非线性特征,预测精度和适用性均受到限制。为解决这一实践问题,构建了基于双注意力机制的长短期记忆网络(LSTM)多元特征变量预测模型... 粮食价格波动复杂性增加,对政策制定、市场调控和粮农收益带来深远影响。传统预测方法难以有效捕捉复杂非线性特征,预测精度和适用性均受到限制。为解决这一实践问题,构建了基于双注意力机制的长短期记忆网络(LSTM)多元特征变量预测模型,引入特征注意力和时间注意力机制,从数据层面提升模型对关键变量的识别能力和预测精度。整合公众关注度指数作为新变量,基于可解释人工智能(XAI)框架中的TFT时序融合转换模型和SHAP模型,对影响粮食价格的主要因素及其传导路径进行详细解释。研究结果表明,双注意力机制显著优化了预测性能,公众关注度指数对短期价格波动有重要影响,国内期货价格和国际原油价格是影响粮食价格波动的主导因素。进一步分析提出,构建多部门协作的预测与预警体系,加强网络舆情动态监测与公众情绪管理,可有效应对粮食价格波动风险。 展开更多
关键词 粮食价格 深度学习 注意力机制 预测 公众关注度
在线阅读 下载PDF
融合注意力机制和轻量化的目标检测方法研究
15
作者 姚庆安 孙旭 +1 位作者 冯云丛 乔石丽 《计算机仿真》 2025年第2期252-258,525,共8页
针对YOLOv5s目标检测过程中小目标漏检导致整体检测精度下降的问题,提出一种基于注意力机制和轻量化的优化YOLOv5s目标检测算法。上述优化方法主要是在YOLOv5s的骨干网络中引人深度可分离卷积,在不降低检测精度的同时减少参数量,同时在... 针对YOLOv5s目标检测过程中小目标漏检导致整体检测精度下降的问题,提出一种基于注意力机制和轻量化的优化YOLOv5s目标检测算法。上述优化方法主要是在YOLOv5s的骨干网络中引人深度可分离卷积,在不降低检测精度的同时减少参数量,同时在颈部网络中采用CA注意力机制和Ghost卷积的搭配方式,在不增加参数量的同时有效的提升检测精度。仿真结果证明,优化后的YOLOv5s算法在PASCALVOC2007数据集和RSOD数据集上的mAP值分别为72.8%和95.5%,相较于原YOL0v5s算法,mAP值分别提高了4.1%和2.0%,同时参数量也都减少了17%。通过仿真证明优化的YOLOv5s目标检测算法可以在提升检测精度的同时兼顾模型的轻量化。 展开更多
关键词 目标检测 注意力机制 轻量化 仿真
在线阅读 下载PDF
融合层注意力机制的多视角图对比学习推荐方法
16
作者 钱忠胜 黄恒 +1 位作者 朱辉 刘金平 《计算机研究与发展》 北大核心 2025年第1期160-178,共19页
图对比学习因其可有效缓解数据稀疏问题被广泛应用在推荐系统中.然而,目前大多数基于图对比学习的推荐算法均采用单一视角进行学习,这极大地限制了模型的泛化能力,且图卷积网络本身存在的过度平滑问题也影响着模型的稳定性.基于此,提出... 图对比学习因其可有效缓解数据稀疏问题被广泛应用在推荐系统中.然而,目前大多数基于图对比学习的推荐算法均采用单一视角进行学习,这极大地限制了模型的泛化能力,且图卷积网络本身存在的过度平滑问题也影响着模型的稳定性.基于此,提出一种融合层注意力机制的多视角图对比学习推荐方法.一方面,该方法提出2种不同视角下的3种对比学习,在视图级视角下,通过对原始图添加随机噪声构建扰动增强视图,利用奇异值分解(singular value decomposition)重组构建SVD增强视图,对这2个增强视图进行视图级对比学习;在节点视角下,利用节点间的语义信息分别进行候选节点和候选结构邻居对比学习,并将3种对比学习辅助任务和推荐任务进行多任务学习优化,以提高节点嵌入的质量,从而提升模型的泛化能力.另一方面,在图卷积网络学习用户和项目的节点嵌入时,采用层注意力机制的方式聚合最终的节点嵌入,提高模型的高阶连通性,以缓解过度平滑问题.在4个公开数据集LastFM,Gowalla,Ifashion,Yelp上与10个经典模型进行对比,结果表明该方法在Recall,Precision,NDCG这3个指标上分别平均提升3.12%,3.22%,4.06%,这说明所提方法是有效的. 展开更多
关键词 注意力机制 对比学习 图卷积网络 多任务学习 推荐系统
在线阅读 下载PDF
基于Transformer与注意力机制的肺部肿瘤分割方法
17
作者 曾安 王丹 +4 位作者 杨宝瑶 张小波 石镇维 刘再毅 潘丹 《广东工业大学学报》 2025年第1期24-32,共9页
肺部肿瘤的准确分割对于肿瘤的诊断和治疗具有重要作用,然而肺部肿瘤分割中存在病灶与周围组织的对比度低、肿瘤与正常组织易粘连和背景噪声大等问题。针对这些问题,本文提出了一种基于Transformer和注意力机制的肺部肿瘤分割方法。在Tr... 肺部肿瘤的准确分割对于肿瘤的诊断和治疗具有重要作用,然而肺部肿瘤分割中存在病灶与周围组织的对比度低、肿瘤与正常组织易粘连和背景噪声大等问题。针对这些问题,本文提出了一种基于Transformer和注意力机制的肺部肿瘤分割方法。在Transformer编码器阶段引入全局和局部的注意力机制,使得网络可以同时关注全局和局部的上下文信息;在跳跃连接阶段,使用通道优先卷积注意力机制,可以增强复杂病灶的空间感知能力和降低通道维度冗余,从而提高肿瘤的分割精度。在私有数据集GDPH和公共数据集LUNG1上的测试结果表明,本文方法相比其他8种分割方法,Dice指标在两个数据集上表现最优,分别为90.96%和88.18%,可以为临床的诊疗提供可靠辅助。 展开更多
关键词 肺部肿瘤 医学图像分割 卷积神经网络 TRANSFORMER 注意力机制
在线阅读 下载PDF
融合注意力机制和多尺度特征的图像水印方法
18
作者 张天骐 谭霜 +1 位作者 沈夕文 唐娟 《计算机应用》 北大核心 2025年第2期616-623,共8页
针对基于深度学习的水印方法未充分突显图像的关键特征,以及未有效利用中间卷积层输出特征的问题,为提升含水印图像的视觉质量和抵抗噪声攻击的能力,提出一种融合注意力机制和多尺度特征的图像水印方法。在编码器部分,设计注意力模块关... 针对基于深度学习的水印方法未充分突显图像的关键特征,以及未有效利用中间卷积层输出特征的问题,为提升含水印图像的视觉质量和抵抗噪声攻击的能力,提出一种融合注意力机制和多尺度特征的图像水印方法。在编码器部分,设计注意力模块关注重要图像特征,以减小水印嵌入引起的图像失真;在解码器部分,设计多尺度特征提取模块,以捕获不同层次的图像细节。实验结果表明,在COCO数据集上与深度水印模型HiDDeN(Hiding Data with Deep Networks)相比,所提方法生成的含水印图像的峰值信噪比(PSNR)和结构相似度(SSIM)分别增加了11.63%和1.29%;所提方法针对dropout、cropout、crop、高斯模糊和JPEG压缩的水印提取平均误比特率(BER)降低了53.85%;此外,消融实验结果验证了添加注意力模块和多尺度特征提取模块的方法有更好的不可见性和鲁棒性。 展开更多
关键词 图像水印 注意力机制 特征提取 鲁棒水印 深度学习 对抗训练
在线阅读 下载PDF
基于注意力机制和多尺度融合的人群计数网络
19
作者 栾方军 龚琪 袁帅 《计算机工程》 北大核心 2025年第3期352-361,共10页
为了应对人群图像中尺度变化和背景干扰的问题,提出一种人群计数网络模型,旨在充分利用多尺度信息并降低背景噪声的影响。首先采用ConvNeXt作为主干网络,用于提取特征。其次为了有效融合不同层次的特征,提出多层次特征融合模块(MFFM),... 为了应对人群图像中尺度变化和背景干扰的问题,提出一种人群计数网络模型,旨在充分利用多尺度信息并降低背景噪声的影响。首先采用ConvNeXt作为主干网络,用于提取特征。其次为了有效融合不同层次的特征,提出多层次特征融合模块(MFFM),将主干网络中不同层次的特征进行跨尺度融合,融合后的特征包含了不同尺度的语义信息,可以更好地适应人群计数任务中的尺度变化问题。接着为了更好地解决人群计数中存在的挑战,设计一个多尺度注意力模块(MSAM),根据不同感受野的分支提取不同尺度的特征,利用选择性Kernel通道注意力(SKCA)缓解多列结构存在的特征相似问题,并将模块生成的注意力图反馈到对应的尺度特征中,以抑制背景的干扰。网络模型在ShanghaiTechA数据集中的平均绝对误差(MAE)和均方根误差(RMSE)分别达到了56.1和93.9;在ShanghaiTechB数据集中的MAE和RMSE分别达到了6.1和10.3;在UCF_CC_50数据集中的MAE和RMSE分别达到了174.9和252.7;在Mall数据集中的MAE和RMSE分别达到了1.42和1.85。在公开数据集上的实验结果表明,提出的网络模型与现有代表性的人群计数方法相比,在提升人群计数任务的准确性和鲁棒性方面均取得了明显进展。 展开更多
关键词 人群计数 多尺度特征融合 注意力机制 神经网络 密度图
在线阅读 下载PDF
基于自注意力机制与高斯混合变分自编码器的飞行轨迹聚类方法研究
20
作者 张召悦 李莎 鲍水达 《河南科技大学学报(自然科学版)》 北大核心 2025年第1期25-33,M0003,M0004,共11页
为精确识别飞行轨迹的运行模式,提出了一种基于自注意力机制(SA)与高斯混合变分自编码器(GMVAE)的飞行轨迹聚类方法。SA-GMVAE是一种端到端的深度聚类方法,GMVAE利用变分推断估计每条轨迹的潜在分布,将输入的飞行轨迹数据映射到由多个... 为精确识别飞行轨迹的运行模式,提出了一种基于自注意力机制(SA)与高斯混合变分自编码器(GMVAE)的飞行轨迹聚类方法。SA-GMVAE是一种端到端的深度聚类方法,GMVAE利用变分推断估计每条轨迹的潜在分布,将输入的飞行轨迹数据映射到由多个高斯分布组成的潜在空间,同时依据轨迹分布特征进行聚类。考虑到GMVAE无法兼顾潜在特征的全局关键信息,将自注意力机制嵌入到编码器中,以便于在特征提取时能够捕获全局依赖关系并自动分配权重,突出关键特征,提升轨迹聚类效果。最后,以天津滨海国际机场的进场飞行轨迹数据集为例验证了模型的有效性,实验结果表明:SA-GMVAE相较于K-means、DBSCAN、DTW+HDBSCAN、AE+DP与AE+GMM 5种聚类方法,轮廓系数分别提高了27.6%、20.2%、18.2%、18.6%、15.7%;与未引入自注意力机制的GMVAE聚类模型相比,轮廓系数提高了9.5%,能够更准确地对飞行轨迹进行聚类。 展开更多
关键词 飞行轨迹 模式识别 变分自编码器 注意力机制
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部