期刊文献+
共找到1,015篇文章
< 1 2 51 >
每页显示 20 50 100
基于多头注意力机制的单幅逆光图像卷积增强方法
1
作者 宋雅丽 《常州工学院学报》 2025年第1期31-36,77,共7页
使用中值滤波与小波阈值相结合的去噪方法去除单幅逆光图像中包含的椒盐噪声以及高斯噪声,并通过在卷积神经网络中引入多头注意力机制,构建单幅逆光图像增强模型,之后将去噪后的单幅逆光图像输入所构建的单幅逆光图像增强模型中,通过多... 使用中值滤波与小波阈值相结合的去噪方法去除单幅逆光图像中包含的椒盐噪声以及高斯噪声,并通过在卷积神经网络中引入多头注意力机制,构建单幅逆光图像增强模型,之后将去噪后的单幅逆光图像输入所构建的单幅逆光图像增强模型中,通过多头注意力机制,有效辅助卷积神经网络关注单幅逆光图像欠曝光、过曝光区域,经梯度下降法实施有效模型训练后,输出增强后的逆光图像,完成单幅逆光图像增强工作。实验结果表明:该方法能够实现单幅逆光图像增强,增强效果较好,增强后逆光图像视觉效果明显强于未引入多头注意力机制前。 展开更多
关键词 多头注意力机制 逆光图像 图像增强 卷积神经网络 图像去噪 模型训练
在线阅读 下载PDF
基于图增强和注意力机制的时间序列不确定性预测
2
作者 门超杰 赵静 张楠 《华东师范大学学报(自然科学版)》 北大核心 2025年第1期82-96,共15页
为提升对未来事件的预判能力并有效应对不确定性,提出了一种基于图增强和注意力机制的网络架构,用于多元时间序列的不确定性预测.通过引入隐含式图结构并结合图神经网络技术,捕捉各序列间相互依赖关系,从而建模时间序列之间的相互影响;... 为提升对未来事件的预判能力并有效应对不确定性,提出了一种基于图增强和注意力机制的网络架构,用于多元时间序列的不确定性预测.通过引入隐含式图结构并结合图神经网络技术,捕捉各序列间相互依赖关系,从而建模时间序列之间的相互影响;运用注意力机制捕捉同一序列内的时序变化模式,以建模时间序列的动态演变规律;采用蒙特卡洛随机失活(Monte Carlo dropout)方法近似模型参数,并将预测序列建模为随机分布,以实现精确的时间序列不确定性预测.实验证明,该方法在保持较高预测精度的同时,还能进行可靠的不确定性估计,可以为决策任务提供置信度信息. 展开更多
关键词 不确定性 增强 时间序列 注意力机制
在线阅读 下载PDF
融合注意力机制和高斯滤波的Retinex图像增强算法
3
作者 张亚蒙 张宝菊 +6 位作者 张博 张翠萍 褚博华 姜凯 薛梦奇 孙艺 隋晓楚 《软件》 2025年第1期20-23,共4页
本文在Retinex-Net网络的基础上,提出了一种新的低光照图像增强网络,以解决Retinex-Net网络中反射分量噪声大,光照分量亮度低且特征提取不足等问题,有效增强了低光图像的质量。在分解网络中使用Retinex-Net网络作为基本模型,将普通卷积... 本文在Retinex-Net网络的基础上,提出了一种新的低光照图像增强网络,以解决Retinex-Net网络中反射分量噪声大,光照分量亮度低且特征提取不足等问题,有效增强了低光图像的质量。在分解网络中使用Retinex-Net网络作为基本模型,将普通卷积与空洞卷积结合,进行多尺度特征抽取,从而获得更为丰富的细节信息;在增强网络中,采用多层注意力机制模块,实现对图像中细节部分和光照部分的增强。最后,通过结合去除噪声的反射分量和增强后的光照分量,生成一幅标准的正常光照图像。实验结果表明,本文所提出的算法能够有效地增强低光照图像的亮度和对比度,同时更好地保留图像中细节信息,从而提高图像的视觉效果。 展开更多
关键词 RETINEX算法 注意力机制 低照度图像 图像增强
在线阅读 下载PDF
融合坐标注意力机制的植物低照度多光谱图像增强模型
4
作者 张伯驹 朱启兵 +1 位作者 黄敏 赵鑫 《激光技术》 北大核心 2025年第1期79-86,共8页
为了解决短时曝光条件下高(多)光谱图像照度和信噪比偏低问题,提出了一种基于改进残差(Res-UNet)的高(多)光谱图像增强模型。该模型以Res-UNet为主干网络,采用空洞空间金字塔池化和坐标注意力机制强化模型的特征聚合能力,并引入标准分... 为了解决短时曝光条件下高(多)光谱图像照度和信噪比偏低问题,提出了一种基于改进残差(Res-UNet)的高(多)光谱图像增强模型。该模型以Res-UNet为主干网络,采用空洞空间金字塔池化和坐标注意力机制强化模型的特征聚合能力,并引入标准分数损失函数以改善模型对光谱曲线的重构能力,利用图像增强质量指标和下游任务(干旱叶片分割精度)对所提模型的性能进行评价。结果表明,改进后模型的峰值信噪比、结构相似度和光谱角映射分别达到0.9852、39.71和3.120,优于对比算法;其对于干旱叶片的分割精确率也高于各类主流算法。该模型对植物低照多光谱图像增强的有效性,可为各类光谱图像下游任务提供信息支持。 展开更多
关键词 图像处理 多光谱图像 注意力机制 低照度图像 图像增强
在线阅读 下载PDF
基于数据增强和注意力机制的输电线异物检测算法的研究
5
作者 齐国营 高彦飞 +1 位作者 李剑武 吴永华 《微型电脑应用》 2025年第2期55-60,共6页
输电线异物检测模型的训练数据集存在种类多和数据少的特点,而现有的方法在深度网络特征学习过程中存在细节特征丢失的情况,对此,提出了使用数据增强和增加注意力机制的单框多次检测器(SSD)框架对输电线异物进行检测。对采集的输电线异... 输电线异物检测模型的训练数据集存在种类多和数据少的特点,而现有的方法在深度网络特征学习过程中存在细节特征丢失的情况,对此,提出了使用数据增强和增加注意力机制的单框多次检测器(SSD)框架对输电线异物进行检测。对采集的输电线异物图像进行预处理,主要包括对图像的颗粒噪声进行高斯去噪,然后进行直方图均衡化;使用Mosaic方式对输电线异物检测模型的训练数据集进行扩充,提高异物检测模型的鲁棒性和泛化能力;将注意力机制挤压—激励(SE)网络模块引入SSD检测框架,能够高效地学习不同Channel之间的特征,并进行特征融合,从而能够快速和精准提取关键的特征信息。试验结果表明,基于数据增强和注意力机制的输电线异物检测算法能够对输电线异物进行更加准确的检测,所提算法相较于Faster RCNN、SSD和YOLOv3检测算法提高了5个百分点、3个百分点和6个百分点,模型平均检测速度减小了0.021 s、0.007 s和0.003 s。 展开更多
关键词 输电线异物检测 Mosaic数据增强 SSD目标检测 注意力机制 SE网络
在线阅读 下载PDF
基于特征增强的双重注意力去雾网络
6
作者 陈海秀 黄仔洁 +5 位作者 陆康 陆成 何珊珊 房威志 卢海涛 陈子昂 《电光与控制》 北大核心 2025年第1期15-20,67,共7页
针对现有去雾方法处理的图像细节模糊和色彩偏差等问题,提出了一种基于特征增强的双重注意力去雾网络。该网络采用编码器-解码器结构,设计了一个双重注意力特征增强模块,其中,利用Ghost模块替代非线性卷积,实现模型轻量化处理,通过RFB... 针对现有去雾方法处理的图像细节模糊和色彩偏差等问题,提出了一种基于特征增强的双重注意力去雾网络。该网络采用编码器-解码器结构,设计了一个双重注意力特征增强模块,其中,利用Ghost模块替代非线性卷积,实现模型轻量化处理,通过RFB充分融合不同尺度的特征,实现均匀去雾,引入双重注意力实现信息跨通道与空间交互,保证模型性能和抑制噪声特征。使用RESIDE数据集对网络进行训练和测试。实验结果表明,所提算法在主观视觉和客观评价指标上均有优异表现,能有效地提升网络的特征提取能力,实现对不同场景雾图的色彩恢复,增强图像的对比度和清晰度。 展开更多
关键词 图像去雾 特征增强 并行分支结构 多尺度映射 注意力机制
在线阅读 下载PDF
多尺度注意力网络的水下图像增强算法
7
作者 陈海秀 陆康 +2 位作者 何珊珊 刘磊 颜秋叙 《机械科学与技术》 北大核心 2025年第3期505-512,共8页
针对水下环境中的图像存在严重的偏色、模糊等问题,该文提出了一种新型的生成对抗网络。采用U-Net作为生成网络的基础模型并对其进行了改进,首先将注意力机制引入到网络中,并设计多尺度特征提取模块,来提取不同层次的特征。其次通过预... 针对水下环境中的图像存在严重的偏色、模糊等问题,该文提出了一种新型的生成对抗网络。采用U-Net作为生成网络的基础模型并对其进行了改进,首先将注意力机制引入到网络中,并设计多尺度特征提取模块,来提取不同层次的特征。其次通过预处理操作输入白平衡图像提升模型的鲁棒性。为解决单一损失造成图像细节恢复不均匀的问题,在传统的对抗损失函数中联合L1损失与内容损失。实验结果表明:此方法在水下图像的颜色恢复和提高清晰度方面具有很好的效果,其中结构相似度、峰值信噪比、水下彩色质量评估和水下图像质量度量的平均值分别为0.8906、29.0761、0.4454和3.1810。在主观评价和客观评价指标上,综合来说该文算法实验结果均优于对比算法。 展开更多
关键词 水下图像增强 生成对抗网络 注意力机制 多尺度
在线阅读 下载PDF
基于多重相似性和增强注意力预测药物-靶标相互作用
8
作者 王伟 余梦雪 +5 位作者 孙斌 万仕彤 刘栋 周运 张红军 王鲜芳 《河南师范大学学报(自然科学版)》 北大核心 2025年第2期99-107,共9页
在新药发现和药物重定位研究中,发现药物与靶标之间的相互作用是重要的研究内容.针对药物与靶标相互作用网络,提出一种基于多重相似性和增强注意力机制的图卷积神经网络模型(RSGCN)预测药物-靶标相互作用.首先,提出了多重相似性来捕捉... 在新药发现和药物重定位研究中,发现药物与靶标之间的相互作用是重要的研究内容.针对药物与靶标相互作用网络,提出一种基于多重相似性和增强注意力机制的图卷积神经网络模型(RSGCN)预测药物-靶标相互作用.首先,提出了多重相似性来捕捉网络结构特征,以充分利用节点间的直接或间接关系.然后,通过PCA降维减少相似性噪声对实验结果的影响.最后,采用图卷积神经网络(graph convolution neural network,GCN)获得节点嵌入表示,并融入基于注意力的增强层,通过增强注意力机制获得节点间的注意力权重,能够高效地预测药物与靶标之间的相互作用.在黄金标准数据集上的实验结果表明RSGCN模型具有较好的性能. 展开更多
关键词 图卷积神经网络(GCN) 多重相似性 PCA 增强注意力机制 药物-靶标相互作用
在线阅读 下载PDF
伪异常引导的融合注意力和记忆增强的鱼群异常行为检测
9
作者 袁红春 肖智豪 《湖南农业大学学报(自然科学版)》 北大核心 2025年第1期123-130,共8页
现有的鱼群异常行为检测方法无法有效提取高级语义信息、特征学习不足,且缺乏对异常样本的学习和提取关键特征的能力,无法满足现有的大规模水产养殖需求。笔者结合深度学习技术,提出了一种伪异常引导的融合注意力和记忆增强的鱼群异常... 现有的鱼群异常行为检测方法无法有效提取高级语义信息、特征学习不足,且缺乏对异常样本的学习和提取关键特征的能力,无法满足现有的大规模水产养殖需求。笔者结合深度学习技术,提出了一种伪异常引导的融合注意力和记忆增强的鱼群异常行为检测方法:通过在视频序列中随机选择跳跃的帧构建伪异常合成器生成伪异常样本,增强对异常样本的感知能力;提出选择性内核频率通道注意力(SKFca)机制,在选择性内核(SK)注意力的基础上引入频域信息,以捕捉更丰富的输入信息;通过瓶颈注意力(BAM)机制在通道和空间维度上抑制不相关的背景特征,突出前景目标特征;在2种注意力模块后面添加记忆增强模块,将异常样本的编码特征替换为正常样本的编码特征,扩大异常样本输出与输入的重构误差;将记忆增强后的通道和空间维度上的关键特征和频域特征融合,以全面提取高级语义信息。结果表明,本研究所提方法在2种自制的鱼类数据集上检测效果都很好,曲线下面积(AUC)分别达0.953和0.957,且能实现对异常的精确定位。 展开更多
关键词 鱼群异常行为检测 高级语义信息 深度学习 伪异常引导 注意力机制 记忆增强
在线阅读 下载PDF
结合倒残差自注意力机制的遥感图像目标检测
10
作者 赵文清 赵振寰 巩佳潇 《智能系统学报》 北大核心 2025年第1期64-72,共9页
针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,... 针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,构造多尺度空间金字塔池化模块,提供多尺度感受野,增强捕捉不同尺寸目标的能力;最后,提出轻量级特征融合模块,对骨干网络提取的特征图进行融合,充分结合低层与高层特征,提高网络对不同尺寸目标的检测能力。与传统网络及其他改进目标检测算法进行对比,实验发现该方法的检测精度明显优于其他算法。此外,在DIOR数据集和RSOD数据集上设计消融实验,结果表明,该方法在DIOR数据集与RSOD数据集上的平均精度均值比YOLOv8算法分别提升4.6和4.2百分点,明显提升遥感图像目标检测的精度。 展开更多
关键词 遥感图像 目标检测 倒残差 自注意力机制 多尺度 空间金字塔 特征提取 特征融合
在线阅读 下载PDF
基于增强多头注意力机制的Optuna-BiGRU测井岩性识别 被引量:2
11
作者 王婷婷 王振豪 +1 位作者 李方 赵万春 《地球科学与环境学报》 CAS 北大核心 2024年第1期127-142,共16页
测井岩性识别是油气勘探开发中至关重要的内容。针对现有算法模型在处理测井曲线数据时,无法有效捕获曲线内部深层关联和深度方向关系、拟合能力较弱、难以准确提取关键特征、噪声干扰以及模型超参数调优过程复杂困难等问题,提出了一种... 测井岩性识别是油气勘探开发中至关重要的内容。针对现有算法模型在处理测井曲线数据时,无法有效捕获曲线内部深层关联和深度方向关系、拟合能力较弱、难以准确提取关键特征、噪声干扰以及模型超参数调优过程复杂困难等问题,提出了一种通过Optuna超参数优化双向门循环单元(Optuna-BiGRU)结合增强多头注意力机制(EMHA)的测井岩性识别模型——Optuna-BiGRU-EMHA模型。该模型引入残差机制和层归一化以改进多头注意力机制模块,并结合双向门循环单元(BiGRU)解决了处理测井数据时的问题,同时使用Optuna超参数优化框架和小波包自适应阈值方法分别解决了超参数调优和噪声干扰问题。首先通过交会图分析和敏感性箱线图分析选取自然伽马、深感应电阻率、中子-密度孔隙度、平均中子-密度孔隙度和岩性密度5个特征参数的测井数据,通过小波包自适应阈值方法对数据进行去噪,并将测井数据分割成数据块,然后利用Optuna框架优化BiGRU-EMHA模型超参数,最后通过实验对比K-近邻算法(KNN)、随机森林(RF)、极端梯度提升算法(XGBoost)、长短期记忆(LSTM)神经网络、BiGRU、双向长短期记忆(BiLSTM)神经网络、BiGRU-MHA、Optuna-BiGRU-EMHA等8种模型在测井岩性识别中的精度。结果表明:Optuna-BiGRU-EMHA模型识别准确率达到80%,相对于传统机器学习模型和深度学习模型,综合岩性识别准确率分别提高15.94%~23.14%和3.93%~15.94%,该模型为常规测井岩性识别提供了坚实的理论支持。 展开更多
关键词 岩性识别 深度学习 BiGRU 增强多头注意力机制 小波包自适应阈值 超参数优化
在线阅读 下载PDF
基于注意力机制语义增强的文档级关系抽取 被引量:1
12
作者 柳先辉 吴文达 +1 位作者 赵卫东 侯文龙 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期822-828,共7页
文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间... 文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间关系的推理。具体来说,首先在数据编码模块改进编码策略,引入更多实体信息,通过编码网络捕获文档的语义特征,获得实体对矩阵;然后,设计了一个基于Attention门控机制的U-Net网络,对实体对矩阵进行局部信息捕获和全局信息汇总,实现语义增强;最后,使用自适应焦点损失函数缓解关系分布不平衡的问题。在4个公开的文档级关系抽取数据集(DocRED、CDR、GDA和DWIE)上评估了Att-DocuNet模型并取得了良好的实验结果。 展开更多
关键词 文档级关系抽取 注意力机制 语义增强 焦点损失
在线阅读 下载PDF
基于多尺度注意力和数据增强的细胞核分割 被引量:1
13
作者 张兴鹏 何东 +1 位作者 杨模 叶杭滨 《计算机工程》 北大核心 2025年第2期387-396,共10页
U-Net因结构简单且高效被广泛应用于医学分割领域。然而,U-Net的跳跃连接不能很好地弥补编码器和解码器之间的语义差距。而医学分割数据的标注要求严格,使得数据集数量和规模都较小。针对上述问题,设计多尺度注意力融合(MSAF)模块,旨在... U-Net因结构简单且高效被广泛应用于医学分割领域。然而,U-Net的跳跃连接不能很好地弥补编码器和解码器之间的语义差距。而医学分割数据的标注要求严格,使得数据集数量和规模都较小。针对上述问题,设计多尺度注意力融合(MSAF)模块,旨在利用注意力机制可调整网络学习方向的特点和多尺度特征融合来有效缓解语义偏差。MSAF模块在前2个阶段使用通道注意力来捕获全局特征;在后2个阶段使用空间注意力来捕获局部特征;最后将多个阶段提取的特征进行融合以增强特征信息。此外,提出基于傅里叶变换的数据增强(FTDA)方法解决医学分割数据集稀少的问题。FTDA通过扰动输入图像在频域中的幅度信息实现其相位信息的数据增强。在MoNuSeg、CryoNuSeg和2018 Data Science Bowl数据集上的实验结果表明,提出方法的mIoU和Dice指标比其他先进方法表现出更好的性能。此外,提出的FTDA方法对小规模数据集也具有较好的增益效果。 展开更多
关键词 注意力机制 U-Net模型 傅里叶变换 细胞核分割 数据增强
在线阅读 下载PDF
融合双向注意力和对比增强机制的多标签文本分类 被引量:1
14
作者 李建东 傅佳 李佳琦 《计算机工程与应用》 CSCD 北大核心 2024年第16期105-115,共11页
现有多标签文本分类模型面对文本序列增长时语义信息缺失,预测特定标签时忽略已有实例中的丰富知识等问题不能很好地解决,由此提出一种融合双向注意力和对比增强机制的多标签文本分类模型。结合BERT词嵌入,利用CTransformer模型分别获... 现有多标签文本分类模型面对文本序列增长时语义信息缺失,预测特定标签时忽略已有实例中的丰富知识等问题不能很好地解决,由此提出一种融合双向注意力和对比增强机制的多标签文本分类模型。结合BERT词嵌入,利用CTransformer模型分别获取序列的全局依赖关系和局部结构信息;使用双向注意力和标签嵌入进一步生成最终文本表示和标签表示,将文本信息与标签信息进行交互,得到更为全面的综合语义信息;利用对比增强机制进行KNN实例检索,设计一个多标签对比学习目标,使模型意识到KNN分类过程,并提高推理过程中检索邻居实例的质量。分类器根据标签表示和文本表示进行文本分类。为了评估模型的性能,在三个公开英文数据集上进行测试,实验结果表明提出的模型在P@K和nDCG@K指标上均优于其他主流基线模型。 展开更多
关键词 多标签文本分类 注意力机制 对比增强机制 CTransformer模型 多标签对比学习
在线阅读 下载PDF
融合双重注意力机制的缅甸语图像文本识别方法
15
作者 王奉孝 毛存礼 +3 位作者 余正涛 高盛祥 黄于欣 刘福浩 《中文信息学报》 北大核心 2025年第1期47-55,共9页
由于缅甸语字符具有独特的语言编码结构以及字符组合规则,现有图像文本识别方法在缅甸语图像识别任务中无法充分关注文字边缘的特征,会导致缅甸语字符上下标丢失的问题。因此,该文基于Transformer框架的图像文本识别方法做出改进,提出... 由于缅甸语字符具有独特的语言编码结构以及字符组合规则,现有图像文本识别方法在缅甸语图像识别任务中无法充分关注文字边缘的特征,会导致缅甸语字符上下标丢失的问题。因此,该文基于Transformer框架的图像文本识别方法做出改进,提出一种融合通道和空间注意力机制的视觉关注模块,旨在捕获像素级成对关系和通道依赖关系,降低缅甸语图像中噪声干扰,从而获得语义更完整的特征图。此外,在解码过程中,将基于多头注意力的解码单元组合为解码器,用于将特征序列转化为缅甸语文字。实验结果表明,该方法在自构的缅甸语图像文本识别数据集上相比Transformer识别准确率提高0.5%,达到95.3%。 展开更多
关键词 缅甸语 文本识别 通道和空间注意力 特征增强 文字边缘特征
在线阅读 下载PDF
基于双重注意力机制的多尺度指代目标分割方法
16
作者 胡梦楠 王蓉 +1 位作者 张文靖 张琪 《计算机辅助设计与图形学学报》 北大核心 2025年第1期148-156,共9页
针对指代分割任务中视觉和语言间缺乏充分的跨模态交互、不同尺寸的目标空间和语义信息存在差异的问题,提出了基于双重注意力机制的多尺度指代目标分割方法.首先,利用语言表达中不同类型的信息关键词来增强视觉和语言特征的跨模态对齐,... 针对指代分割任务中视觉和语言间缺乏充分的跨模态交互、不同尺寸的目标空间和语义信息存在差异的问题,提出了基于双重注意力机制的多尺度指代目标分割方法.首先,利用语言表达中不同类型的信息关键词来增强视觉和语言特征的跨模态对齐,并使用双重注意力机制捕捉多模态特征间的依赖性,实现模态间和模态内的交互;其次,利用语言特征作为引导,从其他层次的特征中聚合与目标相关的视觉信息,进一步增强特征表示;然后利用双向ConvLSTM以自下而上和自上而下的方式逐步整合低层次的空间细节和高层次的语义信息;最后,利用不同膨胀因子的空洞卷积融合多尺度信息,增加模型对不同尺度分割目标的感知能力.此外,在UNC,UNC+,GRef和ReferIt基准数据集上进行实验,实验结果表明,文中方法在UNC,UNC+,GRef和ReferIt上的oIoU指标分别提高了1.81个百分点、1.26个百分点、0.84个百分点和0.32个百分点,广泛的消融研究也验证了所提方法中各组成部分的有效性. 展开更多
关键词 指代目标分割 跨模态交互 特征增强 注意力机制 多尺度融合
在线阅读 下载PDF
基于多维度注意力机制和复数Conformer的单通道语音增强方法
17
作者 高盛祥 莫尚斌 +2 位作者 余正涛 董凌 王文君 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第2期393-403,共11页
为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-... 为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-Net架构下引入复数Conformer,对语音幅度和相位的相关性进行建模;利用多维度注意力机制,构造更加丰富的特征来增强卷积层的表示能力;在残差连接中加入注意力门控机制强化重构语音的细节信息。实验结果显示,相比于深度复数卷积递归网络,SE-MDACC的客观评价指标语音质量感知评估和短时客观可懂度分别提升15.299%、1.462%,表明SE-MDACC可充分提取语音声学特征并对幅度和相位相关性进行合理建模,有效提升语音质量和可理解性。 展开更多
关键词 深度复数网络 声学特征 关联信息 多维度注意力机制 语音增强
在线阅读 下载PDF
基于多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合
18
作者 邸敬 梁婵 +2 位作者 任莉 郭文庆 廉敬 《红外技术》 CSCD 北大核心 2024年第7期754-764,共11页
针对目前红外与可见光图像融合存在特征提取不足、融合图像目标区域不显著、细节信息缺失等问题,提出了一种多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合方法。首先,设计了多尺度对比度增强模块,以增强目标区域强度... 针对目前红外与可见光图像融合存在特征提取不足、融合图像目标区域不显著、细节信息缺失等问题,提出了一种多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合方法。首先,设计了多尺度对比度增强模块,以增强目标区域强度信息利于互补信息的融合;其次,采用密集连接块进行特征提取,减少信息损失最大限度利用信息;接着,设计了一种跨维度交互注意力机制,有助于捕捉关键信息,从而提升网络性能;最后,设计了从融合图像到源图像的分解网络使融合图像包含更多的场景细节和更丰富的纹理细节。在TNO数据集上对提出的融合框架进行了评估实验,实验结果表明本文方法所得融合图像目标区域显著,细节纹理丰富,具有更优的融合性能和更强的泛化能力,主观性能和客观评价优于其他对比方法。 展开更多
关键词 红外与可见光图像融合 多尺度对比度增强 跨模态交互注意力机制 分解网络
在线阅读 下载PDF
基于多尺度注意力机制的RAW图像重建
19
作者 张科 刘昱 胡凯 《北京航空航天大学学报》 北大核心 2025年第1期257-264,共8页
针对传统图像信号处理(ISP)算法繁琐的问题,基于可取代ISP算法的PyNET网络模型,提出一种端到端的RAW图像重建方法Py-CBAM。通过引入高效的注意力机制,并利用该机制对原有网络的多层级多尺度结构进行重设计,实现不同尺度特征的自适应加权... 针对传统图像信号处理(ISP)算法繁琐的问题,基于可取代ISP算法的PyNET网络模型,提出一种端到端的RAW图像重建方法Py-CBAM。通过引入高效的注意力机制,并利用该机制对原有网络的多层级多尺度结构进行重设计,实现不同尺度特征的自适应加权,以较大程度提升图像重建的性能。实验结果表明,所提方法在公开的ZRR数据集上获得的峰值信噪比(PSNR)与PyNET方法相比提升了0.37 dB,结构相似度(SSIM)提升了0.0018。将ZRR数据集和新构建的NRR数据集联合对Py-CBAM重新训练后,PSNR和SSIM分别达到25.73 dB和0.9654。视觉效果上,所提方法解决了RAW图像重建时的噪声高与色彩失真、畸变等问题,增强模型在多场景不同光照环境条件下的重建能力;重建结果较为真实,视觉质量最优,在图像过曝和过暗区域视觉提升效果较为明显。 展开更多
关键词 图像信号处理 图像重建 增强网络 注意力机制 深度学习
在线阅读 下载PDF
结合残差与双注意力机制的U-Net语音增强方法
20
作者 许春冬 王磊 +2 位作者 胡菁兰 闵源 徐锦武 《计算机工程与设计》 北大核心 2024年第11期3383-3389,共7页
针对U-Net语音增强网络深层特征提取能力不足,以及编解码过程中特征信息丢失问题,提出一种结合残差与双注意力机制的DA-Res-Unet语音增强方法。将U-Net编解码部分设计为残差结构来深化网络,增强深层特征提取能力;在网络结构中构造双注... 针对U-Net语音增强网络深层特征提取能力不足,以及编解码过程中特征信息丢失问题,提出一种结合残差与双注意力机制的DA-Res-Unet语音增强方法。将U-Net编解码部分设计为残差结构来深化网络,增强深层特征提取能力;在网络结构中构造双注意力机制,减少时频特征提取中的细节信息丢失;在网络中融入空洞空间金字塔池化结构,在低参数量情况下融合不同尺度上下文背景信息,提高模型特征捕获能力。实验结果表明,DA-Res-Unet网络模型在可见噪声测试集上的PESQ、STOI和LSD这3种评测指标取得了不同程度的提升,在未知噪声测试集上具备一定优势。 展开更多
关键词 语音增强 深度学习 残差网络 特征提取 编解码结构 注意力机制 空洞空间池化金字塔
在线阅读 下载PDF
上一页 1 2 51 下一页 到第
使用帮助 返回顶部