期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于多维度注意力机制和复数Conformer的单通道语音增强方法
1
作者 高盛祥 莫尚斌 +2 位作者 余正涛 董凌 王文君 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第2期393-403,共11页
为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-... 为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-Net架构下引入复数Conformer,对语音幅度和相位的相关性进行建模;利用多维度注意力机制,构造更加丰富的特征来增强卷积层的表示能力;在残差连接中加入注意力门控机制强化重构语音的细节信息。实验结果显示,相比于深度复数卷积递归网络,SE-MDACC的客观评价指标语音质量感知评估和短时客观可懂度分别提升15.299%、1.462%,表明SE-MDACC可充分提取语音声学特征并对幅度和相位相关性进行合理建模,有效提升语音质量和可理解性。 展开更多
关键词 深度复数网络 声学特征 关联信息 多维度注意力机制 语音增强
在线阅读 下载PDF
基于双维信息与剪枝的中文猕猴桃文本命名实体识别方法
2
作者 齐梓均 牛当当 +3 位作者 吴华瑞 张礼麟 王仑峰 张宏鸣 《智慧农业(中英文)》 2025年第1期44-56,共13页
[目的/意义]中文猕猴桃文本在段落上下文主题与字符间的左右关系中,展现出垂直与水平双维度特性。若能充分利用中文猕猴桃文本的双维特性,将有助于进一步提升命名实体识别的识别效果。基于此,提出了一种基于双维信息与剪枝的命名实体识... [目的/意义]中文猕猴桃文本在段落上下文主题与字符间的左右关系中,展现出垂直与水平双维度特性。若能充分利用中文猕猴桃文本的双维特性,将有助于进一步提升命名实体识别的识别效果。基于此,提出了一种基于双维信息与剪枝的命名实体识别方法,命名为KIWI-Coord-Prune(kiwifruit-CoordKIWINER-PruneBiLSTM)。[方法]通过设计CoordKIWINER与PruneBi-LSTM两个模块,对中文猕猴桃文本中的双维信息进行精准处理。其中CoordKIWINER模块能够显著提升模型捕捉复杂和嵌套实体的能力,从而生成涵盖更多文本信息的加强字符矢量;PruneBi-LSTM模块在上一模块的基础上,加强了模型对重要特征的学习与识别能力,从而进一步提升了实体识别效果。[结果和讨论]在自建数据集KIWIPRO和四个公开数据集人民日报(People's Daily)、ClueNER、Boson,以及ResumeNER上进行试验,并与LSTM、Bi-LSTM、LR-CNN、Softlexicon-LSTM,以及KIWINER五个先进模型进行对比,本研究提出的方法在5个数据集上分别取得了较好的F1值,分别为89.55%、91.02%、83.50%、83.49%和95.81%。[结论]与现有方法相比,本研究提出的方法不仅能够有效提升中文猕猴桃领域文本的命名实体识别效果,且具有一定的泛化性,同时也能够为相关知识图谱和问答系统的构建等下游任务提供技术支持。 展开更多
关键词 中文命名实体识别 猕猴桃文本 自建数据集 多维度注意力机制 剪枝 深度学习 文本特征增强
在线阅读 下载PDF
基于改进YOLOv8的SAR舰船目标检测算法
3
作者 谷岳 邓松峰 +2 位作者 沈霁 穆文涛 赵恩棋 《计算机与现代化》 2024年第12期78-83,共6页
为了提高SAR图像中舰船目标检测的准确性,特别是在面对目标大小不均、分布密集和复杂背景的挑战时,提出一种基于YOLOv8改进的YOLO-3M舰船目标检测算法。首先,算法引入多尺度膨胀卷积特征提取模块(Multiscale Dilated Convolution Block,... 为了提高SAR图像中舰船目标检测的准确性,特别是在面对目标大小不均、分布密集和复杂背景的挑战时,提出一种基于YOLOv8改进的YOLO-3M舰船目标检测算法。首先,算法引入多尺度膨胀卷积特征提取模块(Multiscale Dilated Convolution Block,MSDB)到主干网络中,使用多个膨胀率不同的卷积来提取多尺度特征,在不增加计算成本的情况下增大了感受野;其次,在颈部网络中引入多维度协作注意力机制(Multidimensional Collaborative Attention,MCA),在通道、高度和宽度3个维度上捕捉关键特征,实现不同维度信息的交互,帮助网络有效地关注到复杂背景中的关键部分;最后,在检测头引入MPDIoU损失函数,以应对现有损失函数在处理预测边界框与实际边界框时,尽管长宽比相同但宽度和高度数值完全不同时无法有效进行检测的问题。在SSDD数据集上的实验结果表明,本文算法在准确率和平均精度更高的同时,有效减少了参数量和计算量,使得模型更轻量并更适合于资源受限的环境,并且在复杂舰船的误检和漏检情况上有了显著的改善。 展开更多
关键词 舰船检测 SAR图像 YOLOv8 多尺度膨胀卷积模块 多维度协作注意力机制 MPDIoU
在线阅读 下载PDF
面向社区问答匹配的混合神经网络模型 被引量:3
4
作者 张衍坤 陈羽中 刘漳辉 《小型微型计算机系统》 CSCD 北大核心 2020年第9期1833-1838,共6页
问答匹配是社区问答的一项重要且具有挑战性的任务.本文提出了一种面向社区问答匹配的混合神经网络模型.针对问答对序列,提出了融合卷积神经网络(CNN)与双向长短期记忆网络(Bi-LSTM)的混合模型,学习问答对的语义信息及问答对序列的上下... 问答匹配是社区问答的一项重要且具有挑战性的任务.本文提出了一种面向社区问答匹配的混合神经网络模型.针对问答对序列,提出了融合卷积神经网络(CNN)与双向长短期记忆网络(Bi-LSTM)的混合模型,学习问答对的语义信息及问答对序列的上下文相关性信息;针对用户的历史回答,提出基于多维度注意力机制的用户-问题建模方法,学习用户与问题之间的相关性信息.在SemEval-2015CQA数据集上的实验结果表明,与现有的社区问答匹配算法相比,本文算法能够有效提高社区问答匹配精度. 展开更多
关键词 社区问答 问答匹配 多维度注意力机制 用户建模
在线阅读 下载PDF
基于3A-RCNN网络的说话人识别研究
5
作者 李建文 赵统军 《电子技术与软件工程》 2020年第14期23-27,共5页
本文为了更加有针对性的从语音信息中筛选出说话人的身份信息,减少冗余信息,提出一种将通道维度、时间维度、频率维度三种维度的多重注意力机制嵌入每个残差块末端的模型(3A-RCNN)。结果表明,3A-RCNN模型收敛后平均准确率达到98.0%。相... 本文为了更加有针对性的从语音信息中筛选出说话人的身份信息,减少冗余信息,提出一种将通道维度、时间维度、频率维度三种维度的多重注意力机制嵌入每个残差块末端的模型(3A-RCNN)。结果表明,3A-RCNN模型收敛后平均准确率达到98.0%。相比于ResCNN和CNN-LSTM模型准确率分别提升5.48%和2.72%。 展开更多
关键词 多维度注意力机制 残差块末端嵌入 说话人识别 3A-RCNN网络 梅尔语谱图
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部