期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于门控残差卷积编解码网络的单通道语音增强方法 被引量:6
1
作者 张天骐 柏浩钧 +1 位作者 叶绍鹏 刘鉴兴 《信号处理》 CSCD 北大核心 2021年第10期1986-1995,共10页
针对卷积编解码网络(CED,Convolution encoder-and-decoder)对语音时序相关信息捕获困难的问题,本文提出了一种基于门控残差卷积编解码网络的语音增强方法。该方法在卷积编解码网络的基础上引入了门控机制、膨胀卷积与残差连接:门控机... 针对卷积编解码网络(CED,Convolution encoder-and-decoder)对语音时序相关信息捕获困难的问题,本文提出了一种基于门控残差卷积编解码网络的语音增强方法。该方法在卷积编解码网络的基础上引入了门控机制、膨胀卷积与残差连接:门控机制能够很好地处理序列前后相关信息;膨胀卷积使得卷积过程获得更大的感受野,提取更加丰富的全局信息;残差连接能够防止梯度消失与梯度爆炸,提升网络精度。此外,采用频域损失函数与时域评价指标联合优化的策略对网络进行训练,以进一步提升网络增强效果。实验表明,在匹配噪声和不匹配噪声下,相比于基线CED与其他对比方法,本文方法取得了更高的PESQ、STOI与SI-SDR,对语音的清浊音都有较好恢复效果,且具有较强的泛化能力。 展开更多
关键词 语音增强 门控机制 卷积编解码网络 残差连接
在线阅读 下载PDF
基于卷积编解码网络的自由感应衰减信号提取方法
2
作者 王琦 杜海龙 +1 位作者 陈玫玫 韦健 《实验技术与管理》 CAS 北大核心 2022年第1期59-61,65,共4页
在实际应用中,自由感应衰减信号(FID)数据中通常含有大量噪声干扰,直接影响了检测结果的准确性。该文针对上述问题,设计了一种基于卷积编解码网络的FID信号提取方法。即在卷积神经网络的框架下,通过训练学习复杂噪声背景下FID数据时频... 在实际应用中,自由感应衰减信号(FID)数据中通常含有大量噪声干扰,直接影响了检测结果的准确性。该文针对上述问题,设计了一种基于卷积编解码网络的FID信号提取方法。即在卷积神经网络的框架下,通过训练学习复杂噪声背景下FID数据时频谱与纯净FID信号时频谱之间的映射关系,实现FID信号的噪声压制,再经短时傅里叶逆变换完成FID信号的提取。在卷积网络训练中同时考虑了FID信号的实部和虚部特征,更好地保留了其相位信息。实验结果表明:提出的FID信号提取方法可以在多种噪声同时存在的情况下有效地压制噪声,且不损失FID信号。该方法可作为深度学习课程的验证性实验,也可作为创新性实验内容。 展开更多
关键词 自由感应衰减 卷积编解码网络 时频谱
在线阅读 下载PDF
基于卷积编解码器和门控循环单元的语音分离算法 被引量:7
3
作者 陈修凯 陆志华 周宇 《计算机应用》 CSCD 北大核心 2020年第7期2137-2141,共5页
在大部分基于深度学习的语音分离和语音增强算法中,把傅里叶变换后的频谱特征作为神经网络的输入特征,并未考虑到语音信号中的相位信息。然而过去的一些研究表明,尤其是在低信噪比(SNR)条件下,相位信息对于提高语音质量是必不可少的。... 在大部分基于深度学习的语音分离和语音增强算法中,把傅里叶变换后的频谱特征作为神经网络的输入特征,并未考虑到语音信号中的相位信息。然而过去的一些研究表明,尤其是在低信噪比(SNR)条件下,相位信息对于提高语音质量是必不可少的。针对这个问题,提出了一种基于卷积编解码器网络和门控循环单元(CED-GRU)的语音分离算法。首先,利用原始波形既包含幅值信息也包含相位信息的特点,在输入端以混合语音信号的原始波形作为输入特征;其次,通过结合卷积编解码器(CED)网络和门控循环单元(GRU)网络,可以有效解决语音信号中存在的时序问题。提出的改进算法在男性和男性、男性和女性、女性和女性的语音质量的感知评价(PESQ)和短时目标可懂度(STOI)方面,与基于排列不变训练(PIT)算法、基于深度聚类(DC)算法、基于深度吸引网络(DAN)算法相比,分别提高了1.16和0.29、1.37和0.27、1.08和0.3;0.87和0.21、1.11和0.22、0.81和0.24;0.64和0.24、1.01和0.34、0.73和0.29个百分点。实验结果表明,基于CED-GRU的语音分离系统在实际应用中具有较大的价值。 展开更多
关键词 卷积神经网络 卷积编解码 门控循环单元 端到端 语音分离
在线阅读 下载PDF
一种新的胎心率信号压缩方法——卷积编解码网络 被引量:1
4
作者 阙与清 陈定科 +1 位作者 童蕾 陈超敏 《南方医科大学学报》 CAS CSCD 北大核心 2021年第2期279-284,共6页
为减少物联网系统中数据传输和存储的能量损失,提高胎心率数据的传输效率,实现胎儿的实时监控,本文使用卷积编解码器网络(CC-Net)压缩数据。网络有两个模块:编码和解码,在编码模块中,原始数据被压缩;在解码模块中,压缩数据被重建。然后... 为减少物联网系统中数据传输和存储的能量损失,提高胎心率数据的传输效率,实现胎儿的实时监控,本文使用卷积编解码器网络(CC-Net)压缩数据。网络有两个模块:编码和解码,在编码模块中,原始数据被压缩;在解码模块中,压缩数据被重建。然后,通过使用原始信号和重建信号的均方误差来连续更新内部参数,以使误差最小。最后,在编码模块中获得有效的压缩数据。在本研究中,该方法对胎儿心率信号的压缩率达到了12.07%,重构信号与原始信号之间的误差为0.03。本研究提出的卷积编解码器网络(CC-Net)可以实现非常低的胎儿心率压缩率,并且可以确保重建的信号与原始信号非常相似,表明压缩方法是有效的,并且保留了胎儿心率信号的重要信息。 展开更多
关键词 物联网 母婴监测系统 卷积编解码器网络 胎心率 数据压缩
在线阅读 下载PDF
基于冗余卷积编解码器的变压器噪声抑制 被引量:3
5
作者 辛全金 李晓华 +2 位作者 杨义 李俊聪 夏能弘 《中国电力》 CSCD 北大核心 2023年第4期112-118,共7页
变压器运行过程中产生的声信号是评估变压器运行状态以及变电站噪声水平的重要依据。提出一种基于冗余卷积编解码器网络(redundant convolutional encoder decoder,RCED)的变压器噪声抑制方法,利用短时傅立叶变换得到干净声信号和含噪... 变压器运行过程中产生的声信号是评估变压器运行状态以及变电站噪声水平的重要依据。提出一种基于冗余卷积编解码器网络(redundant convolutional encoder decoder,RCED)的变压器噪声抑制方法,利用短时傅立叶变换得到干净声信号和含噪声信号的时频特征,构建了变压器声信号降噪模型。通过对某换流站换流变压器的噪声信号进行测试验证,结果表明:所提模型具有较好的降噪效果,所提方法对于变压器声纹振动在线监测系统以及变电站噪声的准确检测具有参考意义。 展开更多
关键词 电力变压器 声信号预处理 冗余卷积编解码 信噪分离
在线阅读 下载PDF
基于深度卷积编解码网络的fNIRS成像技术研究 被引量:4
6
作者 李铁妮 刘东远 +2 位作者 张鹏睿 李志勇 高峰 《中国激光》 EI CAS CSCD 北大核心 2023年第21期96-104,共9页
在功能性近红外光谱(fNIRS)成像技术的实现中,扩散光学层析成像(DOT)具有改善定量性和分辨率的巨大潜力,但其效果受制于生理干扰(呼吸、心跳和低频振荡等)、检测系统的随机噪声以及有限测量数据量带来的不适定性。为增强fNIRS-DOT成像... 在功能性近红外光谱(fNIRS)成像技术的实现中,扩散光学层析成像(DOT)具有改善定量性和分辨率的巨大潜力,但其效果受制于生理干扰(呼吸、心跳和低频振荡等)、检测系统的随机噪声以及有限测量数据量带来的不适定性。为增强fNIRS-DOT成像的性能,本文提出了一种基于模型先验信息的深度卷积编解码网络重建方法,利用分层半三维重建算法实现对表层和深层脑血氧变化信息的初步区分,发挥卷积、编解码网络对空间特征的学习能力,实现对深层脑激活信息的提取重建。为验证所提重建方法的有效性,开展了数值模拟和仿体实验,并将其与传统重建方法进行对比。结果表明,所提重建法不仅可以显著提高重建精度,极大地缩短重建时间,而且具有优异的泛化能力,为实现动态fNIRS成像提供了重要参考。 展开更多
关键词 生物光学 功能性近红外光谱成像 分层半三维重建 深度卷积编解码网络
原文传递
融合通道注意力机制和深度编解码卷积网络的道路场景分割 被引量:4
7
作者 黄泽华 丁学明 《小型微型计算机系统》 CSCD 北大核心 2021年第11期2362-2367,共6页
针对深度编解码卷积网络在道路场景分割中没有考虑对各卷积特征图通道依赖性的问题,提出了一种融合通道注意力机制的深度编解码卷积网络,并将通道注意力机制改进为双路通道注意力机制.该方法保留了原有通道注意力机制能优化背景信息的优... 针对深度编解码卷积网络在道路场景分割中没有考虑对各卷积特征图通道依赖性的问题,提出了一种融合通道注意力机制的深度编解码卷积网络,并将通道注意力机制改进为双路通道注意力机制.该方法保留了原有通道注意力机制能优化背景信息的优点,同时增加另一路通道用来收集到难区分物体之间重要的特征,从而获得详细的通道注意力.实验结果表明,对于道路场景图像,融合双路通道注意力机制的深度编解码卷积网络进一步提高了分割性能,其中在评价指标准确率和平均交并比分别提高了约7个百分点和8个百分点. 展开更多
关键词 道路场景分割 深度编解码卷积网络 通道注意力机制 分割性能
在线阅读 下载PDF
一种基于卷积神经网络的端到端语音分离方法 被引量:13
8
作者 范存航 刘斌 +2 位作者 陶建华 温正棋 易江燕 《信号处理》 CSCD 北大核心 2019年第4期542-548,共7页
大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方... 大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理。然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用。为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法。这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构。跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得。我们在TIMIT数据集上验证本文提出的方法。实验结果表明,本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training,uPIT)基线方法,对于信号失真比(signal-to-distortion ratio,SDR)相对提高了16.06%。 展开更多
关键词 说话人独立语音分离 鸡尾酒会问题 端到端 卷积编解码
在线阅读 下载PDF
一种密集卷积神经网络的电视语音响度补偿方法
9
作者 谢仁礼 秦宇 罗雪倩 《电声技术》 2021年第6期18-24,共7页
现有的电视语音响度补偿是针对人耳听阈和听力障碍的损失进行均衡补偿,这类方法会放大同频段的非人声。针对这类方法的缺陷,提出利用深度学习语音增强技术将人声从电视节目音频中分离出来,使用户直接听到清晰人声。对此提出密集连接卷... 现有的电视语音响度补偿是针对人耳听阈和听力障碍的损失进行均衡补偿,这类方法会放大同频段的非人声。针对这类方法的缺陷,提出利用深度学习语音增强技术将人声从电视节目音频中分离出来,使用户直接听到清晰人声。对此提出密集连接卷积网络(Densely Connected Convolutional Network,DenseNet)结合卷积神经网络编解码器(Convolutional Encoder-Decoder,CED)结构的新型神经网络语音增强模型。该模型量级较轻,能够在电视上实时运行,与同量级网络参数的卷积神经网络(Convolutional Neural Networks,CNN)语音增强模型相比,效果更好且模型更小。 展开更多
关键词 密集连接卷积神经网络 卷积编解码 实时语音增强 残差连接
在线阅读 下载PDF
IEEE 802.11a物理层链路中的删余及交织技术研究 被引量:3
10
作者 卢继华 杨博 陈奎熹 《北京理工大学学报》 EI CAS CSCD 北大核心 2012年第6期611-616,共6页
搭建了基于正交频分复用(OFDM)的IEEE 802.11a的物理层链路平台,并针对链路平台中编译码模块,分别对其中的删余及交织环节进行了改进.基于特比译维码原理提出了一种改进的删余方法,并在其他物理层参数固定前提下,针对不同Eb/N0进行理论... 搭建了基于正交频分复用(OFDM)的IEEE 802.11a的物理层链路平台,并针对链路平台中编译码模块,分别对其中的删余及交织环节进行了改进.基于特比译维码原理提出了一种改进的删余方法,并在其他物理层参数固定前提下,针对不同Eb/N0进行理论分析与链路性能仿真;基于改进的卷积编码器提出了一种改进的矩阵交织器结构.仿真结果表明,提出的删余方法比IEEE 802.11a标准中的相应方法在系统误码率性能方面大约有3dB的提高;改进的矩阵交织结构在Eb/N0大于5dB时,误码率有1~2dB的改善. 展开更多
关键词 IEEE 802.11A标准 删余 卷积编解码 交织 正交频分复用
在线阅读 下载PDF
基于跳跃连接注意力网络的音乐分离 被引量:1
11
作者 王岚 《电声技术》 2022年第2期29-32,共4页
在对音乐进行歌声与伴奏分离过程中,基于卷积编解码的分离模型虽然在一定程度上提升了分离效果,但网络存在丢失信息的问题。为了解决这个问题,提出一种有效的歌声与伴奏分离的模型。传统方法指的是非深度学习模型,本文在基于深度学习模... 在对音乐进行歌声与伴奏分离过程中,基于卷积编解码的分离模型虽然在一定程度上提升了分离效果,但网络存在丢失信息的问题。为了解决这个问题,提出一种有效的歌声与伴奏分离的模型。传统方法指的是非深度学习模型,本文在基于深度学习模型的基础上进行改进,通过在卷积编解码器的跳跃连接部分加入注意力机制,解决了网络丢失重要信息的问题,提高了分离性能。在开源数据集MUSDB18上进行验证,结果表明所提的模型分离效果良好。 展开更多
关键词 歌声与伴奏分离 卷积编解码 注意力
在线阅读 下载PDF
MAAUNet:Exploration of U-shaped encoding and decoding structure for semantic segmentation of medical image 被引量:1
12
作者 SHAO Shuo GE Hongwei 《Journal of Measurement Science and Instrumentation》 CAS CSCD 2022年第4期418-429,共12页
In view of the problems of multi-scale changes of segmentation targets,noise interference,rough segmentation results and slow training process faced by medical image semantic segmentation,a multi-scale residual aggreg... In view of the problems of multi-scale changes of segmentation targets,noise interference,rough segmentation results and slow training process faced by medical image semantic segmentation,a multi-scale residual aggregation U-shaped attention network structure of MAAUNet(MultiRes aggregation attention UNet)is proposed based on MultiResUNet.Firstly,aggregate connection is introduced from the original feature aggregation at the same level.Skip connection is redesigned to aggregate features of different semantic scales at the decoder subnet,and the problem of semantic gaps is further solved that may exist between skip connections.Secondly,after the multi-scale convolution module,a convolution block attention module is added to focus and integrate features in the two attention directions of channel and space to adaptively optimize the intermediate feature map.Finally,the original convolution block is improved.The convolution channels are expanded with a series convolution structure to complement each other and extract richer spatial features.Residual connections are retained and the convolution block is turned into a multi-channel convolution block.The model is made to extract multi-scale spatial features.The experimental results show that MAAUNet has strong competitiveness in challenging datasets,and shows good segmentation performance and stability in dealing with multi-scale input and noise interference. 展开更多
关键词 U-shaped attention network structure of MAAUNet convolutional neural network encoding-decoding structure attention mechanism medical image semantic segmentation
在线阅读 下载PDF
Multivariate time series prediction based on AR_CLSTM 被引量:2
13
作者 QIAO Gangzhu SU Rong ZHANG Hongfei 《Journal of Measurement Science and Instrumentation》 CAS CSCD 2021年第3期322-330,共9页
Time series is a kind of data widely used in various fields such as electricity forecasting,exchange rate forecasting,and solar power generation forecasting,and therefore time series prediction is of great significanc... Time series is a kind of data widely used in various fields such as electricity forecasting,exchange rate forecasting,and solar power generation forecasting,and therefore time series prediction is of great significance.Recently,the encoder-decoder model combined with long short-term memory(LSTM)is widely used for multivariate time series prediction.However,the encoder can only encode information into fixed-length vectors,hence the performance of the model decreases rapidly as the length of the input sequence or output sequence increases.To solve this problem,we propose a combination model named AR_CLSTM based on the encoder_decoder structure and linear autoregression.The model uses a time step-based attention mechanism to enable the decoder to adaptively select past hidden states and extract useful information,and then uses convolution structure to learn the internal relationship between different dimensions of multivariate time series.In addition,AR_CLSTM combines the traditional linear autoregressive method to learn the linear relationship of the time series,so as to further reduce the error of time series prediction in the encoder_decoder structure and improve the multivariate time series Predictive effect.Experiments show that the AR_CLSTM model performs well in different time series predictions,and its root mean square error,mean square error,and average absolute error all decrease significantly. 展开更多
关键词 encoder_decoder attention mechanism CONVOLUTION autoregression model multivariate time series
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部