-
题名基于嵌入式注意机制的目标语音提取算法
被引量:2
- 1
-
-
作者
郭志楷
杨明堃
蒋国峰
陶祁
刘欢欢
马红强
-
机构
空军工程大学航空机务士官学校航空电子工程系
-
出处
《计算机测量与控制》
2023年第10期174-181,共8页
-
文摘
针对说话人语音提取问题,提出了一种基于深度神经网络多任务学习的嵌入式注意机制单声道说话人语音提取方法;该算法将语音分离和语音提取统一到单个框架中,向频谱映射分离模型中嵌入说话人注意机制,并在引入说话人辅助信息的注意机制中得到时变注意权重,利用时变注意权重分离出目标说话人的内部嵌入向量,随后采用提取模型对目标说话人的嵌入向量进行非线性处理运算,估计出目标说话人对应的掩蔽,进而提取出目标说话人语音;同时借助TIMIT数据集,进行了语音提取实验;实验结果验证了所提算法的可行性和有效性,并在说话人语音提取的性能上有明显的优越性。
-
关键词
深度神经网络
单声道说话人语音提取
多任务学习
嵌入式注意机制
-
Keywords
deep neural network
monophonic speaker speech extraction
multi-task learning
embedded attention mechanism
-
分类号
TN912
[电子电信—通信与信息系统]
-