基于深度学习的声学模型研究被引量：3

Research on Acoustic Model Based on Deep Learning

在线阅读下载PDF

导出

摘要近年来,深度学习凭借其优越的性能广泛应用于图像处理、自然语言处理、语音识别等领域,它对性能的提升远超于以往的传统方法。论文采取循环神经网络(Recurrent Neural Networks,RNN)中的长短期记忆模型(Long Short Time Memory,LSTM)实现了语音识别中的声学模型构建,并增加反向时序信息对训练的影响,构成了双向长短期记忆模型(Bi-directional Long Short Time Memory,BLSTM)。语音信号是一种复杂的时变信号,而BLSTM能够在处理时间序列数据的同时,选择性地记住有效信息,丢弃无用信息,实验表明该方法的识别率较传统的高斯混合模型-隐马尔可夫模型(Gaussian Mixture Model-Hidden Markov Model,GMM-HMM)有显著的提高。 In recent years,deep learning has been widely used in many fields with its advantages,such as image processing,natural language processing,speech recognition and so on.It improves performance far beyond the traditional methods.In this pa⁃per,the long short time memory(LSTM)model of recurrent neural networks(RNN)is used to construct the acoustic model in speech recognition,and the effect of reverse timing information on training is added to form the bi-directional long short time memo⁃ry(BLSTM).Speech signal is a complex time-varying signal.BLSTM can selectively remember valid information and discard use⁃less information while processing time series data.Experiments show that the recognition accuracy of BLSTM is significantly im⁃proved compared with the traditional Gauss Mixture Model-Hidden Markov Model(GMM-HMM).

作者沈东风张二华 SHEN Dongfeng;ZHANG Erhua(School of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing 210094)

机构地区南京理工大学计算机科学与工程学院

出处《计算机与数字工程》 2021年第2期315-321,共7页 Computer & Digital Engineering

基金军委装备发展部十三五装备预研领域基金项目(编号:61403120102)资助。

关键词语音识别声学模型深度学习 BLSTM speech recognition acoustic model deep learning BLSTM

分类号 O141.4 [理学—基础数学]

引文网络
相关文献

参考文献9

1詹新明,黄南山,杨灿.语音识别技术研究进展[J].现代计算机,2008,14(9):43-45. 被引量：44
2山世光,阚美娜,刘昕,刘梦怡,邬书哲.深度学习:多层神经网络的复兴与变革[J].科技导报,2016,34(14):60-70. 被引量：38
3杨丽,吴雨茜,王俊丽,刘义理.循环神经网络研究综述[J].计算机应用,2018,38(A02):1-6. 被引量：443
4戴礼荣,张仕良,黄智颖.基于深度学习的语音识别技术现状与展望[J].数据采集与处理,2017,32(2):221-231. 被引量：73
5居治华,刘罡,陈琦岚,吕微,阮佳慧,武业皓.基于反向卷积的Bi-LSTM语音识别[J].软件导刊,2018,17(7):27-30. 被引量：6
6李云红,王成,王延年.基于混合DBNN-BLSTM模型的大词汇量连续语音识别[J].纺织高校基础科学学报,2018,31(1):103-107. 被引量：9
7黄光许,田垚,康健,刘加,夏善红.低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统[J].计算机应用研究,2017,34(2):392-396. 被引量：22
8舒帆,屈丹,张文林,周利莉,郭武.采用长短时记忆网络的低资源语音识别方法[J].西安交通大学学报,2017,51(10):120-127. 被引量：20
9侯一民,周慧琼,王政一.深度学习在语音识别中的研究进展综述[J].计算机应用研究,2017,34(8):2241-2246. 被引量：82

二级参考文献71

1林坤辉,息晓静,周昌乐.基于HMM与神经网络的声学模型研究[J].厦门大学学报（自然科学版）,2006,45(1):44-46. 被引量：13
2易克初,田斌,付强.语音信号处理.北京:国防工业出版社,2003:160-197
3Lippmann R, Singer E. Hybrid Neural HMM Approaches Wordspotting ICASSP
4McCulloeh W S, Pitts W. A logical calculus of the ideas immanent in nervous activity[J]. Bulletin of Mathematical Biophysics. 1943, 5(4): 115-133.
5Hebb D O. The organization of behavior[M]. New York: Wiley, 1949.
6Rosenblatt F. The pereeptron: A probal,ilistic model for information storage and organization in the brain[J]. Psyehological Review, 1958.65(6): 386-408.
7Rumelhart D E. Hinton G E. Williams R J. Learning internal representations by error propagalion[J]. Nature. 323. 1986. ttoi: 10.1016/B978-1-4832- 1446-7.50035-2.
8Hornik K, Stinchcombe M, White H. Muhilayer feedforward networks are universal approximators[J]. Neural Networks. 1989. 2(2): 359-366.
9Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313: 504-507.
10Hinton G E, Osindero S, Teh Y. A fast learning algorithm for deep belief nets[J]. Neural Computation, 2006, 18: 1527-1554.

共引文献698

1吴煌,杨智成,李梦华.基于长短期记忆神经网络的矿井涌水量预测[J].中国水运（下半月）,2023,23(3):25-27. 被引量：4
2姚晨明,姚磊.基于智能感知与数据决策的疏浚与通航预警系统研发[J].中国水运（下半月）,2022,22(9):35-36. 被引量：1
3刘强强,刘恒霞,严家兴.高校智慧教室功能改进思考[J].中国教育技术装备,2021(2):1-2.
4师庆科,郑涛.大型三甲医院患者智能随访语音平台设计与应用[J].中国数字医学,2021,16(8):22-27. 被引量：16
5朱梦帆,汪志成,戴诗柏.基于语谱图与稠密卷积神经网络的性别与年龄识别研究[J].仪表技术,2022(1):66-70. 被引量：4
6孙铭,魏守科,王莹洁,赵金东,袁梅雪.基于小波分解的LSTM水质预测模型[J].计算机系统应用,2020,29(12):55-63. 被引量：11
7许昱旻,郭春.基于移动平均和神经网络的公路隧道运营通风折减率修正研究[J].现代隧道技术,2022,59(S01):121-127. 被引量：3
8秦帅波.中医知识智能诊断系统的研究[J].计算机产品与流通,2020,9(1):142-142.
9范慧鹏,闪恒杰,房哲续,郭江川.用于故障诊断的深度学习分类模型及方法[J].河南电力,2023(S01):51-55. 被引量：2
10宋宇,李治霖,程超.基于CNN-BILSTM的工业控制系统ARP攻击入侵检测方法[J].计算机应用研究,2020,37(S02):242-244. 被引量：15

同被引文献32

1寇蔚,孙丰瑞,杨立.神经网络求解传热反问题的可行性研究[J].激光与红外,2004,34(5):347-349. 被引量：7
2赵长龙.上海地铁统型车轮热机耦合有限元分析[J].计算机辅助工程,2012,21(3):34-37. 被引量：2
3董红松,刘振宇,马辉栋,闫静.语音增强在去除猪咳嗽噪声中的应用研究[J].山西农业大学学报（自然科学版）,2017,37(11):831-836. 被引量：3
4黎煊,赵建,高云,刘望宏,雷明刚,谭鹤群.基于连续语音识别技术的猪连续咳嗽声识别[J].农业工程学报,2019,35(6):174-180. 被引量：22
5杨金锋,李凯涛,贾桂敏,师一华.基于DNN-HMM的陆空通话声学模型构建方法[J].中国民航大学学报,2019,37(4):36-40. 被引量：2
6季景方,张建辉,范佳能,邵子君.基于回归分析理论的盘式制动器制动温度预测研究[J].汽车实用技术,2019,0(18):75-77. 被引量：3
7朱祥.基于隐马尔可夫模型和聚类的英语语音识别混合算法[J].计算机测量与控制,2020,28(5):175-179. 被引量：15
8苍岩,罗顺元,乔玉龙.基于深层神经网络的猪声音分类[J].农业工程学报,2020,36(9):195-204. 被引量：22
9曹丽静.语音增强技术研究综述[J].河北省科学院学报,2020,37(2):30-36. 被引量：7
10李江丽,田建艳,张苏楠.生猪咳嗽声识别与定位方法的研究[J].黑龙江畜牧兽医,2020(14):36-41. 被引量：6

引证文献3

1李娅,马琳.基于机器翻译的日语识别方法研究[J].自动化与仪器仪表,2021(10):178-182. 被引量：2
2彭硕,刘东阳,时国龙,李广博,慕京生,辜丽川,焦俊.基于深度神经网络及隐马尔科夫模型的生猪状态音频识别[J].中国农业大学学报,2022,27(6):172-181. 被引量：4
3刘洋,郭奇宗,贾志东,杨亦铮.基于门控循环单元的动车组制动盘温度模型构建与预测研究[J].铁道机车车辆,2024,44(5):59-64.

二级引证文献6

1李星.基于语义匹配的外语翻译机器人自动问答检索研究[J].自动化与仪器仪表,2022(2):138-141. 被引量：2
2刘红刚,张丽慧,钟林忆,黎国明,谢秋波,陈万云.基于数字孪生的智慧猪场管理平台设计与应用研究[J].现代农业装备,2022,43(6):38-44. 被引量：6
3田玉玲.日语机器翻译机器人翻译错误自动检测系统设计[J].自动化与仪器仪表,2022(11):205-209. 被引量：2
4彭硕,陶亮,查文文,陈成鹏,辜丽川,朱诚,焦俊.基于稀疏分量分析的生猪音频欠定盲源分离研究[J].畜牧兽医学报,2023,54(7):2794-2809. 被引量：1
5柏孝燚,陈超,张晋恒,周兵.生猪健康状态评估及预警云平台的构建[J].江西农业,2024(8):51-53.
6熊婷荣,陈威,王宁,汤先美,辜丽川,焦俊.基于特征融合的生猪音频识别[J].合肥学院学报（综合版）,2024,41(2):100-107.

1郑维卓.思维导图与思维可视化在当代大学生个人知识管理中的应用[J].商业文化,2020(29):96-97. 被引量：1
2陈传敏,冯洪达,郭兆枫,王哲伦.220 kV电力变压器辐射噪声特性仿真分析[J].电力学报,2020,35(6):515-521. 被引量：5
3王晓霞,钱雪忠,宋威.基于注意力与图卷积网络的关系抽取模型[J].计算机应用,2021,41(2):350-356. 被引量：8
4尹积军,潘巍巍.基于电力大数据的企业复工电力指数研究与应用[J].浙江电力,2021,40(2):26-32. 被引量：7
5周成龙,陈涛.基于小波熵的化工园区流场不稳定性[J].清华大学学报（自然科学版）,2021,61(2):135-143. 被引量：2
6赵辉,李志伟,方禄发.特征信息增强的单发多框检测器算法[J].计算机工程与应用,2021,57(4):148-154. 被引量：3
7张贝,陈石,李红蕾,杨锦玲,韩建成,卢红艳.时变重力场球面模型反演算法和模拟实验[J].地震,2021,41(1):13-24. 被引量：9
8艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：13
9田宇,李旺,赵昶宇.武器火控系统故障预测技术研究[J].电子设计工程,2021,29(4):164-167. 被引量：2
10张杰,史治宇.应用加速度响应Chirplet积分的线性时变系统参数识别[J].机械科学与技术,2021,40(2):198-203.

计算机与数字工程

2021年第2期

浏览历史

内容加载中请稍等...

基于深度学习的声学模型研究被引量：3

参考文献9

二级参考文献71

共引文献698

同被引文献32

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于深度学习的声学模型研究 被引量：3

参考文献9

二级参考文献71

共引文献698

同被引文献32

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于深度学习的声学模型研究被引量：3