一种适于计算声场景分析的混叠语音基音检测方法被引量：3

A Multi-Pitch Detecting Method Suitable for CASA

在线阅读下载PDF

导出

摘要本文提出了一种在混叠语音信号中检测各自语音分量基音信息的方法 .该方法采用小波变换作为基音检测模型中的滤波处理 ,并用广义自相关运算突出基音信息 ,用增强自相关累和消除冗余信息 ,并提出了用基音概率函数来预测并跟踪不同基音的变化以提高基音检测的准确性 .本文提出的方法可应用于计算声场景分析中 .实验结果表明 ,该方法对于混叠语音的基音检测是非常有效的 . This paper puts up a method suitable for multi pitch detecting under overlapping speech signals environment.In this method,wavelet transform is used as filtering analysis part of this pitch detecting model.Besides that,generalized autocorrelation function is used to strengthen pitch information and enhanced summary autocorrelation function is used to weaken redundant information.It is the most important that a pitch probability function is given to predict and tail after each pitch tracking to improve the veracity of pitch detecting.Above mentioned method could be applied to computational auditory scene analysis.From the experiment results provided,we can infer that this method is very useful and efficient.

作者赵鹤鸣朱美虹俞一彪陈雪勤

机构地区苏州大学通信与电子工程系

出处《电子学报》 EI CAS CSCD 北大核心 2003年第1期123-126,共4页 Acta Electronica Sinica

基金国家自然科学基金 (No 60 1 72 0 1 6)

关键词声场景分析混叠语音基音检测小波变换 overlapping speech pitch detecting wavelet transform

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1程俊,张璞,戴善荣,易克初.小波变换用于信号突变的检测[J].通信学报,1995,16(3):96-104. 被引量：36
2顾良,刘润生.高性能汉语语音基音周期估计[J].电子学报,1999,27(1):8-11. 被引量：19
3JWAndr.A comparison of auditory and blind separation techniques for speech separation [J].IEEE Trans on Speech and Audio Processing,2001,9(3):189-195.

二级参考文献6

1杨行峻迟惠生.语音信号数学处理[M].北京:电子工业出版社,1995.8-21.
2程俊，Proc of Inter Conf on Signal Processing Vol.1，1993年
3拉宾纳 L R，语音信号数字处理，1983年
4杨行峻，语音信号数字处理，1995年
5Gu Y H，Proc of IEEE ICASSP.2，1992年，21页
6林焘，语音学教程，1992年

共引文献53

1张超琼,苗夺谦,岳晓冬.基于高斯混合模型的语音性别识别[J].计算机应用,2008,28(S2):360-362. 被引量：1
2雷达.瞬变电磁法数据提取纯异常方法技术[J].物探与化探,2004,28(4):320-322. 被引量：9
3刘伟铭,王倩.基于小波包变换的交通事件检测[J].交通与计算机,2004,22(6):9-12. 被引量：1
4王笑梅,戴酉.小波变换对于ECG信号中QRS波的检测[J].上海应用技术学院学报（自然科学版）,2004,4(4):297-300. 被引量：1
5刘建,郑方,吴文虎.基于幅度差平方和函数的基音周期提取算法[J].清华大学学报（自然科学版）,2006,46(1):74-77. 被引量：22
6彭柏,许刚.利用改进的LF模型进行语音嗓音源合成[J].电声技术,2006,30(5):53-57.
7战卫侠,谭继文,文妍.小波分析对钢丝绳损伤信号奇异点的检测[J].矿山机械,2006,34(8):73-74.
8刘建,郑方,邓菁,吴文虎.基于混合幅度差函数的基音提取算法[J].电子学报,2006,34(10):1925-1928. 被引量：16
9王浩宇,胡仲军,张旭,龚宗颖,李文婷,李川勇.基于LabVIEW的心电实时监测系统[J].医疗卫生装备,2006,27(10):21-23. 被引量：5
10张国伟,田岚.一种改进的基于小波变换的语音基频检测[J].临沂师范学院学报,2006,28(6):101-105.

同被引文献30

1王珊,许刚.基于计算听觉场景分析的语音混叠信号分离[J].计算机工程,2007,33(18):211-213. 被引量：1
2Van der Kouwe J W,Wang D L,Brown G L.A Comparison of Auditory and Blind Separation Techniques for Speech Segregation[J].IEEE Trans.on Speech Audio Processing,2001,9(3):189-195.
3Roman N,Wang D L.Binaural Sound Segregation for Multisource Reverberant Environment[C]//Proc.of Int'l Conference on Acoustics,Speech,and Signal Processing.2004:373-376.
4Wang D L,Brown G L.Separation of Speech from Interfering Sounds Based on Oscillatory Correlation[J].IEEE Trans.on Neural Networks,1999,10(3):684-697.
5Carlyon R P,Shackleton T M.Comparing the Fundamental Frequencies of Resolved and Unresolved Harmonics:Evidence for Two Pitch Mechanisms?[J].Journal of the Acoustic Society of America,1994,95(6):3541-3554.
6Ellis D P W,Rosenthal D.Mid-level Representations for Computational Auditory Scene Analysis:The Weft Element[C]//Proc.of Int'l Joint Conference on Artificial Intelligence.Mahwah,NJ:Lawrence Erlbaum,1998.
7Hu G,Wang D L.Monaural Speech Segregation Based on Pitch Tracking and Amplitude Modulation[J].IEEE Trans.on Neural Networks,2004,15(5):1135-1150.
8Voiers W D.Evaluating Processed Speech Using the DiagnosticRhyme Test[J].Speech Technology,1983,1(4):30-39.
9Meddis R.Simulation of Auditory-neural Transduction:Further Studies[J] Journal of the Acoustic Society of America,1988,83(3):1056-1063.
10Cooke M P.Modeling Auditory Processing and Organization[D].CS Dept.,Univ.of Sheffield,1991.

引证文献3

1王珊,许刚.基于计算听觉场景分析的语音混叠信号分离[J].计算机工程,2007,33(18):211-213. 被引量：1
2王雨,林家骏,袁文浩.基于计算听觉场景分析的语音增强改进算法[J].华东理工大学学报（自然科学版）,2012,38(5):617-621. 被引量：2
3屈俊玲,李鸿燕.基于计算听觉场景分析的混合语音信号分离算法研究[J].计算机应用研究,2014,31(12):3822-3824. 被引量：6

二级引证文献8

1王雨,林家骏,袁文浩,陈宁.基于计算听觉场景分析的改进清音分离方法[J].华东理工大学学报（自然科学版）,2014,40(2):212-217. 被引量：3
2屈俊玲,李鸿燕.基于计算听觉场景分析的混合语音信号分离算法研究[J].计算机应用研究,2014,31(12):3822-3824. 被引量：6
3赵蓉蓉,李鸿燕,曹猛.基于CASA和谱减法的清音分离改进算法[J].电子技术应用,2016,42(1):68-71.
4刘航,李扬,袁浩期,王俊影.基于生成对抗网络的语音信号分离[J].计算机工程,2020,46(1):302-308. 被引量：8
5郝敏,刘航,李扬,简单,王俊影.基于聚类分析与说话人识别的语音跟踪[J].计算机与现代化,2020,0(4):7-13. 被引量：4
6杨吕祥,胡燕.基于多层次注意力机制一维DenseNet音频事件检测[J].计算机应用研究,2020,37(6):1642-1646. 被引量：2
7何冰,孟夏卿,顾俊杰,俞杰,李伟.微振动传感与声振特征识别的输电线路环境异变预警研究[J].电力信息与通信技术,2020,18(9):57-63. 被引量：1
8李伟,曾繁洋,王博,陈忠斌.基于MFCC加权动态特征组合的声纹识别技术在地下电缆防护的应用[J].电力信息与通信技术,2022,20(5):16-22. 被引量：2

1陈雪勤,赵鹤鸣,陈小平.基于计算听觉场景分析的强噪声背景下基音检测方法[J].电路与系统学报,2003,8(3):128-131. 被引量：5
2张海英,赵军,潘永湘.一种基于小波变换的混叠语音基音提取方法[J].西安理工大学学报,2005,21(2):200-203.
3赵鹤鸣,朱美虹,陈雪勤,肖筱华.基于声场景分析的混叠语音分离研究[J].通信技术,2002,35(1X):4-5. 被引量：4
4胡连锋,夏秀渝,张佩,李志昌.一种改进的强噪声背景下基音检测算法[J].通信技术,2009,42(12):164-166. 被引量：2
5杜军.基于稀疏编码和ICA的带噪混叠语音盲分离[J].山东师范大学学报（自然科学版）,2008,23(4):136-138.
6赵彩华,刘琚,孙建德,闫华.基于小波变换和独立分量分析的含噪混叠语音盲分离[J].电子与信息学报,2006,28(9):1565-1568. 被引量：14
7谢建平.基于MVQM说话人识别系统的DSP实现[J].微电子学与计算机,2006,23(6):220-222. 被引量：2
8杨德钊,宋凝芳,林志立,欧攀.基于自相关及相位差法的高精度频率估计算法[J].北京航空航天大学学报,2011,37(8):1030-1033. 被引量：10
9胡连锋,夏秀渝,张佩,李志昌.一种改进的强噪声背景下基音检测算法[J].金属材料与冶金工程,2012,40(3).
10王忠文,谢莉萍,梁杰豪.基于计算听觉场景分析的混叠语音分离算法[J].电声技术,2008,32(10):56-59. 被引量：1

电子学报

2003年第1期

浏览历史

内容加载中请稍等...

一种适于计算声场景分析的混叠语音基音检测方法被引量：3

参考文献3

二级参考文献6

共引文献53

同被引文献30

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

一种适于计算声场景分析的混叠语音基音检测方法 被引量：3

参考文献3

二级参考文献6

共引文献53

同被引文献30

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

一种适于计算声场景分析的混叠语音基音检测方法被引量：3