-
题名一种噪声环境下的实时语音端点检测算法
被引量:30
- 1
-
-
作者
徐大为
吴边
赵建伟
刘重庆
-
机构
上海交通大学图像处理与模式识别研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第1期115-117,共3页
-
基金
国家863计划资助项目(编号:1863-306-ZD13-05-61)
-
文摘
语音识别中的端点检测要求对噪声有很强的鲁棒性。该文提出一种方法,综合采用了语音信号中的4个相互之间独立性强的特征-短时能量、倒谱距离、能量谱方差和能量-熵特征,有效地改进传统的基于单一语音特征方法的缺陷,在动态变化的噪声环境中,大大提高了端点检测对噪声的鲁棒性;为了克服分类回归树(CART)决策法的过度复杂性,引入一种新的5状态自动机进行快速决策,以保证算法的实时性能,并且能够提高端点检测的可靠性。通过各种实际噪声环境的测试,实验表明这一算法可以显著提高在低信噪比、噪声动态变化的各种环境下的端点检测性能。
-
关键词
噪声环境
实时语音端点检测算法
语音识别
语音分割
倒谱距离
能量-熵特征
5状态自动机
-
Keywords
Endpoint detection,Cepstral distance,Energy-entropy feature,5-states automation
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名说话人识别技术及其在工厂自动控制系统中的应用
被引量:1
- 2
-
-
作者
覃爱娜
韩华
-
机构
中南大学信息科学与工程学院
-
出处
《长沙电力学院学报(自然科学版)》
2003年第2期68-70,共3页
-
文摘
说话人识别是以话音对说话人进行区分,从而进行身份鉴别与认证的技术.介绍了在工厂自动控制系统中说话人识别技术的应用,包含其原理、所采用的识别方法及其系统实现.
-
关键词
说话人识别
身份鉴别
语音识别
工厂自动控制系统
实时端点检测算法
MEL倒谱系数
动态时间规整
矢量量化
-
Keywords
speaker recognition
frame-based real-time endpoint detection
Mel frequency cepstrum coefficient
dynamic time warping
vector quantization
-
分类号
TN912.34
[电子电信—通信与信息系统]
TP273
[自动化与计算机技术—检测技术与自动化装置]
-