期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
基于Mel频率倒谱参数相似度的语音端点检测算法 被引量:16
1
作者 王宏志 徐玉超 李美静 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第5期1331-1335,共5页
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似... 为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。 展开更多
关键词 通信技术 端点检测 Mel频率参数 相关系数
在线阅读 下载PDF
梅尔频率倒谱耦合神经网络的焊接缺陷检测
2
作者 金晖 金传伟 +2 位作者 刘俊勇 刘利民 刘念 《计算机工程与设计》 北大核心 2016年第7期1911-1915,共5页
当前焊接图像缺陷检测技术因依赖焊接几何特征缺陷,对微小缺陷中黑暗边缘的噪声较为敏感,导致其定位精度不佳,为此提出一种梅尔频率倒谱耦合神经网络特征匹配的焊接缺陷检测算法。利用DCT(discrete cosine transform)与Zigzag机制,将焊... 当前焊接图像缺陷检测技术因依赖焊接几何特征缺陷,对微小缺陷中黑暗边缘的噪声较为敏感,导致其定位精度不佳,为此提出一种梅尔频率倒谱耦合神经网络特征匹配的焊接缺陷检测算法。利用DCT(discrete cosine transform)与Zigzag机制,将焊接图像排列成1D信号数组;将1D信号分割为多个帧,构造窗口函数,增强相邻帧之间的连续性,引入倒谱技术,查询1D信号的稳定特性,提取其梅尔频率倒谱系数;定义两个正交多项式,建立多项式系数计算模型,提取多项式系数。基于神经网络训练,对提取特征与数据库特征进行匹配,完成缺陷检测。实验结果表明,与当前焊接缺陷检测技术相比,该算法的定位精度高达90%,鲁棒性更强,不受噪声影响。 展开更多
关键词 焊接图像 缺陷检测 梅尔频率 神经网络 窗口函数 多项式系数
在线阅读 下载PDF
采用复倒谱峰值滤波GMM识别混响语音
3
作者 孔荣 吴迪 +3 位作者 廖启鹏 朱俊杰 周强 陶智 《计算机工程与应用》 CSCD 2014年第15期191-193,203,共4页
针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下... 针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下语音识别率。经实验验证,该方法避免了在现实条件下准确估计房间冲击响应函数的麻烦,降低了计算难度,提高了混响环境下至少4%的系统识别率。 展开更多
关键词 高斯混合模型 Mel频率系数(MFCC)
在线阅读 下载PDF
基于MFCC相似度和谱熵的端点检测算法 被引量:6
4
作者 邓瑞 肖纯智 高勇 《现代电子技术》 2013年第21期67-69,共3页
为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离... 为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离与谱熵做综合判决。实验结果表明,在低信噪比环境下此方法相对谱熵法能够提高检测准确率。 展开更多
关键词 语音信号处理 端点检测 Mel频率参数 相关系数
在线阅读 下载PDF
短时谱特征的汉语重音检测方法研究 被引量:2
5
作者 赵云雪 张珑 郑世杰 《计算机科学与探索》 CSCD 2014年第9期1120-1128,共9页
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual line... 重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 展开更多
关键词 重音检测 Mel频率系数(MFCC) 相关感知线性预测(RASTA-PLP) 短时特征
在线阅读 下载PDF
基于GFCC与RLS的说话人识别抗噪系统研究 被引量:5
6
作者 茅正冲 王正创 黄芳 《计算机工程与应用》 CSCD 北大核心 2015年第10期215-218,231,共5页
为了提高说话人识别抗噪系统的性能,提出了将RLS自适应滤波器作为语音信号去噪的预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFC... 为了提高说话人识别抗噪系统的性能,提出了将RLS自适应滤波器作为语音信号去噪的预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFCC用于说话人识别系统中。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显的提高。 展开更多
关键词 抗噪系统 递归式最小均方(RLS) Grammatone频率系数(gfcc) 识别率
在线阅读 下载PDF
基于GMM模型和LPC-MFCC联合特征的声道谱转换研究 被引量:9
7
作者 曾歆 张雄伟 +2 位作者 孙蒙 苗晓孔 姚琨 《声学技术》 CSCD 北大核心 2020年第4期451-455,共5页
声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略... 声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略了不同声道特征参数之间可能存在的互补性。针对这一问题,研究了不同声道特征参数之间进行联合建模的方法,引入了一种由线性预测系数(LinearPredictionCoefficient,LPC)和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)联合构成的LPC-MFCC特征参数,提出了一种基于高斯混合模型(Gaussian Mixture Model, GMM)和LPC-MFCC联合特征参数的语音转换方法。为验证文中方法的有效性,仿真实验选取了基于GMM和LPC的语音转换方法进行对比,对多组实验数据进行主观和客观测试,结果表明,文中提出的语音转换方法可以获得相似度更高的转换语音。 展开更多
关键词 语音转换 声道转换 高斯混合模型 联合建模 线性预测系数-梅尔频率系数
在线阅读 下载PDF
基于Mel频率倒谱系数的光缆声音信号特征提取方法研究
8
作者 李一芳 《计量技术》 2013年第7期3-5,共3页
Mel频率倒谱系数(MFCC)能够很好的模拟人耳的听觉特性,在识别系统中具有很广泛的应用。本文采用Mel倒谱系数来提取基于光缆感知的声音信号的特征,通过线性分类器中的支持向量机(SVM)进行仿真,验证了其具有较好的识别效果。
关键词 Mel频率系数(MFCC) 声音识别 特征提取 支持向量机
原文传递
基于LSTM模型的音乐推荐系统研究
9
作者 范凯燕 胡彦红 《电声技术》 2024年第9期136-138,共3页
随着音乐推荐技术的快速发展,如何提升音乐推荐系统的准确性和用户满意度成为研究的重点。研究一种结合梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)、长短期记忆(Long Short-Term Memory,LSTM)网络、内容推荐方法的音... 随着音乐推荐技术的快速发展,如何提升音乐推荐系统的准确性和用户满意度成为研究的重点。研究一种结合梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)、长短期记忆(Long Short-Term Memory,LSTM)网络、内容推荐方法的音乐推荐系统,并通过MATLAB平台进行测试。结果表明,该推荐系统表现良好。 展开更多
关键词 音乐推荐 梅尔频率系数(MFCC) 长短期记忆(LSTM) 内容推荐
在线阅读 下载PDF
基于MFCC与CNN的机械故障声音自动识别
10
作者 黄炜 罗谢飞 《电声技术》 2024年第6期129-131,共3页
针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明... 针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明,该方法在机械故障声音识别中具有较高的准确率、精确率及召回率,能够有效识别故障案例。 展开更多
关键词 机械故障 声音识别 梅尔频率系数(MFCC) 卷积神经网络(CNN)
在线阅读 下载PDF
基于用户语音情感分析的景区反馈评估方法
11
作者 胡辉 《电声技术》 2024年第10期95-97,共3页
提出一种基于用户语音情感分析的景区反馈评估方法。首先,构建一个面向景区评估的情感分析框架,采用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)提取语音特征。其次,利用长短期记忆(Long Short-Term Memory,LSTM)网络... 提出一种基于用户语音情感分析的景区反馈评估方法。首先,构建一个面向景区评估的情感分析框架,采用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)提取语音特征。其次,利用长短期记忆(Long Short-Term Memory,LSTM)网络对提取的特征进行情感极性分类,将情感分为积极、消极、中性。最后,在交互式情感二元动作捕捉(Interactive Emotional Dyadic Motion Capture,IEMOCAP)数据集上进行实验。实验结果显示,本方法在精确率、召回率、准确率等指标上均表现出色,特别是在中性情感分类中达到了较高的识别性能。 展开更多
关键词 语音情感分析 景区评估 梅尔频率系数(MFCC) 长短期记忆(LSTM)网络
在线阅读 下载PDF
基于MFCC和HMM的语音识别优化方法研究
12
作者 郭佳淇 张继通 《电声技术》 2024年第10期83-85,共3页
为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectatio... 为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectation Maximization,EM)算法优化HMM参数,最后利用THCHS-30数据集进行实验验证。结果表明,引入EM算法优化HMM,可有效克服传统HMM在复杂语音环境下的识别困难问题,显著提升系统的识别精度和健壮性。 展开更多
关键词 语音识别 梅尔频率系数(MFCC) 隐马尔可夫模型(HMM) 期望最大化(EM)
在线阅读 下载PDF
基于声纹识别技术的电力调度系统设计
13
作者 沈亚玲 《电声技术》 2024年第12期1-3,共3页
为提升电力调度的效率与安全性,探讨声纹识别技术在电力调度系统中的应用。采用梅尔频率倒谱系数(Mel Frequency Ceptral Coefficient,MFCC)特征提取与高斯混合模型(Gaussian Mixture Model,GMM)建模方法,结合大词汇量连续语音识别(Larg... 为提升电力调度的效率与安全性,探讨声纹识别技术在电力调度系统中的应用。采用梅尔频率倒谱系数(Mel Frequency Ceptral Coefficient,MFCC)特征提取与高斯混合模型(Gaussian Mixture Model,GMM)建模方法,结合大词汇量连续语音识别(Large Vocabulary Continuous Speech Recognition,LVCSR)技术和改进的蚁群优化(Ant Colony Optimization,ACO)算法,设计基于声纹识别的电力调度系统。实验结果显示,该系统在身份验证和指令处理方面表现出色,具备较高的准确率与响应速度,能够有效保障电网运行的安全性与稳定性。 展开更多
关键词 声纹识别 电力调度 梅尔频率系数(MFCC)
在线阅读 下载PDF
混合MFCC特征参数应用于语音情感识别 被引量:19
14
作者 周萍 李晓盼 +1 位作者 李杰 景新幸 《计算机测量与控制》 北大核心 2013年第7期1966-1968,1986,共4页
引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提... 引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。 展开更多
关键词 Mel频率系数(MFCC) 增减分量法 特征提取
在线阅读 下载PDF
融合GMM及SVM的特定音频事件高精度识别方法 被引量:5
15
作者 罗森林 王坤 +2 位作者 谢尔曼 潘丽敏 李金玉 《北京理工大学学报》 EI CAS CSCD 北大核心 2014年第7期716-722,共7页
针对特定音频事件识别中持续时间特别短的音频事件漏检概率高、识别速度较慢的问题,提出一种融合高斯混合模型(GMM)及支持向量机(SVM)的特定音频事件识别算法.该方法利用GMM的统计分布描述能力和SVM的推广泛化能力,将GMM和SVM分别识别... 针对特定音频事件识别中持续时间特别短的音频事件漏检概率高、识别速度较慢的问题,提出一种融合高斯混合模型(GMM)及支持向量机(SVM)的特定音频事件识别算法.该方法利用GMM的统计分布描述能力和SVM的推广泛化能力,将GMM和SVM分别识别的结果进行融合处理,以手枪、步枪、机关枪等10类以上枪声为实验数据,无需针对每种枪声生成相应的识别模板,仅需训练生成2个识别模板.实验结果表明,识别准确率达到92.71%.该方法模板数量少,不需要多次训练,算法复杂度较低,不仅便于应用而且可大幅提升识别效率. 展开更多
关键词 音频识别 高斯混合模型(GMM) 支持向量机(SVM) Mel频率系数(MFCC) 特定音频事件
在线阅读 下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
16
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 Mel频率系数(MFCC) 语音识别 特征提取
在线阅读 下载PDF
GMM文本无关的说话人识别系统研究 被引量:27
17
作者 蒋晔 唐振民 《计算机工程与应用》 CSCD 北大核心 2010年第11期179-182,195,共5页
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。... 在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。 展开更多
关键词 说话人识别 高斯混合模型 美尔频率系数(MFCC) 分裂法与K均值聚类结合法
在线阅读 下载PDF
结合MFCC分析和仿生模式识别的语音识别研究 被引量:4
18
作者 王宪保 陈勇 汤丽平 《计算机工程与应用》 CSCD 北大核心 2011年第12期20-22,26,共4页
提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也... 提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也会得到一定程度的提高。运用仿生模式识别理论中同类样本连续的观点,通过在特征空间中对训练样本进行有效的覆盖,大大提高了识别结果。 展开更多
关键词 仿生模式识别 语音识别 Mel频率系数(MFCC)
在线阅读 下载PDF
结合节拍语义和MFCC声学特征的音乐流派分类 被引量:7
19
作者 庄严 于凤芹 《计算机工程与应用》 CSCD 北大核心 2015年第3期197-201,共5页
由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述... 由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述频域能量包络的MFCC声学特征与节拍特征结合,并用基于音乐流派机理分析的8阶MFCC代替常用的12阶MFCC。对8类音乐流派实验仿真结果表明,基于语义特征和声学特征结合的方法,总体分类准确率可达68.37%,同时特征维数增加对分类时间影响很小。 展开更多
关键词 音乐流派分类 节拍特征 Mel频率系数(MFCC) 小波分解 支持向量机
在线阅读 下载PDF
基于SVM的非特定人声调识别的研究 被引量:4
20
作者 肖汉光 蔡从中 《计算机工程与应用》 CSCD 北大核心 2009年第9期174-176,共3页
在建立非特定人普通话四声语调语音数据库的基础上,采用Mel频率倒谱系数(MFCCs)对语音数据进行特征参数的提取,并利用支持向量机(SVM)对语音中的四种声调进行了训练和识别研究。实验结果表明MFCCs和SVM的结合得到的平均识别率达到了97.6%。
关键词 声调识别 特征提取 Mel频率系数(MFCC) 支持向量机
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部