题名 基于融合特征ADRMFCC的语音识别方法
被引量:1
1
作者
朵琳
马建
韦贵香
唐剑
机构
昆明理工大学信息工程与自动化学院
出处
《吉林大学学报(理学版)》
CAS
北大核心
2024年第4期943-950,共8页
基金
国家自然科学基金(批准号:61962032)。
文摘
针对在复杂噪声环境下语音识别准确率低和鲁棒性差的问题,提出一种基于增减残差Mel倒谱融合特征的语音识别方法.该方法首先利用增减分量法筛选关键语音特征,然后将其映射到Mel域-残差域空间坐标系中生成增减残差Mel倒谱系数,最后将这些融合特征用于训练端到端模型.实验结果表明,该方法在不同噪声类型和信噪比条件下均显著提高了语音识别准确率及性能,在-5 dB低信噪比条件下,语音识别准确率达73.13%,而在其他噪声条件下的平均语音识别准确率达88.67%,充分证明了该方法的有效性和鲁棒性.
关键词
语音识别
残差Mel倒谱系数
特征筛选
增减分量法
Keywords
speech recognition
residual Mel cepstral coefficient
feature screening
increase and decrease component method
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TN912.3
[电子电信—通信与信息系统]
题名 一种基于改进Mel倒谱的语音质量评估方法
被引量:2
2
作者
宣章健
蔡晓霞
廖锡畅
丁睿
机构
国防科技大学电子对抗学院
南京理工大学电子工程与光电技术学院
出处
《电子信息对抗技术》
2019年第1期51-55,共5页
文摘
在语音质量客观评估方法中,通常以Mel倒谱系数作为语音特征参数。但是Mel倒谱阶数的变化对评估效果有着直接的影响,同时Mel倒谱系数中各个分量对语音质量评估的贡献度不同,而以往的研究没有涉及Mel倒谱阶数和分量贡献度对语音质量评估效果的影响。实验确定了最佳阶数后,结合增减分量法对Mel倒谱系数进行贡献度的研究,通过对特征参数的选择重组,得到维数更低的IMFCC(Important Mel Frequency Cepstrum coefficient)。经检验,改进后的方法提高了2%的评估效果,降低了2%的预测误差。
关键词
语音质量评估
MEL倒谱系数
增减分量法
贡献度
失真距离
Keywords
speech quality evaluation
Mel cepstrum coefficient
increment-subtraction component method
degree of contribution
distortion distance
分类号
TN912.3
[电子电信—通信与信息系统]
题名 混合MFCC特征参数应用于语音情感识别
被引量:19
3
作者
周萍
李晓盼
李杰
景新幸
机构
桂林电子科技大学电子工程与自动化学院
桂林电子科技大学计算机科学与工程学院
桂林电子科技大学信息与通信学院
出处
《计算机测量与控制》
北大核心
2013年第7期1966-1968,1986,共4页
基金
国家自然科学基金资助项目(60961002)
广西自然科学基金资助项目(2012GXNSFAA053221)
文摘
引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。
关键词
Mel频率倒谱系数(MFCC)
增减分量法
特征提取
Keywords
MFCC
increase or decrease component method
feature extraction
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
题名 反蓄意模仿说话人识别系统中特征参数提取的研究
被引量:1
4
作者
唐宗渤
周萍
王茂蓉
刘继锦
机构
桂林电子科技大学信息科技学院
桂林电子科技大学电子工程与自动化学院
出处
《微型机与应用》
2016年第12期18-20,共3页
基金
国家自然科学基金资助项目(61363005)
国家自然科学基金资助项目(61462017)
广西研究生教育创新计划资助项目(YCSZ2015152)
文摘
当模仿者蓄意模仿说话人的语音且相似度极高时,说话人识别系统就有可能被欺骗。特征参数的提取是说话人识别的关键环节,直接影响了系统的识别性能。MFCC是语音识别中最热门的特征参数之一,但由于其只反映了语音的静态特性,为了提取更具个人语音特性的特征参数,引入加权MFCC,同时结合离散小波变换得到DWTWC,根据增减分量法,提出了DWI-MFCC。实验表明,DWI-MFCC倒谱系数比MFCC能更有效地区分语音的相似度。
关键词
特征参数
MFCC
蓄意模仿
增减分量法
Keywords
feature parameter
MFCC
deliberate imitation
method of increasing or decreasing the component
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
题名 基于特征相对贡献度对加权Mel倒谱的改进
被引量:5
5
作者
王家盛
郭其威
吴松
马建敏
机构
复旦大学航空航天系
上海宇航系统工程研究所
出处
《声学技术》
CSCD
北大核心
2021年第3期408-414,共7页
基金
上海航天科技创新基金(SAST2019-021)资助项目。
文摘
在声纹识别系统的搭建过程中,提高识别率的一个重要做法是使语音信号中能够提取出的特征尽可能包含更多的说话人个性特征。为了探究特征参数各分量对识别系统性能的影响,文章基于高斯混合-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)基线系统,研究了在无噪环境中各维特征组合下的识别率,利用增减分量法定量计算出各维特征分量对识别率的相对贡献程度,并根据贡献度的强弱对各维特征分量进行合理加权,得到了贡献度拟合权重系数,将此系数用于改进梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征参数。仿真结果表明,对特征参数进行贡献度拟合权重系数加权后,声纹识别的正确率得到了提升。
关键词
增减分量法
贡献度
梅尔(Mel)倒谱系数
高斯混合-通用背景模型(GMM-UBM)
Keywords
increment-subtraction component method
degree of contribution
Mel frequency cepstrum coefficient(MFCC)
Gaussian mixture model-universal background model(GMM-UBM)
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于Mel系数的特征参数在模仿语音中的应用研究
6
作者
韦国刚
周萍
机构
桂林电子科技大学电子工程与自动化学院
出处
《电子世界》
2014年第6期61-61,99,共2页
文摘
模仿者蓄意模仿说话人的语音,当相似度较高时,说话人识别系统就有可能被模仿者欺骗。语音特征参数作为说话人识别系统的关键组成部分,直接影响系统的性能。Mel系数是语音识别领域最成熟的特征参数之一,但是,MFCC特征参数在语音识别中对中、高频段的识别精度较低。为了解决上述问题,融合Mid-MFCC和IMFCC,采用增减分量法,提出了MMI-MFCC特征参数。实验结果表明,新的MMI-MFCC特征参数比传统的MFCC特征参数更有效的区分模仿语音的相似度。
关键词
模仿语音
Mel系数
增减分量法
相似度
分类号
TN912.34
[电子电信—通信与信息系统]