期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于改进Mel滤波器组的声纹特征提取SoC设计 被引量:2
1
作者 陶佰睿 郭琴 +2 位作者 苗凤娟 李青龙 张景林 《微电子学》 CAS CSCD 北大核心 2015年第6期785-788,共4页
针对说话人声纹身份认证一体化设计需求,利用曲线拟合方法改进Mel滤波器组,开展声纹特征参数提取的SoC设计研究。首先选取MFCC,IMFCC,MidMFCC的Mel频率刻度上的平均值作为拟合参数,得到拟合函数;然后利用插值方法改进Mel滤波器组中各滤... 针对说话人声纹身份认证一体化设计需求,利用曲线拟合方法改进Mel滤波器组,开展声纹特征参数提取的SoC设计研究。首先选取MFCC,IMFCC,MidMFCC的Mel频率刻度上的平均值作为拟合参数,得到拟合函数;然后利用插值方法改进Mel滤波器组中各滤波器的加权中心频率;通过Matlab进行算法设计和仿真分析,采用Quartus II和Modelsim实现代码编写、编译、时序仿真和综合;最后利用SOPC Builder技术将Verilog模块封装为IP核,并下载到DE2开发板中进行验证。研究结果表明,本系统提取出的多维特征参数具有更好的鲁棒性,有利于提高识别率。 展开更多
关键词 声纹身份认证 改进Mel滤波器组 声纹特征提取 片上系统
在线阅读 下载PDF
基于二维特征提取方法与混合神经网络的接触式采集110 kV三相三绕组变压器无载调压异常放电声纹的识别方法
2
作者 童旸 黄文礼 +1 位作者 李磊 晏雨晴 《电机与控制应用》 2024年第2期34-43,共10页
异常放电是电力变压器中一种潜在的危险故障,若未及时检测可能导致严重的安全事故。采用接触式拾音器收集变压器箱体内异常放电声纹信号,并提出了一种特征提取方法和一个深度神经网络结构,以实现对变压器异常放电的高效识别。首先,设计... 异常放电是电力变压器中一种潜在的危险故障,若未及时检测可能导致严重的安全事故。采用接触式拾音器收集变压器箱体内异常放电声纹信号,并提出了一种特征提取方法和一个深度神经网络结构,以实现对变压器异常放电的高效识别。首先,设计了一种结合梅尔频率提取和关键频率提取的二维声纹特征提取方法。其次,提出了一种基于卷积神经网络和Transformer网络的混合二维特征识别模型,能够在确保识别速度的同时准确辨识异常放电声纹信号。通过对110 kV三相三绕组变压器无载调压试验过程中采集的放电数据进行试验分析,所提方法相较于ResNet50识别速度增加约0.16秒/样本,同时识别效果提升了4.5%。 展开更多
关键词 变压器异常放电 声纹识别 声纹特征提取 混合神经网络
在线阅读 下载PDF
孤独症访谈场景下融入角色信息的说话人日志方法
3
作者 王康月 程铭 +2 位作者 谢奕香 邹小兵 李明 《计算机科学》 北大核心 2025年第2期231-241,共11页
说话人日志技术在智能语音转写领域扮演着关键的角色,其核心任务是按照说话人的身份对多人音频进行分割和聚类,以便更好地对音频内容及转写文本进行整理。在医疗访谈领域,说话人日志技术是自动化评估的前置条件。医疗交互对话领域天然... 说话人日志技术在智能语音转写领域扮演着关键的角色,其核心任务是按照说话人的身份对多人音频进行分割和聚类,以便更好地对音频内容及转写文本进行整理。在医疗访谈领域,说话人日志技术是自动化评估的前置条件。医疗交互对话领域天然存在角色信息,以孤独症辅助诊断为例,典型的情境包括医生、家长和接受诊断的孩子这3种明确定义的角色。但在实际对话中,角色和说话人之间的对应关系可能并非一一对应。例如,在孤独症诊断过程中,每次会话仅涉及一个孩子,而医生或家长的数量却是不确定的。文中认为语音片段中隐含的角色信息与声纹信息可以进行有效的互补,进而降低错误率,故提出一种将角色信息引入序列到序列目标说话人语音活动检测(Seq2Seq-TSVAD)中的方法。在CPEP-3数据集上,说话人日志的错误率(DER)为20.61%,相比Seq2Seq-TSVAD方法降低了9.8%,相比模块化说话人日志方法降低了19.3%,表明孤独症访谈场景下角色信息在提升说话人日志性能方面具有明显的作用。 展开更多
关键词 说话人日志 角色分类 特定说话人语音活动检测 声纹特征提取 孤独症谱系障碍
在线阅读 下载PDF
基于B-S模式说话人声纹身份识别管理系统
4
作者 李耀成 陶佰睿 +2 位作者 王小碧 张桂香 刘英男 《齐齐哈尔大学学报(自然科学版)》 2015年第1期1-3 9,9,共4页
针对社会保险领域存在的待认证人数量庞大、所处地域分散遥远等情况,基于B/S(浏览器/服务器)模式构建说话人声纹识别管理系统来实现远程说话人身份识别。该系统以My Eclipse作为开发工具,采用My SQL数据库和Java语言开发平台,利用Tomcat... 针对社会保险领域存在的待认证人数量庞大、所处地域分散遥远等情况,基于B/S(浏览器/服务器)模式构建说话人声纹识别管理系统来实现远程说话人身份识别。该系统以My Eclipse作为开发工具,采用My SQL数据库和Java语言开发平台,利用Tomcat6.0设计服务器。管理页面开发运用了CSS样式,JSP等脚本语言并通过Servlet技术进行用户和声纹信息的管理。研究内容对声纹识别技术的推广应用具有重要意义。 展开更多
关键词 声纹特征提取 浏览器/服务器模式 管理系统 数据库 远程身份识别
在线阅读 下载PDF
一种多模态生物特征融合算法探究 被引量:5
5
作者 王俊生 王波 韩庆芝 《智能计算机与应用》 2018年第6期87-89,共3页
单一模态的生物识别技术各有缺陷,如指纹易被复制、人脸易被改变以及声音容易受到噪音等因素影响等,因此,通过研究某种算法将2个或多个生物特征相融合,弥补单一生物特征识别的缺陷,使多模态生物特征识别成为生物识别发展的必然趋势。本... 单一模态的生物识别技术各有缺陷,如指纹易被复制、人脸易被改变以及声音容易受到噪音等因素影响等,因此,通过研究某种算法将2个或多个生物特征相融合,弥补单一生物特征识别的缺陷,使多模态生物特征识别成为生物识别发展的必然趋势。本文试图通过卷积神经网络提取人脸特征,用梅尔频率倒谱系数(MFCC)方法提取声纹特征,然后将2种特征融合。希望通过本文提出的多模态生物特征融合思路,能为其它相关研究者提供借鉴。 展开更多
关键词 多模态生物识别技术 卷积神经网络 人脸与声纹特征提取 特征融合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部