关于维吾尔语口语语料的三音子选取方法研究被引量：2

Analysis of Triphone Selection Method in Uyghur Speech Corpus

在线阅读下载PDF

导出

摘要在大词汇量连续语音识别应用中,优质的语音训练语料是所有识别工作的基础和前提,能否挑选出覆盖更多语音现象的语料是提高语音识别性能的关键。该文在多种维吾尔文口语化传播平台中采集了大量口语句子语料,并考虑协同发音的影响和常用词的适用性,根据评估函数对语料筛选。经过筛选后的语料包含的三音子更加均衡和高效,囊括的语音现象更加全面,为训练准确而牢靠的语音模型打下了稳固的根基。 A good speech training corpus is essential for the wide application of continuous speech recognition. Therefore, whether more multiple yoice phenomena are covered in the corpus is of substantial importance to improve the performance of speech recognition. In this paper, we collect a large number of spoken corpus sentences from a variety of Uigl^ur spoken language communication platforms. Then, we refine the corpus according to the evaluation function considering the effect of co-articulation and applicability of the common words. The final corpus contain mot more balanced and efficient tri-phones, covering more phonetic phenomena, which lays a solid foundation for training a much accurate and reliable acoustic model.

作者徐宝龙努尔麦麦提.尤鲁瓦斯吾守尔.斯拉木

机构地区新疆大学信息科学与工程学院

出处《中文信息学报》 CSCD 北大核心 2015年第2期118-124,共7页 Journal of Chinese Information Processing

基金国家973重点基础研究计划项目(2014CB340506) 国家自然科学基金(61363063) 新疆维吾尔自治区科技计划项目(201312104)

关键词维吾尔语语音识别语料库三音子 Uighur Language speech recognition database Triphone

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1Rabiner L R, Juang B H. Fundamentals of speech rec-ognition[M]. Englewood Cliffs: PTR Prentice Hall,1993.
2那斯尔江.吐尔逊,吾守尔.斯拉木.基于隐马尔可夫模型的维吾尔语连续语音识别系统[J].计算机应用,2009,29(7):2009-2011. 被引量：17
3刘玉宇,吴及,王作英.汉语三音子模型观测概率比较[J].中文信息学报,2003,17(3):47-52. 被引量：2
4曹剑芬.普通话语音的环境音变与双音子和三音子结构[J].语言文字应用,1996(2):58-63. 被引量：11
5曹剑芬.普通话双音子和三音子结构系统代表语料集[J].语言文字应用,1997(1):62-70. 被引量：7
6蔡琴,吾守尔.斯拉木.基于HTK的维吾尔语连续数字语音识别[J].现代计算机,2007,13(4):14-16. 被引量：7
7那斯尔江.吐尔逊,吾守尔.斯拉木,麦麦提艾力.维吾尔语大词汇量连续语音识别研究一一语音语料库的建立[C]//第十一届全国民族语言文字信息学术研讨会论文集,2007(2): 379-385.
8吴华,徐波,黄泰翼.基于三音子模型的语料自动选择算法[J].软件学报,2000,11(2):271-276. 被引量：12
9热依曼.吐尔逊,依皮提哈尔.买买提.维吾尔语语音语料库管理软件的研究与实现[J].新疆大学学报（自然科学版）,2011,28(2):242-247. 被引量：7
10康恒,刘文举.基于综合因素的汉语连续语音库语料自动选取[J].中文信息学报,2003,17(4):27-32. 被引量：3

二级参考文献50

1刘鹏,王作英.多模式汉语连续语音识别中视觉特征的提取和应用[J].中文信息学报,2004,18(4):79-84. 被引量：6
2祖漪清.实现语音数据库科学性的重要环节——篇章断句与连续语音的韵律结构[J].语言文字应用,1998(1):95-99. 被引量：6
3曹剑芬.普通话双音子和三音子结构系统代表语料集[J].语言文字应用,1997(1):62-70. 被引量：7
4曹剑芬.普通话语音的环境音变与双音子和三音子结构[J].语言文字应用,1996(2):58-63. 被引量：11
5洪晓鹏,姚鸿勋,徐铭辉.基于句子级的唇读语料库及其切分算法[J].计算机工程与应用,2005,41(3):174-177. 被引量：7
6李永宏,于洪志.安多藏语语音合成语料库的设计[J].西北民族大学学报（自然科学版）,2006,27(1):36-39. 被引量：16
7徐波,史晓东,刘群,宗成庆,庞薇,陈振标,杨振东,魏玮,杜金华,陈毅东,刘洋,熊德意,侯宏旭,何中军.2005统计机器翻译研讨班研究报告[J].中文信息学报,2006,20(5):1-9. 被引量：10
8石现峰,张学智,张峰.基于HTK的语音识别系统设计[J].计算机技术与发展,2006,16(10):37-38. 被引量：23
9王作英.基于段长分布的HMM语音识别模型.第二届全国汉字语音识别会议[M].庐山,1989..
10BROWN P, COCKE J, PIETRA S, et al. A statistical approach to machine translation[J]. Computational Linguistics, 1990, 16(2):79 -85.

共引文献58

1李荪,曹峰,刘姿杉.面向算法模型的语音数据集质量评估方法研究[J].计算机科学,2022,49(S02):519-524. 被引量：4
2宁振江,杜利民.面向语音识别声学模型的汉语语料抽选方法[J].声学技术,2003,22(z2):356-358. 被引量：1
3钟明辉,李姮,李生华.基于HTK的汉语数码语音识别系统[J].贺州学院学报,2009,25(3):133-135.
4曹剑芬.连续话语语音特性及其信息处理[J].语言文字应用,1998(1):100-103. 被引量：3
5肉克艳木.买买提,热依曼.吐尔逊,吾守尔.斯拉木.维吾尔语语音标注复查软件的研究与实现[J].新疆大学学报（自然科学版）,2013,30(1):87-90. 被引量：2
6宁振江,杜利民.一种改进后的递增式语音语料抽选算法[J].中国科学院研究生院学报,2005,22(2):140-146.
7刘刚,张洪刚,郭军.不同训练样本对识别系统的影响[J].计算机学报,2005,28(11):1923-1928. 被引量：15
8骆锤炼.论普通话水平测试中的语音正误和缺陷[J].温州师范学院学报,2006,27(3):83-86.
9钟武媚.论普通话语音缺陷的判断原则与评分细则[J].玉林师范学院学报,2007,28(4):70-73.
10杨阳蕊,李永宏,于洪志.藏语安多方言的音联结构及统计分析[J].西北民族大学学报（自然科学版）,2008,29(2):11-16. 被引量：2

同被引文献13

1肉克艳木.买买提,热依曼.吐尔逊,吾守尔.斯拉木.维吾尔语语音标注复查软件的研究与实现[J].新疆大学学报（自然科学版）,2013,30(1):87-90. 被引量：2
2热依曼.吐尔逊,依皮提哈尔.买买提.维吾尔语语音语料库管理软件的研究与实现[J].新疆大学学报（自然科学版）,2011,28(2):242-247. 被引量：7
3杨雅婷,马博,王磊,吐尔洪.吾司曼,李晓.维吾尔语语音识别中发音变异现象[J].清华大学学报（自然科学版）,2011,51(9):1230-1233. 被引量：5
4杨雅婷,马博,王磊,吐尔洪.吾司曼,李晓.多发音字典在维吾尔语方言语音识别中的应用[J].清华大学学报（自然科学版）,2011,51(9):1303-1306. 被引量：5
5吴华,徐波,黄泰翼.基于三音子模型的语料自动选择算法[J].软件学报,2000,11(2):271-276. 被引量：12
6努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木.维吾尔语连续语音识别声学模型优化研究[J].计算机工程与应用,2013,49(2):145-147. 被引量：4
7努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木,热依曼.吐尔逊.基于音节的维吾尔语大词汇连续语音识别系统[J].清华大学学报（自然科学版）,2013,53(6):741-744. 被引量：5
8李冠宇,于洪志,李永宏,马宁.基于决策树的藏语拉萨话三音子模型[J].计算机工程与科学,2013,35(9):146-150. 被引量：4
9努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木,热依曼.吐尔逊.维吾尔语大词汇语音识别系统识别单元研究[J].北京大学学报（自然科学版）,2014,50(1):149-152. 被引量：4
10王玮,张劲松.汉语中介语语音库的文本设计[J].世界汉语教学,2019,33(1):104-116. 被引量：8

引证文献2

1徐健,热依曼.吐尔逊,吾守尔.斯拉木.在线多语种语音语料库平台的研究与实现[J].信息通信,2018,31(4):150-153. 被引量：3
2买买提阿依甫,帕丽旦·木合塔尔,郭文强.基于三音子模型的柯尔克孜最优语料选取算法[J].计算机仿真,2024,41(8):296-302.

二级引证文献3

1张晓.一种网络多模态语料库构建方法[J].软件导刊,2018,17(11):49-51.
2林正柏.重开发、重研制——“互联网+”背景下多语种平行语料库的建设思路[J].海外英语,2020(15):238-239.
3郑文婕,张敬谊,李静,佘盼.医疗语义众包标注平台设计和应用研究[J].医学信息学杂志,2020,41(7):49-52. 被引量：2

1徐向华,朱杰,郭强.汉语连续语音识别中的分级聚类算法的研究和应用[J].信号处理,2004,20(5):497-500. 被引量：2
2杨阳蕊,李永宏,于洪志.藏语安多方言的音联结构及统计分析[J].西北民族大学学报（自然科学版）,2008,29(2):11-16. 被引量：2
3其米克.巴特西,黄浩,王羡慧.基于深度神经网络的维吾尔语语音识别[J].计算机工程与设计,2015,36(8):2239-2244. 被引量：13
4听写机及其语音模型[J].科技开发动态,2003(8):24-24.
5王开宇.粘性来自牢靠的关系[J].互联网周刊,2008(8):70-70.
6孙敏.把重要文件隐藏起来[J].电脑迷,2012(5):13-13.
7徐成,王涛,王红丽.WinXP文件夹解密[J].中小学信息技术教育,2007(11):65-65.
8李皓,陈艳艳,唐朝京.唇部子运动与权重函数表征的汉语动态视位[J].信号处理,2012,28(3):322-328. 被引量：12
9吴翠娟,赵晖.可视化协同发音合成研究综述[J].现代计算机,2014,20(9):9-14.
10左欣,李小琳,连伟,王利民.基于数据挖掘的隐性知识显性化及其构建[J].广西师范大学学报（自然科学版）,2010,28(1):77-81. 被引量：2

中文信息学报

2015年第2期

浏览历史

内容加载中请稍等...

关于维吾尔语口语语料的三音子选取方法研究被引量：2

参考文献14

二级参考文献50

共引文献58

同被引文献13

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

关于维吾尔语口语语料的三音子选取方法研究 被引量：2

参考文献14

二级参考文献50

共引文献58

同被引文献13

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

关于维吾尔语口语语料的三音子选取方法研究被引量：2