连续汉语语音识别中基于归并的音节切分自动机被引量：10

Merging-based Syllable Detection Automaton in Continuous Chinese Speech Recognition

在线阅读下载PDF

导出

摘要文章研究并实现了汉语连续语音中的音节自动切分算法─—基于归并的音节切分自动机（merging－basedSyllabledeteCtionautomaton,简称MBSDA）算法．MBSDA算法利用了包括语音的短时能量、过零率和基音周期在内的多种特征参数，把特征参数高度相似的相邻帧（1帧或若干帧）的语音信号进行“归并（merging）”，形成“归并类似段（mergedsimilarsegment，简称MSS）”，它们被认定属于同一音节的相同状态．这些MSS经过一个包含若干状态的“音节切分自动机（syllabledetectionautomaton，简称SDA）”后，输出音节的切分点．每个确定的切分段中所包合音节个数的范围（rangeofsyllablenumber，简称RSN）也由MBSDA算法给出． In this paper, an automatic syllable detection method namely merging-based syllable detectionautomaton (MBSDA) is studied and implemented. The MBSDA uses a variety of features including the frameenergy, the zero crossing rate and the fundamental frequency to merge similar consecutive frames (one or sever-al frames) into one merged similar segment (MSS). The frames in the same MSS are treated as frames of thesame state of a phonetic. These MSSs are passed into a syllable detection automaton (SDA) to give the syllabledetection results. In addition, the MBSDA gives the range of syllable number (RNS) of each definite detectionsegment.

作者张继勇 sp.cs.tsinghua.edu.cn 郑方 sp.cs.tsinghua.edu.cn 杜术 sp.cs.tsinghua.edu.cn 宋战江 sp.cs.tsinghua.edu.cn 徐明星 sp.cs.tsinghua.edu.cn

机构地区清华大学计算机科学与技术系语音实验室

出处《软件学报》 EI CSCD 北大核心 1999年第11期1212-1215,共4页 Journal of Software

关键词语音识别归并音节切分自动机连续汉语语音 Syllable detection, merging, syllable detection automaton, vowel feature segment, range of syllable number

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1郑方吴文虎等.CDCPM及其在语音识别中的应用[J].软件学报,1996,7(10):69-75.
2郑方王承发等.一个语文转换文本编辑器的实现.第5届全国人机语音通讯学术会议（NCMMSC'98）会议论文集[M].哈尔滨:哈尔滨工业大学出版社,1998.280-285.
3郑方，第五届全国人机语音通讯学术会议论文集（NCMMSC’98），1998年，280页
4Zheng Fang，Proc Int Conf Computer Processing Oriental Languages’97，1997年，204页
5郑方，软件学报，1996年，7卷，863专刊，69页
6杨行峻，语音信号数字处理，1995年
7Lee C H，IEEE Trans ASSP，1989年，37卷，11期，1649页

共引文献5

1郑方,牟晓隆,徐明星,武健,宋战江.汉语语音听写机技术的研究与实现[J].软件学报,1999,10(4):436-444. 被引量：6
2郭皓婷,郑方,罗灿华,李银国.嵌入式文本相关说话人识别算法的研究与开发[J].中文信息学报,2010,24(6):64-68.
3王昆仑.基于CDCPM的维吾尔语非特定人语音识别[J].计算机研究与发展,2001,38(10):1242-1245. 被引量：4
4杨大利,徐明星,吴文虎.噪音环境下的语音识别研究[J].计算机工程与应用,2003,39(20):1-4. 被引量：8
5王昆仑.维吾尔语音节语音识别与识别基元的研究[J].计算机科学,2003,30(7):182-184. 被引量：7

同被引文献66

1王卓,苏牧,李鹏,徐波.噪音环境下基于高阶谱的端点检测算法[J].中文信息学报,2004,18(5):70-77. 被引量：3
2刘宇红,刘桥,任强.基于改进的模糊ART的语音信号端点检测与切分[J].系统工程与电子技术,2004,26(8):1151-1154. 被引量：6
3何新,王晓兰,周献中.汉语语音识别中的一种音节分割方法[J].火力与指挥控制,2004,29(6):94-96. 被引量：5
4贾卓燕,申瑞民.一种利用声音特性快速切分英文单词音节的算法[J].计算机仿真,2005,22(2):86-88. 被引量：1
5顾明亮,代春倩.一种新的汉语连续语音统计切分算法[J].徐州师范大学学报（自然科学版）,2005,23(4):45-49. 被引量：1
6林帆,徐明星.一种改进的基于时域参数的语音切分算法[J].计算机科学,2006,33(4):164-167. 被引量：3
7齐峰岩,鲍长春.一种基于支持向量机的含噪语音的清/浊/静音分类的新方法[J].电子学报,2006,34(4):605-611. 被引量：12
8齐士钤张家禄.汉语普通话辅音音长分析[J].声学学报,1982,(1):8-13.
9Lee Chin- Hui, Soong F K, Juang Bing - Hwang. A segment model based approach to speech recognition[ C] // International Conference on Acoustic, Speech, and Signal Preassing ( ICASSP- 88). New Vork. NY, USA: [s. n. ]. 1988.
10Toledano D T, Gomez L A H, Grande L V. Automatic phonetic segmentation[J]. IEEE Transactions on Speech and Audio Processing, 2004,11:617 - 621.

引证文献10

1何致远,胡起秀,徐光祜.说话人识别中语音切分算法的研究[J].计算机科学,2002,29(z1):140-143.
2林帆,徐明星.一种改进的基于时域参数的语音切分算法[J].计算机科学,2006,33(4):164-167. 被引量：3
3张帅,贾珈,杨大利,徐明星,蔡莲红.方言转换系统中的音节切分算法研究[J].计算机技术与发展,2009,19(7):41-43. 被引量：1
4汤霖,黄建中,尹俊勋.基于语音知识的音节切分[J].中文信息学报,2010,24(4):91-95. 被引量：4
5王艳,冯宏伟,张利平,忽满利.基于元音检测的汉语连续语音声韵母分割[J].计算机工程与应用,2011,47(14):134-136. 被引量：7
6宋战江,郑方,徐明星,武健,吴文虎.汉语连续语音识别系统与知识导引的搜索策略研究[J].自动化学报,2000,26(4):470-477. 被引量：1
7张扬,赵晓群,王缔罡.基于时频二维能量特征的汉语音节切分方法[J].计算机应用,2016,36(11):3222-3228. 被引量：5
8杨健,李振鹏,苏鹏.语音分割与端点检测研究综述[J].计算机应用,2020,40(1):1-7. 被引量：9
9冯夫健,吴磊,谭棉,蔡姗,张学文,王林.苗语语音音节自适应切分算法[J].科学技术与工程,2024,24(14):5863-5871.
10何致远,胡起秀,徐光.说话人识别中语音切分算法的研究[J].计算机工程与应用,2003,39(6):55-58. 被引量：4

二级引证文献30

1林帆,徐明星.一种改进的基于时域参数的语音切分算法[J].计算机科学,2006,33(4):164-167. 被引量：3
2曹玉东.语音识别中的搜索策略研究[J].攀枝花学院学报,2007,24(3):46-49.
3张帅,贾珈,杨大利,徐明星,蔡莲红.方言转换系统中的音节切分算法研究[J].计算机技术与发展,2009,19(7):41-43. 被引量：1
4张永锋,杨影,肖莹莹.基于主成分分析的汉语连续语音切分算法[J].应用声学,2011,30(5):366-369. 被引量：3
5赵芳丽.基于praat软件的俄语读音分析[J].计算机工程与应用,2012,48(11):133-136. 被引量：3
6李皓,唐朝京.采用损失函数和声学特征切分声韵母的方法[J].声学学报,2012,37(3):339-345. 被引量：3
7石锐,叶亮亮,何庆华.基于音频波形极值的基音检测方法[J].计算机工程与应用,2012,48(32):107-112.
8汤霖,尹俊勋.超音段信息对文本无关话者识别的影响[J].湖南科技大学学报（自然科学版）,2013,28(2):81-85.
9李正友,李天伟,黄谦,隋振庚.一种新的VDR浊语音检测方法[J].计算机应用研究,2013,30(8):2461-2463.
10卓嘎,边巴旺堆,姜军.双门限算法在藏语语音音节分割中的应用分析[J].科学技术与工程,2015,35(14):196-199. 被引量：3

1张文国.连续汉语语音识别技术[J].自动化博览,1997(6):21-22.
2王松林.用语音动态谱特征实现连续汉语语音按音节的自动分割[J].电声技术,1990,14(6):4-9.
3施建俊,诸鸿文.MERGING AND SPLITTING SECOND-ORDER SELF-SIMILAR PROCESSES (TRAFFICS)[J].Journal of Shanghai Jiaotong university(Science),2000,5(2):33-37. 被引量：2
4Song ZHU,Danhua CAO,Yubin WU,Shixiong JIANG.Improved accuracy of superpixel segmentation by region merging method[J].Frontiers of Optoelectronics,2016,9(4):633-639.
5赵力,邹采荣,吴镇扬.基于连续分布型HMM的汉语连续语音的声调识别方法[J].信号处理,2000,16(1):20-23. 被引量：6
6傅晓,林道发,杨家沅.全音节连续汉语语音识别的研究[J].信号处理,1994,10(3):161-167. 被引量：5
7赵鹤鸣,周旭东.基于知识的汉语连续语音识别研究[J].计算机研究与发展,1993,30(6):44-48. 被引量：2
8吴霁,侯伯亨.一种新的汉语连续语音音节分割方法[J].西部电子,1993,4(4):8-17.
9王正茹,王俊渊.蜗牛VS水滴最小”蓝牙耳机赏析吾爱BTEC018 VS赛尔贝尔D80[J].移动信息,2013(11):28-30.
10杨祎巍,史峥,沈珊瑚.Seamless-merging-oriented parallel inverse lithography technology[J].Journal of Semiconductors,2009,30(10):147-152. 被引量：1

软件学报

1999年第11期

浏览历史

内容加载中请稍等...

连续汉语语音识别中基于归并的音节切分自动机被引量：10

参考文献7

共引文献5

同被引文献66

引证文献10

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

连续汉语语音识别中基于归并的音节切分自动机 被引量：10

参考文献7

共引文献5

同被引文献66

引证文献10

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

连续汉语语音识别中基于归并的音节切分自动机被引量：10