期刊文献+

基于句子级的唇读语料库及其切分算法 被引量:7

Bimodal Database and Its Material Segmentation for Lip-Reading Recognition on Sentence
在线阅读 下载PDF
导出
摘要 论文对适合唇读研究的连续音节双模态语料库及其语料切分算法的设计和研究工作进行了讨论。介绍了基于句子级的双模态语料库HITBi-CAVDatabaseII的设计和建立,形式化地讨论了该库的主要特点及基于语音能量的语料切分算法的可行性。该切分算法在基于能量的语音切分算法基础上,结合了双模态语料库的一些特征,实现了对语料的自动切分。 The topic of this paper is about the design of Bimodal Database for continuous Lip-Reading and the research on its material segmentation.First,it describes the design and foundation of a new Bimodal Database HIT Bi-CAVDatabaseII which is for Lip-Reading on sentence.Then,its key characters and the feasibility of the material segmentation algorithm based on the speech energy are analyzed formally.This segmentation algorithm combines the speech segmentation approach based on energy with the characters of the database.Now,the automatic segmentation in the Bimodal Database can be realized.
出处 《计算机工程与应用》 CSCD 北大核心 2005年第3期174-177,190,共5页 Computer Engineering and Applications
基金 国家863高技术研究发展计划(编号:2001AA114160) 哈尔滨工业大学校基金(编号:HIT2002.72)资助
关键词 唇读 双模态语料库 语料切分 Lip-Reading,Bimodal Database,material segmentation
  • 相关文献

参考文献12

  • 1姚鸿勋,高文,王瑞,郎咸波.视觉语言——唇读综述[J].电子学报,2001,29(2):239-246. 被引量:31
  • 2徐彦君,杜利民,李国强,张欣,周治.汉语听觉视觉双模态数据库CAVSR1.0[J].声学学报,2000,25(1):42-49. 被引量:16
  • 3高文.多功能感知机的框架结构[C]..见:第二届中国计算机智能接口与190 2005.3 计算机工程与应用智能应用学术会议论文集[C].威海,1995.7-20.
  • 4周治,杜利民,徐彦君.汉语听觉视觉双模态信息的互补作用[J].中国科学(E辑),2000,30(3):283-288. 被引量:4
  • 5.[EB/OL].http://amp.ece.cmu.edu/.,.
  • 6.[EB/OL].http://www.intel.com/research/mrl/research/avcsr.htm#.,.
  • 7.[EB/OL].http://www.ee.surrey.ac.uk/Research/VSSP/xm2vtsdb/.,.
  • 8S Pfeiffer. Pause Concepts for audio Segmentation at Different Semartic Levels[J].ACM Multimedia,2001:187~193.
  • 9Dong Wang, Lie Lu , Hong Jiang Zhang. Speech"Segnentation Without Speech Recognition "[C].In: ICASSP 2003 Papers, 2003.
  • 10Gerasimos tamianos,ChalapathyNeti,GiridharanIyengar et al.Large-Vocabulary Audio-Visual Speech Recognition by Machines and Humans.IBM Thomas J Watson Research Center,Aalborg,Denmark,2001.

二级参考文献22

  • 1齐士钤 吕士楠 等.汉语综合资料库的设计[J].应用声学,1994,13(3):1-5.
  • 2朱维彬.汉语言语数据库自动标注系统的研究.中国科学院声学研究所博士论文[M].,1998..
  • 3林茂灿.北京话声调分布域的感知实验研究.语音研究报告[M].中国社会科学院语言研究所语音研究室,1992..
  • 4王瑞.连续语音唇读识别的研究.哈尔滨工业大学计算机系博士论文开题报告[M].哈尔滨工业大学档案馆,1998..
  • 5徐彦君.中文双语料语音识别关键技术研究:博士论文[M].北京:中科院语音所,1998..
  • 6间濑健二.读唇[J].电子情报通信学会论文志,1990,73(6):796-803.
  • 7张家----,应用声学,1994年,13卷,3期,5页
  • 8朱维彬,博士学位论文,1998年
  • 9Chiou G I,IEEE Trans Image Processing,1997年,6卷,8期,1192页
  • 10张家,应用声学,1994年,13卷,3期,1页

共引文献46

同被引文献46

引证文献7

二级引证文献36

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部