期刊文献+

基于短语的汉维/维汉统计机器翻译 被引量:15

Phrase-based Chinese-Uyghur/Uyghur-Chinese Statistical Machine Translation
在线阅读 下载PDF
导出
摘要 利用电话录音的汉维平行语料库和开源的Moses系统构建一个基于短语的统计机器翻译系统。针对汉维平行语料库规模较小和维吾尔语形态变化比较丰富的特点,通过对词级的语料库进行切分得到词素级的语料库,并分别进行词一级的实验和词素级的实验。实验表明,词素级的实验能降低无法识别的词的概率,提高翻译的质量。 This paper gives a description of implementing a phrase-based machine translation system for Chinese-Uyghur,by the Moses toolkit,using a parallel corpus which is based on telephone recording.For the small scale parallel corpus and highly-inflected characteristics for Uyghur,it splits the Uyghur words into morphemes,and it gets another parallel corpus on morpheme-level.Experiments are carried out on word-level and morpheme-level separately,and show it can reduce the probability of Out-Of-Vocabulary(OOV) and improve the translation quality.
出处 《计算机工程》 CAS CSCD 北大核心 2011年第9期16-18,21,共4页 Computer Engineering
基金 中国科学院西部行动计划高新技术基金资助项目(KGCX2-YW-507)
关键词 汉维 维汉 词素 预处理 后处理 Chinese-Uyghur Uyghur-Chinese morpheme-level preprocessing postprocessing
  • 相关文献

参考文献7

  • 1Dyer C.Using Word Lattices to Improve Translation from Morphologically Complex Languages[EB/OL].(2007-04-20).http://www.ling.umd.edul-redpony/edinburgh.pdf.
  • 2Koehn P.Europarl:A Parallel Corpus for Statistical Machine Translation[C]//Proc.of the 10th Machine Translation Summit.Phuket,Thailand:[s.n.],2005.
  • 3Creutz M,Lagus K.Unsupervised Morpheme Segmentation and Morphology Induction from Text Corpora Using Moffessor1.0[M].Berlin,Germany:Springer-Verlag,2005.
  • 4杨攀,张建,李淼,乌达巴拉,雪艳.汉蒙统计机器翻译中的形态学方法研究[J].中文信息学报,2009,23(1):50-57. 被引量:10
  • 5Koehn P,Och F J,Marcu D.Statistical Phrase-based Translation[C]//Proc.of HLTNAACL'03.Edmonton,Canada:[s.n.],2003:48-54.
  • 6米尔夏提.力提甫,米吉提.阿布力米提.汉维机器翻译中维语动词的处理方法[J].新疆大学学报(自然科学版),2004,21(1):77-80. 被引量:2
  • 7艾山.吾买尔,吐尔根.依步拉音.基于最大熵的维吾尔语句子边界识别模型[J].计算机工程,2010,36(6):24-26. 被引量:7

二级参考文献26

  • 1刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量:198
  • 2付雷,刘群.单纯形算法在统计机器翻译Re-ranking中的应用[J].中文信息学报,2007,21(3):28-33. 被引量:2
  • 3侯宏旭,刘群,那顺乌日图.基于实例的汉蒙机器翻译[J].中文信息学报,2007,21(4):65-72. 被引量:16
  • 4米尔夏提·力提甫 买尔旦.UCDOS维文化的研究[J].新疆大学学报,1995,:50-55.
  • 5米尔夏提力提甫.英、汉、维DOS与Windows操作系统[M].乌鲁木齐:新疆大学出版社,1997..
  • 6Sonja Niessen, Hermann Ney. Statistical Machine translation with Scarce Resources Using Morphosyntatic Information [J]. Computational Linguistics, 2004,30(2) : 181-204.
  • 7Mei Yang, Katrin Kirchhoff. Phrase-based Backoff Models for Machine Translation of Highly Inflected Languages[C]// Proceedings of EACL. 2006: 41-48.
  • 8Young-Suk Lee. Morphological analysis for statistical machine translation[C]//Proceedings of HLT-NAACL 2004-Companion Volume. 2004: 57-60.
  • 9Andreas Zollmann, Ashish Venugopal, Stephan Vogel. Bridging the Inflection Morphology Gap for Arabic Statistical Machine Translation [C]//Proceedings of the Human Language Technology Conference of the NAACL, Companion Volume. 2006: 201-204.
  • 10Maja Popovic, Hermann Ney. Towards the Use of Word Stems and Suffixes for Statistical Machine Translation[C]//Proceedings of the 4th International Conference on Language Resources and Evaluation (LREC). 2004:1585- 1588.

共引文献16

同被引文献178

引证文献15

二级引证文献67

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部