期刊文献+

多策略汉日机器翻译系统中的核心技术研究 被引量:4

Study on Key Technologies in a Multi-Strategy Chinese-Japanese Machine Translation System
在线阅读 下载PDF
导出
摘要 多策略的机器翻译是当今机器翻译系统的一个发展方向。该文论述了一个多策略的汉日机器翻译系统中各翻译核心子系统所使用的核心技术和算法,其中包含了使用词法分析、句法分析和语义角色标注的汉语分析子系统、利用双重索引技术的基于翻译记忆技术的机器翻译子系统、以句法树片段为模板的基于实例模式的机器翻译子系统以及综合了配价模式和断段分析的机器翻译子系统。翻译记忆子系统的测试结果表明其具有高效的特性;实例模式子系统在1 559个句子的封闭测试中达到99%的准确率,在1 500个句子的开放测试中达到85%的准确率;配价模式子系统在3 059个句子的测试中达到了89%的准确率。 Multi-strategy MT (Machine Translation) is a direction for machine translation system. This paper introduces the studies on certain key technologies in a multi-strategy Chinese-Japanese machine translation system. The system is made up by four sub systems ; the Chinese analysis system using lexcical analysis, syntax analysis and semantic role labeling, The translation memory MT using double index technology, the Example-based MT (EBMT) using syntax tree segments as translation templates and the valence-based MT using valence models and partition analyse. The test result shows that 1) the TM system is efficient, 2) the EBMT get 99% translation accuracy under the close-test of 1 559 Chinese sentences and 85 % accuracy under the open-test of 1 500 sentences and 3) the valency-based system get 89% accuracy under all 3 059 sentences.
作者 杜伟 陈群秀
出处 《中文信息学报》 CSCD 北大核心 2008年第5期60-66,共7页 Journal of Chinese Information Processing
基金 国家863计划重点资助项目(2006AA010109)
关键词 人工智能 机器翻译 汉日机器翻译系统 汉语分析 翻译记忆技术 基于实例的机器翻译方法 基于配价的 机器翻译方法 artificial intelligence machine translation Chinese-Japanese machine translation system Chinese analysis translation memory technology example-based machine translation valence-based machine translation
  • 相关文献

参考文献11

  • 1陈群秀,张捷,孙勇,等.日汉机器翻译系统综合表示模型的设计和实现[C]//2000年多语种信息处理国际会议论文集,2000年,213-223.
  • 2张捷,陈群秀.日汉机器翻译系统中的多Agent研究[J].中文信息学报,2003,17(1):7-12. 被引量:4
  • 3陈群秀.计算机辅助翻译系统漫谈[C]//民族语言文字信息技术研究,北京:西苑出版社,2007:95-103.
  • 4魏勇鹏.多Agent日汉机器翻译系统研究及实用化[D].北京:清华大学计算机系,2006.
  • 5周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量:90
  • 6王锦,陈群秀.现代汉语语义资源用于短语歧义模式消歧研究[J].中文信息学报,2007,21(5):80-86. 被引量:9
  • 7陈群秀.一个现代汉语语义知识库的研究和实现[C]//中文信息处理前沿进展,北京:清华大学出版社,2006.
  • 8胡日勒,宗成庆,等.一种基于suffixarray的快速翻译方法[C]//全国第八届计算语言学联合学术会议论文集,2005,267-273.
  • 9Feiliang Ren, Shaoming Liu. Building Translation Memory System by N-Gram[C]//The 20th Pacific Asia Conference on Language, Information and Computation, 2006.
  • 10Harold Somers. Review Article: Example-based Machine Translation [ M]. Machine Translation 14, 1999, 113-157.

二级参考文献35

  • 1尹一瓴,陈群秀.现代汉语语义知识库用于句法分析的研究[J].计算机应用,2004,24(B12):264-267. 被引量:1
  • 2戴浩一.概念结构与非自主性语法:汉语语法概念系统初探[J].当代语言学,2002,4(1):1-12. 被引量:109
  • 3冯志伟.论歧义结构的潜在性[J].中文信息学报,1995,9(4):14-24. 被引量:61
  • 4朱德熙.汉语句法中的歧义现象[J].中国语文,1980,(2).
  • 5邵敬敏.歧义分化方法探讨[A].邵敬敏.九十年代的语法思考[C].北京:北京语言学院出版社,1994.
  • 6[2]Chen Qunxiu, Zhang Jie, Sun yong. Design and Realization of Integrated Representing Model for Machine Translation System from Japanese to Chinese, 2000 International Conference on Multilingual Information Processing, 2000 年.
  • 7[3]Mukhopadhyay,S. ;Bindu Jain. Multi-agent Markov Decision Processes with Limited Agent Communication. Inteligent Control, 2001. (ISIC' 01 ). Proceedings of the 2001 IEEE International Symposium on,2001:7- 12.
  • 8[4]Egerstedt, M.; Xiaoming Hu. Formation Constrained Multi-agent Control. Robotics and Automation,IEEE Transactions on, Volume: 17 Issue: 6, Dec. 2001 : 947 - 951.
  • 9[5]Fuji Ren;Hongehi Shi;Shingo Kuroiwa. A New Machine Translation Approach using Multiple Translation Engines and Sentence Partitioning. Systems, Man, and Cybernetics, 2001 IEEE International Conference on, Volume: 3,2001:1699 - 1704.
  • 10[6]Ren, F. Dialogue Machine Translation System using Multiple Translation Processors. Database and Expert Systems Applications,2000. Proceedings. 11th International Workshop on,2000:143- 152.

共引文献104

同被引文献64

  • 1陈家骏,戴新宇,尹存燕,王启祥.一个基于格语法和转换策略的日汉机器翻译系统[J].中文信息学报,2006,20(B03):61-65. 被引量:1
  • 2黄河燕,张克亮,张孝飞.基于本体的专业机器翻译术语词典研究[J].中文信息学报,2007,21(1):17-22. 被引量:10
  • 3郝晓燕,刘伟,李茹,刘开瑛.汉语框架语义知识库及软件描述体系[J].中文信息学报,2007,21(5):96-100. 被引量:52
  • 4冯丽萍,肖青.主谓谓语句研究中有关主语的分歧及其原因探讨[J].云南师范大学学报(哲学社会科学版),2007,39(6):131-134. 被引量:2
  • 5朱小健,晋耀红.层次语义类型树模型及其在汉英机器翻译中的应用[J].中国通信,2012,9(12) :80-92.
  • 6P. Brown, S. Della Pietra,V. Della Pietra,et al.The Mathematics of Machine Translation: ParameterEstimation. Computational Linguistics. 1993,19 (2):263-311.
  • 7Bahl L R,Jelinek F, Mercer R L. A maximum likeli-hood approach to continuous speech recognition[J].IEEE Transactions on Pattern Analysis and MachineIntelligence, 1983 (2): 179-190.
  • 8Och F J, Ney H. A comparison of alignment modelsfor statistical machine translation[C]//Proceedings ofthe 18th conference on Computational linguistics-Vol-ume 2. Association for Computational Linguistics,2000: 1086-1090.
  • 9Och F J,Ney H. Discriminative training and maxi-mum entropy models for statistical machine transla-tion[C]//Proceedings of the 40th Annual Meeting onAssociation for Computational Linguistics. Associa-tion for Computational Linguistics, 2002: 295-302.
  • 10Xiao T,Zhu J. Unsupervised Sub-tree Alignment forTree-to-Tree TranslationQ]. Journal of Artificial In-telligence Research, 2013,48: 733-782.

引证文献4

二级引证文献25

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部