摘要
多策略的机器翻译是当今机器翻译系统的一个发展方向。该文论述了一个多策略的汉日机器翻译系统中各翻译核心子系统所使用的核心技术和算法,其中包含了使用词法分析、句法分析和语义角色标注的汉语分析子系统、利用双重索引技术的基于翻译记忆技术的机器翻译子系统、以句法树片段为模板的基于实例模式的机器翻译子系统以及综合了配价模式和断段分析的机器翻译子系统。翻译记忆子系统的测试结果表明其具有高效的特性;实例模式子系统在1 559个句子的封闭测试中达到99%的准确率,在1 500个句子的开放测试中达到85%的准确率;配价模式子系统在3 059个句子的测试中达到了89%的准确率。
Multi-strategy MT (Machine Translation) is a direction for machine translation system. This paper introduces the studies on certain key technologies in a multi-strategy Chinese-Japanese machine translation system. The system is made up by four sub systems ; the Chinese analysis system using lexcical analysis, syntax analysis and semantic role labeling, The translation memory MT using double index technology, the Example-based MT (EBMT) using syntax tree segments as translation templates and the valence-based MT using valence models and partition analyse. The test result shows that 1) the TM system is efficient, 2) the EBMT get 99% translation accuracy under the close-test of 1 559 Chinese sentences and 85 % accuracy under the open-test of 1 500 sentences and 3) the valency-based system get 89% accuracy under all 3 059 sentences.
出处
《中文信息学报》
CSCD
北大核心
2008年第5期60-66,共7页
Journal of Chinese Information Processing
基金
国家863计划重点资助项目(2006AA010109)
关键词
人工智能
机器翻译
汉日机器翻译系统
汉语分析
翻译记忆技术
基于实例的机器翻译方法
基于配价的
机器翻译方法
artificial intelligence
machine translation
Chinese-Japanese machine translation system
Chinese analysis
translation memory technology
example-based machine translation
valence-based machine translation