期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于长短时注意力机制的汉藏党政公文机器翻译
1
作者 赞拉公 安见才让 《信息技术与信息化》 2025年第1期91-94,共4页
在研究汉藏党政公文机器翻译时,由于语言资源匮乏,在对党政公文领域的术语、短语及句子进行翻译时,专用术语和短句方面均暴露出错译、漏译、解释性翻译、口语化翻译以及用词不精准等问题。这些问题严重影响翻译质量,对汉藏党政公文的准... 在研究汉藏党政公文机器翻译时,由于语言资源匮乏,在对党政公文领域的术语、短语及句子进行翻译时,专用术语和短句方面均暴露出错译、漏译、解释性翻译、口语化翻译以及用词不精准等问题。这些问题严重影响翻译质量,对汉藏党政公文的准确传递和理解起着负面作用。因此,构建高质量的汉藏党政公文语料库的同时融合和优化模型性能来提高翻译任务至关重要,文章通过融合LSTM和Transformer的长短时注意力机制的翻译模型来分别在音节、词、音节和词融合的分词方式上进行实验,实验结果表明,融合LSTM和Transformer的长短时注意力机制的翻译模型在音词融合分词方式上准确率分别在词和音节上提升了3.14%和1.92%,此外,将翻译软件与阳光翻译、班智达翻译软件在翻译任务上进行对比后得知,翻译软件在汉藏党政公文领域的翻译效果达到了预期的目标。 展开更多
关键词 长短时注意力机制 模型融合 汉藏党政公文 音词融合 翻译效果
在线阅读 下载PDF
藏语及物与不及物动词的自动识别研究
2
作者 完么才让 曹玉林 《西南民族大学学报(自然科学版)》 CAS 2014年第1期132-136,共5页
藏语动词分类很细,准确识别和判断藏文动词的词性是藏语自然语言处理中一个基础又关键的内容,及物与不及物动词的自动识别,可以在用计算机生成自然语言句子时能很好地阻止不合法句子的生成,也能从整体上减少句子生成量,从而提高效率.提... 藏语动词分类很细,准确识别和判断藏文动词的词性是藏语自然语言处理中一个基础又关键的内容,及物与不及物动词的自动识别,可以在用计算机生成自然语言句子时能很好地阻止不合法句子的生成,也能从整体上减少句子生成量,从而提高效率.提出了一种在理想环境下,通过句子中的使格助词来自动判断动词及物性的方法,这种自动识别方法是一种理性主义的判断方法,所以不需要大规模语料的支持.因为是一种理想情况,所以自动识别效率高,准确率为100%. 展开更多
关键词 及物 不及物 自动识别
在线阅读 下载PDF
藏文信息处理中藏文名词短语研究
3
作者 下吾卓玛 安见才让 《信息与电脑(理论版)》 2013年第8期28-29,共2页
藏文名词的含义及类型由两个或两个以上的文字组合在一起,并且表示本意或基本意思的音叫做名词■。藏文文法中名词分为本名(实名)和取名(虚名)。本名可分为随欲本名和随立本名。
关键词 名词短语 文本校对 自动摘要 语言单位 句法分析 普通名词 词集 计算语言学 字集 语音识别
原文传递
基于实例的党政公文汉藏机器翻译
4
作者 赞拉公 安见才让 《信息化研究》 2024年第6期73-78,共6页
现有的汉藏机器翻译,在翻译党政公文领域的术语和短语时,专用术语、短句方面存在着错译、漏译、解释性翻译、口语化翻译、用词不精准等问题。本文针对以上问题提出了以实例库为基础的Jaccard算法和GRU模型融合的汉藏实例机器翻译方法,... 现有的汉藏机器翻译,在翻译党政公文领域的术语和短语时,专用术语、短句方面存在着错译、漏译、解释性翻译、口语化翻译、用词不精准等问题。本文针对以上问题提出了以实例库为基础的Jaccard算法和GRU模型融合的汉藏实例机器翻译方法,以中国民族语文翻译局藏语文实例库为基础,通过计算句子相似度和文本语义匹配,计算出相似度的阈值为0.7时输出待翻译句子对应的藏文译文,有效解决了党政公文的专用术语和标志性政治短语的错译问题,从而使得译文的规范性和统一性得到了保障。 展开更多
关键词 实例机器翻译 相似度 党政公文 汉藏机器翻译
在线阅读 下载PDF
藏文虚词添置校对算法研究与实现 被引量:1
5
作者 公保才让 安见才让 《信息与电脑(理论版)》 2013年第12期203-204,共2页
该文通过藏文语法中对虚词的定义为线索;分析藏文真实文本,识别出藏文各种虚词。按照藏文虚词的添置规则进行校对。提出了一种基于规则和藏文语法相结合的校对算法。实验表明,系统对藏文虚词的查错率达100%。
关键词 真实文本 查错 时态助词 后加字 离合词 格助词 指人名词 时间状语 疑问语气 疑问代词
原文传递
基于声韵母的藏语语音合成研究 被引量:1
6
作者 公保才让 《信息与电脑(理论版)》 2014年第1期52-53,共2页
本文根据安多藏语的特点,提出了以声母韵母为语音基元的藏语语音合成方法,以声韵母进行组合来生成语音音节。从而使音库的容量能够控制在数百KB,同时语音质量与以音节为基元的合成方法相比并没有明显的下降。
关键词 语音合成 语音质量 合成语音 安多藏语 后置辅音 原始语音 以声 拼接方法 语合 短时傅里叶变换
原文传递
藏文分词歧义类型与消歧方法
7
作者 端智项杰 安见才让 《信息与电脑(理论版)》 2013年第10期187-188,共2页
藏文信息处理技术随着对语言文字信息处理研究工作的不断深入,逐步从字信息处理转向语言信息处理。与汉语、日语等语种的信息处理一样,藏文自动分词是藏文信息处理中一项必不可缺的工作。但是目前藏文自动分词系统的研制在国内仍是空白... 藏文信息处理技术随着对语言文字信息处理研究工作的不断深入,逐步从字信息处理转向语言信息处理。与汉语、日语等语种的信息处理一样,藏文自动分词是藏文信息处理中一项必不可缺的工作。但是目前藏文自动分词系统的研制在国内仍是空白。本文从四个方面详细报告了书面藏文自动分词系统的具体实现形式,以及在实现过程中出现的歧义类型及如何进行有效消除歧义方法的探讨,通过实验结果和实例分析来进行本论文的研究。 展开更多
关键词 自动分词 消歧 信息处理技术 语言信息处理 文本自动分类 分词系统 语言文字 分词算法 检索方法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部