期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于最大熵模型的本体概念获取方法 被引量:17
1
作者 韦小丽 孙涌 +1 位作者 张书奎 苗艳军 《计算机工程》 CAS CSCD 北大核心 2009年第24期114-116,120,共4页
本体是语义检索的核心。本体构建主要包括领域概念获取和概念间关系获取,其中领域概念获取是本体构建的基础。采用基于最大熵模型的方法来获取概念,通过对领域文本进行挖掘而得到名词性短语,使用改进的TF-IDF公式从中抽取具有领域性的短... 本体是语义检索的核心。本体构建主要包括领域概念获取和概念间关系获取,其中领域概念获取是本体构建的基础。采用基于最大熵模型的方法来获取概念,通过对领域文本进行挖掘而得到名词性短语,使用改进的TF-IDF公式从中抽取具有领域性的短语,并经人工修正后得到本体概念。实验表明该方法提高了概念的准确性和完整性。 展开更多
关键词 本体 最大熵模型 自然语言处理
在线阅读 下载PDF
基于最大熵方法的统计语言模型 被引量:4
2
作者 徐延勇 郭忠伟 周献中 《计算机工程与应用》 CSCD 北大核心 2002年第5期53-55,121,共4页
针对现有统计语言模型中存在计算量过大和系统负担过重的问题,该文提出了一种基于最大熵方法的统计语言模型。模型在参数估计阶段,引入约束最优化理论中拉格朗日乘数定理和牛顿迭代算法,以确保模型在多个约束条件中可求出最优化参数值;... 针对现有统计语言模型中存在计算量过大和系统负担过重的问题,该文提出了一种基于最大熵方法的统计语言模型。模型在参数估计阶段,引入约束最优化理论中拉格朗日乘数定理和牛顿迭代算法,以确保模型在多个约束条件中可求出最优化参数值;在特征选择阶段,采用计算近似增益的平行算法,解决模型计算量过大和系统开销问题。将该模型用于汉语句子分析的软件实验中表明:模型具有较高的计算效率和鲁棒性。 展开更多
关键词 自然语言处理 统计语言模型 最大熵方法 鲁棒性 计算机
在线阅读 下载PDF
基于多层最大熵模型的句子主干分析 被引量:4
3
作者 葛斌 封孝生 +1 位作者 谭文堂 肖卫东 《计算机科学》 CSCD 北大核心 2010年第12期156-160,共5页
句子主干分析的主要任务是自动识别句子的主干成分。鉴于汉语句子之间成分的相关性,提出一种多层最大熵模型,它的底层最大熵利用句子的上下文特征识别主干词候选项,高层最大熵利用底层最大熵模型的计算结果,结合句子内的远距离特征和句... 句子主干分析的主要任务是自动识别句子的主干成分。鉴于汉语句子之间成分的相关性,提出一种多层最大熵模型,它的底层最大熵利用句子的上下文特征识别主干词候选项,高层最大熵利用底层最大熵模型的计算结果,结合句子内的远距离特征和句子之间的关系,对底层最大熵模型识别出的主干词候选集进行分析。实验证明,该模型对于简单的主干成分识别正确率较高,对训练语料有一定的依赖;随着语料规模的增长,模型性能缓慢提升。 展开更多
关键词 最大熵 多层最大熵模型 主干词 主干分析 自然语言理解
在线阅读 下载PDF
基于统计分析的蒙汉自然语言的机器翻译 被引量:4
4
作者 苏依拉 乌尼尔 刘婉婉 《北京工业大学学报》 CAS CSCD 北大核心 2017年第1期36-42,共7页
为改变内蒙古地区蒙汉机器翻译发展相对落后的现状,采用基于统计的机器翻译方法将短语作为翻译的最基本单元,并基于最大熵模型提出了一种分词方法和词对齐方法,通过调序结果来输出译文.实验结果表明:改进后的翻译系统BLEU值在一定程度... 为改变内蒙古地区蒙汉机器翻译发展相对落后的现状,采用基于统计的机器翻译方法将短语作为翻译的最基本单元,并基于最大熵模型提出了一种分词方法和词对齐方法,通过调序结果来输出译文.实验结果表明:改进后的翻译系统BLEU值在一定程度上有所提高,所提方法可为蒙汉应用研究提供参考. 展开更多
关键词 自然语言 蒙汉翻译 统计机器翻译 最大熵模型 短语
在线阅读 下载PDF
应用二叉树剪枝识别韵律短语边界 被引量:4
5
作者 荀恩东 钱揖丽 +1 位作者 郭庆 宋柔 《中文信息学报》 CSCD 北大核心 2006年第3期1-5,28,共6页
句子的韵律短语识别是语音合成的重要研究内容。本文提出了应用统计语言模型生成的二叉树,结合最大熵方法识别待合成汉语句子的语音停顿点。文中给出了二叉树相关的模型训练和生成算法;二叉树与语音停顿点之间的关系;在最大熵方法中应... 句子的韵律短语识别是语音合成的重要研究内容。本文提出了应用统计语言模型生成的二叉树,结合最大熵方法识别待合成汉语句子的语音停顿点。文中给出了二叉树相关的模型训练和生成算法;二叉树与语音停顿点之间的关系;在最大熵方法中应用二叉树剪枝识别句子的韵律短语。实验结果表明,在搜索算法中,利用二叉树进行剪枝,可以很大程度上提高语音停顿预测的正确率和召回率,基于试验数据的f-Score提高了近35%。 展开更多
关键词 人工智能 自然语言处理 统计语言模型 二叉树 韵律短语 最大熵
在线阅读 下载PDF
SUBDIVIDING VERBS TO IMPROVE SYNTACTIC PARSING 被引量:2
6
作者 Liu Ting Ma Jinshan Zhang Huipeng Li Sheng 《Journal of Electronics(China)》 2007年第3期347-352,共6页
This paper proposes a new way to improve the performance of dependency parser: subdividing verbs according to their grammatical functions and integrating the information of verb subclasses into lexicalized parsing mod... This paper proposes a new way to improve the performance of dependency parser: subdividing verbs according to their grammatical functions and integrating the information of verb subclasses into lexicalized parsing model. Firstly,the scheme of verb subdivision is described. Secondly,a maximum entropy model is presented to distinguish verb subclasses. Finally,a statistical parser is developed to evaluate the verb subdivision. Experimental results indicate that the use of verb subclasses has a good influence on parsing performance. 展开更多
关键词 Verb subdivision maximum entropy model Syntactic parsing natural language processing
在线阅读 下载PDF
基于自然语言处理的通用信息模型自动调试 被引量:1
7
作者 项炜 《计算机应用》 CSCD 北大核心 2013年第5期1446-1449,共4页
通用信息模型(CIM)是工业界的一种公开标准,并已实现于很多产品中,大量的bug被发现和修复。为了减少了人工查找错误根源所需的时间和精力,提出一种基于自然语言处理的方法对CIM的bug进行自动调试。首先使用最大熵模型对已解决bug的文档... 通用信息模型(CIM)是工业界的一种公开标准,并已实现于很多产品中,大量的bug被发现和修复。为了减少了人工查找错误根源所需的时间和精力,提出一种基于自然语言处理的方法对CIM的bug进行自动调试。首先使用最大熵模型对已解决bug的文档描述进行分词,然后基于构建的词典使用simHash找出那些重复性很大的已修复的bug,最后使用文档处理的方法分析客户提供的trace找出问题所在和解决方法。实验结果取得了87.5%准确率,表明了该方法的有效性。 展开更多
关键词 通用信息模型 自然语言处理 最大熵模型 调试 文档处理
在线阅读 下载PDF
基于统计的自然语言处理模型 被引量:3
8
作者 戴文华 焦翠珍 徐斌 《咸宁学院学报》 2005年第3期79-82,共4页
基于统计的自然语言处理模型采用统计方法进行自然语言建模.实际应用过程中可根据具体情况在多种模型中选择适当的模型.本文简要介绍了N-gram模型和最大熵模型,并给出了几种参数估计和数据平滑方法,为自然语言建模提供了一定的参考.
关键词 自然语言处理 N-GRAM模型 最大熵模型 数据平滑
在线阅读 下载PDF
关于对数线性模型在词性标注中的应用 被引量:1
9
作者 王保芳 张瑞强 《计算机科学》 CSCD 北大核心 2008年第5期163-166,共4页
词性标注是自然语言理解中很长期的问题,但对于大词性标注集的词性标注,它的标注精度还很低。为此我们应用隐含马尔可夫方法(HMM)和最大熵方法对大词性标注集的词性标注问题进行了研究,并在此基础上提出了关于词性标注的最新方法——对... 词性标注是自然语言理解中很长期的问题,但对于大词性标注集的词性标注,它的标注精度还很低。为此我们应用隐含马尔可夫方法(HMM)和最大熵方法对大词性标注集的词性标注问题进行了研究,并在此基础上提出了关于词性标注的最新方法——对数线性模型,以此来提高词性标注精度。此次实验分别在运用HMM模型时,提出了新的光滑算法;在运用最大熵模型上,集成了详细的局部和远距离的上下文特征信息;在对数线性模型中,集成了HMM模型和最大熵模型,并进行了对比。结果表明综合了多源信息的对数线性模型标注精度达81.52%,取得了比传统的HMM模型更好的结果。 展开更多
关键词 对数线性模型 最大熵模型 词性标注 自然语言理解
在线阅读 下载PDF
基于最大熵模型的QA系统置信度评分算法 被引量:8
10
作者 游斓 周雅倩 +1 位作者 黄萱菁 吴立德 《软件学报》 EI CSCD 北大核心 2005年第8期1407-1414,共8页
置信度指的是一个问题回答系统(QA系统)对其所作回答的自信程度.描述了一种基于最大熵模型的算法.首先,从训练语料中提取若干因素来训练最大熵模型;然后应用训练好的模型在测试集上计算置信度.在2002年度的文本检索会议(TREC)中,QA系统... 置信度指的是一个问题回答系统(QA系统)对其所作回答的自信程度.描述了一种基于最大熵模型的算法.首先,从训练语料中提取若干因素来训练最大熵模型;然后应用训练好的模型在测试集上计算置信度.在2002年度的文本检索会议(TREC)中,QA系统用该算法计算每个问题答案的置信度,并依此排序,获得了显著的成绩. 展开更多
关键词 自然语言处理 信息检索 问答系统 最大熵模型 置信度
在线阅读 下载PDF
中文时间表达式及类型识别 被引量:9
11
作者 李君婵 谭红叶 王风娥 《计算机科学》 CSCD 北大核心 2012年第S3期191-194,211,共5页
目前,时间信息识别在信息抽取、问答系统、摘要生成、话题跟踪和检测等领域中有着广泛应用,同时也是自然语言处理的重要研究任务之一。针对TempEval-2会议评测任务中的时间表达式识别和类型识别任务:1)句内时间表达式识别,2)时间表达式... 目前,时间信息识别在信息抽取、问答系统、摘要生成、话题跟踪和检测等领域中有着广泛应用,同时也是自然语言处理的重要研究任务之一。针对TempEval-2会议评测任务中的时间表达式识别和类型识别任务:1)句内时间表达式识别,2)时间表达式类型识别,分别提出了基于词性构建时间单元规则库的识别方法以及基于最大熵的类型识别方法。实验对象为中文,结果显示时间表达式识别的准确率为85.16%,时间表达式类型识别的准确率为93.02%。 展开更多
关键词 时间表达式 规则 时间表达式类型 最大熵 自然语言处理
在线阅读 下载PDF
基于最大熵的哈萨克语词性标注模型 被引量:4
12
作者 桑海岩 古丽拉.阿东别克 牛宁宁 《计算机工程与应用》 CSCD 2013年第11期126-129,165,共5页
最大熵模型能够充分利用上下文,灵活取用多个特征。使用最大熵模型进行哈萨克语的词性标注,根据哈语的粘着性、形态丰富等特点设计特征模板,并加入了向后依赖词性的特征模板。对模型进行了改进,在解码中取概率最大的前n个词性分别加入... 最大熵模型能够充分利用上下文,灵活取用多个特征。使用最大熵模型进行哈萨克语的词性标注,根据哈语的粘着性、形态丰富等特点设计特征模板,并加入了向后依赖词性的特征模板。对模型进行了改进,在解码中取概率最大的前n个词性分别加入下一个词的特征向量中,以此类推直至句子结束,最终选出一条概率最优的词性标注序列。实验结果表明,特征模板的选择是正确的,改进模型的准确率达到了96.8%。 展开更多
关键词 自然语言处理 词性标注 最大熵模型 哈萨克语
在线阅读 下载PDF
基于深层特征抽取的日文词义消歧系统 被引量:1
13
作者 雷雪梅 王大亮 +1 位作者 田中贵秋 曾广平 《北京科技大学学报》 EI CAS CSCD 北大核心 2010年第2期263-269,共7页
词义消歧的特征来源于上下文.日文兼有中英文的语言特性,特征抽取更为复杂.针对日文特点,在词义消歧逻辑模型基础上,利用最大熵模型优良的信息融合性能,采用深层特征抽取方法,引入语义、句法类特征用于消解歧义.同时,为避免偏斜指派,采... 词义消歧的特征来源于上下文.日文兼有中英文的语言特性,特征抽取更为复杂.针对日文特点,在词义消歧逻辑模型基础上,利用最大熵模型优良的信息融合性能,采用深层特征抽取方法,引入语义、句法类特征用于消解歧义.同时,为避免偏斜指派,采用BeamSearch算法进行词义序列标注.实验结果表明,与仅使用表层词法类特征方法相比,本文构造的日文词义消歧系统的消歧精度提高2%~3%,动词消歧精度获得5%的改善. 展开更多
关键词 自然语言处理 词义消歧 最大熵模型 特征抽取
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部