期刊文献+
共找到75篇文章
< 1 2 4 >
每页显示 20 50 100
A Natural Language Generation Algorithm for Greek by Using Hole Semantics and a Systemic Grammatical Formalism
1
作者 Ioannis Giachos Eleni Batzaki +2 位作者 Evangelos C.Papakitsos Stavros Kaminaris Nikolaos Laskaris 《Journal of Computer Science Research》 2023年第4期27-37,共11页
This work is about the progress of previous related work based on an experiment to improve the intelligence of robotic systems,with the aim of achieving more linguistic communication capabilities between humans and ro... This work is about the progress of previous related work based on an experiment to improve the intelligence of robotic systems,with the aim of achieving more linguistic communication capabilities between humans and robots.In this paper,the authors attempt an algorithmic approach to natural language generation through hole semantics and by applying the OMAS-III computational model as a grammatical formalism.In the original work,a technical language is used,while in the later works,this has been replaced by a limited Greek natural language dictionary.This particular effort was made to give the evolving system the ability to ask questions,as well as the authors developed an initial dialogue system using these techniques.The results show that the use of these techniques the authors apply can give us a more sophisticated dialogue system in the future. 展开更多
关键词 natural language processing natural language generation natural language understanding Dialog system Systemic grammar formalism OMAS-III HRI Virtual assistant Hole semantics
在线阅读 下载PDF
Classification of Conversational Sentences Using an Ensemble Pre-Trained Language Model with the Fine-Tuned Parameter
2
作者 R.Sujatha K.Nimala 《Computers, Materials & Continua》 SCIE EI 2024年第2期1669-1686,共18页
Sentence classification is the process of categorizing a sentence based on the context of the sentence.Sentence categorization requires more semantic highlights than other tasks,such as dependence parsing,which requir... Sentence classification is the process of categorizing a sentence based on the context of the sentence.Sentence categorization requires more semantic highlights than other tasks,such as dependence parsing,which requires more syntactic elements.Most existing strategies focus on the general semantics of a conversation without involving the context of the sentence,recognizing the progress and comparing impacts.An ensemble pre-trained language model was taken up here to classify the conversation sentences from the conversation corpus.The conversational sentences are classified into four categories:information,question,directive,and commission.These classification label sequences are for analyzing the conversation progress and predicting the pecking order of the conversation.Ensemble of Bidirectional Encoder for Representation of Transformer(BERT),Robustly Optimized BERT pretraining Approach(RoBERTa),Generative Pre-Trained Transformer(GPT),DistilBERT and Generalized Autoregressive Pretraining for Language Understanding(XLNet)models are trained on conversation corpus with hyperparameters.Hyperparameter tuning approach is carried out for better performance on sentence classification.This Ensemble of Pre-trained Language Models with a Hyperparameter Tuning(EPLM-HT)system is trained on an annotated conversation dataset.The proposed approach outperformed compared to the base BERT,GPT,DistilBERT and XLNet transformer models.The proposed ensemble model with the fine-tuned parameters achieved an F1_score of 0.88. 展开更多
关键词 Bidirectional encoder for representation of transformer conversation ensemble model fine-tuning generalized autoregressive pretraining for language understanding generative pre-trained transformer hyperparameter tuning natural language processing robustly optimized BERT pretraining approach sentence classification transformer models
在线阅读 下载PDF
基于本地大模型的骨质疏松专病数据库构建流程优化研究
3
作者 王耀国 唐诗诗 +2 位作者 刘泓泽 安雨婷 周毅 《医学信息学杂志》 2025年第1期75-79,共5页
目的/意义利用本地大模型和知识库优化骨质疏松专病数据库构建流程,降低医疗数据泄漏风险。方法/过程收集相关临床研究文献和业务数据信息,构建本地知识库;基于本地大模型应用架构,使用本地知识库限定本地大模型的生成内容;基于本地大... 目的/意义利用本地大模型和知识库优化骨质疏松专病数据库构建流程,降低医疗数据泄漏风险。方法/过程收集相关临床研究文献和业务数据信息,构建本地知识库;基于本地大模型应用架构,使用本地知识库限定本地大模型的生成内容;基于本地大模型应用架构图形问答界面和编程接口,通过自然语言问询和编程引导本地大模型生成骨质疏松专病数据库字段集。结果/结论本地大模型结合本地知识库可以总结骨质疏松既往研究中涉及的字段,有效提高骨质疏松专病数据库构建效率和质量,但处理结果需要人工核查。 展开更多
关键词 专病数据库 大模型 本地化部署 自然语言理解 非结构化数据处理
在线阅读 下载PDF
Metaphor Analysis Method Based on Latent Semantic Analysis
4
作者 TAO Ran WEI Yaping YANG Tangfeng 《Journal of Donghua University(English Edition)》 CAS 2021年第1期83-90,共8页
Current research on metaphor analysis is generally knowledge-based and corpus-based,which calls for methods of automatic feature extraction and weight calculation.Combining natural language processing(NLP),latent sema... Current research on metaphor analysis is generally knowledge-based and corpus-based,which calls for methods of automatic feature extraction and weight calculation.Combining natural language processing(NLP),latent semantic analysis(LSA),and Pearson correlation coefficient,this paper proposes a metaphor analysis method for extracting the content words from both literal and metaphorical corpus,calculating correlation degree,and analyzing their relationships.The value of the proposed method was demonstrated through a case study by using a corpus with keyword“飞翔(fly)”.When compared with the method of Pearson correlation coefficient,the experiment shows that the LSA can produce better results with greater significance in correlation degree.It is also found that the number of common words that appeared in both literal and metaphorical word bags decreased with the correlation degree.The case study also revealed that there are more nouns appear in literal corpus,and more adjectives and adverbs appear in metaphorical corpus.The method proposed will benefit NLP researchers to develop the required step-by-step calculation tools for accurate quantitative analysis. 展开更多
关键词 latent semantic analysis(LSA) metaphor natural language processing(NLP) pearson correlation coefficient
在线阅读 下载PDF
融合多结构信息的代码注释生成模型 被引量:1
5
作者 余天赐 高尚 《计算机工程与科学》 CSCD 北大核心 2024年第4期667-675,共9页
代码注释可以帮助开发人员理解代码的功能和实现方法。代码注释生成模型可以自动识别代码中的关键信息,并生成相关注释,提高代码的可读性和可维护性。现有的代码注释生成模型通常只使用抽象语法树结构信息来表示代码,导致模型生成注释... 代码注释可以帮助开发人员理解代码的功能和实现方法。代码注释生成模型可以自动识别代码中的关键信息,并生成相关注释,提高代码的可读性和可维护性。现有的代码注释生成模型通常只使用抽象语法树结构信息来表示代码,导致模型生成注释质量不高。提出一种融合多结构信息的代码注释生成模型,该模型在代码抽象语法树的基础上,增加了数据流图结构信息来表示代码。模型使用Transformer的编码器对抽象语法树序列进行编码,捕获代码全局信息。使用图神经网络对数据流图进行特征提取,提供变量之间的计算依赖关系等信息。然后使用跨模态注意力机制融合抽象语法树和数据流2种特征,经过Transformer的解码器生成相应的注释。实验结果表明,与6种主流模型相比,所提出的模型在Java和Python数据集上的BLEU、METEOR和ROUGE-L指标得分均有提高,生成的注释也具有良好的可读性。 展开更多
关键词 代码理解 代码注释生成 图神经网络 多特征融合 自然语言处理
在线阅读 下载PDF
基于双向特征金字塔的密集视频描述生成方法
6
作者 张煜杨 刘茂福 《中国科技论文》 CAS 2024年第2期200-208,共9页
针对当前方法普遍存在较为严重的细节结构信息丢失与事件间重叠的问题,提出一种基于双向特征金字塔的密集视频描述生成方法(dense video captioning with bilateral feature pyramid net,BFPVC)。BFPVC通过带有自底向上、自顶向下、横... 针对当前方法普遍存在较为严重的细节结构信息丢失与事件间重叠的问题,提出一种基于双向特征金字塔的密集视频描述生成方法(dense video captioning with bilateral feature pyramid net,BFPVC)。BFPVC通过带有自底向上、自顶向下、横向链接3条分支的双向特征金字塔强化视频多尺度特征图,兼顾对时序信息、空间信息、语义信息的特征表示,解码器从强化后的视频特征中捕获更加全面的事件候选集,从而为对应的视频事件生成更加丰富、详尽的文本描述。在ActivityNet Captions数据集和YouCook2数据集上的实验结果表明,BFPVC与同类模型相比生成的文本描述更详细、丰富,验证了双向特征金字塔在密集视频描述领域的有效性。 展开更多
关键词 密集视频描述 视频描述 视频理解 特征金字塔 自然语言处理
在线阅读 下载PDF
融合标签特征和胶囊注意力的口语理解方法
7
作者 李丹涛 曾碧 +1 位作者 魏鹏飞 蔡佳 《计算机工程与设计》 北大核心 2024年第8期2484-2491,共8页
针对目前意图检测和槽位填充联合学习中未充分考虑交互前标签特征信息的有效提取和融合,缺乏对交互后标签特征的提炼问题,提出一种融合标签特征和胶囊注意力的口语理解方法。主要由意图与槽位标签特征融合交互(label feature fusion int... 针对目前意图检测和槽位填充联合学习中未充分考虑交互前标签特征信息的有效提取和融合,缺乏对交互后标签特征的提炼问题,提出一种融合标签特征和胶囊注意力的口语理解方法。主要由意图与槽位标签特征融合交互(label feature fusion interactive, LFFI)和多头胶囊注意力机制(multi-head capsule attention, MHCA)两大关键模组组成。LFFI-MHCA通过LFFI提取序列中有效的意图和槽位标签信息,对两者进行融合和交互;利用MHCA对交互过程中产生的不同子空间信息进行提炼,获得更为精确的意图和槽位标签特征。该模型在ATIS和SNIPS数据集上进行实验,句子准确率分别为88.1%和89.0%,验证了该模型的有效性。 展开更多
关键词 口语理解 意图检测 槽位填充 标签特征融合交互 多头胶囊注意力机制 深度学习 自然语言处理
在线阅读 下载PDF
基于自然语言处理的铁路客运营销分析智能对话系统研究
8
作者 李仕旺 江琳 王桂林 《铁路计算机应用》 2024年第8期61-71,共11页
为提高铁路客运营销数据分析能力,研究开发了铁路客运营销分析智能对话系统,为铁路客运营销业务人员提供一种基于人机对话的数据分析工具。该系统包括语音识别、自然语言文本处理、智能数据挖掘、智能应答4个主要功能模块;利用语音唤醒... 为提高铁路客运营销数据分析能力,研究开发了铁路客运营销分析智能对话系统,为铁路客运营销业务人员提供一种基于人机对话的数据分析工具。该系统包括语音识别、自然语言文本处理、智能数据挖掘、智能应答4个主要功能模块;利用语音唤醒和语音识别技术采集语音数据,通过神经网络模型将语音数据转换成自然语言文本;建立自然语言文本预处理模型,完成基于规则的词法句法分析方法,使用长短期记忆神经网络实现语义理解,确定用户意图;基于Bert模型的Text-to-SQL技术,将自然语言文本数据转换成数据查询SQL语句,构建智能Agent完成数据挖掘分析,生成数据分析结果;最后,运用语音合成技术和数据可视化技术,将数据分析结果转换为用户应答信息。 展开更多
关键词 客运营销分析 智能对话系统 自然语言处理 语音识别 深度学习 语义理解 数据挖掘 语音合成 数据可视化
在线阅读 下载PDF
Computational Mechanisms for Metaphor in Languages: A Survey 被引量:8
9
作者 周昌乐 杨芸 黄孝喜 《Journal of Computer Science & Technology》 SCIE EI CSCD 2007年第2期308-319,共12页
Metaphor computation has attracted more and more attention because metaphor, to some extent, is the focus of mind and language mechanism. However, it encounters problems not only due to the rich expressive power of na... Metaphor computation has attracted more and more attention because metaphor, to some extent, is the focus of mind and language mechanism. However, it encounters problems not only due to the rich expressive power of natural language but also due to cognitive nature of human being. Therefore machine-understanding of metaphor is now becoming a bottle-neck in natural language processing and machine translation. This paper first suggests how a metaphor is understood and then presents a survey of current computational approaches, in terms of their linguistic historical roots, underlying foundations, methods and techniques currently used, advantages, limitations, and future trends. A comparison between metaphors in English and Chinese languages is also introduced because compared with development in English language Chinese metaphor computation is just at its starting stage. So a separate summarization of current progress made in Chinese metaphor computation is presented. As a conclusion, a few suggestions are proposed for further research on metaphor computation especially on Chinese metaphor computation. 展开更多
关键词 metaphor understanding natural language processing Chinese language computational model logic
原文传递
基于多元组匹配损失的司法论辩理解方法
10
作者 张可 艾中良 +2 位作者 刘忠麟 顾平莉 刘学林 《计算机与现代化》 2024年第6期115-120,共6页
司法论辩理解是论辩挖掘任务在司法领域的具体应用,旨在从诉辩双方观点中挖掘存在交互的观点对。司法领域论辩挖掘任务存在数据样本少、句子长度长、领域专业性强等问题,现有的司法论辩理解模型多基于文本分类思想,构建的模型文本语义... 司法论辩理解是论辩挖掘任务在司法领域的具体应用,旨在从诉辩双方观点中挖掘存在交互的观点对。司法领域论辩挖掘任务存在数据样本少、句子长度长、领域专业性强等问题,现有的司法论辩理解模型多基于文本分类思想,构建的模型文本语义表示能力差。为进一步提高论辩交互观点对的识别准确率,提出一种基于多元组匹配损失函数(Multiplet Loss)的司法论辩理解模型,该模型基于文本匹配的思想,将诉称观点与辩称观点分别进行语义相似性匹配,通过优化交互观点对的匹配度实现论辩交互观点对的挖掘。为提升模型对于论辩交互观点对的匹配度,提出多元组匹配损失函数,通过减小论辩交互观点对的语义距离,加大非交互观点的语义距离,使观点间的语义距离能更好地反应其交互性,采用司法领域预训练模型作为文本语义识别模型,进一步提高了文本的语义表达能力。采用CAIL2022论辩理解赛道数据进行测试,实验结果表明基于多元组匹配损失函数的司法论辩理解模型相较于采用分类思想的模型,准确率能够提高2.04个百分点,达到85.19%,提高了司法论辩理解任务精度。 展开更多
关键词 多元组匹配损失 司法领域预训练模型 司法论辩理解 论辩挖掘 文本分类 自然语言处理 深度学习
在线阅读 下载PDF
工艺语义驱动的序列三维模型构建系统 被引量:23
11
作者 石云飞 张树生 +2 位作者 成彬 范海涛 黄瑞 《计算机集成制造系统》 EI CSCD 北大核心 2009年第11期2133-2139,共7页
为满足企业对三维工序模型的迫切需求,提出一个工艺语义驱动的三维模型构建系统框架。以数字化工艺卡片为研究对象,将工艺信息引入三维重建领域中,采用自然语言理解技术,从工步语言中提取工艺语义模型,以描述工艺设计意图。根据二维工... 为满足企业对三维工序模型的迫切需求,提出一个工艺语义驱动的三维模型构建系统框架。以数字化工艺卡片为研究对象,将工艺信息引入三维重建领域中,采用自然语言理解技术,从工步语言中提取工艺语义模型,以描述工艺设计意图。根据二维工序图形进化过程和特点,将工艺语义模型映射到工序图中,以指导工序图形理解,完成制造毛坯序列三维模型的构建。开发了一个原型系统,该系统能实现三维工序模型快速自动生成和切削加工工艺过程可视化仿真。以某涡轮减速箱零件为例,对系统进行了实例验证。 展开更多
关键词 三维重建 自然语言理解 工艺语义 工序模型 动态演变
在线阅读 下载PDF
文本蕴含关系识别与知识获取研究进展及展望 被引量:30
12
作者 郭茂盛 张宇 刘挺 《计算机学报》 EI CSCD 北大核心 2017年第4期889-910,共22页
文本蕴含关系是广泛分布于自然语言文本中的单向推理关系,文本蕴含相关研究是自然语言处理领域的一项基础性研究,它可以辅助其他自然语言处理任务的进行,并且具有丰富的应用场景.文中首先界定了文本蕴含研究的范畴.作为一种二元关系,文... 文本蕴含关系是广泛分布于自然语言文本中的单向推理关系,文本蕴含相关研究是自然语言处理领域的一项基础性研究,它可以辅助其他自然语言处理任务的进行,并且具有丰富的应用场景.文中首先界定了文本蕴含研究的范畴.作为一种二元关系,文本蕴含有3个基本研究任务——关系识别、知识获取和蕴含对生成.其中,关系识别有两个核心问题——语义表示与推理机制;知识获取也有两个核心问题——知识表示与知识来源;蕴含对生成研究进展比较缓慢,文中细致地分析了其内因和外因.文中围绕语义表示与推理机制这两个核心问题梳理了关系识别的研究进展,围绕知识表示与知识来源梳理了知识获取的研究进展,并指出了各类方法的可取之处与不足之处.文本蕴含研究的进展离不开相关国际评测,文中也对这些国际评测和数据集进行了归纳总结.大数据时代的到来和深度学习理论的不断发展,为文本蕴含相关研究提供了丰富的知识来源和有力的研究工具,同时也带来了许多崭新的研究课题.文中立足当前研究形势,展望了未来研究方向,并从理论上探讨了其可行性. 展开更多
关键词 文本蕴含 知识获取 自然语言理解 自然语言处理 人工智能
在线阅读 下载PDF
中文信息处理60年 被引量:17
13
作者 宗成庆 曹右琦 俞士汶 《语言文字应用》 CSSCI 北大核心 2009年第4期53-61,共9页
本文首先简要回顾中国语文现代化走过的历程、取得的重要成果及其对中文信息处理的影响,然后对汉字信息处理和汉语信息处理的其他工作予以归纳阐述,并对这一领域的学术活动与国际交流情况做简要介绍,最后对中文信息处理所面临的挑战和... 本文首先简要回顾中国语文现代化走过的历程、取得的重要成果及其对中文信息处理的影响,然后对汉字信息处理和汉语信息处理的其他工作予以归纳阐述,并对这一领域的学术活动与国际交流情况做简要介绍,最后对中文信息处理所面临的挑战和未来发展的目标给予粗略的展望。 展开更多
关键词 中文信息处理 自然语言处理 自然语言理解 计算语言学
在线阅读 下载PDF
基于Ontology的信息检索技术研究 被引量:29
14
作者 陈康 武港山 《中文信息学报》 CSCD 北大核心 2005年第2期51-57,共7页
随着Web的迅速发展 ,网上信息资源越来越丰富 ,网络已经成为了一个全球最大的信息库。而用户要从中得到所需的信息一般是通过各种信息检索工具。但是现有的信息检索工具都存在着检索精度不高等问题。本文针对这些问题 ,提出了将Ontolog... 随着Web的迅速发展 ,网上信息资源越来越丰富 ,网络已经成为了一个全球最大的信息库。而用户要从中得到所需的信息一般是通过各种信息检索工具。但是现有的信息检索工具都存在着检索精度不高等问题。本文针对这些问题 ,提出了将Ontology融合到信息检索技术中的思路。利用Ontology中拥有的领域知识 ,可以大大提高检索系统对自然语言文本的理解能力 ,同时方便用户以自然语言的方式提出检索请求 ,从而提高检索的效果。 展开更多
关键词 人工智能 自然语言处理 信息检索 ONTOLOGY 自然语言理解
在线阅读 下载PDF
基于隐喻角色依存模式的汉语隐喻计算分类体系 被引量:5
15
作者 杨芸 周昌乐 李剑锋 《语言文字应用》 CSSCI 北大核心 2008年第3期125-133,共9页
本文在论述汉语隐喻计算分类所依据的心理学和语言学基础上,提出"隐喻角色"的概念及"隐喻角色依存"的隐喻分析模式化方法,将隐喻的语言表达形式和隐喻意义的认知推理两个层面加以区别和关联,由此构建"基于隐... 本文在论述汉语隐喻计算分类所依据的心理学和语言学基础上,提出"隐喻角色"的概念及"隐喻角色依存"的隐喻分析模式化方法,将隐喻的语言表达形式和隐喻意义的认知推理两个层面加以区别和关联,由此构建"基于隐喻角色依存模式"的汉语隐喻计算分类标准及计算分类体系。该分类体系的提出对隐喻信息自动识别和意义推理有着积极的理论和实践意义。 展开更多
关键词 自然语言理解 汉语隐喻识别 计算分类 隐喻角色依存模式
在线阅读 下载PDF
汉语隐喻理解的逻辑描述初探 被引量:18
16
作者 张威 周昌乐 《中文信息学报》 CSCD 北大核心 2004年第5期23-28,共6页
隐喻在语篇中出现非常普遍 ,是语言认知和计算机语篇理解中重要的一环。但无论是其逻辑基础或实验系统的探索都处于初级阶段。本文从逻辑角度给出了隐喻逻辑的定义、建构和性质。同时 ,针对汉语文本中名词性隐喻、动词性隐喻等类型 ,细... 隐喻在语篇中出现非常普遍 ,是语言认知和计算机语篇理解中重要的一环。但无论是其逻辑基础或实验系统的探索都处于初级阶段。本文从逻辑角度给出了隐喻逻辑的定义、建构和性质。同时 ,针对汉语文本中名词性隐喻、动词性隐喻等类型 ,细化了隐喻逻辑的规则 ,并利用细化后的规则 ,分析了隐喻句中隐含信息的发掘方法 ,为隐喻的计算提供了新的解决方案。分析的结果表明 ,本文所提出的隐喻逻辑对汉语隐喻意义的生成有很好的解释能力 。 展开更多
关键词 人工智能 自然语言处理 隐喻逻辑 隐喻理解
在线阅读 下载PDF
隐喻自动处理研究进展 被引量:10
17
作者 贾玉祥 俞士汶 朱学锋 《中文信息学报》 CSCD 北大核心 2009年第6期46-55,共10页
隐喻在人类语言中普遍存在,是自然语言理解必须面对的问题。该文首先探讨了对隐喻的认识及语言中隐喻表达的分类。把隐喻自动处理分为隐喻识别、隐喻理解和隐喻生成三个子任务,对以往的研究成果进行梳理,着重介绍近几年来隐喻自动处理... 隐喻在人类语言中普遍存在,是自然语言理解必须面对的问题。该文首先探讨了对隐喻的认识及语言中隐喻表达的分类。把隐喻自动处理分为隐喻识别、隐喻理解和隐喻生成三个子任务,对以往的研究成果进行梳理,着重介绍近几年来隐喻自动处理研究的新成果、新特点。隐喻自动处理离不开隐喻知识库的支持,文章也介绍了国内外隐喻知识库建设的主要成果。隐喻自动处理的目的是为了提高自然语言处理的智能化水平,文章探讨了隐喻处理在自然语言处理任务中的应用。最后展望了汉语隐喻自动处理研究的前景。 展开更多
关键词 人工智能 机器翻译 隐喻自动处理 自然语言处理 机器学习 知识获取
在线阅读 下载PDF
隐喻理解的计算模型综述 被引量:7
18
作者 黄孝喜 周昌乐 《计算机科学》 CSCD 北大核心 2006年第8期178-183,共6页
国际上,隐喻在思维及语言中所处的中心地位正逐渐引起人工智能研究者的重视。但在国内学术界,还鲜有开展隐喻计算化这方面研究的;实际上,作为异常用法的隐喻现象是自然语言中的普遍情况,因此隐喻问题若得不到很好的解决,将成为制约自然... 国际上,隐喻在思维及语言中所处的中心地位正逐渐引起人工智能研究者的重视。但在国内学术界,还鲜有开展隐喻计算化这方面研究的;实际上,作为异常用法的隐喻现象是自然语言中的普遍情况,因此隐喻问题若得不到很好的解决,将成为制约自然语言理解和机器翻译的瓶颈问题。本文结合相关的隐喻理论基础,根据不同的计算路线对已有隐喻理解计算模型进行分类,包括基于语义优先方法、基于知识表示的方法、基于逻辑的方法和基于统计语料库的方法,并在分析这些方法的适用范围和优缺点的基础上,对隐喻的计算理解方法以及面向汉语的隐喻理解计算模型研究提出了展望和建议。 展开更多
关键词 隐喻 自然语言理解 优先语义学 计算模型
在线阅读 下载PDF
无监督词义消歧研究 被引量:17
19
作者 王瑞琴 孔繁胜 《软件学报》 EI CSCD 北大核心 2009年第8期2138-2152,共15页
研究的目的是对现有的无监督词义消歧技术进行总结,以期为进一步的研究指明方向.首先,介绍了无监督词义消歧研究的意义.然后,重点总结分析了国内外各类无监督词义消歧研究中的各项关键技术,包括使用的数据源、采用的消歧方法、评价体系... 研究的目的是对现有的无监督词义消歧技术进行总结,以期为进一步的研究指明方向.首先,介绍了无监督词义消歧研究的意义.然后,重点总结分析了国内外各类无监督词义消歧研究中的各项关键技术,包括使用的数据源、采用的消歧方法、评价体系以及达到的消歧效果等方面.最后,对14个较有特色的无监督词义消歧方法进行了总结,并指出无监督词义消歧的现有研究成果和可能的发展方向. 展开更多
关键词 词义消歧 无监督词义消歧 自然语言处理 语义理解
在线阅读 下载PDF
音字转换中的机器学习研究 被引量:7
20
作者 王晓龙 王开铸 +1 位作者 孙希文 王英伟 《计算机学报》 EI CSCD 北大核心 1993年第5期370-377,共8页
本文提出了音字转换学习系统的模型,给出了它所采用的三种机器学习形式:单词学习,规则学习,参数修正学习、单词以及规则的自动获取用于确定的推理机制,而非确定规则的自动获取以及可信度函数的自适应调整主要用于概率推理上,基于上述学... 本文提出了音字转换学习系统的模型,给出了它所采用的三种机器学习形式:单词学习,规则学习,参数修正学习、单词以及规则的自动获取用于确定的推理机制,而非确定规则的自动获取以及可信度函数的自适应调整主要用于概率推理上,基于上述学习机制所进行的数万字的学习实验结果表明,机器学习在改进音字转换的系统性能(如正确率、通用性等)上,具有相当好的效果,目前已经在语句级声音输入、键盘输入等汉字系统上实用。 展开更多
关键词 机器学习 信息处理 音字转换
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部