期刊文献+
共找到268篇文章
< 1 2 14 >
每页显示 20 50 100
面向领域知识图谱的实体关系抽取模型仿真
1
作者 何山 肖晰 张嘉玲 《吉林大学学报(理学版)》 北大核心 2025年第2期465-471,共7页
针对目前领域知识图谱实体关系抽取效果不佳的问题,提出一种面向领域知识图谱的实体关系抽取模型研究方法.先建立由编解码模块、实体识别模块和实体关系抽取模块组成的实体关系抽取模型,在实体关系抽取模型中,通过双向长短期记忆神经网... 针对目前领域知识图谱实体关系抽取效果不佳的问题,提出一种面向领域知识图谱的实体关系抽取模型研究方法.先建立由编解码模块、实体识别模块和实体关系抽取模块组成的实体关系抽取模型,在实体关系抽取模型中,通过双向长短期记忆神经网络对文本句子进行编码处理,将编码后文本句子特征表示向量输入至基于深度神经网络的实体识别模块中进行文本句子的实体识别,并将识别结果输入至基于卷积神经网络的实体关系抽取模块中进行实体关系抽取,然后将实体关系抽取获取的实体关系三元组输入至编解码模块中进行解码操作,实现最终的面向领域知识图谱的实体关系抽取.实验结果表明,该方法的实体关系抽取效果和整体应用效果较好. 展开更多
关键词 知识图谱 实体关系抽取 实体识别 卷积神经网络
在线阅读 下载PDF
基于关系提示的单模块单步骤实体关系抽取方法研究
2
作者 刘辉 张智 王启源 《西安交通大学学报》 北大核心 2025年第3期222-234,共13页
针对现有关系三元组抽取方法由于忽略关系本身的关系语义信息以及三元组中元素的相互依赖和不可分性所导致的抽取效果不佳问题,提出了一种基于关系提示的实体关系抽取方法。在构建单模块单步关系三重抽取模型(RPSS)的基础上,考虑不同层... 针对现有关系三元组抽取方法由于忽略关系本身的关系语义信息以及三元组中元素的相互依赖和不可分性所导致的抽取效果不佳问题,提出了一种基于关系提示的实体关系抽取方法。在构建单模块单步关系三重抽取模型(RPSS)的基础上,考虑不同层次的关系语义信息和符号级和特征级的关系提示信息,对实体和关系提示符进行联合编码,得到统一的全局表示;同时通过注意力机制挖掘不同嵌入之间的深层关联,构建三重交互矩阵,可在一个步骤中直接从单个模块中提取所有三元组。结果表明:所提方法在NYT、WebNLG两个基准数据集上实现了最佳的表现,F_(1)分别达到了93.3%和94.9%。 展开更多
关键词 实体关系抽取 注意力机制 联合编码
在线阅读 下载PDF
基于自动生成句法模板的方法类实体关系抽取——以CSDN人工智能主题博客为例
3
作者 李奎良 化柏林 《科技情报研究》 2025年第1期30-40,共11页
[目的/意义]方法类实体与应用场景、问题、组织机构等实体之间存在着较多的关联关系,抽取这些实体关系有助于捕捉技术发展趋势,助力创新能力提升。[方法/过程]文章探讨了一种基于自动生成句法模板的方法类实体关系抽取方法,通过设计一... [目的/意义]方法类实体与应用场景、问题、组织机构等实体之间存在着较多的关联关系,抽取这些实体关系有助于捕捉技术发展趋势,助力创新能力提升。[方法/过程]文章探讨了一种基于自动生成句法模板的方法类实体关系抽取方法,通过设计一种新的自适应模板,提高抽取的灵活性和适应性,降低对大规模标注数据的依赖。文章实证以CSDN人工智能主题博客为例,使用少量种子三元组迭代生成句法模板抽取方法类实体及其关系,并通过过滤器模型提高抽取质量。[结果/结论]经过5轮迭代抽取,模型抽取三元组的精确度达到55.2%,优于现有通用模型。研究结果表明,该方法能够高效利用有限的标注数据,实现特定领域方法类实体及其关系的高效抽取,为学术界和产业界的科技情报分析提供支持。 展开更多
关键词 实体关系抽取 方法类实体 自动生成 句法模板 种子学习
在线阅读 下载PDF
融合层次对比学习的威胁情报实体关系抽取
4
作者 周法国 宋亚楠 廖俊斌 《计算机工程与设计》 北大核心 2025年第1期131-137,共7页
针对当前威胁情报领域实体关系抽取语义利用不充分、准确率低下的问题,提出一种基于层次对比学习的威胁情报领域实体关系抽取模型。利用预训练模型提取文本特征,融合三元组、句子级别正负样例信息输入到层次对比层进行全局语义和局部边... 针对当前威胁情报领域实体关系抽取语义利用不充分、准确率低下的问题,提出一种基于层次对比学习的威胁情报领域实体关系抽取模型。利用预训练模型提取文本特征,融合三元组、句子级别正负样例信息输入到层次对比层进行全局语义和局部边界增强,通过级联解码层加强实体识别与关系抽取的交互,采用层叠指针标注方式抽取出所有的实体关系三元组。根据威胁情报数据特点设计实体关系标注方案,构建数据集进行实验验证,模型在自建数据集上F1值达到82%,在公开数据集上的结果达到79%,验证了模型的有效性。 展开更多
关键词 威胁情报 实体关系抽取 层次对比学习 级联解码 正负样例信息 自建数据集 多头注意力机制
在线阅读 下载PDF
基于预训练大语言模型的实体关系抽取框架及其应用
5
作者 魏伟 金成功 +3 位作者 杨龙 周默 孟祥主 冯慧 《应用科学学报》 北大核心 2025年第1期20-34,共15页
实体关系抽取是构建大规模知识图谱和专业领域数据集的重要基础之一,为此提出了一种基于预训练大语言模型的实体关系抽取框架(entity relation extraction framework based on pre-trained large language model, PLLM-RE),并针对循环... 实体关系抽取是构建大规模知识图谱和专业领域数据集的重要基础之一,为此提出了一种基于预训练大语言模型的实体关系抽取框架(entity relation extraction framework based on pre-trained large language model, PLLM-RE),并针对循环经济政策进行了实体关系抽取研究。基于所提出的PLLM-RE框架,首先使用RoBERTa模型进行循环经济政策文本的实体识别,然后选取基于Transformer的双向编码器表示(bidirectional encoder representation from Transformers, BERT)模型进行循环经济政策实体关系抽取研究,以构建该政策领域的知识图谱。研究结果表明,PLLM-RE框架在循环经济政策实体关系抽取任务上的性能优于对比模型BiLSTM-ATT、PCNN、BERT以及ALBERT,验证了所提框架在循环经济政策实体关系抽取任务上的适配性和优越性,为后续循环经济领域资源的信息挖掘和政策分析提供了新思路。 展开更多
关键词 预训练大语言模型 实体关系抽取框架 循环经济政策 政策分析
在线阅读 下载PDF
基于改进CasRel模型的党建领域实体关系抽取研究
6
作者 陈心意 陈亮 王珺琳 《通信与信息技术》 2025年第1期128-132,共5页
随着实体关系抽取技术在党建领域数据处理的应用,有效地加强了党建工作信息化,为党建领域数据支持和智能分析提供了保障。然而,党建领域文本有复杂的语境和逻辑关系,为进一步解决党建数据集中实体嵌套以及三元组关系重叠的问题,提出了一... 随着实体关系抽取技术在党建领域数据处理的应用,有效地加强了党建工作信息化,为党建领域数据支持和智能分析提供了保障。然而,党建领域文本有复杂的语境和逻辑关系,为进一步解决党建数据集中实体嵌套以及三元组关系重叠的问题,提出了一种CasRel改进模型的实体关系抽取算法,首先,使用ERNIE编码器进行编码,完成对语义信息的深度挖掘;其次,在编码层增加BiLSTM模块以解决党建数据集中实体跨度较长的问题;最后,在客实体-关系识别层中加入layer normalization和linear层,确保模型能够更好地捕捉输入数据的信息,实现党建领域的实体关系抽取。实验表明,在自行构建的党建领域数据集和DuIE数据集上,与原CasRel模型相比,改进模型的F1值分别提升了3.21%和4.85%,证实了改进模型对党建领域数据集中重叠关系抽取的有效性。 展开更多
关键词 党建领域 实体关系抽取 CasRelE ERNIE BiLSTM
在线阅读 下载PDF
融合知识图谱与图卷积神经网络的非结构文本实体关系抽取
7
作者 熊文俊 赵辉 《信息技术与信息化》 2025年第2期71-74,共4页
非结构文本中的信息通常分散且不连贯,导致实体之间存在关系重叠,影响抽取结果的准确性。为优化非结构文本实体关系抽取效果,文章通过融合知识图谱与图卷积神经网络进行非结构文本实体关系抽取。基于预处理后的非结构文本数据构建一个... 非结构文本中的信息通常分散且不连贯,导致实体之间存在关系重叠,影响抽取结果的准确性。为优化非结构文本实体关系抽取效果,文章通过融合知识图谱与图卷积神经网络进行非结构文本实体关系抽取。基于预处理后的非结构文本数据构建一个包含实体和属性的知识图谱,作为后续实体关系抽取的基础。并将此作为GCN模型的输入,利用GCN对实体和关系进行编码,提取其深层特征。通过与知识图谱的融合,实现了非结构文本中实体关系的抽取。实验结果表明,该方法在处理非结构文本信息量增大的情况下,信息完整性保持得相当稳定,全程维持在约98%的高水平,且在2 ms以内即可完成256个节点的抽取。说明其方法能够完整且准确地抽取非结构文本中的实体关系,应用效果优势显著。 展开更多
关键词 知识图谱 图卷积神经网络 非结构文本 实体关系抽取
在线阅读 下载PDF
基于BiLSTM、BERT的医学知识图谱实体关系抽取研究与实践
8
作者 米仁沙·艾尼 《软件》 2025年第1期27-30,共4页
随着信息技术的迅猛发展,医学领域产生了海量的数据和知识,这些数据不仅包括临床病例、医学文献、实验研究结果等,还涵盖了药物、疾病、治疗方案等多种信息。这些信息的快速增长为医学研究和临床决策提供了丰富的支持,但同时也带来了巨... 随着信息技术的迅猛发展,医学领域产生了海量的数据和知识,这些数据不仅包括临床病例、医学文献、实验研究结果等,还涵盖了药物、疾病、治疗方案等多种信息。这些信息的快速增长为医学研究和临床决策提供了丰富的支持,但同时也带来了巨大的挑战。如何有效地从这些海量信息中提取有价值的知识,成为医学研究中的一个重要课题。知识图谱作为一种新兴的知识表示和管理方式,能够将复杂的医学知识以图形化的方式展现出来,促进知识的整合与共享。本文针对医学知识图谱构建中的核心问题——实体关系抽取,进行了深入的研究。通过分析现有技术的不足,提出了一种基于深度学习的实体关系抽取方法,并在实际医学文本数据上进行了验证。本文的研究成果对于医学知识图谱的构建和应用具有重要的理论和实践意义。 展开更多
关键词 医学知识图谱 实体关系抽取 神经网络
在线阅读 下载PDF
基于异构图和语义融合的实体关系抽取
9
作者 唐贤伦 丁河长 +2 位作者 唐瑜泽 谢涛 罗洪平 《实验技术与管理》 CAS 北大核心 2024年第8期22-29,共8页
关系抽取是信息抽取中的一项重要任务,其目的是从非结构化文本中抽取出所有关系三元组。然而,如何有效地处理这一问题仍然是一个挑战,特别是对于关系重叠问题。为了有效处理重叠问题,该文提出一种基于异构图和语义融合的实体关系抽取方... 关系抽取是信息抽取中的一项重要任务,其目的是从非结构化文本中抽取出所有关系三元组。然而,如何有效地处理这一问题仍然是一个挑战,特别是对于关系重叠问题。为了有效处理重叠问题,该文提出一种基于异构图和语义融合的实体关系抽取方法:使用异构图将关系信息作为先验知识融入词表示,增强词表示的表示能力,使得模型能有效地处理单词实体重叠问题;使用语义融合模块将不同层次特征融合在一起作为关系分类模型的输入,使得模型能够有效地处理实体对重叠问题。所提方法在NYT和WebNLG数据集上取得了最好的效果,详细的实验也表明所提方法可以处理复杂的场景。 展开更多
关键词 实体关系抽取 异构图 语义融合 关系重叠 实体关系三元组
在线阅读 下载PDF
基于并行异构图和序列注意力机制的中文实体关系抽取模型
10
作者 毛典辉 李学博 +2 位作者 刘峻岭 张登辉 颜文婧 《计算机应用》 CSCD 北大核心 2024年第7期2018-2025,共8页
近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之... 近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之一。针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型。HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架。该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题。另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力。运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征。HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%。实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息。 展开更多
关键词 实体关系抽取 异构图 注意力机制 对抗训练 SHAP方法
在线阅读 下载PDF
基于卷积神经网络的医疗护理实体关系抽取
11
作者 曹茂俊 胡喆 《电子设计工程》 2024年第8期18-22,共5页
针对医疗护理领域知识复杂性强、数据量大以及对准确度要求较高的问题,该研究提出一种基于卷积神经网络的医疗护理学实体关系抽取方法,实现对护理学语义关系的细粒度文本挖掘。该研究构建了医疗护理学语料标注系统,通过将医疗语料转化... 针对医疗护理领域知识复杂性强、数据量大以及对准确度要求较高的问题,该研究提出一种基于卷积神经网络的医疗护理学实体关系抽取方法,实现对护理学语义关系的细粒度文本挖掘。该研究构建了医疗护理学语料标注系统,通过将医疗语料转化为向量特征矩阵,实现了对医疗语料的自动过滤和标注。通过向神经网络模型嵌入所构建的医疗关系语料库,一定程度上提高了模型疾病分类的准确度。在医疗护理学数据集上的实验表明,基于卷积神经网络的模型在指标精确度、召回率、F1值可达到89.78%、87.59%、89.77%。综上所述,该研究提出的基于卷积神经网络的医疗护理学实体关系抽取方法能够有效地抽取医疗语料数据中的实体关系,优于传统的实体关系抽取模型。 展开更多
关键词 实体关系抽取 卷积神经网络 医疗护理学 词向量 知识图谱
在线阅读 下载PDF
深度语句级实体关系抽取综述
12
作者 赵从健 焦一源 李雁妮 《西安电子科技大学学报》 CSCD 北大核心 2024年第6期117-131,共15页
语句级实体关系抽取(以下简称实体关系抽取)意指从给定的一条语句中抽取其中一对实体之间的语义关系,它是人工智能中知识图谱构建、自然语言处理、智能问答、Web搜索等应用的重要基础,是当前人工智能中最前沿的基础研究难题。随着深度... 语句级实体关系抽取(以下简称实体关系抽取)意指从给定的一条语句中抽取其中一对实体之间的语义关系,它是人工智能中知识图谱构建、自然语言处理、智能问答、Web搜索等应用的重要基础,是当前人工智能中最前沿的基础研究难题。随着深度神经网络在多个领域的成功应用,现已出现了多种基于深度神经网络模型的实体关系抽取算法。近几年来,随着持续地处理与理解文本信息的需求,开始出现了一些实体关系抽取与持续学习相结合的深度持续实体关系抽取算法。该类算法可以使模型在不遗忘已学习的旧任务知识的同时,可持续高效地进行序列性的多个任务的实体关系抽取。文中将对现有典型的深度实体关系抽取和持续实体关系抽取方法,从其深度网络模型、算法框架、性能特征等方面进行深入分析综述,并指出其研究发展趋势,为实体关系抽取的深入研究起到抛砖引玉的作用。 展开更多
关键词 深度学习 自然语言处理 实体关系抽取 持续学习 持续实体关系抽取
在线阅读 下载PDF
面向文本实体关系抽取研究综述 被引量:2
13
作者 任安琪 柳林 +1 位作者 王海龙 刘静 《计算机科学与探索》 CSCD 北大核心 2024年第11期2848-2871,共24页
信息抽取是知识图谱构建的基础,关系抽取作为信息抽取的关键流程和核心步骤,旨在从文本数据中定位实体并识别实体间的语义联系。因此提高关系抽取的效率可以有效提升信息抽取的质量,进而影响到知识图谱的构建以及后续的下游任务。关系... 信息抽取是知识图谱构建的基础,关系抽取作为信息抽取的关键流程和核心步骤,旨在从文本数据中定位实体并识别实体间的语义联系。因此提高关系抽取的效率可以有效提升信息抽取的质量,进而影响到知识图谱的构建以及后续的下游任务。关系抽取按照抽取文本长度可以分为句子级关系抽取和文档级关系抽取,两种级别的抽取方法在不同应用场景下各有优缺点。句子级关系抽取适用于较小规模数据集的应用场景,而文档级关系抽取适用于新闻事件分析、长篇报告或文章的关系挖掘等场景。不同于已有的关系抽取,介绍了关系抽取的基本概念以及领域内近年来的发展历程,罗列了两种级别关系抽取所采用的数据集,对数据集的特点进行概述;分别对句子级关系抽取和文档级关系抽取进行了阐述,介绍了不同级别关系抽取的优缺点,并分析了各类方法中代表模型的性能以及局限性;总结了当前研究领域中存在的问题并对关系抽取发展前景进行了展望。 展开更多
关键词 信息抽取 实体关系抽取 句子级关系抽取 文档级关系抽取 知识图谱构建
在线阅读 下载PDF
基于RoBERTa和加权图卷积网络的中文地质实体关系抽取 被引量:2
14
作者 张鲁 段友祥 +1 位作者 刘娟 陆誉翕 《计算机科学》 CSCD 北大核心 2024年第8期297-303,共7页
知识是大数据和人工智能的基石,知识图谱的可解释性和可扩展性等优势使其成为智能系统的重要技术。智能决策在各个领域都有迫切的应用需求,为知识图谱提供基于数据分析和推理的决策支持和应用场景,但领域场景复杂、数据多源、知识维度广... 知识是大数据和人工智能的基石,知识图谱的可解释性和可扩展性等优势使其成为智能系统的重要技术。智能决策在各个领域都有迫切的应用需求,为知识图谱提供基于数据分析和推理的决策支持和应用场景,但领域场景复杂、数据多源、知识维度广,因此知识图谱的构建和应用都面临着很多挑战。针对地质领域知识图谱构建过程中领域知识模式完备性差的问题,以及现有实体关系抽取方法在处理非欧氏数据时存在的不足,提出了一种基于图结构的实体关系抽取模型RoGCN-ATT。该模型使用RoBERTa-wwm-ext-large中文预训练模型作为序列编码器,结合BiLSTM获取更丰富的语义信息,使用加权图卷积网络结合注意力机制获取结构依赖信息,以增强模型对关系三元组的抽取性能。在地质数据集上F1值达78.56%,与其他模型的对比实验表明,RoGCN-ATT有效提升了实体关系抽取性能,为地质知识图谱的构建和应用提供了有力的支持。 展开更多
关键词 实体关系抽取 图卷积网络 依存句法分析 注意力机制 地质领域
在线阅读 下载PDF
一种基于异构图神经网络和文本语义增强的实体关系抽取方法 被引量:1
15
作者 彭勃 李耀东 +1 位作者 龚贤夫 李浩 《计算机科学》 CSCD 北大核心 2024年第S01期256-260,共5页
信息化时代,如何从海量自然语言文本中提取结构化信息已经成为研究热点。电力系统中繁杂的知识信息需要通过构建知识图谱来解决,而实体关系抽取是其上游的信息抽取任务,其完成度直接关系到知识图谱的有效性。而随着深度学习的不断发展,... 信息化时代,如何从海量自然语言文本中提取结构化信息已经成为研究热点。电力系统中繁杂的知识信息需要通过构建知识图谱来解决,而实体关系抽取是其上游的信息抽取任务,其完成度直接关系到知识图谱的有效性。而随着深度学习的不断发展,利用深度学习技术来完成实体关系抽取任务的研究逐渐展开并取得了良好的效果。然而目前依然存在文本语义应用不完全等问题。针对这些问题本文尝试提出了一种基于异构图神经网络和文本语义增强的实体关系抽取方法,该方法使用词节点与关系节点学习语义特征,并通过BRET与预训练任务分别获得两种节点的初始特征,使用多层图网络结构迭代更新,并在每一层中使用基于多头注意力机制的信息传递实现两种节点的交互。通过该模型与其他实体关系抽取在两个公开数据集上实验对比,所提模型取得了预期效果,在多种情境下普遍优于对比模型。 展开更多
关键词 深度学习 自然语言处理 知识图谱 实体关系抽取 异构图神经网络 文本语义增强
在线阅读 下载PDF
最近对寻址的专利实体关系抽取方法 被引量:1
16
作者 李成奇 雷海卫 +1 位作者 李帆 呼文秀 《计算机工程与设计》 北大核心 2024年第4期1100-1108,共9页
针对专利领域没有公开数据集的问题,标注一个中文专利实体关系抽取数据集PERD(patent entity relation dataset)。为完成实体关系抽取任务,提出最近对寻址的实体关系抽取模型NPAM(nearest pair addressing entity relationship extracti... 针对专利领域没有公开数据集的问题,标注一个中文专利实体关系抽取数据集PERD(patent entity relation dataset)。为完成实体关系抽取任务,提出最近对寻址的实体关系抽取模型NPAM(nearest pair addressing entity relationship extraction model),实体位置信息获取方法的改进、注意力机制建模矩阵和实体抽取方法的创新,使该模型在PERD上F1值达到72.74%,相比模型PRGC提升12.64个百分点。实验结果验证了该模型的有效性。 展开更多
关键词 实体关系抽取 专利领域 数据集 最近对寻址 注意力机制 关联性矩阵 全词标记
在线阅读 下载PDF
基于对span的预判断和多轮分类的实体关系抽取 被引量:1
17
作者 佟缘 姚念民 《计算机工程与科学》 CSCD 北大核心 2024年第5期916-928,共13页
针对自然语言处理领域中的实体识别和关系抽取任务,提出一种对词元序列(Token Sequence,又称span)进行预测的模型Smrc。模型整体上利用BERT预训练模型作为编码器,另外包含实体预判断(Pej)、实体多轮分类(Emr)和关系多轮分类(Rmr)3个模块... 针对自然语言处理领域中的实体识别和关系抽取任务,提出一种对词元序列(Token Sequence,又称span)进行预测的模型Smrc。模型整体上利用BERT预训练模型作为编码器,另外包含实体预判断(Pej)、实体多轮分类(Emr)和关系多轮分类(Rmr)3个模块。Smrc模型通过Pej模块的初步判断及Emr模块的多轮实体分类来进行实体识别,再利用Rmr模块的多轮关系分类来判断实体对间的关系,进而完成关系抽取任务。在CoNLL04、SciERC和ADE 3个实验数据集上,Smrc模型的实体识别F1值分别达到89.67%,70.62%和89.56%,关系抽取F1值分别达到73.11%,51.03%和79.89%,相较之前在3个数据集上的最佳模型Spert,Smrc模型凭借实体预判断和实体及关系多轮分类,在2个子任务上其F1值分别提高了0.73%,0.29%,0.61%及1.64%,0.19%,1.05%,表明了该模型的有效性及其优势。 展开更多
关键词 对span的预判断 实体关系抽取 BERT预训练模型 多轮实体分类 多轮关系分类
在线阅读 下载PDF
基于伪实体数据增强的高精准率医学领域实体关系抽取
18
作者 郭安迪 贾真 李天瑞 《计算机应用》 CSCD 北大核心 2024年第2期393-402,共10页
针对医学领域知识密集、实体抽取和关系分类存在误差传递的问题,提出一种基于伪实体数据增强的高精准率的实体关系抽取框架。首先,在实体抽取模块添加基于Transformer的特征读取单元捕捉类别信息,以在密集的实体中准确识别医学长实体;其... 针对医学领域知识密集、实体抽取和关系分类存在误差传递的问题,提出一种基于伪实体数据增强的高精准率的实体关系抽取框架。首先,在实体抽取模块添加基于Transformer的特征读取单元捕捉类别信息,以在密集的实体中准确识别医学长实体;其次,在流水线抽取框架的基础上插入关系负例生成模块,通过基于欠采样的伪实体生成模型生成混淆关系分类模型的伪实体,并通过三种数据增强生成策略提升模型鉴别主语宾语颠倒、主语宾语边界错误和关系分类错误的能力;最后,通过基于悬浮标记的关系分类模型缓解数据增强带来的训练时间剧增的问题。在CMeIE数据集中,对比了目前主流的4个模型。实体抽取部分相较于次优模型PL-Marker(Packed Levitated Marker),F1值提升了2.26%;实体关系抽取相较于次优模型CBLUE(Chinese Biomedical Language Understanding Evaluation)提出的流水线抽取模型,F1值提升了5.45%,精准率提升了15.62%。实验结果表明使用特征读取单元和伪实体数据增强模块可有效提高抽取的精准率。 展开更多
关键词 实体关系抽取 数据增强 高精准率 医学领域 关系负例生成
在线阅读 下载PDF
主实体增强型层叠指针网络在中文医学实体关系抽取中的应用
19
作者 姜植瀚 昝红英 张莉 《计算机科学》 CSCD 北大核心 2024年第S01期97-102,共6页
随着中国医学事业的快速发展,中文医学文本的数量不断增加。为了从这些中文医学文本中提取有价值的信息,并解决中文医学领域的实体关系抽取问题,研究人员已经提出一系列基于双向LSTM的模型。然而,由于双向LSTM的训练速度等问题,文中引... 随着中国医学事业的快速发展,中文医学文本的数量不断增加。为了从这些中文医学文本中提取有价值的信息,并解决中文医学领域的实体关系抽取问题,研究人员已经提出一系列基于双向LSTM的模型。然而,由于双向LSTM的训练速度等问题,文中引入了层叠指针网络框架来处理中文医学文本的实体关系抽取任务。为了弥补层叠指针网络框架中主实体识别能力不足以及解决复用编码层时的梯度问题,文中提出了主实体增强模块,并引入了条件层归一化方法,从而提出了面向中文医学文本的主语增强型层叠指针网络框架(Subject Enhanced Cascade Binary Pointer Tagging Framework for Chinese Medical Text,SE-CAS)。通过引入主实体增强模块,能够精确识别有效的主实体,并排除错误实体。此外,还使用条件层归一化方法来替代原模型中的简单相加方法,并将其应用于编码层和主实体编码层。实验结果证明,所提模型在CMeIE数据集上取得了5.73%的F1值提升。通过消融实验证实,各个模块均能带来性能提升,并且这些提升具有叠加效应。 展开更多
关键词 实体关系抽取 层叠指针网络 医学关系抽取 深度学习 主语识别
在线阅读 下载PDF
基于证据图推理的文档级实体关系抽取
20
作者 张钰 王嘉 +1 位作者 袁建园 张益嘉 《情报杂志》 CSSCI 北大核心 2024年第7期122-130,共9页
[研究目的]为缓解文档级实体关系抽取任务中存在的句子噪声问题,提高文档级实体关系抽取性能,提出一种基于证据图推理的文档级实体关系抽取方法,为文档级实体关系抽取和知识发现研究提供参考。[研究方法]通过启发式规则捕获实体对间关... [研究目的]为缓解文档级实体关系抽取任务中存在的句子噪声问题,提高文档级实体关系抽取性能,提出一种基于证据图推理的文档级实体关系抽取方法,为文档级实体关系抽取和知识发现研究提供参考。[研究方法]通过启发式规则捕获实体对间关系推理所需证据句路径信息;引入图结构学习思想将证据句路径信息融入异构文档图;基于关系图卷积网络进行关系推理以提升文档图对证据句信息的聚合能力;采用前馈神经网络对实体关系进行预测,实现文档级实体关系高效抽取。[研究结论]所提出的模型在国际公开文档级评测数据集CDR和GDA上F1值分别达到71.3%和85.4%,较基准模型EIDER提高1.2%与1.1%。实验结果表明该方法能够有效选择实体关系推理所需证据路径,提升文档级实体关系抽取性能。 展开更多
关键词 文档级实体关系抽取 证据推理路径 图神经网络 启发式规则 知识发现
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部