期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
CINOSUM:面向多民族低资源语言的抽取式摘要模型
1
作者 翁彧 罗皓予 +3 位作者 超木日力格 刘轩 董俊 刘征 《计算机科学》 CSCD 北大核心 2024年第7期296-302,共7页
针对现有的模型无法处理多民族低资源语言自动摘要生成的问题,基于CINO提出了一种面向多民族低资源语言的抽取式摘要模型CINOSUM。为扩大文本摘要的语言范围,首先构建了多种民族语言的摘要数据集MESUM。为解决以往模型在低资源语言上效... 针对现有的模型无法处理多民族低资源语言自动摘要生成的问题,基于CINO提出了一种面向多民族低资源语言的抽取式摘要模型CINOSUM。为扩大文本摘要的语言范围,首先构建了多种民族语言的摘要数据集MESUM。为解决以往模型在低资源语言上效果不佳的问题,构建了一个框架,采用统一的句子抽取器,以进行不同民族语言的抽取式摘要生成。此外,提出采用多语言数据集的联合训练方法,旨在弥补知识获取上的不足,进而扩展在低资源语言上的应用,显著增强模型的适应性与灵活性。最终,在MESUM数据集上开展了广泛的实验研究,实验结果表明CINOSUM模型在包括藏语和维吾尔语在内的多民族低资源语言环境中表现卓越,并且在ROUGE评价体系下取得了显著的性能提升。 展开更多
关键词 抽取式摘要 多语言预训练模型 低资源语言信息处理 知识迁移
在线阅读 下载PDF
面向中文法律裁判文书的抽取式摘要算法
2
作者 温嘉宝 杨敏 《集成技术》 2024年第1期62-71,共10页
裁判文书自动摘要的目的在于让计算机能够自动选择、抽取和压缩法律文本中的重要信息,从而减轻法律从业者的工作量。目前,大多数基于预训练语言模型的摘要算法对输入文本的长度存在限制,因此无法对长文本进行有效摘要。为此,该文提出了... 裁判文书自动摘要的目的在于让计算机能够自动选择、抽取和压缩法律文本中的重要信息,从而减轻法律从业者的工作量。目前,大多数基于预训练语言模型的摘要算法对输入文本的长度存在限制,因此无法对长文本进行有效摘要。为此,该文提出了一种新的抽取式摘要算法,利用预训练语言模型生成句子向量,并基于Transformer编码器结构融合包括句子向量、句子位置和句子长度在内的信息,完成句子摘要。实验结果显示,该算法能够有效处理长文本摘要任务。此外,在2020年中国法律智能技术评测(CAIL)摘要数据集上进行测试的结果表明,与基线模型相比,该模型在ROUGE-1、ROUGE-2和ROUGE-L指标上均有显著提升。 展开更多
关键词 抽取式摘要模型 法律裁判文书 文本自动摘要 深度神经网络
在线阅读 下载PDF
基于改进的MMR算法的新闻文本抽取式摘要方法 被引量:11
3
作者 程琨 李传艺 +2 位作者 贾欣欣 葛季栋 骆斌 《应用科学学报》 CAS CSCD 北大核心 2021年第3期443-455,共13页
提出了基于最大边缘相关(maximal marginal relevance, MMR)的新闻摘要方法以及基于支持向量机(support vector machine, SVM)和MMR相结合的新闻摘要方法。其中,第1种方法是对传统MMR模型进行了改进,第2种方法使用了改进MMR模型对SVM分... 提出了基于最大边缘相关(maximal marginal relevance, MMR)的新闻摘要方法以及基于支持向量机(support vector machine, SVM)和MMR相结合的新闻摘要方法。其中,第1种方法是对传统MMR模型进行了改进,第2种方法使用了改进MMR模型对SVM分类结果进行了二次选择。实验表明:相比于传统MMR模型,该文提出的基于改进MMR的摘要方法和基于SVM-MMR的摘要方法的平均准确率分别提升了0.148、0.204,且基于MMR的新闻摘要方法的摘要效率约为基于SVM-MMR的摘要方法的3倍。改进的MMR算法更加适用于对摘要效率要求高的应用场景,特别是对长文本进行摘要。基于SVM-MMR的摘要方法则更适用于生成对文本内容覆盖相对全面的摘要。 展开更多
关键词 新闻摘要 抽取式摘要 冗余处理 支持向量机 最大边缘相关
在线阅读 下载PDF
基于篇章主次关系的单文档抽取式摘要方法研究 被引量:14
4
作者 张迎 王中卿 王红玲 《中文信息学报》 CSCD 北大核心 2019年第8期67-76,共10页
抽取式自动文摘研究抽取文档中最能代表文档核心内容的句子作为摘要,篇章主次关系分析则是从篇章结构方面分析出篇章的主要内容和次要内容,因此,篇章主次关系分析和抽取式自动文摘存在较大关联,篇章主次关系可指导摘要的抽取。该文提出... 抽取式自动文摘研究抽取文档中最能代表文档核心内容的句子作为摘要,篇章主次关系分析则是从篇章结构方面分析出篇章的主要内容和次要内容,因此,篇章主次关系分析和抽取式自动文摘存在较大关联,篇章主次关系可指导摘要的抽取。该文提出了一种基于篇章主次关系的单文档抽取式摘要方法,该方法基于神经网络模型构建了一个篇章主次关系和文本摘要联合学习的模型。该模型在考虑词组、短语等语义信息的基础上同时考虑了篇章的主次关系等结构信息,最终基于篇章内容的整体优化抽取出最能代表文档核心内容的句子作为摘要。实验结果表明,与当前主流的单文档抽取式摘要方法相比,该方法在ROUGE评价指标上有显著提高。 展开更多
关键词 抽取式摘要 主次关系 神经网络
在线阅读 下载PDF
基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法 被引量:6
5
作者 曾昭霖 严馨 +2 位作者 徐广义 陈玮 邓忠莹 《小型微型计算机系统》 CSCD 北大核心 2023年第1期185-192,共8页
针对现有大多数面向查询的多文档抽取式摘要方法通常是将句子的内容显著性及查询相关性分开计算的,且对向量表示的建模不充分的问题,提出一种基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法.首先,通过训练层级BiGRU+Atte... 针对现有大多数面向查询的多文档抽取式摘要方法通常是将句子的内容显著性及查询相关性分开计算的,且对向量表示的建模不充分的问题,提出一种基于层级BiGRU+Attention的面向查询的新闻多文档抽取式摘要方法.首先,通过训练层级BiGRU+Attention神经网络模型,获得具有丰富上下文语义信息的句子、文档向量表示;并在此过程中通过双线性变换注意力机制,使得文档向量表示不仅具有反映文档深层主旨信息的基本特性,还融入句子与用户查询的相关性信息,然后利用句向量与其进行相似度计算获得相应的句子重要性得分;其次,由句子重要性得分、句子中包含的关键词特征、句子的长度特征以及句子的时序权重系数加权组合得到最终的句子综合特征权重得分;最后,利用MMR算法来选择摘要句.实验结果表明,与其他方法相比本文提出的方法能在一定程度上提高面向查询的多文档抽取式摘要的质量,具有一定的有效性及优越性. 展开更多
关键词 面向查询的抽取式摘要 中文多文档 层级BiGRU 注意力机制
在线阅读 下载PDF
BETES:一种中文长文档抽取式摘要方法 被引量:4
6
作者 王宗辉 李宝安 +1 位作者 吕学强 游新冬 《小型微型计算机系统》 CSCD 北大核心 2022年第1期42-49,共8页
在自然语言处理领域是最重要的研究工作之一,并随着深度学习的兴起成为研究热点,而中文长文本的摘要抽取面临更大的挑战,存在长文本-摘要语料库不足、摘要抽取信息不准确、目标摘要冗余、摘要句缺失等问题.本文以中文长文本的摘要抽取... 在自然语言处理领域是最重要的研究工作之一,并随着深度学习的兴起成为研究热点,而中文长文本的摘要抽取面临更大的挑战,存在长文本-摘要语料库不足、摘要抽取信息不准确、目标摘要冗余、摘要句缺失等问题.本文以中文长文本的摘要抽取为研究对象,提出一种BETES方法,基于规则和人工辅助筛选构建中文长文本-摘要语料库;利用Bert预处理模型进行文本向量化,更好地捕捉长文本上下文的语义,提升信息抽取的准确性;在识别中文长文本的基本篇章单元的基础上,以基本篇章单元为抽取对象,降低摘要抽取的冗余度;最后利用Transformer神经网络抽取模型,实现基本篇章单元的抽取,提升摘要句抽取的准确率.实验证明,提出的BETES方法在中文长文本的抽取式摘要过程中提高了准确性,降低了冗余度,并且ROUGE分数优于主流的摘要抽取方法. 展开更多
关键词 文本摘要 抽取式摘要 Bert 基本篇章单元 TRANSFORMER
在线阅读 下载PDF
基于关键词密度的多文档抽取式摘要算法 被引量:1
7
作者 杨朝举 葛唯益 +1 位作者 王羽 徐建 《指挥信息系统与技术》 2021年第5期48-53,共6页
多文档摘要是自然语言处理领域的热点研究问题之一。面向多文档对象,提出了一种基于预训练语言模型和关键词密度的多文档抽取式摘要算法。首先,通过预训练模型获取文档中所有句子的文档级句向量;然后,借助余弦相似度创建句子间的边连接... 多文档摘要是自然语言处理领域的热点研究问题之一。面向多文档对象,提出了一种基于预训练语言模型和关键词密度的多文档抽取式摘要算法。首先,通过预训练模型获取文档中所有句子的文档级句向量;然后,借助余弦相似度创建句子间的边连接关系,并提出了基于关键词密度的句子评分方法来提取摘要;最后,在基准数据集上的试验结果表明,该算法的Rouge性能指标优于其他具有代表性的多文档抽取式摘要算法。 展开更多
关键词 多文档摘要 抽取式摘要 文档级句向量 关键词密度
在线阅读 下载PDF
融合词、句层级信息的抽取式摘要优化框架
8
作者 林心宜 严睿 赵东岩 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第2期229-235,共7页
提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评... 提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评测的高分,证明了该框架的有效性。 展开更多
关键词 抽取式摘要生成 词层级信息 句层级信息 混合迭代优化框架
在线阅读 下载PDF
基于回归的抽取式摘要模型
9
作者 赵怀鹏 车万翔 刘挺 《智能计算机与应用》 2019年第2期200-203,207,共5页
就是一个高度概括原文重要信息的过程。摘要算法大致可以分为2类:抽取式摘要和生成式摘要。抽取式摘要的目的是从原文中选择一些重要的短语或句子来组成摘要。生成式摘要是利用算法生成文本的另一种表达,所用到的词汇表述并不一定来自... 就是一个高度概括原文重要信息的过程。摘要算法大致可以分为2类:抽取式摘要和生成式摘要。抽取式摘要的目的是从原文中选择一些重要的短语或句子来组成摘要。生成式摘要是利用算法生成文本的另一种表达,所用到的词汇表述并不一定来自于原文。自动文本摘要能够帮助很多下游任务(例如新闻摘要,社会媒体等)。近些年一些基于神经网络的工作大都将抽取式摘要任务当成序列标注来建模。这就存在训练和测试的不一致性问题:训练时当成分类任务,测试时当成排序任务。研究提出一种基于神经网络的回归模型,让模型在训练的时候就直接拟合ROUGE得到其分数用来做排序。实验结果超过目前抽取式摘要的最好结果。 展开更多
关键词 神经网络 抽取式摘要 回归模型
在线阅读 下载PDF
面向长文本的抽取式摘要生成方法
10
作者 全安坤 李红莲 《电脑知识与技术》 2023年第20期8-12,16,共6页
为了缓解自动文本摘要技术在长文本上效果不理想的问题,提出了一种面向长文本的抽取式摘要生成方法。首先,使用WoBERT模型获取融入义原信息的文本特征,并利用句子间的余弦相似度代替TextRank中边的权重进行迭代运算,得到句子的TextRank... 为了缓解自动文本摘要技术在长文本上效果不理想的问题,提出了一种面向长文本的抽取式摘要生成方法。首先,使用WoBERT模型获取融入义原信息的文本特征,并利用句子间的余弦相似度代替TextRank中边的权重进行迭代运算,得到句子的TextRank分数,其次利用LDA主题模型获取文章的主题关键词,根据句子中关键词出现频次得到句子的关键词得分,然后将句子的TextRank分数与关键词分数进行加权求和,得到的值应用于MMR算法进行冗余信息处理,最终抽取每篇文章中MMR值较高的3个句子组合成摘要。实验结果表明,所提方法与当前主流模型相比,生成的摘要质量有所提升。 展开更多
关键词 长文本 抽取式摘要 主题关键词 义原 冗余信息处理
在线阅读 下载PDF
基于Deep Q-Learning的抽取式摘要生成方法
11
作者 王灿宇 孙晓海 +4 位作者 吴叶辉 季荣彪 李亚东 张少如 杨士豪 《吉林大学学报(信息科学版)》 CAS 2023年第2期306-314,共9页
为解决训练过程中需要句子级标签的问题,提出一种基于深度强化学习的无标签抽取式摘要生成方法,将文本摘要转化为Q-learning问题,并利用DQN(Deep Q-Network)学习Q函数。为有效表示文档,利用BERT(Bidirectional Encoder Representations ... 为解决训练过程中需要句子级标签的问题,提出一种基于深度强化学习的无标签抽取式摘要生成方法,将文本摘要转化为Q-learning问题,并利用DQN(Deep Q-Network)学习Q函数。为有效表示文档,利用BERT(Bidirectional Encoder Representations from Transformers)作为句子编码器,Transformer作为文档编码器。解码器充分考虑了句子的信息富集度、显著性、位置重要性以及其与当前摘要之间的冗余程度等重要性等信息。该方法在抽取摘要时不需要句子级标签,可显著减少标注工作量。实验结果表明,该方法在CNN(Cable News Network)/DailyMail数据集上取得了最高的Rouge-L(38.35)以及可比较的Rouge-1(42.07)和Rouge-2(18.32)。 展开更多
关键词 抽取式文本摘要 BERT模型 编码器 深度强化学习
在线阅读 下载PDF
融入全局信息的抽取式摘要研究 被引量:2
12
作者 张翔 毛兴静 +1 位作者 赵容梅 琚生根 《计算机科学》 CSCD 北大核心 2023年第4期188-195,共8页
抽取式自动文本摘要旨在从原文中抽取最能表示全文语义的句子组成摘要,由于具有简单高效的特点被广泛地应用和研究。目前,抽取式摘要模型大多基于句子间的局部关系得到重要性得分,从而选择句子,这种方式忽略了原文的全局语义信息,模型... 抽取式自动文本摘要旨在从原文中抽取最能表示全文语义的句子组成摘要,由于具有简单高效的特点被广泛地应用和研究。目前,抽取式摘要模型大多基于句子间的局部关系得到重要性得分,从而选择句子,这种方式忽略了原文的全局语义信息,模型更容易受到局部非重要关系的影响。因此,提出一种融入全局语义信息的抽取式摘要模型。该模型在得到句子和文章的表示后,通过句子级编码器和全局信息提取模块学习句间关系以及全局信息,再将提取到的全局信息融入句向量中,最后得到句子得分以决定其是否为摘要句子。所提模型可以实现端到端的训练,并且在全局信息提取模块采用了基于方面抽取和神经主题模型两种全局信息提取技术。在公开数据集CNN/DailyMail上的实验结果验证了模型融入全局信息的有效性。 展开更多
关键词 抽取式文本摘要 全局信息 方面抽取 神经主题模型
在线阅读 下载PDF
基于度量学习和层级推理网络的抽取式摘要方法
13
作者 成悦 赵康 +1 位作者 勾智楠 高凯 《河北科技大学学报》 CAS 北大核心 2022年第6期594-601,共8页
当前大部分的抽取式摘要方法主要关注对摘要句的表示和抽取,容易忽略对文本特征表示的充分性。为了解决这一问题,提出一种基于度量学习和层级推理网络的抽取式摘要方法。首先,在抽取式任务基础上提出基于度量学习和层级推理的抽取式摘... 当前大部分的抽取式摘要方法主要关注对摘要句的表示和抽取,容易忽略对文本特征表示的充分性。为了解决这一问题,提出一种基于度量学习和层级推理网络的抽取式摘要方法。首先,在抽取式任务基础上提出基于度量学习和层级推理的抽取式摘要模型(MLHIN);其次,在CNN/DailyMail数据集上进行模型评估,并在英文摘要数据集CNN/DailyMail上进行测试;最后,对测试结果进行验证。结果显示,所提方法模型在Rouge-1,Rouge-2,Rouge-L上的得分明显优于其他模型,比Lead-3模型分别高出0.84%,1.29%和2.43%;通过将提出的度量损失metric和层级推理模型中的句子编码器替换掉,可以看出模型性能均有不同程度的下降,证明了提出的层级推理网络和度量损失的有效性。新算法能够提高模型捕捉长距离依赖的能力,增强模型对摘要句与非摘要句的分辨力,有效改善了抽取式摘要方法的性能。 展开更多
关键词 自然语言处理 句子编码器 文档编码器 度量学习 层级推理 抽取式文本摘要
在线阅读 下载PDF
基于无监督学习和监督学习的抽取式文本摘要综述 被引量:4
14
作者 夏吾吉 黄鹤鸣 +1 位作者 更藏措毛 范玉涛 《计算机应用》 CSCD 北大核心 2024年第4期1035-1048,共14页
相较于生成式摘要方法,抽取式摘要方法简单易行、可读性强,使用范围广。目前,抽取式摘要方法综述文献仅对特定的某个方法或领域进行分析综述,缺乏多方面、多语种的系统性综述,因此探讨文本摘要生成任务的内涵,通过系统梳理和提炼现有的... 相较于生成式摘要方法,抽取式摘要方法简单易行、可读性强,使用范围广。目前,抽取式摘要方法综述文献仅对特定的某个方法或领域进行分析综述,缺乏多方面、多语种的系统性综述,因此探讨文本摘要生成任务的内涵,通过系统梳理和提炼现有的相关文献,对无监督学习和监督学习的抽取式文本摘要技术进行多维度、全方位的分析。首先,回顾文本摘要技术的发展,分析不同的抽取式文本摘要方法,主要包括基于规则、词频-逆文件概率(TFIDF)、中心性方法、潜在语义、深度学习、图排序、特征工程和预训练学习等,并对比不同方法的差异;其次,详细介绍不同语种文本摘要生成的常用数据集和主流的评价指标,通过不同的实验指标对相同数据集上的方法进行比较;最后,指出当前抽取式文本摘要研究中存在的主要问题和挑战,并提出具体的解决思路和未来发展趋势。 展开更多
关键词 抽取式摘要 无监督学习 监督学习 数据集 评价指标
在线阅读 下载PDF
基于子句单元的异构图网络抽取式文本摘要
15
作者 林群凯 陈钰枫 +2 位作者 徐金安 张玉洁 刘健 《中文信息学报》 CSCD 北大核心 2024年第6期119-128,共10页
的目标是将长文本进行压缩、归纳和总结,从而形成具有概括性含义的短文本,其能帮助人们快速获取文档的主要信息。当前大多数的抽取式文本摘要的研究都是以整句作为抽取单元,而整句作为抽取单元会引入冗余信息,因此该文考虑使用粒度更细... 的目标是将长文本进行压缩、归纳和总结,从而形成具有概括性含义的短文本,其能帮助人们快速获取文档的主要信息。当前大多数的抽取式文本摘要的研究都是以整句作为抽取单元,而整句作为抽取单元会引入冗余信息,因此该文考虑使用粒度更细的抽取单元。已有研究表明,细粒度的子句单元比整句单元在抽取式摘要上更具有优势。结合当下热门的图神经网络,该文提出了一种基于子句单元异构图网络的抽取式摘要模型,有效融合了词、实体和子句单元等不同层次的语言信息,能够实现更细粒度的抽取式摘要。在大规模基准语料库(CNN/DM和NYT)上的实验结果表明,该模型产生了突破性的性能并优于以前的抽取式摘要模型。 展开更多
关键词 子句 异构图 抽取式摘要
在线阅读 下载PDF
融合抽取式和抽象式的藏文摘要算法
16
作者 高一鸣 魏志恒 +3 位作者 多拉 王文强 左祥建 贾星星 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第6期1215-1222,共8页
为了推动文本摘要技术在藏文领域的发展,采用两阶段微调的方法,构建了一种融合抽取式和抽象式的藏文摘要模型(BERT-ext-abs),保留了摘要的流畅性和语义一致性。训练抽取式藏文摘要模型BERT-ext,在此基础上进行第二次微调,得到抽象式藏... 为了推动文本摘要技术在藏文领域的发展,采用两阶段微调的方法,构建了一种融合抽取式和抽象式的藏文摘要模型(BERT-ext-abs),保留了摘要的流畅性和语义一致性。训练抽取式藏文摘要模型BERT-ext,在此基础上进行第二次微调,得到抽象式藏文摘要模型BERT-ext-abs。从训练模型结构和数据规模两个角度分别设置对比实验,结果表明,相较于未经过二次微调的抽象式藏文摘要模型BERT-abs, BERT-ext-abs模型在ROUGE-1分数上提高了3.23%,在BERT Score分数上提高了0.95%。此外,与BERT-abs相比,BERT-ext-abs的模型参数量和训练数据量更少,能更高效地生成流畅且语义一致的摘要。 展开更多
关键词 抽取式摘要 抽象式摘要 预训练模型 双向编码器表征法 藏文
在线阅读 下载PDF
基于多阶段内容选择框架的无监督抽取式多文档摘要方法
17
作者 冯毅 宋明阳 +1 位作者 景丽萍 于剑 《中文信息学报》 CSCD 北大核心 2024年第11期46-56,共11页
多文档抽取式摘要任务(MDES)旨在从多个相关文档中提取一个简明且包含显著信息的摘要。通常,在同主题的多个文档中冗余信息不可避免,例如,因不同表达方式造成的重复描述等。现有大多数方法在抽取摘要时,仅关注显著性内容的检测或冗余信... 多文档抽取式摘要任务(MDES)旨在从多个相关文档中提取一个简明且包含显著信息的摘要。通常,在同主题的多个文档中冗余信息不可避免,例如,因不同表达方式造成的重复描述等。现有大多数方法在抽取摘要时,仅关注显著性内容的检测或冗余信息的过滤二者之一,导致摘要信息不全面、不准确。因此,在建模抽取式多文档摘要任务时如何权衡两者间的协作是个挑战。考虑到多文档领域缺乏大规模训练数据,该文提出了一个新的多阶段的多文档无监督文本摘要抽取模型,该模型在摘要级别上进行提取,并通过以下三个步骤依次解决冗余性去除问题和显著性检测问题:引入外部知识的噪声过滤机制、冗余感知的排序策略,以及显著性感知的重排序策略。实验结果表明,该文框架可在多文档数据集Multi-News上取得无监督方法的最优结果,并在两个单文档数据集上获得有竞争力的结果。 展开更多
关键词 多文档抽取式摘要 无监督方法 多阶段框架
在线阅读 下载PDF
基于异构图和关键词的抽取式文本摘要模型 被引量:1
18
作者 朱颀林 王羽 徐建 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期259-270,共12页
抽取式文本摘要使用一定的策略从冗长的文本中选择一些句子组成摘要,其关键在于要尽可能多地利用文本的语义信息和结构信息。为了更好地挖掘这些信息,进而利用它们指导摘要的抽取,提出了一种基于异构图和关键词的抽取式文本摘要模型(HGK... 抽取式文本摘要使用一定的策略从冗长的文本中选择一些句子组成摘要,其关键在于要尽可能多地利用文本的语义信息和结构信息。为了更好地挖掘这些信息,进而利用它们指导摘要的抽取,提出了一种基于异构图和关键词的抽取式文本摘要模型(HGKSum)。该模型首先将文本建模为由句子节点和词语节点构成的异构图,在异构图上使用图注意力网络学习节点的特征,之后将关键词抽取任务作为文本摘要任务的辅助任务,使用多任务学习的方式进行训练,得到候选摘要,最后对候选摘要进行精炼以降低冗余度,得到最终摘要。在基准数据集上的对比实验表明,该模型性能优于基准模型,此外,消融实验也证明了引入异构节点和关键词的必要性。 展开更多
关键词 抽取式文本摘要 异构图 关键词 图注意力网络 多任务学习
在线阅读 下载PDF
基于无监督机器学习的抽取式文本摘要与翻译技术研究
19
作者 颜婷婷 戎慧敏 《广西民族大学学报(自然科学版)》 CAS 2024年第1期99-104,共6页
翻译是促进不同语言和文化之间交流和合作的重要手段,文本摘要作为一种有效的信息提取方法,可以帮助翻译者快速准确地把握原文的核心内容和语义信息。基于此,研究引入了无监督机器学习TextRank算法应用于文本摘要抽取中,同时结合了双向... 翻译是促进不同语言和文化之间交流和合作的重要手段,文本摘要作为一种有效的信息提取方法,可以帮助翻译者快速准确地把握原文的核心内容和语义信息。基于此,研究引入了无监督机器学习TextRank算法应用于文本摘要抽取中,同时结合了双向编码器表示、基于相似度关系的多特征融合计算机制以及改进的最大边界相关算法加以改进。结果显示,当抽取3条摘要时,改进TextRank算法的各项Rouge值分别高达48.01%、31.54%、37.86%。同时,改进TextRank算法在DailyMail数据集上双语评估研究指标高达69.81%。说明研究所提的改进TextRank算法在文本摘要抽取和翻译方面具有显著的性能优势,为现代翻译领域提供了一种有效的文本摘要抽取和翻译方法。 展开更多
关键词 无监督机器学习 抽取式文本摘要 翻译技术 TextRank算法
在线阅读 下载PDF
结合层级注意力的抽取式新闻文本自动摘要 被引量:6
20
作者 王红斌 金子铃 毛存礼 《计算机科学与探索》 CSCD 北大核心 2022年第4期877-887,共11页
由于抽取式摘要抽取句子有较强的人为判断主观性,不能准确客观评测出文章中实际每个句子对摘要的重要程度,以及每句话中每个词对句子重要程度的影响,从而影响了摘要的抽取质量。针对该问题,提出了一种结合层级注意力的抽取式新闻文本自... 由于抽取式摘要抽取句子有较强的人为判断主观性,不能准确客观评测出文章中实际每个句子对摘要的重要程度,以及每句话中每个词对句子重要程度的影响,从而影响了摘要的抽取质量。针对该问题,提出了一种结合层级注意力的抽取式新闻文本自动摘要方法。首先,该方法通过对英文新闻文本进行层级编码并依次加入词级注意力、句级注意力,得到结合层级注意力的文本表示。其次,通过神经网络构建动态打分函数并依次选择出打分函数中分值最高的候选句子作为摘要句。最后,抽取出英文新闻文本所对应的摘要。所提方法在CNN/Daily Mail、New York Times与Multi-News公共数据集上均进行了实验验证,实验结果表明所提方法的ROUGE评测值与目前最好的模型相比表现相当,ROUGE F1值较baseline分别提高了1.78、0.70与1.44个百分点。由此表明该方法在英文新闻文本抽取式摘要任务上具有泛化性与有效性,并且与现有方法相比具有一定的优越性。 展开更多
关键词 英文新闻 抽取式摘要 层级注意力 打分函数
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部