-
题名基于无监督学习和监督学习的抽取式文本摘要综述
被引量:4
- 1
-
-
作者
夏吾吉
黄鹤鸣
更藏措毛
范玉涛
-
机构
青海师范大学计算机学院
藏语智能信息处理及应用国家重点实验室(青海师范大学)
-
出处
《计算机应用》
CSCD
北大核心
2024年第4期1035-1048,共14页
-
基金
国家自然科学基金资助项目(62066039)
青海省自然科学基金资助项目(2022⁃ZJ⁃925)
藏语智能信息处理及应用国家重点实验室自主项目(2022⁃SKL⁃007)。
-
文摘
相较于生成式摘要方法,抽取式摘要方法简单易行、可读性强,使用范围广。目前,抽取式摘要方法综述文献仅对特定的某个方法或领域进行分析综述,缺乏多方面、多语种的系统性综述,因此探讨文本摘要生成任务的内涵,通过系统梳理和提炼现有的相关文献,对无监督学习和监督学习的抽取式文本摘要技术进行多维度、全方位的分析。首先,回顾文本摘要技术的发展,分析不同的抽取式文本摘要方法,主要包括基于规则、词频-逆文件概率(TFIDF)、中心性方法、潜在语义、深度学习、图排序、特征工程和预训练学习等,并对比不同方法的差异;其次,详细介绍不同语种文本摘要生成的常用数据集和主流的评价指标,通过不同的实验指标对相同数据集上的方法进行比较;最后,指出当前抽取式文本摘要研究中存在的主要问题和挑战,并提出具体的解决思路和未来发展趋势。
-
关键词
抽取式摘要
无监督学习
监督学习
数据集
评价指标
-
Keywords
extractive summarization
unsupervised learning
supervised learning
dataset
evaluation metric
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名超图神经网络综述
被引量:3
- 2
-
-
作者
林晶晶
冶忠林
赵海兴
李卓然
-
机构
青海师范大学计算机学院
藏语智能信息处理及应用国家重点实验室(青海师范大学)
西宁城市职业技术学院信息工程系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第2期362-384,共23页
-
基金
国家重点研发计划项目(2020YFC1523300)
青海省自然科学基金青年项目(2021-ZJ-946Q)
青海师范大学中青年自然科学基金项目(2020QZR007)。
-
文摘
近年来,图神经网络借助大量数据和超强计算能力在推荐系统和自然语言处理等应用领域取得显著成效,它主要处理具有成对关系的图数据.但许多现实网络中的对象之间的关系是复杂的非成对关系,如科研合作网络、蛋白质网络等.若直接用图结构将这种复杂的关系表示为成对关系,会导致信息丢失.超图是一种灵活的建模工具,可以展现出图无法完整刻画的高阶关系,弥补了图的不足.鉴于此,研究者开始关心如何在超图上设计神经网络,并相继提出应用于下游任务的超图神经网络模型(hypergraph neural network,HGNNs).故对现有的超图神经网络模型进行综述,首先全面回顾超图神经网络在过去3年的研究历程;其次根据设计超图神经网络采用的方法不同对其进行分类,并详细地阐述代表性的模型;然后介绍了超图神经网络的应用领域;最后总结和探讨了超图神经网络未来的研究方向.
-
关键词
超图
超图神经网络
分类
图
图神经网络
-
Keywords
hypergraph
hypergraph neural network
classification
graph
graph neural networks
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于混合特征建模的图卷积网络方法
被引量:3
- 3
-
-
作者
李卓然
冶忠林
赵海兴
林晶晶
-
机构
青海师范大学计算机学院
省部共建藏语智能信息处理及应用国家重点实验室(青海师范大学)
藏文信息处理教育部重点实验室(青海师范大学)
青海省藏文信息处理与机器翻译重点实验室(青海师范大学)
-
出处
《计算机应用》
CSCD
北大核心
2022年第11期3354-3363,共10页
-
基金
国家重点研发计划项目(2020YFC1523300)
青海省自然科学基金资助项目(2021‑ZJ‑946Q)
青海师范大学自然科学中青年科研基金资助项目(2020QZR007)。
-
文摘
对于网络中拥有的复杂信息,需要更多的方式抽取其中的有用信息,但现有的单特征图神经网络(GNN)无法完整地刻画网络中的相关特性。针对该问题,提出基于混合特征的图卷积网络(HDGCN)方法。首先,通过图卷积网络(GCN)得到节点的结构特征向量和语义特征向量;然后,通过改进基于注意力机制或门控机制的聚合函数选择性地聚合语义网络节点的特征,增强节点的特征表达能力;最后,通过一种基于双通道图卷积网络的融合机制得到节点的混合特征向量,将节点的结构特征和语义特征联合建模,使特征之间互相补充,提升该方法在后续各种机器学习任务上的表现。在CiteSeer、DBLP和SDBLP三个数据集上进行实验的结果表明,与基于结构特征训练的GCN相比,HDGCN在训练集比例为20%、40%、60%、80%时的Micro‑F1值平均分别提升了2.43、2.14、1.86和2.13个百分点,Macro‑F1值平均分别提升了1.38、0.33、1.06和0.86个百分点。用拼接或平均值作为融合策略时,准确率相差不超过0.5个百分点,可见拼接和平均值均可作为融合策略。HDGCN在节点分类和聚类任务上的准确率高于单纯使用结构或语义网络训练的模型,并且在输出维度为64、学习率为0.001、2层图卷积层和128维注意力向量时的效果最好。
-
关键词
注意力机制
门控机制
双通道图卷积网络
结构特征
语义特征
-
Keywords
attention mechanism
gating mechanism
dual channel graph convolutional network
structure feature
semantic feature
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-