-
题名结合依存图卷积的中文文本相似度计算研究
被引量:1
- 1
-
-
作者
胡书林
张华军
邓小涛
王征华
-
机构
武汉理工大学自动化学院
武汉大晟极科技有限公司
-
出处
《计算机工程》
北大核心
2025年第3期76-85,共10页
-
基金
湖北省重点研发计划项目(2022BAA051)。
-
文摘
目前中文文本相似度计算能够通过词嵌入技术在语义层面判别文本相似度,但通常忽略了文本中蕴含的丰富的句法结构信息,而以词为单位的中文句法分析与动态词嵌入模型中以字为单位的分词粒度不一致,使得当前大多数结合句法分析的研究只能使用静态词嵌入来表征词的语义向量。针对此问题,根据依存句法分析构建依存图,通过分词掩码映射与注意力混合池化的方法实现动态词嵌入表征词节点的语义特征,然后使用图卷积网络提取依存图中词节点之间的依存关系信息,最终读出依存图,将其作为句子的特征向量,从语义与句法2个层面计算句子间的相似度。在表示型与交互型2种结构模型上应用所提方法,并在BQ_Corpus与ATEC数据集上进行实验,结果显示,该模型的准确率最高分别达到87.12%与88.33%,结合依存句法信息后模型的各项评估指标均有提升。
-
关键词
图卷积神经网络
依存句法分析
动态词嵌入
文本相似度
注意力机制
-
Keywords
graph convolution neural network
dependency syntactic parsing
dynamic word embedding
text similarity
attention mechanism
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-