期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于双流残差融合的多模态讽刺解释研究
1
作者 吴运兵 曾炜森 +2 位作者 高航 阴爱英 廖祥文 《小型微型计算机系统》 CSCD 北大核心 2024年第11期2628-2635,共8页
针对现有多模态讽刺解释模型在融合过程中仅关注图像中的细粒度特征信息,使得模型存在解释效果不佳、多模态特征难以融合等问题,本文设计了一种基于双流残差注意力的多模态融合机制.首先,本文采用了BART和VGG19模型分别提取文本和图像... 针对现有多模态讽刺解释模型在融合过程中仅关注图像中的细粒度特征信息,使得模型存在解释效果不佳、多模态特征难以融合等问题,本文设计了一种基于双流残差注意力的多模态融合机制.首先,本文采用了BART和VGG19模型分别提取文本和图像两种模态特征.其次,模型经过两路多头注意力引导,分别关注图像和文本的细粒度信息,考虑到单纯的多头自注意力不能很好学习图文间的关联信息,采用二次注意力模块(AOA)合理分配特征权重.最后,本文将多模态特征拼接融合后输入BART解码器中进行讽刺解释.模型在公开的数据集MORE上的实验结果表明,相较于ExMore模型,本文模型在METEOR和ROUGE-L评价指标上分别提升了4.35%、3.39%.实验结果表明本文模型能更好融合模态特征,从而显著地提升模型解释的效果. 展开更多
关键词 自然语言处理 深度学习 讽刺解释 多模态 注意力机制
在线阅读 下载PDF
基于深度自动编码器的多标签分类研究 被引量:4
2
作者 聂煜 廖祥文 +2 位作者 魏晶晶 杨定达 陈国龙 《广西师范大学学报(自然科学版)》 CAS 北大核心 2019年第1期71-79,共9页
在多标签分类的相关研究中,由于现有的基于网络表示学习算法的相关方法只利用了网络中节点之间的邻接领域信息,而没有考虑到节点之间的结构相似性,从而导致分类准确性较低,因此,本文提出一种基于深度自动编码器的多标签分类模型。该方... 在多标签分类的相关研究中,由于现有的基于网络表示学习算法的相关方法只利用了网络中节点之间的邻接领域信息,而没有考虑到节点之间的结构相似性,从而导致分类准确性较低,因此,本文提出一种基于深度自动编码器的多标签分类模型。该方法首先利用轨迹计算算法(Orca)计算不同规模下网络中节点的结构相似性,作为深度自动编码器的输入来改进隐藏层中的向量表示,保留网络的全局结构;然后利用节点的邻接领域信息在模型中进行联合优化,从而能有效地捕捉到网络的高度非线性结构;最后根据隐藏层得到节点的向量表示,利用支持向量机对节点进行多标签分类。验证实验采用3个公开的网络数据集,实验结果表明,与基准方法相比,本文方法在多标签分类任务中能取得更好的效果。 展开更多
关键词 多标签分类 网络表示学习 结构相似性 深度自动编码器
在线阅读 下载PDF
角色增强的共情回复生成
3
作者 吴运兵 叶成龙 +2 位作者 阴爱英 陈开志 杨州 《模式识别与人工智能》 CSCD 北大核心 2024年第12期1043-1055,共13页
共情回复生成旨在理解对话中用户的经历与感受并表达出合理的回复.心理学理论认为,角色是人格的外在表现,与共情密切相关.然而,现有工作主要关注共情的认知因素和情绪因素,忽略有益于共情的角色因素,导致缺少个性化的共情回复.为了解决... 共情回复生成旨在理解对话中用户的经历与感受并表达出合理的回复.心理学理论认为,角色是人格的外在表现,与共情密切相关.然而,现有工作主要关注共情的认知因素和情绪因素,忽略有益于共情的角色因素,导致缺少个性化的共情回复.为了解决该问题,文中提出角色增强的共情回复生成模型(Persona-Enhanced Empathetic Response Generation Model,PERG).首先,为了有效利用角色信息,提出角色增强编码模块,通过编码器捕获上下文、情境及角色信息的深层语义关系,结合上下文和情境筛选角色信息,提升模型对说话者与回应者角色的理解,增强共情能力.然后,在角色调控解码模块中,设计基于多解码器融合的调控机制,有效结合角色信息,调节上下文和情境对共情回复的影响,生成高度个性化的共情回复.在公开的共情回复EmpatheticDialogues数据集上的实验表明,PERG在多个指标上均取得较优值. 展开更多
关键词 自然语言处理 对话系统 共情回复 角色增强 角色调控
在线阅读 下载PDF
基于语义相关性分析的多模态摘要模型 被引量:1
4
作者 林于翔 吴运兵 +1 位作者 阴爱英 廖祥文 《计算机应用》 CSCD 北大核心 2024年第1期65-72,共8页
多模态生成式摘要往往采用序列到序列(Seq2Seq)框架,目标函数在字符级别优化模型,根据局部最优解生成单词,忽略了摘要样本全局语义信息,使得摘要与多模态信息产生语义偏差,容易造成事实性错误。针对上述问题,提出一种基于语义相关性分... 多模态生成式摘要往往采用序列到序列(Seq2Seq)框架,目标函数在字符级别优化模型,根据局部最优解生成单词,忽略了摘要样本全局语义信息,使得摘要与多模态信息产生语义偏差,容易造成事实性错误。针对上述问题,提出一种基于语义相关性分析的多模态摘要模型。首先,在Seq2Seq框架基础上对多模态摘要进行训练,生成语义多样性的候选摘要;其次,构建基于语义相关性分析的摘要评估器,从全局的角度学习候选摘要之间的语义差异性和真实评价指标ROUGE(Recall-Oriented Understudy for Gisting Evaluation)的排序模式,从而在摘要样本层面优化模型;最后,不依赖参考摘要,利用摘要评估器对候选摘要进行评价,使得选出的摘要与源文本在语义空间中尽可能相似。实验结果表明,在公开数据集MMSS上,相较于MPMSE(Multimodal Pointer-generator via Multimodal Selective Encoding)模型,所提模型在ROUGE-1、ROUGE-2、ROUGE-L评价指标上分别提升了3.17、1.21和2.24个百分点。 展开更多
关键词 多模态 生成式摘要 序列到序列 事实性错误 语义相关性
在线阅读 下载PDF
从整体到局部优化的文本风格迁移模型
5
作者 范剑宏 杨州 +2 位作者 蔡铁城 吴运兵 廖祥文 《福州大学学报(自然科学版)》 CAS 北大核心 2024年第4期413-420,共8页
提出一种从整体到局部优化的风格迁移(global-local based style transfer,G-LST)模型.首先,利用广泛的源端数据进行迭代优化来自动构建高质量的伪平行数据,并通过联合训练来提升模型对整体风格的语义感知;随后,利用常识性知识修正词级... 提出一种从整体到局部优化的风格迁移(global-local based style transfer,G-LST)模型.首先,利用广泛的源端数据进行迭代优化来自动构建高质量的伪平行数据,并通过联合训练来提升模型对整体风格的语义感知;随后,利用常识性知识修正词级的细粒度风格来增强局部风格的表现,同时兼顾整体与局部风格,提高风格转换的准确度.基于GYAFC数据集的实验结果表明,相较于目前表现最佳的文本风格迁移模型,G-LST模型在E&M与F&R两个领域数据上的风格转换准确率分别提高了2.70%和4.47%,内容保留与风格准确率的综合指标分别提升了1.18%和1.95%. 展开更多
关键词 文本风格迁移 迭代优化 联合训练 常识性知识
在线阅读 下载PDF
基于多任务迭代学习的论辩挖掘方法 被引量:6
6
作者 廖祥文 陈泽泽 +2 位作者 桂林 程学旗 陈国龙 《计算机学报》 EI CSCD 北大核心 2019年第7期1524-1538,共15页
论辩挖掘可分为论点边界的检测、论点类型的识别、论点关系的抽取三个子任务.现有的工作大多数对子任务分别建模研究,忽略了三个子任务之间的关联信息,导致性能低下.另外,还有部分的工作采用流水线模型把三个子任务进行联合建模,由于流... 论辩挖掘可分为论点边界的检测、论点类型的识别、论点关系的抽取三个子任务.现有的工作大多数对子任务分别建模研究,忽略了三个子任务之间的关联信息,导致性能低下.另外,还有部分的工作采用流水线模型把三个子任务进行联合建模,由于流水线模型仍然是独立的看待每个子任务,为每个子任务训练单独的模型,存在错误传播的问题,且在训练过程中产生了冗余信息.因此,本文提出了一种基于多任务迭代学习的论辩挖掘方法.该方法将论辩挖掘三个任务并行地联合在一起学习,首先通过深度卷积神经网络(CNN)和高速神经网络(Highway Network),获得文本字符和词级别的浅层共享参数表示;然后输入双向长短时记忆循环神经网络(Bi-LSTM),利用论辩挖掘三个任务之间的关联信息进行同时训练,不仅可以避免错误传播,而且能够克服冗余信息的产生;最后,联结三个任务的Bi-LSTM网络输出作为下一次迭代的输入,来提高模型的性能.实验采用了德国UKP实验室公开的学生论文数据集,实验结果表明,与目前最好的基准方法对比,该方法的准确率指标提高了2.74%,“ F1 (100%)”和“ F1 (50%)”指标分别提高了1.05%和1.19%,很好地验证了该方法的有效性。 展开更多
关键词 多任务学习 论辩挖掘 迭代模型 深度学习 卷积神经网络
在线阅读 下载PDF
基于多任务联合学习的论辩挖掘 被引量:4
7
作者 廖祥文 倪继昌 +2 位作者 魏晶晶 吴运兵 陈国龙 《模式识别与人工智能》 EI CSCD 北大核心 2019年第12期1072-1079,共8页
现有的论辩挖掘工作大多针对单个数据集建模,忽视数据集不同时可能存在的特征变化情况,导致模型的泛化性能较差.因此,文中提出基于多任务学习的论辩挖掘方法,将多个数据集的论辩挖掘任务进行联合学习.首先融合多个任务的输入层表示,通... 现有的论辩挖掘工作大多针对单个数据集建模,忽视数据集不同时可能存在的特征变化情况,导致模型的泛化性能较差.因此,文中提出基于多任务学习的论辩挖掘方法,将多个数据集的论辩挖掘任务进行联合学习.首先融合多个任务的输入层表示,通过卷积神经网络和高速神经网络获取词级别和字符级共享参数,联合任务相关特征输入栈式双向长短记忆网络,利用多个论辩挖掘任务之间的关联信息并行训练,最终由条件随机场得到序列标注结果.在6个不同领域的数据集上的实验表明,文中方法在Macro-F1值上有所提升,由此验证方法的有效性. 展开更多
关键词 论辩挖掘 多任务学习 深度学习 神经网络
在线阅读 下载PDF
基于辅助记忆循环神经网络的视角级情感分析 被引量:2
8
作者 廖祥文 林威 +2 位作者 吴运兵 魏晶晶 陈国龙 《模式识别与人工智能》 EI CSCD 北大核心 2019年第11期987-996,共10页
现有视角级情感分析方法大多数利用视角词信息从句子中提取特征,不能同时利用视角和视角词信息,导致模型性能较低,为此文中提出基于辅助记忆循环神经网络的视角级情感分析方法.首先通过深度双向长短期记忆网络和单词的位置信息构建位置... 现有视角级情感分析方法大多数利用视角词信息从句子中提取特征,不能同时利用视角和视角词信息,导致模型性能较低,为此文中提出基于辅助记忆循环神经网络的视角级情感分析方法.首先通过深度双向长短期记忆网络和单词的位置信息构建位置权重记忆,利用注意力机制结合视角词建立视角记忆.再联合位置权重记忆和视角记忆输入多层门循环单元,得到视角情感特征.最后由归一化函数识别情感极性.实验表明,相对基准实验,文中方法在3个公开数据集上的效果更好,该方法是有效的. 展开更多
关键词 视角级情感分析 注意力机制 深度学习
在线阅读 下载PDF
基于视觉误差与语义属性的零样本图像分类 被引量:4
9
作者 徐戈 肖永强 +3 位作者 汪涛 陈开志 廖祥文 吴运兵 《计算机应用》 CSCD 北大核心 2020年第4期1016-1022,共7页
在图像分类的实际应用过程中,部分类别可能完全没有带标签的训练数据。零样本学习(ZSL)的目的是将带标签类别的图像特征等知识迁移到无标签的类别上,实现无标签类别的正确分类。现有方法在测试时无法显式地区分输入图像属于已知类还是... 在图像分类的实际应用过程中,部分类别可能完全没有带标签的训练数据。零样本学习(ZSL)的目的是将带标签类别的图像特征等知识迁移到无标签的类别上,实现无标签类别的正确分类。现有方法在测试时无法显式地区分输入图像属于已知类还是未知类,很大程度上导致未知类在传统设定下的ZSL和广义设定下的ZSL(GZSL)上的预测效果相差甚远。为此,提出一种融合视觉误差与属性语义信息的方法来缓解零样本图像分类中的预测偏置问题。首先,设计一种半监督学习方式的生成对抗网络架构来获取视觉误差信息,由此预测图像是否属于已知类;然后,提出融合属性语义信息的零样本图像分类网络来实现零样本图像分类;最后,测试融合视觉误差与属性语义的零样本图像分类方法在数据集AwA2和CUB上的效果。实验结果表明,与对比模型相比,所提方法有效缓解了预测偏置问题,其调和指标H在AwA2(Animal with Attributes)上提升了31.7个百分点,在CUB(Caltech-UCSD-Birds-200-2011)上提升了8.7个百分点。 展开更多
关键词 零样本学习 图像分类 生成对抗网络 视觉误差 属性语义
在线阅读 下载PDF
基于知识图谱与循环注意力网络的视角级情感分析 被引量:3
10
作者 邓立明 魏晶晶 +2 位作者 吴运兵 余小燕 廖祥文 《模式识别与人工智能》 EI CSCD 北大核心 2020年第6期479-487,共9页
现有的视角级情感分析方法难以解决单词在不同语境下“一词多义”问题,因此性能受限.针对上述问题,文中提出基于知识图谱与循环注意力网络的视角级情感分析方法.首先,利用动态注意力机制,结合双向长短时记忆网络的文本表示和知识图谱中... 现有的视角级情感分析方法难以解决单词在不同语境下“一词多义”问题,因此性能受限.针对上述问题,文中提出基于知识图谱与循环注意力网络的视角级情感分析方法.首先,利用动态注意力机制,结合双向长短时记忆网络的文本表示和知识图谱中的同义词信息,获得知识感知状态向量.再联合位置信息构造记忆内容,并输入多层门限循环单元,计算视角词情感特征,进行视角级文本情感分类.在3个公开数据集上的实验表明,文中方法分类效果较优. 展开更多
关键词 视角级情感分析 知识图谱 注意力机制 深度学习
在线阅读 下载PDF
基于级联时空特征的信息传播预测方法 被引量:2
11
作者 梁少斌 陈志豪 +2 位作者 魏晶晶 吴运兵 廖祥文 《模式识别与人工智能》 CSCD 北大核心 2021年第11期969-978,共10页
现有信息传播预测方法对级联序列和拓扑结构独立建模,难以学习级联时序特征和结构特征在嵌入空间的交互表达,造成对信息传播动态演化的刻画不足.因此,文中提出基于级联时空特征的信息传播预测方法.基于社交关系网络和传播路径构建异质图... 现有信息传播预测方法对级联序列和拓扑结构独立建模,难以学习级联时序特征和结构特征在嵌入空间的交互表达,造成对信息传播动态演化的刻画不足.因此,文中提出基于级联时空特征的信息传播预测方法.基于社交关系网络和传播路径构建异质图,使用图神经网络学习异质图和社交关系网络节点的结构上下文,引入门控循环单元提取级联时序特征,融合结构上下文和时序特征,构建级联时空特征,进行信息传播的微观预测.在Twitter、Memes数据集上的实验表明,文中方法性能得到一定提升. 展开更多
关键词 信息级联 传播预测 时空特征 图神经网络 循环神经网络
在线阅读 下载PDF
基于深度学习的情感对话响应综述 被引量:5
12
作者 杨州 陈志豪 +2 位作者 蔡铁城 王宇峰 廖祥文 《计算机学报》 EI CAS CSCD 北大核心 2023年第12期2489-2519,共31页
人机对话作为人工智能的重要领域,以其方便快捷的交互特点广泛应用于任务型和闲聊型机器人等诸多商业场景,并被视为新一代人机交互的主要形式.但情绪感知与表达能力的缺乏致使人机对话技术在复杂交互场景中难以满足人们对情感交流的强... 人机对话作为人工智能的重要领域,以其方便快捷的交互特点广泛应用于任务型和闲聊型机器人等诸多商业场景,并被视为新一代人机交互的主要形式.但情绪感知与表达能力的缺乏致使人机对话技术在复杂交互场景中难以满足人们对情感交流的强烈需求.为弥补人机对话技术中情感智能的缺失,基于深度学习的情感对话响应任务被提出且已发展为对话领域中一个重要的研究方向.本文首先回顾了基于深度学习的情感对话响应任务的发展历程,其次按照任务将情感对话响应分为可控情感对话生成、共情对话响应、情绪支持、多模态情感对话生成、新任务五类.随后本文也按照常用的结构将模型进行了归类与分析,以求更细致地阐述各种结构在情感对话响应任务中的具体用法,之后介绍了常用数据与评测指标.最后本文也对模型进行了总结,并在此基础上进一步展望了该任务未来的发展方向. 展开更多
关键词 情感计算 情感分析 对话系统 文本生成 自然语言处理 深度学习
在线阅读 下载PDF
基于生成式-判别式混合模型的可解释性文档分类 被引量:1
13
作者 王强 陈志豪 +2 位作者 徐庆 鲍亮 廖祥文 《模式识别与人工智能》 EI CSCD 北大核心 2020年第11期995-1003,共9页
现有可解释性文档分类常忽略对文本信息的深度挖掘,未考虑单词与单词上下文、句子与句子上下文之间的语义关系.为此,文中提出基于生成式-判别式混合模型的可解释性文档分类方法,在文档编码器中引入分层注意力机制,获得富含上下文语义信... 现有可解释性文档分类常忽略对文本信息的深度挖掘,未考虑单词与单词上下文、句子与句子上下文之间的语义关系.为此,文中提出基于生成式-判别式混合模型的可解释性文档分类方法,在文档编码器中引入分层注意力机制,获得富含上下文语义信息的文档表示,生成精确的分类结果及解释性信息,解决现有模型对文本信息挖掘不够充分的问题.在PCMag、Skytrax评论数据集上的实验表明,文中方法在文档分类上性能较优,生成较准确的解释性信息,提升方法的整体性能. 展开更多
关键词 可解释性 分层注意力机制 文本分类 文本摘要 视角级情感分类
在线阅读 下载PDF
基于生成对抗网络的类别文本生成 被引量:1
14
作者 蔡丽坤 吴运兵 +2 位作者 陈甘霖 刘翀凌 廖祥文 《广西师范大学学报(自然科学版)》 CAS 北大核心 2022年第4期79-90,共12页
类别文本生成旨在让机器生成人类可理解的文本,并且赋予生成文本特定的类别属性。现有工作主要采用基于生成对抗网络的文本生成框架,往往直接采用卷积神经网络进行文本特征提取,缺乏对文本全局语义的关注;此外,简单地在生成网络中引入... 类别文本生成旨在让机器生成人类可理解的文本,并且赋予生成文本特定的类别属性。现有工作主要采用基于生成对抗网络的文本生成框架,往往直接采用卷积神经网络进行文本特征提取,缺乏对文本全局语义的关注;此外,简单地在生成网络中引入注意力无法有效消除解码过程中的噪声。针对上述问题,本文提出一种将文本全局特征与局部特征联合建模的方法,通过将长短时记忆网络提取的全局语义信息与卷积神经网络提取的局部语义信息进行融合,增强生成过程中对文本全局语义信息的关注,并且引入双重注意力,进一步过滤掉序列生成中的无关信息。与基准模型相比,本文提出的方法分别在2个公开的真实数据集(Movie Review和Amazon Review)上取得了至少0.01和0.004的BLEU值的提升,表明了本文方法的有效性。 展开更多
关键词 文本生成 生成对抗网络 双重注意力 特征融合 进化学习算法
在线阅读 下载PDF
面向特征融合与知识蒸馏的恶意软件分类
15
作者 庄贤 陈志豪 +2 位作者 蔡铁城 陈开志 廖祥文 《福州大学学报(自然科学版)》 CAS 北大核心 2023年第6期762-768,共7页
提出一种面向特征融合与知识蒸馏的恶意软件分类方法.一方面,通过残差网络分别从灰度图和马尔可夫图中抽取恶意软件的序列特征和分布特征,并利用自注意力挖掘不同特征之间的关联性,以提升模型性能;另一方面,通过教师网络向多个学生网络... 提出一种面向特征融合与知识蒸馏的恶意软件分类方法.一方面,通过残差网络分别从灰度图和马尔可夫图中抽取恶意软件的序列特征和分布特征,并利用自注意力挖掘不同特征之间的关联性,以提升模型性能;另一方面,通过教师网络向多个学生网络进行知识迁移,并让学生网络互相协作学习,进一步降低模型规模.在微软和CCF数据集上的实验结果证明,该方法不仅能有效提升模型性能,而且可以降低模型的参数量和计算量.此外,通过热力图定位影响分类结果的字节,验证卷机神经网络从图像中抽取特征进行分类的科学性. 展开更多
关键词 恶意软件分类 恶意软件图像 自注意力 知识蒸馏
在线阅读 下载PDF
基于双重匹配注意力网络的观点型阅读理解
16
作者 蔡子阳 陈志豪 +2 位作者 杨州 苏艺淞 廖祥文 《福州大学学报(自然科学版)》 CAS 北大核心 2023年第3期307-314,共8页
提出一种基于双重匹配注意力网络的方法.先用动态匹配机制迭代综合获取全局观点信息,同时利用多维度匹配机制在不同特征空间上计算全局语义信息,然后交互式多路注意力机制通过两路注意力之间的交互计算对上述全局的观点与语义信息进行融... 提出一种基于双重匹配注意力网络的方法.先用动态匹配机制迭代综合获取全局观点信息,同时利用多维度匹配机制在不同特征空间上计算全局语义信息,然后交互式多路注意力机制通过两路注意力之间的交互计算对上述全局的观点与语义信息进行融合,最后与选项表示结合预测答案的观点倾向.在观点型阅读理解数据集ReCO和Dureader上面的实验表明,该方法相对于基准模型在准确率上提升了1.18%和0.84%,在加权宏F1上提升了1.16%和0.75%. 展开更多
关键词 机器阅读理解 观点挖掘 交互式多路注意力机制
在线阅读 下载PDF
基于分层注意力网络的社交媒体谣言检测 被引量:18
17
作者 廖祥文 黄知 +2 位作者 杨定达 程学旗 陈国龙 《中国科学:信息科学》 CSCD 北大核心 2018年第11期1558-1574,共17页
在社交媒体谣言检测问题上,现有的基于特征表示学习的研究工作大多数先把微博事件划分为若干个时间段,再对每个时间段提取文本向量表示、全局用户特征等,忽略了时间段内各微博间的时序信息,且未利用到在传统机器学习方法中已取得较好效... 在社交媒体谣言检测问题上,现有的基于特征表示学习的研究工作大多数先把微博事件划分为若干个时间段,再对每个时间段提取文本向量表示、全局用户特征等,忽略了时间段内各微博间的时序信息,且未利用到在传统机器学习方法中已取得较好效果的文本潜在信息和局部用户信息,导致性能较低.因此,本文提出了一种基于分层注意力网络的社交媒体谣言检测方法.该方法首先将微博事件按照时间段进行分割,并输入带有注意力机制的双向GRU网络,获取时间段内微博序列的隐层表示,以刻画时间段内微博间的时序信息;然后将每个时间段内的微博视为一个整体,提取文本潜在特征和局部用户特征,并与微博序列的隐层表示相连接,以融入文本潜在信息和局部用户信息;最后通过带有注意力机制的双向GRU网络,得到时间段序列的隐层表示,进而对微博事件进行分类.实验采用了新浪微博数据集和Twitter数据集,实验结果表明,与目前最好的基准方法相比,该方法在新浪微博数据集和Twitter数据集上正确率分别提高了1.5%和1.4%,很好地验证了该方法在社交媒体谣言检测问题上的有效性. 展开更多
关键词 谣言检测 分层注意力网络 社交媒体 时序信息 深度学习
原文传递
基于双层堆叠分类模型的水军评论检测 被引量:2
18
作者 廖祥文 徐阳 +2 位作者 魏晶晶 杨定达 陈国龙 《山东大学学报(理学版)》 CAS CSCD 北大核心 2019年第7期57-67,共11页
对于水军评论检测问题,已有方法在提取用户行为关系以及通过神经网络提取特征时复杂度过大,同时由于网络评论属于短文本类,其书写的不规范会导致训练过程中文本特征提取困难;另外,已有方法对数据集不平衡分布情况考虑不足。为此,提出了... 对于水军评论检测问题,已有方法在提取用户行为关系以及通过神经网络提取特征时复杂度过大,同时由于网络评论属于短文本类,其书写的不规范会导致训练过程中文本特征提取困难;另外,已有方法对数据集不平衡分布情况考虑不足。为此,提出了一种基于双层堆叠分类模型的水军评论检测方法。首先通过三元组形式构造矩阵表示用户间关系,并通过主成分分析得到低维用户关系表示,以此刻画用户在评论数据中的行为差异并且降低计算的复杂度;然后,通过评论的段落向量表示以及计算离散型特征(包括文本相似度、信息熵等)解决文本特征难以提取的问题;最后将三者相联结作为融合文本与行为特征的整体特征表示。利用集成学习的方法构造双层堆叠分类模型对评论分类,以提升模型在非平衡数据集下的检测性能。实验采用Yelp2013评论数据集,结果表明,与目前最好的基准方法对比,F1值提高了1.7%~5.2%,在非平衡数据集中提升尤为明显。 展开更多
关键词 水军检测 特征融合 集成学习 主成分分析
原文传递
融合图卷积神经网络的文本情感分类 被引量:2
19
作者 阴爱英 林建洲 +1 位作者 吴运兵 廖祥文 《山东大学学报(理学版)》 CAS CSCD 北大核心 2021年第11期15-23,30,共10页
文档级别情感分类旨在预测用户对评论文本的情感极性标签。最近研究发现,利用用户和产品信息能有效地提升情感分类性能,然而,现有大多数研究只关注用户与评论、产品与评论的信息,忽略了用户与用户、产品与产品之间的内在关联,因此,本文... 文档级别情感分类旨在预测用户对评论文本的情感极性标签。最近研究发现,利用用户和产品信息能有效地提升情感分类性能,然而,现有大多数研究只关注用户与评论、产品与评论的信息,忽略了用户与用户、产品与产品之间的内在关联,因此,本文提出一种融合图卷积神经网络的文本情感分类模型。首先,根据数据集构建了用户与用户关系图、用户与产品关系图;然后,融合两种关系图形成异质图,并使用图卷积神经网络学习用户与用户、产品与产品之间的内在联系,获得更好的用户和产品表示;最后,使用融合CNN的用户注意力和产品注意力机制的分层网络进行情感分类。实验结果表明,在公开数据集IMDB、Yelp2013和Yelp2014上,本文提出的模型能取得较好的分类效果。 展开更多
关键词 情感分类 图卷积神经网络 异质图 分层网络
原文传递
基于双重多路注意力匹配的观点型阅读理解
20
作者 鲍亮 陈志豪 +2 位作者 陈文章 叶锴 廖祥文 《山东大学学报(理学版)》 CAS CSCD 北大核心 2021年第3期44-53,共10页
观点型阅读理解旨在对于给定的问题和答案段落摘要,判断答案段落摘要相对于问题的观点倾向。现有基于神经网络的模型主要依靠精心设计的匹配网络来捕获各部分文本之间的关系,往往只考虑单向的匹配关系或是采用单一的交互机制对各个文本... 观点型阅读理解旨在对于给定的问题和答案段落摘要,判断答案段落摘要相对于问题的观点倾向。现有基于神经网络的模型主要依靠精心设计的匹配网络来捕获各部分文本之间的关系,往往只考虑单向的匹配关系或是采用单一的交互机制对各个文本对之间的关系进行建模,难以有效捕捉观点型问题中问题和答案段落摘要二者之间的潜在关系。为此,提出一种基于双重多路注意力的匹配方法。该方法对<问题,答案段落摘要>二元组从2个方向同时进行匹配,并采用多种注意力机制学习二者的协同注意力表示,通过双向多视角的交互为最后的观点推断提供更丰富的推理证据。在观点型阅读理解数据集DureaderOpinion上的实验表明,该方法相对于基准模型取得了更好的效果。 展开更多
关键词 机器阅读理解 观点挖掘 注意力机制
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部