基于注意力机制和对比学习的多模态情感分析

Multimodal sentiment analysis based on attention mechanism and contrastive learning

在线阅读下载PDF

导出

摘要针对现有多模态情感分析模型中各模态信息融合不充分以及对时序依赖性挖掘不足的问题,提出了一种结合跨模态注意力、全局自注意力和对比学习的多模态情感分析模型,提高了情感理解的深度。具体来说,首先,分别提取音频、文本、图像3个模态的特征,并将它们映射到同一向量空间中。随后,采用跨注意力机制和全局注意力机制对模态间数据进行有效建模和融合。同时,引入基于数据、标签和时序的对比学习任务,深化模型对多模态特征差异性的理解。在CMU-MOSI和CMU-MOSEI两个公开数据集上的实验结果表明,相较于模态不变和模态特定表示(modality-invariant and-specific representations,MISA)模型,本文模型的二分类准确率分别提升了1.2和1.6百分点,且F1值分别提升了1.0和1.6百分点。 To address the challenges associated with inadequate integration of information across modalities and limited analysis of temporal dependencies in existing multimodal sentiment analysis models,a model incorporating cross-modal attention,global self-attention,and contrastive learning was proposed,to deepen sentiment analysis.Specifically,features from speech,text,and image modalities were independently extracted,and maped into a unified vector space.Then,inter-modal data was effectively modeled and integrated using both cross-attention and global attention mechanisms.Meanwhile,contrastive learning tasks based on data,labeling,and timing were introduced to enhance the model′s understanding of multimodal feature variability.Experimental evaluations on two publicly available datasets,CMU-MOSI and CMU-MOSEI,reveal that the proposed model achieves superior binary classification accuracy improvements of 1.2 and 1.6 percentage points,and F1 score enhancements of 1.0 and 1.6 percentage points,respectively,compared with the modality-invariant and-specific representations(MISA)model.

作者方旭东王兴芬 FANG Xudong;WANG Xingfen(Computer School,Beijing Information Science&Technology University,Beijing 102206,China;School of Information Management,Beijing Information Science&Technology University,Beijing 102206,China)

机构地区北京信息科技大学计算机学院北京信息科技大学信息管理学院

出处《北京信息科技大学学报（自然科学版）》 2024年第4期63-70,共8页 Journal of Beijing Information Science and Technology University

关键词多模态情感分析注意力机制对比学习 multimodal sentiment analysis attention mechanism contrastive learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1奚雪峰,周国栋.面向自然语言处理的深度学习研究[J].自动化学报,2016,42(10):1445-1465. 被引量：228
2刘继明,张培翔,刘颖,张伟东,房杰.多模态的情感分析技术综述[J].计算机科学与探索,2021,15(7):1165-1182. 被引量：40
3陶全桧,安俊秀,戴宇睿,陈宏松,黄萍.基于多视角学习的时序多模态情感分类研究[J].计算机应用研究,2023,40(1):102-106. 被引量：3
4张昱,张海军,刘雅情,梁科晋,王月阳.基于双向掩码注意力机制的多模态情感分析[J].数据分析与知识发现,2023,7(4):46-55. 被引量：7
5魏金龙,邵新慧.基于非文本模态强化和门控融合方法的多模态情感分析[J].计算机应用研究,2024,41(1):39-44. 被引量：1
6于海涛,刘竞泽,刘乐.深度学习在情感分析领域的应用综述[J].现代信息科技,2023,7(17):50-54. 被引量：5
7陈恺,董修岗,周祥生.基于跨模态Transformer的多模态细粒度情感分析方法研究[J].计算机与数字工程,2022,50(10):2270-2275. 被引量：2

二级参考文献58

1王开心,徐秀娟,刘宇,赵哲焕,赵小薇.在线评论的静态多模态情感分析[J].应用科学学报,2022,40(1):25-35. 被引量：3
2谭荧,张进,夏立新.社交媒体情境下的情感分析研究综述[J].数据分析与知识发现,2020,4(1):1-11. 被引量：22
3余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
4徐军,丁宇新,王晓龙.使用机器学习方法进行新闻的情感自动分类[J].中文信息学报,2007,21(6):95-100. 被引量：108
5赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：551
6孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：641
7李婷婷,姬东鸿.基于SVM和CRF多特征组合的微博情感分析[J].计算机应用研究,2015,32(4):978-981. 被引量：85
8李祖贺,樊养余.基于视觉的情感分析研究综述[J].计算机应用研究,2015,32(12):3521-3526. 被引量：6
9乔俊飞,潘广源,韩红桂.一种连续型深度信念网的设计与应用[J].自动化学报,2015,41(12):2138-2146. 被引量：21
10耿杰,范剑超,初佳兰,王洪玉.基于深度协同稀疏编码网络的海洋浮筏SAR图像目标识别[J].自动化学报,2016,42(4):593-604. 被引量：22

共引文献277

1左旭.TED演讲中人际意义研究文献综述[J].英语广场（学术研究）,2020(36):71-73. 被引量：1
2周俊,郑彭元,袁立存,戈为溪,梁静.基于改进CASREL的水稻施肥知识图谱信息抽取研究[J].农业机械学报,2022,53(11):314-322. 被引量：10
3冯建英,王博,吴丹丹,穆维松,田东.用户画像技术与其在农业领域应用研究进展[J].农业机械学报,2021,52(S01):385-395. 被引量：7
4高园,罗悦,陈菊,冯杰,彭安杰,刘思涵.基于人工神经网络技术构建中医思维模型的研究[J].辽宁中医杂志,2022,49(7):48-51.
5胡远洋.基于深度神经网络的电阻层析成像重建方法[J].电子测量技术,2023,46(5):78-82.
6罗枭.基于深度学习的自然语言处理研究综述[J].智能计算机与应用,2020(4):133-137. 被引量：15
7张逸,李渴,邵振国,罗海荣.基于标准文件的电能质量领域本体构建方法[J].电力系统自动化,2020,44(17):102-111. 被引量：7
8侯宇豪,杨维芳,马文骏,王卓,余懿韬,闫香蓉,闫浩文.一种利用VSM检索微地图的方法[J].测绘科学,2023,48(12):225-233. 被引量：1
9卢洪.基于深度学习聚类算法的城市数据分类分级方法[J].工业技术创新,2021,8(4):73-78. 被引量：4
10宋雪姣.基于主播专属机器人系统的设计与研究[J].黑龙江广播电视技术,2022(1):31-34.

1刁秀广.强冰雹和强降水超级单体风暴双偏振特征差异性[J].海洋气象学报,2024,44(3):23-36.
2刘莉,瞿印权,余延浩,王倩,洑香香.青钱柳全基因组SSR位点分析及多态性引物开发[J].南京林业大学学报（自然科学版）,2024,48(4):67-75.
3王煜华,王贵勇,陈贵升,李进龙,何述超.农用柴油机的DPF再生条件与排放性能智能多目标优化[J].农业工程学报,2024,40(15):34-43.
4卢娜,刘轩,冯淑怡,刘志荣,刘子铭.环境目标约束对地方政府清洁生产型行业土地出让的影响[J].中国人口·资源与环境,2024,34(7):146-157.
5王天喜,王蕊嘉,张利娜,谢雨琪,吴学尉,张达,郑莉.不同休眠时期珠芽魔芋球茎转录组SSR和SNP位点信息分析[J].分子植物育种,2024,22(15):5007-5013.
6Lina Sun,Anjun Jiao,Haiyan Liu,Renyi Ding,Ning Yuan,Biao Yang,Cangang Zhang,Xiaoxuan Jia,Gang Wang,Yanhong Su,Dan Zhang,Lin Shi,Chenming Sun,Aijun Zhang,Lianjun Zhang,Baojun Zhang.Targeting a disintegrin and metalloprotease(ADAM)17-CD122 axis enhances CD8^(+)T cell effector differentiation and anti-tumor immunity[J].Signal Transduction and Targeted Therapy,2024,9(7):3097-3111.
7Patrick Klüber,Emna Arous,Jeanny Jerschow,Marco Fraatz,Daniel Bakonyi,Martin Rühl,Holger Zorn.Fatty acids derived from oviposition systems guide female black soldier flies(Hermetia illucens)toward egg deposition sites[J].Insect Science,2024,31(4):1231-1248. 被引量：1
8Jing Yang,Justin Flaven-Pouchon,Yiwen Wang,Bernard Moussian.Spirotetramat reduces fitness of the spotted-wing Drosophila,Drosophila suzukii[J].Insect Science,2024,31(4):1222-1230.
9Anouk Tosserams,Bastiaan R.Bloem,Kaylena A.Ehgoetz Martens,Rick C.Helmich,Roy P.C.Kessels,James M.Shine,Natasha L.Taylor,Gabriel Wainstein,Simon J.G.Lewis,Jorik Nonnekes.Modulating arousal to overcome gait impairments in Parkinson’s disease:how the noradrenergic system may act as a double-edged sword[J].Translational Neurodegeneration,2023,12(1):666-676.
10柴鑫,杨卫诚.白化红点齿蟾蝌蚪皮肤的转录组学分析[J].水产学杂志,2024,37(4):18-27.

北京信息科技大学学报（自然科学版）

2024年第4期

浏览历史

内容加载中请稍等...

基于注意力机制和对比学习的多模态情感分析

参考文献7

二级参考文献58

共引文献277

相关作者

相关机构

相关主题

浏览历史