单向句法依存关系指导下的跨模态检索

Cross-Modal Retrieval Guided by One-Directional Syntactic Dependency Relationship

在线阅读下载PDF

导出

摘要大多数现有的跨模态检索方法仅使用每个模态内的模态内关系或图像区域和文本词之间的模态间关系。文章中提出了一种基于自然语言的句法依存关系的视觉语言模型,称为Dep-ViLT。通过句法依存分析,构建句法依存树,利用单向的句法依存关系增强核心语义的特征表达,促进语言模态与视觉模态的特征交互。实验表明,Dep-ViLT对比现有的SOTA模型召回率(R@K)平均提升了1.7%,最高提升2.2%。最重要的是,Dep-ViLT在具有复杂语法结构的长难句中依然表现良好。 Most of the existing cross-modal retrieval methods only use the intra-modal relationship within each mode or the inter-modal relationship between image regions and text words.This paper proposes a visual language model based on the syntactic dependency relationship of natural language,called Dep-ViLT.Through syntactic dependency analysis,the syntactic dependency tree is constructed,and the one-directional syntactic dependency relationship is used to enhance the feature expression of core semantics and promote the feature interaction between language mode and visual mode.The experiment shows that the recall rate(R@K)of Dep-ViLT compared with the existing SOTA model has an average increase of 1.7%,with a maximum increase of 2.2%.Most importantly,the Dep-ViLT still performs well in long and difficult sentences with complex grammatical structures.

作者张知奇袁鑫攀曾志高 ZHANG Zhiqi;YUAN Xinpan;ZENG Zhigao(Hunan University of Technology,Zhuzhou 412007,China)

机构地区湖南工业大学

出处《现代信息科技》 2023年第10期74-79,共6页 Modern Information Technology

基金 2022年湖南省教育厅科学研究项目(22B0559) 2022年湖南省自然科学基金面上项目(2022JJ30231) 政府间国际科技创新合作资助(2022YFE0103700) 湖南工业大学研究生科研创新项目资助(CX2213)。

关键词句法依存跨模态检索图卷积 TRANSFORMER syntactic dependency cross-modal retrieval ﬁgure convolution Transformer

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张翠,周茂杰,杨志清.融合句法依存树注意力的关系抽取研究[J].广东通信技术,2020,40(10):43-47. 被引量：1
2刘颖,郭莹莹,房杰,范九伦,郝羽,刘继明.深度学习跨模态图文检索研究综述[J].计算机科学与探索,2022,16(3):489-511. 被引量：22

二级参考文献12

1胡宝顺,王大玲,于戈,马婷.基于句法结构特征分析及分类技术的答案提取算法[J].计算机学报,2008,31(4):662-676. 被引量：24
2郭喜跃,何婷婷,胡小华,陈前军.基于句法语义特征的中文实体关系抽取[J].中文信息学报,2014,28(6):183-189. 被引量：50
3甘丽新,万常选,刘德喜,钟青,江腾蛟.基于句法语义特征的中文实体关系抽取[J].计算机研究与发展,2016,53(2):284-302. 被引量：78
4高俊平,张晖,赵旭剑,杨春明,李波.面向维基百科的领域知识演化关系抽取[J].计算机学报,2016,39(10):2088-2101. 被引量：19
5欧卫华,刘彬,周永辉,宣瑞晟.跨模态检索研究综述[J].贵州师范大学学报（自然科学版）,2018,36(2):114-120. 被引量：16
6于玉海,林鸿飞,孟佳娜,郭海,赵哲焕.跨模态多标签生物医学图像分类建模识别[J].中国图象图形学报,2018,23(6):917-927. 被引量：13
7李志义,黄子风,许晓绵.基于表示学习的跨模态检索模型与特征抽取研究综述[J].情报学报,2018,37(4):422-435. 被引量：21
8郭剑毅,陈鹏,余正涛,线岩团,毛存礼,赵君.基于多核融合的中文领域实体关系抽取[J].中文信息学报,2016,30(1):24-29. 被引量：19
9曾倩倩,张婷婷.基于大数据的图像检索技术在侦查中的应用[J].电子技术与软件工程,2018(21):175-176. 被引量：4
10冯建周,宋沙沙,王元卓,刘亚坤,武红颖,龚昊.基于改进注意力机制的实体关系抽取方法[J].电子学报,2019,47(8):1692-1700. 被引量：21

共引文献21

1杜锦丰,王海荣,梁焕,王栋.基于表示学习的跨模态检索方法研究进展[J].广西师范大学学报（自然科学版）,2022,40(3):1-12. 被引量：4
2刘颖,王哲,房杰,朱婷鸽,李琳娜,刘继明.基于图文融合的多模态舆情分析[J].计算机科学与探索,2022,16(6):1260-1278. 被引量：9
3洪惠群,沈贵萍,黄风华.表情识别技术综述[J].计算机科学与探索,2022,16(8):1764-1778. 被引量：7
4曾素佳,庞善民,郝问裕.基于深度监督学习的零样本跨模态检索方法[J].西安交通大学学报,2022,56(11):156-166. 被引量：1
5杨慧,施水才.基于内容的图像检索技术研究综述[J].软件导刊,2023,22(4):229-244. 被引量：4
6李颖婷.生成式人工智能给图书馆带来的机遇、挑战及应对策略[J].图书与情报,2023(2):42-48. 被引量：39
7王鸿,葛红.基于注意力机制和语义相似度的跨模态哈希检索[J].计算机与现代化,2023(8):44-53.
8杨迪,吴春明.一种融合注意力机制的跨模态图文检索算法[J].计算机技术与发展,2023,33(11):143-148. 被引量：1
9翟一琛,顾佼佼,宗富强,姜文志.融合注意力机制的IETM细粒度跨模态检索算法[J].系统工程与电子技术,2023,45(12):3915-3923.
10刘萌,齐孟津,詹圳宇,曲磊钢,聂秀山,聂礼强.基于深度学习的图像-文本匹配研究综述[J].计算机学报,2023,46(11):2370-2399. 被引量：8

1刘漳辉,杨耀东,陈羽中.一种用于方面级情感分析的关系注意力图卷积网络[J].小型微型计算机系统,2023,44(4):752-758. 被引量：1
2衡红军,苗菁.语义与句法信息加强的二元标记实体关系联合抽取[J].计算机工程,2023,49(4):77-84. 被引量：4
3温浩,何茜茹,王杰,乔晓东,张鹏.基于ERNIE-BiGRU模型的摘要语步自动识别研究[J].中文信息学报,2022,36(11):91-100. 被引量：4
4马心怡,黄文晶,胡凝,肖薇,胡诚,张弥,曹畅,赵佳玉.基于不同排放清单的长三角人为CO_(2)排放模拟[J].环境科学,2023,44(4):2009-2021. 被引量：5
5余本功,张书文,高春阳.基于局部特征聚焦的方面级情感分析[J].计算机应用研究,2023,40(3):682-688. 被引量：2
6毛淇华,杨琳,岳怡歆,张婷婷,刘宁.河南省登封市产业发展优化路径研究[J].中文科技期刊数据库（全文版）经济管理,2023(2):40-43.
7张知奇,袁鑫攀,曾志高.图像情景文本融合的多模态模型性能策略研究——以跨模态检索为例[J].现代信息科技,2023,7(9):166-168. 被引量：1
8Jihong ZHU,Yunjie YANG,Xiangyang WANG,Xiaming YUAN,Xiao YANG.Attitude control of a novel tilt-wing UAV in hovering flight[J].Science China(Information Sciences),2023,66(5):279-281. 被引量：2
9Chao Zhang,Xueyuan Heng,Wenpeng Neng,Haixin Chen,Aigang Sun,Jinxing Li,Mingguang Wang.Prediction of high infiltration levels in pituitary adenoma using MRI-based radiomics and machine learning[J].Chinese Neurosurgical Journal,2022,8(4):221-229. 被引量：2

现代信息科技

2023年第10期

浏览历史

内容加载中请稍等...

单向句法依存关系指导下的跨模态检索

参考文献2

二级参考文献12

共引文献21

相关作者

相关机构

相关主题

浏览历史