用于图像分类的深度卷积神经网络中的空间分割注意力模块被引量：1

SPAM: Spatially Partitioned Attention Module in Deep ConvolutionalNeural Networks for Image Classification

在线阅读下载PDF

导出

摘要针对现有注意力机制常采用融合或压缩的方式来获取所需信息,会导致空间或通道维度损失的信息过多的问题,提出了一种有效的轻量级注意力模块SPAM,它可以在不经过通道融合或压缩的情况下获取注意力。对于输入的中间特征图,SPAM首先会自适应地采用平均池化和最大池化来进行特征提取;采用空间上局部的块特征代替点特征以减少计算量,并利用实例标准化(IN)层与深层卷积来捕获全局空间注意力;通道维度信息的重建通过分组卷积来完成;最终使用插值操作获得整体注意力,对输入特征图进行加权。SPAM可以方便地嵌入到各种主流卷积神经网络架构中,只需增加微量参数和计算量,就可以显著提高网络性能。为了证明SPAM的有效性,在ImageNet-1K、CIFAR-100和Food-101图像分类数据集上进行了大量实验,并使用Grad-CAM可视化了网络的关注区域。实验结果表明,在ImageNet-1K、CIFAR-100和Food-101数据集上,SPAM分别将基线网络的准确率最多提高了约1.08%、2.46%和1.09%。研究结果表明,嵌入SPAM的网络的性能都有较大提升;且相较于其他常用的轻量级注意力机制,SPAM的效果始终更好;SPAM使网络更关注目标对象所在区域,确切提高了网络的表达能力。 Existing attention mechanisms often use fusion or compression to obtain the required information,but this leads to a large quantity of information lost in the spatial or channel dimension.In order to solve this problem,the Spatially Partitioned Attention Module(SPAM),a really effective and lightweight attention module that can help obtain attention without channel fusion or compression,was proposed in the paper.For the input intermediate feature map,the SPAM first adaptively used average pooling and maximum pooling features for feature extraction,replaced the point feature with the local block feature in space to reduce the amount of calculation and used the IN layer and depthwise convolution to capture global spatial attention.Meanwhile,the reconstruction of channel dimension information was directly completed by group convolution.Finally,the interpolation operation was used to obtain overall attention and weight the input feature map.Notably,the SPAM can be easily embedded in various mainstream CNN architectures,and network performance can be significantly improved by increasing a few microparameters and calculations.To demonstrate the effectiveness of the SPAM,numerous experiments were conducted on the ImageNet-1K,CIFAR-100,and Food-101 datasets,and the network's regions of interest were visualized using Grad-CAM.On the ImageNet-1K,CIFAR-100,and Food-101 datasets,the SPAM improved the accuracy of the baseline network by up to about 1.08%,2.46%,and 1.09%,respectively.The results show that the performance of the network embedded with the SPAM components is greatly improved;compared to other commonly used lightweight attention mechanisms,the SPAM always works better;the SPAM can really induce the networks to pay more attention to the target object regions and accurately improve the expression ability of the networks.

作者王方乔瑞萍 WANG Fang;QIAO Ruiping(School of Information and Communication Engineering,Xi’an Jiaotong University,Xi’an 710049,China)

机构地区西安交通大学信息与通信工程学院

出处《西安交通大学学报》 EI CAS CSCD 北大核心 2023年第9期185-192,共8页 Journal of Xi'an Jiaotong University

基金陕西省重点研发计划资助项目(2020GY-074)。

关键词卷积神经网络注意力机制图像分类特征提取 convolutional neural networks attention mechanisms image classification feature extraction

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1张珂,冯晓晗,郭玉荣,苏昱坤,赵凯,赵振兵,马占宇,丁巧林.图像分类的深度卷积神经网络模型综述[J].中国图象图形学报,2021,26(10):2305-2325. 被引量：117
2刘文祥,舒远仲,唐小敏,刘金梅.采用双注意力机制Deeplabv3+算法的遥感影像语义分割[J].热带地理,2020,40(2):303-313. 被引量：43
3Meng-Hao Guo,Tian-Xing Xu,Jiang-Jiang Liu,Zheng-Ning Liu,Peng-Tao Jiang,Tai-Jiang Mu,Song-Hai Zhang,Ralph R.Martin,Ming-Ming Cheng,Shi-Min Hu.Attention mechanisms in computer vision:A survey[J].Computational Visual Media,2022,8(3):331-368. 被引量：160
4张宸嘉,朱磊,俞璐.卷积神经网络中的注意力机制综述[J].计算机工程与应用,2021,57(20):64-72. 被引量：122

二级参考文献17

1耿磊,邱玲,吴骏,肖志涛,张芳.结合深度可分离卷积与通道加权的全卷积神经网络视网膜图像血管分割[J].生物医学工程学杂志,2019,36(1):107-115. 被引量：12
2梁斌,刘全,徐进,周倩,章鹏.基于多注意力卷积神经网络的特定目标情感分析[J].计算机研究与发展,2017,54(8):1724-1735. 被引量：141
3朱丰,胡晓峰,吴琳,贺筱媛,吕学志,廖鹰.从态势认知走向态势智能认知[J].系统仿真学报,2018,30(3):761-771. 被引量：52
4陈天华,郑司群,于峻川.采用改进DeepLab网络的遥感图像分割[J].测控技术,2018,37(11):34-39. 被引量：27
5冯兴杰,张志伟,史金钏.基于卷积神经网络和注意力模型的文本情感分析[J].计算机应用研究,2018,35(5):1434-1436. 被引量：63
6陈龙杰,张钰,张玉梅,吴晓军.基于多注意力多尺度特征融合的图像描述生成算法[J].计算机应用,2019,39(2):354-359. 被引量：17
7王文冠,沈建冰,贾云得.视觉注意力检测综述[J].软件学报,2019,30(2):416-439. 被引量：60
8朱张莉,饶元,吴渊,祁江楠,张钰.注意力机制在深度学习中的研究进展[J].中文信息学报,2019,33(6):1-11. 被引量：152
9袁立,袁吉收,张德政.基于DeepLab-v3+的遥感影像分类[J].激光与光电子学进展,2019,56(15):228-235. 被引量：30
10王中宇,倪显扬,尚振东.利用卷积神经网络的自动驾驶场景语义分割[J].光学精密工程,2019,27(11):2429-2438. 被引量：35

共引文献427

1李莉,陈心宇,高文斌.一种基于FPGA的卷积神经网络加速器实现方案[J].北京电子科技学院学报,2022,30(4):96-104. 被引量：2
2张令雨,石东新.一种面向DASH的QoE客观评价模型[J].中国科技论文在线精品论文,2022(2):168-180.
3乌伦赛,胡一可,陈江为.景观可供性视角下小微公共空间的景观服务[J].风景园林,2023,30(S02):74-81. 被引量：1
4张银胜,杨宇龙,吉茹,蓝天鹤,单慧琳.改进YOLOv5s的风力涡轮机表面缺陷检测[J].电子测量与仪器学报,2023,37(1):40-49. 被引量：16
5刘斌,贾浩强,杨一,申佳,盖美辰,宋天霖.基于改进OpenPose算法的矿工危险行为识别研究[J].电视技术,2023,47(2):20-23. 被引量：2
6朱洪波,张在岩,秦育罗,宋伟东,张晋赫.农村路面多类型病害检测方法研究[J].测绘科学,2022,47(9):170-180. 被引量：3
7杨子勋,陈广新,李长荣,曹文超.基于计算机辅助诊断的皮肤癌良恶性诊断研究[J].新一代信息技术,2022,5(8):134-138.
8王凌霄,贾婧.基于改进DeepLabv3plus算法的遥感图像海岛建筑提取方法[J].热带地理,2021,41(4):834-844. 被引量：3
9戴雨舒,仲晓春,孙成明,杨俊,刘涛,刘升平.基于图像处理和Deeplabv3+模型的小麦赤霉病识别[J].中国农机化学报,2021,42(9):209-215. 被引量：12
10邓泓,杨滢婷,刘兆朋,刘木华,陈雄飞,刘鑫.基于深度学习的无人机水田图像语义分割方法[J].中国农机化学报,2021,42(10):165-172. 被引量：12

同被引文献3

1杨萌林,张文生.分类激活图增强的图像分类算法[J].计算机科学与探索,2020,14(1):149-158. 被引量：9
2付晓,沈远彤,李宏伟,程晓梅.基于半监督编码生成对抗网络的图像分类模型[J].自动化学报,2020,46(3):531-539. 被引量：14
3张峰,黄仕鑫,花强,董春茹.基于Depth-wise卷积和视觉Transformer的图像分类模型[J].计算机科学,2024,51(2):196-204. 被引量：4

引证文献1

1姜文涛,董睿,张晟翀.局部注意力引导下的全局池化残差分类网络[J].光电工程,2024,51(7):107-124. 被引量：1

二级引证文献1

1张艳,马春明,刘树东,孙叶美.基于多尺度特征增强的高效Transformer语义分割网络[J].光电工程,2024,51(12):79-93.

1刘景明,彭明洋,王同兴,陈国中,谢光辉,马跃虎.基于MRI影像组学的机器学习在预测恶性大脑中动脉梗死中的研究[J].临床神经病学杂志,2023,36(4):241-246.
2李阳,代宗仰,张洁伟,肖朵艳,李丹,赵晓阳,李甜,黄澜,黄囿霖.基于无监督学习的多参数储层评价:以蒲包山地区下三叠统飞仙关组礁滩储层为例[J].地质科技通报,2023,42(5):285-292. 被引量：3

西安交通大学学报

2023年第9期

浏览历史

内容加载中请稍等...

用于图像分类的深度卷积神经网络中的空间分割注意力模块被引量：1

参考文献4

二级参考文献17

共引文献427

同被引文献3

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

用于图像分类的深度卷积神经网络中的空间分割注意力模块 被引量：1

参考文献4

二级参考文献17

共引文献427

同被引文献3

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

用于图像分类的深度卷积神经网络中的空间分割注意力模块被引量：1