基于激活-熵的分层迭代剪枝策略的CNN模型压缩被引量：2

CNN model compression based on activation-entropy based layer-wise iterative pruning strategy

在线阅读下载PDF

导出

摘要针对卷积神经网络(CNN)模型现有剪枝策略各尽不同和效果一般的情况,提出了基于激活-熵的分层迭代剪枝(AE-LIP)策略,保证模型精度在可控范围内的同时缩减模型的参数量。首先,结合神经元激活值和信息熵,构建基于激活-熵的权重评判准则,计算权值重要性得分;然后,逐层剪枝,根据重要性得分对权值排序,并结合各层剪枝数量筛选出待剪枝权重并将其设置为0;最后,微调模型,重复上述过程,直至迭代结束。实验结果表明,采用基于激活-熵的分层迭代剪枝策略:AlexNet模型压缩了87.5%;相应的准确率下降了2.12个百分点,比采用基于幅度的权重剪枝策略提高了1.54个百分点,比采用基于相关性的权重剪枝策略提高0.91个百分点。VGG-16模型压缩了84.1%;相应的准确率下降了2.62个百分点,比采用上述两个对比策略分别提高了0.62个百分点和0.27个百分点。说明所提策略在保证模型精确度下有效缩减了CNN模型的大小,有助于CNN模型在存储受限的移动设备上的部署。 Since the existing pruning strategies of the Convolutional Neural Network(CNN)model are different and have general effects,an Activation-Entropy based Layer-wise Iterative Pruning(AE-LIP)strategy was proposed to reduce the parameter amount of the model while ensuring the accuracy of the model within a controllable range.Firstly,combined with the neuronal activation value and information entropy,a weight evaluation criteria based on activation-entropy was constructed,and the weight importance score was calculated.Secondly,the pruning was performed layer by layer,the weights were sorted according to the importance score,and the pruning number in each layer was combined to filter out the weights to be pruned and set them to zero.Finally,the model was fine-tuned,and the above process was repeated until the iteration ended.The experimental results show that the activation-entropy based layer-wise iterative pruning strategy makes the AlexNet model compressed 87.5%,and the corresponding accuracy is reduced by 2.12 percentage points,which is 1.54 percentage points higher than that of the magnitude-based weight pruning strategy and 0.91 percentage points higher than that of the correlation-based weight pruning strategy;the strategy makes VGG-16 model compressed 84.1%,and the corresponding accuracy is reduced by 2.62 percentage points,which is 0.62 and 0.27 percentage points higher than those of the two above strategies.It can be seen that the proposed strategy reduces the size of the CNN model effectively while ensuring the accuracy of the model,and is helpful for the deployment of CNN model on mobile devices with limited storage.

作者陈程军毛莺池王绎超 CHEN Chengjun;MAO Yingchi;WANG Yichao(College of Computer and Information,Hohai University,Nanjing Jiangsu 211100,China)

机构地区河海大学计算机与信息学院

出处《计算机应用》 CSCD 北大核心 2020年第5期1260-1265,共6页 journal of Computer Applications

基金 “十三五”国家重点研发计划项目(2018YFC0407105) 华能集团重点研发项目(HNKJ17-21)。

关键词移动云计算神经元激活值信息熵迭代剪枝模型压缩 mobile cloud computing neuronal activation value information entropy iterative pruning model compression

分类号 TP389.1 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1彭冬亮,王天兴.基于GoogLeNet模型的剪枝算法[J].控制与决策,2019,34(6):1259-1264. 被引量：20
2靳丽蕾,杨文柱,王思乐,崔振超,陈向阳,陈丽萍.一种用于卷积神经网络压缩的混合剪枝方法[J].小型微型计算机系统,2018,39(12):2596-2601. 被引量：21

二级参考文献2

1张德园,常云翔,张利国,石祥滨.SAT-CNN:基于卷积神经网络的遥感图像分类算法[J].小型微型计算机系统,2018,39(4):859-864. 被引量：18
2韩云飞,蒋同海,马玉鹏,徐春香,张睿.深度神经网络的压缩研究[J].计算机应用研究,2018,35(10):2894-2897. 被引量：12

共引文献39

1卢海伟,夏海峰,袁晓彤.基于滤波器注意力机制与特征缩放系数的动态网络剪枝[J].小型微型计算机系统,2019,40(9):1832-1838. 被引量：8
2李新叶,宋维.基于深度学习的图像语义分割研究进展[J].科学技术与工程,2019,19(33):21-27. 被引量：13
3衣柳成,魏伟波,刘小芳.基于GoogLeNet的智能录播系统中站立人脸的检测与定位[J].青岛大学学报（自然科学版）,2019,32(4):91-95. 被引量：3
4谢斌红,钟日新,潘理虎,张英俊.结合剪枝与流合并的卷积神经网络加速压缩方法[J].计算机应用,2020,40(3):621-625. 被引量：7
5王忠锋,徐志远,宋纯贺,张宏宇,蔡颖凯.基于梯度的深度网络剪枝算法[J].计算机应用,2020,40(5):1253-1259. 被引量：3
6邵伟平,王兴,曹昭睿,白帆.基于MobileNet与YOLOv3的轻量化卷积神经网络设计[J].计算机应用,2020,40(S01):8-13. 被引量：46
7侯俊龙,潘文林,王璐,何翠玲,王翠.基于剪枝AlexNet的普米语孤立词识别[J].云南民族大学学报（自然科学版）,2020,29(4):382-389. 被引量：2
8耿丽丽,牛保宁.深度神经网络模型压缩综述[J].计算机科学与探索,2020,14(9):1441-1455. 被引量：20
9甘岚,李佳,沈鸿飞.面向嵌入式的残差网络加速方法研究[J].小型微型计算机系统,2020,41(11):2314-2320. 被引量：3
10张静,李化奇,陈玲艳.基于决策树算法的生理特征数据分析方法研究[J].电子设计工程,2021,29(2):20-24. 被引量：4

同被引文献18

1李庆忠,李宜兵,牛炯.基于改进YOLO和迁移学习的水下鱼类目标实时检测[J].模式识别与人工智能,2019,32(3):193-203. 被引量：37
2白静,司庆龙,秦飞巍.轻量级实时点云分类网络LightPointNet[J].计算机辅助设计与图形学学报,2019,31(4):612-621. 被引量：22
3卢海伟,袁晓彤.基于层融合特征系数的动态网络结构化剪枝[J].模式识别与人工智能,2019,32(11):1051-1059. 被引量：7
4赵宝康,李晋文,杨帆,刘佳豪.一种基于深度学习的遥感图像目标检测算法[J].计算机工程与科学,2019,41(12):2166-2172. 被引量：10
5史文旭,江金洪,鲍胜利.基于特征融合的遥感图像舰船目标检测方法[J].光子学报,2020,49(7):51-61. 被引量：13
6张新良,付鹏飞,赵运基,谢恒,王琬如.融合图卷积和差异性池化函数的点云数据分类分割模型[J].中国图象图形学报,2020,25(6):1201-1208. 被引量：8
7孙彦丽,叶炯耀.基于剪枝与量化的卷积神经网络压缩方法[J].计算机科学,2020,47(8):261-266. 被引量：10
8冯毅博,仇大伟,曹慧,张俊忠,辛在海,刘静.基于深度可分离稠密网络的新型冠状病毒肺炎X线图像检测方法研究[J].生物医学工程学杂志,2020,37(4):557-565. 被引量：14
9马京晖,潘巍,王茹.基于K-means聚类的三维点云分类[J].计算机工程与应用,2020,56(17):181-186. 被引量：21
10丁海勇,孙月霞,徐田野.顾及局部特征的深度学习点云分类研究[J].测绘科学,2021,46(9):61-66. 被引量：3

引证文献2

1刘紫燕,袁磊,朱明成,马珊珊.融合改进通道和层剪枝的口罩人脸检测[J].计算机工程与科学,2022,44(3):463-470. 被引量：1
2王豪洋,田茂义,俞家勇.超轻量级点云分类网络[J].计算机应用,2024,44(S01):65-70.

二级引证文献1

1贺晶,余梓铱,丁伟国.基于改进YOLOx的口罩规范性佩戴检测方法[J].科学技术创新,2025(1):48-51.

1程东升,陈宝文,诸振家.基于分层迭代理念的高职院校课程教学模式研究——以《Java Web应用开发》教学为例[J].职业,2019,0(33):68-70. 被引量：1
2王千千.对比让阅读教学更高效[J].语文天地,2020,0(9):59-60.
3程东升,王振国.高职同一课堂分层迭代教学模式研究[J].教育教学论坛,2020(8):377-379. 被引量：2
4王瑶.基于学生核心素养形成与发展的小学美术示范教学策略研究*[J].新教育时代电子杂志（学生版）,2019(42):88-88.
5李忠成.基于移动云计算的假名按需分发管理方案[J].浙江万里学院学报,2020,33(3):91-97.
6赵永宏,李永成,陈东,侯文彬.基于改进图分解法的多材料车身结构优化设计方法[J].汽车工程,2020,42(4):560-566. 被引量：3
7金鑫,任保全,李洪钧,巩向武,董飞鸿.星-地混合通信网络前向链路安全传输方案研究[J].宇航学报,2019,40(12):1444-1452. 被引量：4
8黄青.论设备采购谈判的策略与技巧[J].设备监理,2019(8):63-64.

计算机应用

2020年第5期

浏览历史

内容加载中请稍等...

基于激活-熵的分层迭代剪枝策略的CNN模型压缩被引量：2

参考文献2

二级参考文献2

共引文献39

同被引文献18

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于激活-熵的分层迭代剪枝策略的CNN模型压缩 被引量：2

参考文献2

二级参考文献2

共引文献39

同被引文献18

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于激活-熵的分层迭代剪枝策略的CNN模型压缩被引量：2