一种基于FPGA的卷积神经网络加速器实现方案被引量：2

An FPGA-based Implementation of Convolutional Neural Network Accelerator

在线阅读下载PDF

导出

摘要近年来在人工智能领域,卷积神经网络(CNN)因为其优异的算法性能获得广泛应用。由于CNN的模型结构及卷积运算具有高度并行性,FPGA加速CNN成为硬件加速CNN的重要解决方案。本文针对典型的卷积神经网络LeNet-5,提出一种采用卷积-池化-卷积-池化-卷积五级层间流水线架构的卷积核间全并行、核内部分并行,输出部分并行加速方案,实现卷积神经网络卷积池化运算的硬件加速。实验结果表明,在129.8Mhz时钟频率及16bit定点精度的情况下,系统对单张图片的处理速度较CPU提高近337倍,能效比为13.68GOP/(s*W)。 In recent years,convolutional neural network(CNN)is widely used in field of artificial intelligence thanks to excellent algorithm performance.Due to high parallelism of the CNN model structure and the convolution operation,FPGA has been a promising hardware solution to accelerating the CNN.For the typical CNN network LeNet-5,in this paper an acceleration scheme adopting a convolutional-pooling-convolutional-pooling-convolutional five-level interlayer pipeline architecture is proposed,where hardware acceleration of CNN convolution pooling operation is realized with full parallelism between convolution kernels and partial parallelism within convolution kernel and at the output.Experiment results show that speed of system processing a single image increases by about 337 times compared with that of the CPU in the case of 129.8Mhz clock frequency and 16bits fixed-point precision,achieving energy efficiency ratio of 13.68GOP/(s*W).

作者李莉陈心宇高文斌 LI Li;CHEN Xinyu;GAO Wenbin(Beijing Electronic Science and Technology Institution,Beijing 100070,P.R.China)

机构地区北京电子科技学院

出处《北京电子科技学院学报》 2022年第4期96-104,共9页 Journal of Beijing Electronic Science And Technology Institute

基金北京高校“高精尖”学科建设项目(项目编号:20210069Z0402) 2020教育部一流本科专业建设项目(项目编号:gjylzy2021001) 国家重点研发计划基金资助项目(项目编号:2017YFB0801803)

关键词卷积神经网络 FPGA 硬件加速流水线架构 convolutional neural network(CNN) FPGA hardware acceleration pipeline architecture

分类号 TN791 [电子电信—电路与系统] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1张珂,冯晓晗,郭玉荣,苏昱坤,赵凯,赵振兵,马占宇,丁巧林.图像分类的深度卷积神经网络模型综述[J].中国图象图形学报,2021,26(10):2305-2325. 被引量：117
2周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1834
3秦华标,曹钦平.基于FPGA的卷积神经网络硬件加速器设计[J].电子与信息学报,2019,41(11):2599-2605. 被引量：18
4王巍,周凯利,王伊昌,王广,杨正琳,袁军.卷积神经网络(CNN)算法的FPGA并行结构设计[J].微电子学与计算机,2019,36(4):57-62. 被引量：13
5张榜,来金梅.一种基于FPGA的卷积神经网络加速器的设计与实现[J].复旦学报（自然科学版）,2018,57(2):236-242. 被引量：15
6崔江伟,周勇胜,张帆,尹嫱,项德良.基于流水线架构的卷积神经网络FPGA实现[J].北京化工大学学报（自然科学版）,2021,48(5):111-118. 被引量：6

二级参考文献11

1余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：627
2刘建伟,刘媛,罗雄麟.玻尔兹曼机研究进展[J].计算机研究与发展,2014,51(1):1-16. 被引量：72
3金林鹏,董军.面向临床心电图分析的深层学习算法[J].中国科学：信息科学,2015,45(3):398-416. 被引量：37
4Yi ZHENG,QiLIU,Enhong CHEN,Yong GE,J. Leon ZHAO.Exploiting multi-channels deep convolutional neural networks for multivariate time series classification[J].Frontiers of Computer Science,2016,10(1):96-112. 被引量：23
5高君宇,杨小汕,张天柱,徐常胜.基于深度学习的鲁棒性视觉跟踪方法[J].计算机学报,2016,39(7):1419-1434. 被引量：30
6李红,刘芳,杨淑媛,张凯.基于深度支撑值学习网络的遥感图像融合[J].计算机学报,2016,39(8):1583-1596. 被引量：40
7常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：433
8周飞燕,金林鹏,董军.基于集成学习的室性早博识别方法[J].电子学报,2017,45(2):501-507. 被引量：8
9吴艳霞,梁楷,刘颖,崔慧敏.深度学习FPGA加速器的进展与趋势[J].计算机学报,2019,42(11):2461-2480. 被引量：63
10林景栋,吴欣怡,柴毅,尹宏鹏.卷积神经网络结构优化综述[J].自动化学报,2020,46(1):24-37. 被引量：146

共引文献1984

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：8
4林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：23
5陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：22
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：13
7谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126. 被引量：1
8任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3
9胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
10孙守强,李青青,肖舒玥,曾子明.基于情景感知的叙事型壁画场景式移动视觉搜索模型研究[J].数据分析与知识发现,2024,8(8):52-62.

同被引文献9

1毕鹏程,罗健欣,陈卫卫.轻量化卷积神经网络技术研究[J].计算机工程与应用,2019,55(16):25-35. 被引量：38
2窦阳,卿粼波,何小海,廖海鹏.基于FPGA的CNN加速器设计与实现[J].信息技术与网络安全,2019,38(11):96-101. 被引量：6
3李金凤,黄纬然,赵雨童,郭巾男.基于Kintex⁃7 FPGA的DDR3 SDRAM高速访存控制器优化与实现[J].现代电子技术,2021,44(20):112-116. 被引量：9
4刘腾达,朱君文,张一闻.FPGA加速深度学习综述[J].计算机科学与探索,2021,15(11):2093-2104. 被引量：12
5陈恩志,王春阳,李晨晨,吴夏铭.改进的LeNet-5网络在图像分类中的研究[J].长春理工大学学报（自然科学版）,2022,45(5):74-79. 被引量：4
6武世雄,高巍,尹震宇,张飞青,徐福龙.面向ZYNQ SoC的卷积神经网络加速器研究[J].小型微型计算机系统,2022,43(12):2682-2688. 被引量：7
7朱育琳,蒋林,王欣,刘帅.可重构结构下卷积神经网络加速研究与设计[J].传感器与微系统,2023,42(4):67-70. 被引量：2
8秦文强,吴仲城,张俊,李芳.基于异构平台的卷积神经网络加速系统设计[J].计算机工程与科学,2024,46(1):12-20. 被引量：4
9高强,邵春霖,李京润,沈宗凯.面向图卷积神经网络的FPGA部署及加速研究[J].现代电子技术,2024,47(10):39-46. 被引量：2

引证文献2

1周诗云,钱松荣,卫少东,郑鑫.基于边缘部署低功耗的神经网络加速器[J].自动化与仪表,2024,39(7):147-151.
2严飞,郑绪文,孟川,李楚,刘银萍.基于FPGA的MobileNetV1目标检测加速器设计[J].现代电子技术,2025,48(1):151-156.

1肖世伟,李承凯,杨美娜,冯祥虎,孙国萃,杜军.MIPS指令集的流水线CPU模型机设计[J].单片机与嵌入式系统应用,2023,23(2):15-18. 被引量：2
2蔡银琼,范意兴,郭嘉丰,张儒清.基于多表达的第一阶段语义检索模型[J].计算机工程与应用,2023,59(4):139-146. 被引量：2
3贾亮,徐善博,邢轶博.基于FPGA的卷积神经网络图像识别算法研究[J].电脑与电信,2022(12):58-61. 被引量：1
4杨淑莹,李欣.用于流式语音识别的轻量化端到端声学架构[J].模式识别与人工智能,2023,36(3):268-279. 被引量：2
5闫童.电力系统状态估计并行加速研究[J].上海电气技术,2023,16(1):1-5.
6冯严冰,钱锦.基于GWO-ABC的混合算法研究[J].邢台职业技术学院学报,2023,40(1):85-91.
7田小瑜,秦永彬,黄瑞章,陈艳平.基于相关性约束矩阵分解的多标签分类方法[J].南京大学学报（自然科学版）,2023,59(1):76-84.
8张珈睿,吴超.计算机视觉领域的Transformer系列算法[J].信息与电脑,2023,35(2):101-103. 被引量：2
9张天宇,李楠,王祉涵,刘斌,冯涛.基于曙光CPU-DCU架构的市区噪声地图计算[J].智能计算机与应用,2023,13(3):16-24.
10李天祥,蒋德钧,熊劲.基于闪存固态盘的存储系统性能优化关键技术综述[J].高技术通讯,2023,33(1):50-62.

北京电子科技学院学报

2022年第4期

浏览历史

内容加载中请稍等...

一种基于FPGA的卷积神经网络加速器实现方案被引量：2

参考文献6

二级参考文献11

共引文献1984

同被引文献9

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种基于FPGA的卷积神经网络加速器实现方案 被引量：2

参考文献6

二级参考文献11

共引文献1984

同被引文献9

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种基于FPGA的卷积神经网络加速器实现方案被引量：2