-
题名面向深度神经网络加速芯片的高效硬件优化策略
被引量:5
- 1
-
-
作者
张萌
张经纬
李国庆
吴瑞霞
曾晓洋
-
机构
东南大学电子学院国家专用集成电路系统工程技术研究中心
复旦大学专用集成电路与系统国家重点实验室
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2021年第6期1510-1517,共8页
-
基金
国家重点研发计划(2018YFB2202703)
江苏省自然科学基金(BK20201145)。
-
文摘
轻量级神经网络部署在低功耗平台上的解决方案可有效用于无人机(UAV)检测、自动驾驶等人工智能(AI)、物联网(IOT)领域,但在资源有限情况下,同时兼顾高精度和低延时来构建深度神经网络(DNN)加速器是非常有挑战性的。该文针对此问题提出一系列高效的硬件优化策略,包括构建可堆叠共享计算引擎(PE)以平衡不同卷积中数据重用和内存访问模式的不一致;提出了可调的循环次数和通道增强方法,有效扩展加速器与外部存储器之间的访问带宽,提高DNN浅层网络计算效率;优化了预加载工作流,从整体上提高了异构系统的并行度。经Xilinx Ultra96 V2板卡验证,该文的硬件优化策略有效地改进了iSmart3-SkyNet和SkrSkr-SkyNet类的DNN加速芯片设计。结果显示,优化后的加速器每秒处理78.576帧图像,每幅图像的功耗为0.068 J。
-
关键词
深度神经网络
目标检测
神经网络加速器
低功耗
硬件优化
-
Keywords
Deep Neural Networks(DNN)
Object detection
Neural network accelerator
Low power consumption
Hardware optimization
-
分类号
TN79.1
[电子电信—电路与系统]
-