期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
用于实时目标检测的FPGA神经网络加速器设计 被引量:5
1
作者 李岑 贺光辉 《微电子学与计算机》 北大核心 2020年第7期6-11,共6页
在FPGA上实现YOLO等目标检测算法,需要从模型量化到硬件优化等多种优化方法.为了缩短硬件延时,使用了三种技术:(1)利用层融合和位宽量化策略来降低计算复杂度;(2)利用具有padding跳过技术的基于列的流水线架构来减少启动时间;(3)利用设... 在FPGA上实现YOLO等目标检测算法,需要从模型量化到硬件优化等多种优化方法.为了缩短硬件延时,使用了三种技术:(1)利用层融合和位宽量化策略来降低计算复杂度;(2)利用具有padding跳过技术的基于列的流水线架构来减少启动时间;(3)利用设计空间探索算法来平衡流水线时间,提高DSP使用效率.为了验证提出的神经网络加速器架构,在ZC706 FPGA上实现了具有1280×384输入的YOLO网络.与传统加速器相比,取得了1.97倍的延迟缩减或者1.54倍的DSP效率提升. 展开更多
关键词 YOLO FPGA加速器 基于列的流水线架构 低延时 高DSP效率
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部