期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
DVCPRO HD并行解码算法的研究与实现
1
作者 王祥远 王兴东 宋利 《信息技术》 2009年第7期72-74,共3页
DVCPRO HD标准广泛应用于广播电影电视前端的视频压缩,在普通的PC平台上每帧解码耗时需80到100ms,经过汇编优化后城需40到60ms,在优化比较好的情况下能达到实时解码播放的需求。GPU具有强大的并行处理能力,而DVCPRO HD的视频单元间耦合... DVCPRO HD标准广泛应用于广播电影电视前端的视频压缩,在普通的PC平台上每帧解码耗时需80到100ms,经过汇编优化后城需40到60ms,在优化比较好的情况下能达到实时解码播放的需求。GPU具有强大的并行处理能力,而DVCPRO HD的视频单元间耦合性小,适应于并行处理。充分利用GPU的并行性和强大的浮点运算功能,在CUDA开发环境下对其进行并行解码优化,可远远超过实时解码的要求。 展开更多
关键词 DVCPRO HD GPU CUDA 编解码并行
在线阅读 下载PDF
星载高速海量存储系统的并行RS纠错方法 被引量:3
2
作者 张宇宁 杨根庆 +1 位作者 李华旺 常亮 《航天控制》 CSCD 北大核心 2009年第3期86-89,共4页
针对在使用新型商用存储器构建航天器海量存储系统的过程中,高速、海量数据传输与SEU导致的数据错误之间的矛盾,提出了1种新的存储数据校验方法——并行RS纠错来解决这个矛盾。该方法采用并行RS编解码电路取代传统的基于移位寄存器的串... 针对在使用新型商用存储器构建航天器海量存储系统的过程中,高速、海量数据传输与SEU导致的数据错误之间的矛盾,提出了1种新的存储数据校验方法——并行RS纠错来解决这个矛盾。该方法采用并行RS编解码电路取代传统的基于移位寄存器的串行电路,可在1个时钟周期内完成编、解码运算,纠正SEU引起的单字节错误。在75MHz的时钟频率下达到4.8Gbps的传输速度,满足高速海量存储系统的要求。 展开更多
关键词 单粒子翻转 高速海量存储器 并行RS编解码
在线阅读 下载PDF
FAQ-CNN:面向量化卷积神经网络的嵌入式FPGA可扩展加速框架 被引量:8
3
作者 谢坤鹏 卢冶 +4 位作者 靳宗明 刘义情 龚成 陈新伟 李涛 《计算机研究与发展》 EI CSCD 北大核心 2022年第7期1409-1427,共19页
卷积神经网络(convolutional neural network, CNN)模型量化可有效压缩模型尺寸并提升CNN计算效率.然而,CNN模型量化算法的加速器设计,通常面临算法各异、代码模块复用性差、数据交换效率低、资源利用不充分等问题.对此,提出一种面向量... 卷积神经网络(convolutional neural network, CNN)模型量化可有效压缩模型尺寸并提升CNN计算效率.然而,CNN模型量化算法的加速器设计,通常面临算法各异、代码模块复用性差、数据交换效率低、资源利用不充分等问题.对此,提出一种面向量化CNN的嵌入式FPGA加速框架FAQ-CNN,从计算、通信和存储3方面进行联合优化,FAQ-CNN以软件工具的形式支持快速部署量化CNN模型.首先,设计面向量化算法的组件,将量化算法自身的运算操作和数值映射过程进行分离;综合运用算子融合、双缓冲和流水线等优化技术,提升CNN推理任务内部的并行执行效率.然后,提出分级编码与位宽无关编码规则和并行解码方法,支持低位宽数据的高效批量传输和并行计算.最后,建立资源配置优化模型并转为整数非线性规划问题,在求解时采用启发式剪枝策略缩小设计空间规模.实验结果表明,FAQ-CNN能够高效灵活地实现各类量化CNN加速器.在激活值和权值为16 b时,FAQ-CNN的加速器计算性能是Caffeine的1.4倍;在激活值和权值为8 b时,FAQ-CNN可获得高达1.23TOPS的优越性能. 展开更多
关键词 卷积神经网络量化 量化算法解耦 并行编解码 片上资源建模 加速器设计
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部