期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
DVCPRO HD并行解码算法的研究与实现
1
作者
王祥远
王兴东
宋利
《信息技术》
2009年第7期72-74,共3页
DVCPRO HD标准广泛应用于广播电影电视前端的视频压缩,在普通的PC平台上每帧解码耗时需80到100ms,经过汇编优化后城需40到60ms,在优化比较好的情况下能达到实时解码播放的需求。GPU具有强大的并行处理能力,而DVCPRO HD的视频单元间耦合...
DVCPRO HD标准广泛应用于广播电影电视前端的视频压缩,在普通的PC平台上每帧解码耗时需80到100ms,经过汇编优化后城需40到60ms,在优化比较好的情况下能达到实时解码播放的需求。GPU具有强大的并行处理能力,而DVCPRO HD的视频单元间耦合性小,适应于并行处理。充分利用GPU的并行性和强大的浮点运算功能,在CUDA开发环境下对其进行并行解码优化,可远远超过实时解码的要求。
展开更多
关键词
DVCPRO
HD
GPU
CUDA
编解码
并行
在线阅读
下载PDF
职称材料
星载高速海量存储系统的并行RS纠错方法
被引量:
3
2
作者
张宇宁
杨根庆
+1 位作者
李华旺
常亮
《航天控制》
CSCD
北大核心
2009年第3期86-89,共4页
针对在使用新型商用存储器构建航天器海量存储系统的过程中,高速、海量数据传输与SEU导致的数据错误之间的矛盾,提出了1种新的存储数据校验方法——并行RS纠错来解决这个矛盾。该方法采用并行RS编解码电路取代传统的基于移位寄存器的串...
针对在使用新型商用存储器构建航天器海量存储系统的过程中,高速、海量数据传输与SEU导致的数据错误之间的矛盾,提出了1种新的存储数据校验方法——并行RS纠错来解决这个矛盾。该方法采用并行RS编解码电路取代传统的基于移位寄存器的串行电路,可在1个时钟周期内完成编、解码运算,纠正SEU引起的单字节错误。在75MHz的时钟频率下达到4.8Gbps的传输速度,满足高速海量存储系统的要求。
展开更多
关键词
单粒子翻转
高速海量存储器
并行
RS
编解码
在线阅读
下载PDF
职称材料
FAQ-CNN:面向量化卷积神经网络的嵌入式FPGA可扩展加速框架
被引量:
8
3
作者
谢坤鹏
卢冶
+4 位作者
靳宗明
刘义情
龚成
陈新伟
李涛
《计算机研究与发展》
EI
CSCD
北大核心
2022年第7期1409-1427,共19页
卷积神经网络(convolutional neural network, CNN)模型量化可有效压缩模型尺寸并提升CNN计算效率.然而,CNN模型量化算法的加速器设计,通常面临算法各异、代码模块复用性差、数据交换效率低、资源利用不充分等问题.对此,提出一种面向量...
卷积神经网络(convolutional neural network, CNN)模型量化可有效压缩模型尺寸并提升CNN计算效率.然而,CNN模型量化算法的加速器设计,通常面临算法各异、代码模块复用性差、数据交换效率低、资源利用不充分等问题.对此,提出一种面向量化CNN的嵌入式FPGA加速框架FAQ-CNN,从计算、通信和存储3方面进行联合优化,FAQ-CNN以软件工具的形式支持快速部署量化CNN模型.首先,设计面向量化算法的组件,将量化算法自身的运算操作和数值映射过程进行分离;综合运用算子融合、双缓冲和流水线等优化技术,提升CNN推理任务内部的并行执行效率.然后,提出分级编码与位宽无关编码规则和并行解码方法,支持低位宽数据的高效批量传输和并行计算.最后,建立资源配置优化模型并转为整数非线性规划问题,在求解时采用启发式剪枝策略缩小设计空间规模.实验结果表明,FAQ-CNN能够高效灵活地实现各类量化CNN加速器.在激活值和权值为16 b时,FAQ-CNN的加速器计算性能是Caffeine的1.4倍;在激活值和权值为8 b时,FAQ-CNN可获得高达1.23TOPS的优越性能.
展开更多
关键词
卷积神经网络量化
量化算法解耦
并行编解码
片上资源建模
加速器设计
在线阅读
下载PDF
职称材料
题名
DVCPRO HD并行解码算法的研究与实现
1
作者
王祥远
王兴东
宋利
机构
上海交通大学图像通信与信息处理研究所
上海市数字媒体处理与传输重点实验室
出处
《信息技术》
2009年第7期72-74,共3页
文摘
DVCPRO HD标准广泛应用于广播电影电视前端的视频压缩,在普通的PC平台上每帧解码耗时需80到100ms,经过汇编优化后城需40到60ms,在优化比较好的情况下能达到实时解码播放的需求。GPU具有强大的并行处理能力,而DVCPRO HD的视频单元间耦合性小,适应于并行处理。充分利用GPU的并行性和强大的浮点运算功能,在CUDA开发环境下对其进行并行解码优化,可远远超过实时解码的要求。
关键词
DVCPRO
HD
GPU
CUDA
编解码
并行
Keywords
DVCPRO
HD
GPU
CUDA
codec parallel
分类号
TN919.8 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
星载高速海量存储系统的并行RS纠错方法
被引量:
3
2
作者
张宇宁
杨根庆
李华旺
常亮
机构
中国科学院上海微系统与信息技术研究所
中国科学院研究生院
上海微小卫星工程中心
出处
《航天控制》
CSCD
北大核心
2009年第3期86-89,共4页
基金
中国科学院方向性创新重大项目(项目编号:KGCY-SYW-407-02)
上海市科委国际合作项目资助(项目编号:052207046)
文摘
针对在使用新型商用存储器构建航天器海量存储系统的过程中,高速、海量数据传输与SEU导致的数据错误之间的矛盾,提出了1种新的存储数据校验方法——并行RS纠错来解决这个矛盾。该方法采用并行RS编解码电路取代传统的基于移位寄存器的串行电路,可在1个时钟周期内完成编、解码运算,纠正SEU引起的单字节错误。在75MHz的时钟频率下达到4.8Gbps的传输速度,满足高速海量存储系统的要求。
关键词
单粒子翻转
高速海量存储器
并行
RS
编解码
Keywords
SEU
High-speed mass memory
Parallel Reed-Solomon code
分类号
TN911.22 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
FAQ-CNN:面向量化卷积神经网络的嵌入式FPGA可扩展加速框架
被引量:
8
3
作者
谢坤鹏
卢冶
靳宗明
刘义情
龚成
陈新伟
李涛
机构
南开大学计算机学院
天津市网络与数据安全技术重点实验室(南开大学)
计算机体系结构国家重点实验室(中国科学院计算技术研究所)
福建省信息处理与智能控制重点实验室(闽江学院)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2022年第7期1409-1427,共19页
基金
国家重点研发计划项目(2018YFB2100304)
国家自然科学基金项目(62002175)
+3 种基金
计算机体系结构国家重点实验室(中国科学院计算技术研究所)开放课题(CARCHB202016)
天津市优秀科技特派员项目(21YDTPJC00380)
福建省信息处理与智能控制重点实验室(闽江学院)开放基金项目(MJUKF-IPIC202105)
中国高校产学研创新基金项目(2020HYA01003)。
文摘
卷积神经网络(convolutional neural network, CNN)模型量化可有效压缩模型尺寸并提升CNN计算效率.然而,CNN模型量化算法的加速器设计,通常面临算法各异、代码模块复用性差、数据交换效率低、资源利用不充分等问题.对此,提出一种面向量化CNN的嵌入式FPGA加速框架FAQ-CNN,从计算、通信和存储3方面进行联合优化,FAQ-CNN以软件工具的形式支持快速部署量化CNN模型.首先,设计面向量化算法的组件,将量化算法自身的运算操作和数值映射过程进行分离;综合运用算子融合、双缓冲和流水线等优化技术,提升CNN推理任务内部的并行执行效率.然后,提出分级编码与位宽无关编码规则和并行解码方法,支持低位宽数据的高效批量传输和并行计算.最后,建立资源配置优化模型并转为整数非线性规划问题,在求解时采用启发式剪枝策略缩小设计空间规模.实验结果表明,FAQ-CNN能够高效灵活地实现各类量化CNN加速器.在激活值和权值为16 b时,FAQ-CNN的加速器计算性能是Caffeine的1.4倍;在激活值和权值为8 b时,FAQ-CNN可获得高达1.23TOPS的优越性能.
关键词
卷积神经网络量化
量化算法解耦
并行编解码
片上资源建模
加速器设计
Keywords
convolutional neural network quantization
decoupling of quantization algorithm
encode and decode in parallel
on-chip resource modeling
accelerator design
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
DVCPRO HD并行解码算法的研究与实现
王祥远
王兴东
宋利
《信息技术》
2009
0
在线阅读
下载PDF
职称材料
2
星载高速海量存储系统的并行RS纠错方法
张宇宁
杨根庆
李华旺
常亮
《航天控制》
CSCD
北大核心
2009
3
在线阅读
下载PDF
职称材料
3
FAQ-CNN:面向量化卷积神经网络的嵌入式FPGA可扩展加速框架
谢坤鹏
卢冶
靳宗明
刘义情
龚成
陈新伟
李涛
《计算机研究与发展》
EI
CSCD
北大核心
2022
8
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部