期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于阵列处理器的HEVC数据流图可重构实现
1
作者 胡传瞻 蒋林 +3 位作者 朱筠 谢晓燕 杨坤 崔馨月 《计算机应用与软件》 北大核心 2024年第3期240-245,257,共7页
提出一种基于阵列处理器的HEVC算法数据流图可重构实现方法。基于动态重构机制完成不同的划分方式、算法间的灵活切换,采用深度优先贪婪对数据流图划分后子任务时域流水的并行方式对HEVC中典型编码算法的数据流图重新划分后设计合理映... 提出一种基于阵列处理器的HEVC算法数据流图可重构实现方法。基于动态重构机制完成不同的划分方式、算法间的灵活切换,采用深度优先贪婪对数据流图划分后子任务时域流水的并行方式对HEVC中典型编码算法的数据流图重新划分后设计合理映射方案,以Sobel算子值为重构依据在阵列处理器上进行帧内预测算法验证。实验结果表明,与块间流水方案实现相比加速比可达14.97,各算法资源利用率及计算速度均有提升,与帧内预测模式选择快速算法相比每个时钟周期可多处理7.1个像素。 展开更多
关键词 数据流图 HEVC 深度优先贪婪 可重构阵列处理器
在线阅读 下载PDF
阵列处理器上一种基于DFGSP的分像素插值算法实现 被引量:1
2
作者 胡传瞻 蒋林 +3 位作者 朱筠 谢晓燕 王萍 杨坤 《计算机应用与软件》 北大核心 2022年第10期49-53,103,共6页
提出一种基于深度优先贪婪搜索(Depth First Greedy Search Partitioning,DFGSP)的分像素插值任务划分映射方法,采用任务并行的方式,按深度优先搜索节点的方式减少子任务之间的通信量。对分像素插值算法的数据流图划分后设计合理并行方... 提出一种基于深度优先贪婪搜索(Depth First Greedy Search Partitioning,DFGSP)的分像素插值任务划分映射方法,采用任务并行的方式,按深度优先搜索节点的方式减少子任务之间的通信量。对分像素插值算法的数据流图划分后设计合理并行方案,以极大限度利用处理元为原则进行贪婪搜索,并在项目组前期研究的阵列处理器(DPR-CODEC)上加速实现。实验表明,该方法执行时间远低于两步搜索方案,与未优化的原始HEVC插值滤波器相比,硬件资源占用减少72%。 展开更多
关键词 任务划分 阵列处理器 深度优先贪婪搜索 分像素插值
在线阅读 下载PDF
一种HEVC帧内预测算法的动态自重构实现方法 被引量:1
3
作者 崔馨月 蒋林 +3 位作者 杨坤 惠超 胡传瞻 赵静 《计算机工程与科学》 CSCD 北大核心 2022年第12期2120-2127,共8页
高效视频编码HEVC中帧内预测算法在专用硬件上的实现无法满足在高清和移动视频等多种应用场景间灵活切换的需求,导致编码性能差,硬件资源利用率不高。针对这一问题,提出一种新的帧内预测算法在可重构阵列处理器上的实现方法。该方法基... 高效视频编码HEVC中帧内预测算法在专用硬件上的实现无法满足在高清和移动视频等多种应用场景间灵活切换的需求,导致编码性能差,硬件资源利用率不高。针对这一问题,提出一种新的帧内预测算法在可重构阵列处理器上的实现方法。该方法基于状态监测机制监测处理单元的执行状态,监测到空闲状态的处理单元则下发新的执行任务,根据处理单元的执行状态实现不同映射方案间的灵活切换,达到算法执行过程的动态自重构。实验结果表明,与帧内预测算法在专用处理器上的实现相比,本文方法在提高灵活性的同时,硬件资源使用减少了33.6%,算法执行的时钟周期数减少了16.2%。不同测试序列经过整个I帧环路测试的结果,与HM16.7官方软件的测试结果相比,平均图像质量有所提高。 展开更多
关键词 动态自重构 阵列处理器 状态监测器 高效视频编码 帧内预测
在线阅读 下载PDF
HEVC中率失真优化算法的动态可重构实现 被引量:8
4
作者 杨坤 蒋林 +3 位作者 谢晓燕 邓军勇 刘新闯 胡传瞻 《计算机工程与科学》 CSCD 北大核心 2021年第2期354-361,共8页
基于视频阵列处理器高效视频编码HEVC实现中,HEVC灵活的编码块增加了率失真优化算法硬件实现的难度,难以实现阵列规模和不同块的灵活切换。针对这一问题,提出一种动态可重构的率失真优化实现方法。基于上下文切换的动态重构机制,完成不... 基于视频阵列处理器高效视频编码HEVC实现中,HEVC灵活的编码块增加了率失真优化算法硬件实现的难度,难以实现阵列规模和不同块的灵活切换。针对这一问题,提出一种动态可重构的率失真优化实现方法。基于上下文切换的动态重构机制,完成不同规模、不同块大小算法之间的灵活切换,并以率失真优化算法作为帧内模式选择的判别依据,实现帧内预测的模式重构。实验结果表明,与专用硬件实现的率失真优化算法相比,在算法灵活切换的同时,硬件面积减少了8.2%,算法执行的时钟周期数减少了16.5%。 展开更多
关键词 动态可重构 高效视频编码 率失真优化 阵列处理器
在线阅读 下载PDF
基于重构设计的Inception网络 被引量:2
5
作者 谢晓燕 杜卓林 +2 位作者 胡传瞻 杨坤 王安琪 《计算机工程与设计》 北大核心 2022年第4期1195-1200,F0003,共7页
卷积神经网络(CNN)中大量乘加操作带来了巨大的参数量和计算量,使其在硬件加速中面临严重的访存和功耗问题。提出在4×4处理元阵列上实现同时支持1×1、3×3、5×5卷积核的28×28和32×32图像的并行重构计算方... 卷积神经网络(CNN)中大量乘加操作带来了巨大的参数量和计算量,使其在硬件加速中面临严重的访存和功耗问题。提出在4×4处理元阵列上实现同时支持1×1、3×3、5×5卷积核的28×28和32×32图像的并行重构计算方案,减少Inception网络的片上资源占用量。对输入图像进行预处理,提出一种重叠窗口的数据组织方案,将外存加载的像素数减少了30%。实验结果表明,在123 MHz的工作频率下,经过预处理的硬件访存开销降至45%,卷积计算的数据复用率达到66.7%,运行功耗为6.395 W,每瓦功率为0.176,性能较FPGA版本有明显提升。 展开更多
关键词 Inception网络 阵列处理器 重构 重叠窗口 数据组织
在线阅读 下载PDF
基于块分类的深度图运动估计及其并行实现 被引量:1
6
作者 谢晓燕 王安琪 +2 位作者 朱筠 胡传瞻 杜卓林 《计算机工程与设计》 北大核心 2021年第9期2561-2567,共7页
针对三维高效视频编码(3D high efficiency video coding,3D-HEVC)深度图在运动估计过程中没有充分利用平坦区域数据特性而导致的计算量大、编码时间长等问题,提出一种基于块分类的深度图运动估计优化方法。依据编码块像素分布特征,将... 针对三维高效视频编码(3D high efficiency video coding,3D-HEVC)深度图在运动估计过程中没有充分利用平坦区域数据特性而导致的计算量大、编码时间长等问题,提出一种基于块分类的深度图运动估计优化方法。依据编码块像素分布特征,将其分类为平坦或者边缘区域,自适应地为不同类型编码块分配不同的搜索算法,减少整体计算开销。实验结果表明,优化后的算法相比于全搜索算法,平均峰值信噪比(peak signal to noise ratio,PSNR)的损耗仅为0.0870 dB;相比于TZSearch(test zone search)算法,运动搜索次数平均减少12.04%。为进一步提升编码速度,基于视频阵列处理器对优化后的算法设计并行实现方案。实验结果表明,所设计的并行方案串/并平均加速比达到2.8940。 展开更多
关键词 深度图 运动估计 编码块分类 并行 视频阵列处理器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部