提出一种基于深度优先贪婪搜索(Depth First Greedy Search Partitioning,DFGSP)的分像素插值任务划分映射方法,采用任务并行的方式,按深度优先搜索节点的方式减少子任务之间的通信量。对分像素插值算法的数据流图划分后设计合理并行方...提出一种基于深度优先贪婪搜索(Depth First Greedy Search Partitioning,DFGSP)的分像素插值任务划分映射方法,采用任务并行的方式,按深度优先搜索节点的方式减少子任务之间的通信量。对分像素插值算法的数据流图划分后设计合理并行方案,以极大限度利用处理元为原则进行贪婪搜索,并在项目组前期研究的阵列处理器(DPR-CODEC)上加速实现。实验表明,该方法执行时间远低于两步搜索方案,与未优化的原始HEVC插值滤波器相比,硬件资源占用减少72%。展开更多
针对三维高效视频编码(3D high efficiency video coding,3D-HEVC)深度图在运动估计过程中没有充分利用平坦区域数据特性而导致的计算量大、编码时间长等问题,提出一种基于块分类的深度图运动估计优化方法。依据编码块像素分布特征,将...针对三维高效视频编码(3D high efficiency video coding,3D-HEVC)深度图在运动估计过程中没有充分利用平坦区域数据特性而导致的计算量大、编码时间长等问题,提出一种基于块分类的深度图运动估计优化方法。依据编码块像素分布特征,将其分类为平坦或者边缘区域,自适应地为不同类型编码块分配不同的搜索算法,减少整体计算开销。实验结果表明,优化后的算法相比于全搜索算法,平均峰值信噪比(peak signal to noise ratio,PSNR)的损耗仅为0.0870 dB;相比于TZSearch(test zone search)算法,运动搜索次数平均减少12.04%。为进一步提升编码速度,基于视频阵列处理器对优化后的算法设计并行实现方案。实验结果表明,所设计的并行方案串/并平均加速比达到2.8940。展开更多
文摘提出一种基于深度优先贪婪搜索(Depth First Greedy Search Partitioning,DFGSP)的分像素插值任务划分映射方法,采用任务并行的方式,按深度优先搜索节点的方式减少子任务之间的通信量。对分像素插值算法的数据流图划分后设计合理并行方案,以极大限度利用处理元为原则进行贪婪搜索,并在项目组前期研究的阵列处理器(DPR-CODEC)上加速实现。实验表明,该方法执行时间远低于两步搜索方案,与未优化的原始HEVC插值滤波器相比,硬件资源占用减少72%。
文摘针对三维高效视频编码(3D high efficiency video coding,3D-HEVC)深度图在运动估计过程中没有充分利用平坦区域数据特性而导致的计算量大、编码时间长等问题,提出一种基于块分类的深度图运动估计优化方法。依据编码块像素分布特征,将其分类为平坦或者边缘区域,自适应地为不同类型编码块分配不同的搜索算法,减少整体计算开销。实验结果表明,优化后的算法相比于全搜索算法,平均峰值信噪比(peak signal to noise ratio,PSNR)的损耗仅为0.0870 dB;相比于TZSearch(test zone search)算法,运动搜索次数平均减少12.04%。为进一步提升编码速度,基于视频阵列处理器对优化后的算法设计并行实现方案。实验结果表明,所设计的并行方案串/并平均加速比达到2.8940。