期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
访存与用户行为敏感的MPSoC应用映射 被引量:3
1
作者 王一拙 左琦 +2 位作者 计卫星 王小军 石峰 《电子学报》 EI CAS CSCD 北大核心 2015年第4期631-638,共8页
应用映射是MPSo C设计中的关键问题,针对多应用负载的MPSo C,提出一种访存与用户行为敏感的动态映射策略,该策略根据应用的数据访问特征区分热点与非热点应用,并对用户行为进行建模,根据用户行为模型,进一步在运行时区分关键与非关键应... 应用映射是MPSo C设计中的关键问题,针对多应用负载的MPSo C,提出一种访存与用户行为敏感的动态映射策略,该策略根据应用的数据访问特征区分热点与非热点应用,并对用户行为进行建模,根据用户行为模型,进一步在运行时区分关键与非关键应用.对每个进入系统的应用,按照应用的热点及关键性分类动态选择在线映射算法,让热点应用围绕存储器布局,非热点应用尽量避免占用存储器附近的资源;对关键应用,最小化应用内通信开销和链路竞争,对非关键应用,最小化应用间通信开销和链路竞争.实验表明,与单纯考虑访存或用户行为的映射策略相比,本文策略能够降低系统整体的通信能耗. 展开更多
关键词 多处理器片上系统 片上网络 应用映射 任务映射
在线阅读 下载PDF
基于MPSoC的遥感图像目标检测算法硬件加速研究 被引量:6
2
作者 李强 武文波 何明一 《航天返回与遥感》 CSCD 北大核心 2022年第1期58-68,共11页
遥感图像目标实时检测是遥感应用领域的关键技术问题之一。深度神经网络遥感图像目标检测准确率高,但此类网络通常结构复杂、参数多、计算量大,对计算资源和存储的需求较高,设计轻量化软硬件系统实现星载边缘端部署较为困难。针对上述问... 遥感图像目标实时检测是遥感应用领域的关键技术问题之一。深度神经网络遥感图像目标检测准确率高,但此类网络通常结构复杂、参数多、计算量大,对计算资源和存储的需求较高,设计轻量化软硬件系统实现星载边缘端部署较为困难。针对上述问题,文章提出了一种基于多处理器片上系统(MPSoC)现场可编程门阵列(FPGA)的遥感图像目标检测算法硬件加速方案。首先研究了适合星载边缘端部署的目标检测算法;然后设计了深度卷积神经网络并行加速计算结构和引擎,采用有限精度运算实现网络参数,使其数字量减少了75%,显著降低了计算和存储开销;最后基于MPSoC FPGA处理器实现了飞机目标检测的原型演示验证系统。实验结果表明,文章提出的遥感图像目标检测系统方案的目标检测精度可达92%以上;与基于嵌入式CPU、CPU、GPU的方案相比,单帧图像推理时间从100s、1000ms、100ms缩短至10ms级,可以满足遥感图像目标检测实时处理要求,具有一定的工程应用价值。 展开更多
关键词 目标检测 多处理器片上系统 现场可编程门阵列 深度卷积神经网络 嵌入式 硬件 加速 遥感应用
在线阅读 下载PDF
访存敏感的增量式MPSoC应用映射 被引量:1
3
作者 王一拙 左琦 +2 位作者 计卫星 王小军 石峰 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1198-1209,共12页
现代多处理器片上系统(multiprocessor system-on-chip,MPSoC)通常采用片上网络(networkon-chip,NoC)作为其基本互连结构,应用映射是基于片上网络互连的MPSoC设计中的关键问题,应用映射决定应用划分成的各个任务到片上网络节点的分配.... 现代多处理器片上系统(multiprocessor system-on-chip,MPSoC)通常采用片上网络(networkon-chip,NoC)作为其基本互连结构,应用映射是基于片上网络互连的MPSoC设计中的关键问题,应用映射决定应用划分成的各个任务到片上网络节点的分配.许多基于片上网络互连的MPSoC系统将共享存储作为网络中的独立节点,针对这类MPSoC系统,提出一种访存敏感的增量式动态映射策略.该策略离线分析获取应用的访存特征,运行中当应用到达系统时,根据其访存特征选择不同的映射算法,将热点应用围绕共享存储器布局,非热点应用远离共享存储器布局,并最小化应用间以及应用所含任务间的通信链路竞争.模拟实验表明:与贪恋区域选择加随机节点映射的策略相比较,提出的策略对系统整体通信功耗平均节约34.6%,性能提升可达36.3%,并能适应不同片上网络规模. 展开更多
关键词 多处理器片上系统 片上网络 应用映射 任务映射 访存敏感
在线阅读 下载PDF
红外/毫米波复合制导信息处理方法及MPSoC实现 被引量:1
4
作者 陈禾 彭桂花 吴强 《北京理工大学学报》 EI CAS CSCD 北大核心 2011年第11期1355-1359,1364,共6页
针对共口径红外/毫米波复合制导应用需求,提出一种基于自回归(AR)谱估计和扩展卡尔曼滤波的信息融合处理新方法,基于此方法构建了实现红外/毫米波复合制导信息处理的多处理器片上系统(multiprocessor SoC,MPSoC),该系统采用主/从流水线... 针对共口径红外/毫米波复合制导应用需求,提出一种基于自回归(AR)谱估计和扩展卡尔曼滤波的信息融合处理新方法,基于此方法构建了实现红外/毫米波复合制导信息处理的多处理器片上系统(multiprocessor SoC,MPSoC),该系统采用主/从流水线结构,解决了基于此系统框架的多核通信、系统同步等问题.所提多处理器片上系统在单片FPGA上实现,FPGA实测结果表明,目标融合预测轨迹和真实轨迹基本重合,误差不超过10-2 rad,航向角融合精度远高于毫米波雷达和红外的精度,取得了比较好的融合效果;在100MHz的时钟下,整个红外/毫米波复合制导的信号处理的处理时间不超过2ms,满足复合制导对系统的实时性要求. 展开更多
关键词 红外/毫米波复合制导 多传感器数据融合 目标跟踪 多处理器片上系统
在线阅读 下载PDF
MPSoc上动静态结合的SPM分配策略 被引量:3
5
作者 罗飞 过敏意 陈英 《计算机工程》 CAS CSCD 北大核心 2010年第21期275-276,279,共3页
基于片上多处理器系统,提出一种动静态结合的便签式内存分配策略,采用整数线性规划方法将全局变量静态地分配到SPM中,使用拓展的数据程序关系图来描述任务和数据,根据贪心算法将合适的局部变量动态的分配到SPM中。实验结果表明,该分配... 基于片上多处理器系统,提出一种动静态结合的便签式内存分配策略,采用整数线性规划方法将全局变量静态地分配到SPM中,使用拓展的数据程序关系图来描述任务和数据,根据贪心算法将合适的局部变量动态的分配到SPM中。实验结果表明,该分配策略比纯静态分配策略平均减少程序执行时间27%,比不使用SPM时减少35%。 展开更多
关键词 片上多处理器系统 便签式内存 调度
在线阅读 下载PDF
基于OpenCL的流式应用程序在MPSoC上的动态并行度伸缩调度
6
作者 黄姗 石晶林 萧放 《高技术通讯》 CSCD 北大核心 2016年第12期925-934,共10页
分析了嵌入式系统应用程序的复杂化和多样化趋势,面向嵌入式系统常见的流式应用程序,提出了基于开放运算语言(OpenCL)的统一编程框架,并在此框架的基础上设计一个运行时系统,在应用程序可用计算资源发生变化的场景下,该系统可在线调整... 分析了嵌入式系统应用程序的复杂化和多样化趋势,面向嵌入式系统常见的流式应用程序,提出了基于开放运算语言(OpenCL)的统一编程框架,并在此框架的基础上设计一个运行时系统,在应用程序可用计算资源发生变化的场景下,该系统可在线调整应用程序的并行度,并进行动态调度。实验结果显示,与已有的Flextream动态调度系统相比,该调度系统在性能上最高可以提场17%,在动态调度的时间开销上最多可以降低7%。 展开更多
关键词 多处理器片上系统(mpsoc) 开放运算语言(OpenCL) 编程框架 并行度伸缩 运行时系统
在线阅读 下载PDF
Physical design method of MPSoC
7
作者 LIU Peng XIA Bing-jie TENG Zhao-wei 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2007年第4期631-637,共7页
Floorplan, clock network and power plan are crucial steps in deep sub-micron system-on-chip design. A novel di- agonal floorplan is integrated to enhance the data sharing between different cores in system-on-chip. Cus... Floorplan, clock network and power plan are crucial steps in deep sub-micron system-on-chip design. A novel di- agonal floorplan is integrated to enhance the data sharing between different cores in system-on-chip. Custom clock network con- taining hand-adjusted buffers and variable routing rules is constructed to realize balanced synchronization. Effective power plan considering both IR drop and electromigration achieves high utilization and maintains power integrity in our MediaSoC. Using such methods, deep sub-micron design challenges are managed under a fast prototyping methodology, which greatly shortens the design cycle. 展开更多
关键词 Physical design Fast prototyping FLOORPLAN Clock tree synthesis (CTS) Power plan multiprocessor system-onchip (mpsoc
在线阅读 下载PDF
基于有色Petri网的多处理器片上系统调度方法(英文)
8
作者 冯晓静 李曦 +2 位作者 王超 陈鹏 周学海 《中国科学技术大学学报》 CAS CSCD 北大核心 2014年第1期19-33,共15页
为了生成一个适用于多处理器片上系统的硬件调度器,提出一种新型的基于有色Petri网(CPN)的动态调度方法.该调度方法使用CPN对包括写后读、写后写、读后写数据相关以及结构相关在内的任务间相关性进行了建模,这些相关会在模型运行的过程... 为了生成一个适用于多处理器片上系统的硬件调度器,提出一种新型的基于有色Petri网(CPN)的动态调度方法.该调度方法使用CPN对包括写后读、写后写、读后写数据相关以及结构相关在内的任务间相关性进行了建模,这些相关会在模型运行的过程中被自动检测出来.根据相关性,任务会被动态地调度并分配到不同的计算单元上乱序执行,从而达到提高任务级并行度的目的.该调度方法分别在软件仿真平台和基于FPGA的硬件平台上得以实现.状态空间分析和对比实验的结果证明了调度方法的正确性和有效性. 展开更多
关键词 有色PETRI网 任务调度 多处理器片上系统 基于模型的设计方法
在线阅读 下载PDF
一种针对多处理器片上系统的静态任务分配方法
9
作者 吉慧 周磊 《无线电工程》 2017年第8期22-26,共5页
随着集成技术的快速发展,使得单个芯片上集成IP核数目越来越多。然而,晶体管密度和处理器工作频率的不断提升,使得功耗密度持续增加,导致芯片热量的不断上升。因此,MPSoCs面临不可避免的散热问题。提出了一种基于处理器核区域均温(Regio... 随着集成技术的快速发展,使得单个芯片上集成IP核数目越来越多。然而,晶体管密度和处理器工作频率的不断提升,使得功耗密度持续增加,导致芯片热量的不断上升。因此,MPSoCs面临不可避免的散热问题。提出了一种基于处理器核区域均温(Regional Mean Temperature,RMT)的初始任务分配策略,该方法充分考虑到处理器核区域温度。通过向量距离计算处理器核温度梯度,使用遗传算法进行初始任务分配。实验结果表明,该策略相比于随机任务分配策略,峰值温度降低率、热点降低率和温度梯度降低率最高分别达到4.69%、42.31%和77.49%。 展开更多
关键词 多处理器片上系统(mpsocs) 任务分配 区域均温 遗传算法
在线阅读 下载PDF
AN OBJECT ORIENTED MODEL SCHEDULING FOR MEDIA-SOC
10
作者 Cheng Xingmei Yao Yingbiao +2 位作者 Zhang Yixiong Liu Peng Yao Qingdong 《Journal of Electronics(China)》 2009年第2期244-251,共8页
This paper proposes an object oriented model scheduling for parallel computing in media MultiProcessors System on Chip(MPSoC).Firstly,the Coarse Grain Data Flow Graph(CGDFG) parallel programming model is used in this ... This paper proposes an object oriented model scheduling for parallel computing in media MultiProcessors System on Chip(MPSoC).Firstly,the Coarse Grain Data Flow Graph(CGDFG) parallel programming model is used in this approach.Secondly,this approach has the feature of unified abstraction for software objects implementing in processor and hardware objects implementing in ASICs,easy for mapping CGDFG programming on MPSoC.This approach cuts down the kernel overhead and reduces the code size effectively.The principle of the oriented object model,the method of scheduling,and how to map a parallel programming through CGDFG to the MPSoC are analyzed in this approach.This approach also compares the code size and execution cycles with conventional control flow scheduling,and presents respective management overhead for one application in me-dia-SoC. 展开更多
关键词 Multimedia computing Coarse Grain Data Flow Graph(CGDFG) Parallel program-ming Real Time Operating System(RTOS) multiprocessors System on Chip(mpsoc
在线阅读 下载PDF
Gradual refinement for application-specific MPSoC design from Simulink model to RTL implementation 被引量:1
11
作者 Kai HUANG Xiao-lang YAN +6 位作者 Sang-il HAN Soo-ik CHAE Ahmed A. JERRAYA Katalin POPOVICI Xavier GUERIN Lisane BRISOLARA Luigi CARRO 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2009年第2期151-164,共14页
The application-specific multiprocessor system-on-chip(MPSoC) architecture is becoming an attractive solution to deal with increasingly complex embedded applications,which require both high performance and flexible pr... The application-specific multiprocessor system-on-chip(MPSoC) architecture is becoming an attractive solution to deal with increasingly complex embedded applications,which require both high performance and flexible programmability. As an effective method for MPSoC development,we present a gradual refinement flow starting from a high-level Simulink model to a synthesizable and executable hardware and software specification. The proposed methodology consists of five different abstract levels:Simulink combined algorithm and architecture model(CAAM),virtual architecture(VA),transactional accurate architecture(TA),virtual prototype(VP) and field-programmable gate array(FPGA) emulation. Experimental results of Motion-JPEG and H.264 show that the proposed gradual refinement flow can generate various MPSoC architectures from an original Simulink model,allowing processor,communication and tasks design space exploration. 展开更多
关键词 multiprocessor system-on-chip (mpsoc design REFINEMENT Simulink SYSTEMC Motion-JPEG H.264
原文传递
Low-cost fault tolerance in evolvable multiprocessor systems:a graceful degradation approach
12
作者 Shervin VAKILI Sied Mehdi FAKHRAIE +1 位作者 Siamak MOHAMMADI Ali AHMADI 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2009年第6期922-926,共5页
The evolvable multiprocessor (EvoMP), as a novel multiprocessor system-on-chip (MPSoC) machine with evolvable task decomposition and scheduling, claims a major feature of low-cost and efficient fault tolerance. Non-ce... The evolvable multiprocessor (EvoMP), as a novel multiprocessor system-on-chip (MPSoC) machine with evolvable task decomposition and scheduling, claims a major feature of low-cost and efficient fault tolerance. Non-centralized control and adaptive distribution of the program among the available processors are two major capabilities of this platform, which remarkably help to achieve an efficient fault tolerance scheme. This letter presents the operational as well as architectural details of this fault tolerance scheme. In this method, when a processor becomes faulty, it will be eliminated of contribution in program execution in remaining run-time. This method also utilizes dynamic rescheduling capability of the system to achieve the maximum possible efficiency after processor reduction. The results confirm the efficiency and remarkable advantages of the proposed approach over common redundancy based techniques in similar systems. 展开更多
关键词 Fault tolerance multiprocessor system-on-chip (mpsoc Genetic algorithm (GA) Adaptive task scheduling
原文传递
Energy Efficient Run-Time Incremental Mapping for 3-D Networks-on-Chip 被引量:5
13
作者 Xiao-Hang Wang Peng Liu +3 位作者 Mei Yang Maurizio Palesi Ying-Tao Jiang Michael C Huang 《Journal of Computer Science & Technology》 SCIE EI CSCD 2013年第1期54-71,共18页
3-D Networks-on-Chip (NoC) emerge as a potent solution to address both the interconnection and design complexity problems facing future Multiprocessor System-on-Chips (MPSoCs). Effective run-time mapping on such 3... 3-D Networks-on-Chip (NoC) emerge as a potent solution to address both the interconnection and design complexity problems facing future Multiprocessor System-on-Chips (MPSoCs). Effective run-time mapping on such 3-D NoC-based MPSoCs can be quite challenging, as the arrival order and task graphs of the target applications are typically not known a priori, which can be further complicated by stringent energy requirements for NoC systems. This paper thus presents an energy-aware run-time incremental mapping algorithm (ERIM) for 3-D NoC which can minimize the energy consumption due to the data communications among processor cores, while reducing the fragmentation effect on the incoming applications to be mapped, and simultaneously satisfying the thermal constraints imposed on each incoming application. Specifically, incoming applications are mapped to cuboid tile regions for lower energy consumption of communication and the minimal routing. Fragment tiles due to system fragmentation can be gleaned for better resource utilization. Extensive experiments have been conducted to evaluate the performance of the proposed algorithm ERIM, and the results are compared against the optimal mapping algorithm (branch-and-bound) and two heuristic algorithms (TB and TL). The experiments show that ERIM outperforms TB and TL methods with significant energy saving (more than 10%), much reduced average response time, and improved system utilization. 展开更多
关键词 energy efficiency NETWORKS-ON-CHIP multiprocessor system-on-chips run-time incrementa] mapping
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部