期刊文献+
共找到190篇文章
< 1 2 10 >
每页显示 20 50 100
任务并行编程模型下排列熵算法的并行实现
1
作者 李维权 《软件工程》 2024年第2期40-43,共4页
排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度... 排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度到不同的CPU上执行,实现排列熵算法的并行化。基于StarPU的排列熵并行算法与串行程序相比较,加速比为23.79倍,相较于OpenMP(一种用于共享内存并行系统的并行计算方案),在分配28个线程时,加速比为1.17倍,结果表明该方法能够有效实现排列熵算法的加速执行。 展开更多
关键词 排列熵算法 任务并行编程模型 OPENMP StarPU
在线阅读 下载PDF
任务并行编程模型研究与进展 被引量:29
2
作者 王蕾 崔慧敏 +1 位作者 陈莉 冯晓兵 《软件学报》 EI CSCD 北大核心 2013年第1期77-90,共14页
任务并行编程模型是近年来多核平台上广泛研究和使用的并行编程模型,旨在简化并行编程和提高多核利用率.首先,介绍了任务并行编程模型的基本编程接口和支持机制;然后,从3个角度,即并行性表达、数据管理和任务调度介绍任务并行编程模型... 任务并行编程模型是近年来多核平台上广泛研究和使用的并行编程模型,旨在简化并行编程和提高多核利用率.首先,介绍了任务并行编程模型的基本编程接口和支持机制;然后,从3个角度,即并行性表达、数据管理和任务调度介绍任务并行编程模型的研究问题、困难和最新研究成果;最后展望了任务并行未来的研究方向. 展开更多
关键词 任务并行 并行编程模型 任务窃取调度 并行性表达
在线阅读 下载PDF
LilyTask任务并行环境中基于任务关系的初始任务分配算法 被引量:6
3
作者 邸楠 王韬 李晓明 《计算机学报》 EI CSCD 北大核心 2005年第5期892-899,共8页
LilyTask是一个基于任务并行的并行程序设计环境,它引入了任务间关系的概念.任务间会由于这种任务依赖关系而产生等待,为了减少这种等待开销,LilyTask系统在预编译阶段分析这些数据依赖关系,并做出相应的静态任务分配.该文给出在LilyTas... LilyTask是一个基于任务并行的并行程序设计环境,它引入了任务间关系的概念.任务间会由于这种任务依赖关系而产生等待,为了减少这种等待开销,LilyTask系统在预编译阶段分析这些数据依赖关系,并做出相应的静态任务分配.该文给出在LilyTask任务并行环境中的一族新的基于任务关系图的静态任务分配的算法——WCP算法,并在实际测试中与另外两个著名的静态分配算法ETF和MCP算法作了比较,测试结果说明WCP算法在任务计算开销与通信开销不能准确给出的情况下有更好的分配效果. 展开更多
关键词 LILY TASK 任务并行 静态任务分配 有向无环图 关键路径
在线阅读 下载PDF
SW26010众核任务并行调度系统及其嵌套并行算法应用 被引量:5
4
作者 孙乔 黎雷生 +2 位作者 赵海涛 赵慧 吴长茂 《软件学报》 EI CSCD 北大核心 2021年第8期2352-2364,共13页
任务并行是并行程序设计的基础设计模式.但由于算法本身的复杂性及目标平台的特殊性,设计实现高效率的任务并行程序对程序员来说往往充满挑战.基于新兴的SW26010众核CPU,提出了支持任务嵌套并行模式的通用运行时框架SWAN.SWAN对任务并... 任务并行是并行程序设计的基础设计模式.但由于算法本身的复杂性及目标平台的特殊性,设计实现高效率的任务并行程序对程序员来说往往充满挑战.基于新兴的SW26010众核CPU,提出了支持任务嵌套并行模式的通用运行时框架SWAN.SWAN对任务并行程序的实现提供了高层次的抽象,使程序员能够专注于算法逻辑本身而提高开发效率.在性能方面,SWAN框架对诸多共享资源进行了细粒度的划分,从而有效地避免了众多线程间对共享资源的高强度争用.充分利用平台的高速访存机制、高速可控缓存和原子操作等特性,对SWAN框架的核心数据结构进行优化设计以降低其本身的性能开销.SWAN还具备动态负载均衡能力,使各个处理器核心的资源得以充分利用.基于SWAN框架,在目标平台上实现了若干典型的具有递归特性的嵌套并行算法,包括N-皇后问题、二叉树遍历、快速排序和凸包求解.实验结果表明,这些通过使用SWAN框架得以并行化的算法相对于其串行版本取得了4.5~32倍的加速,充分说明了SWAN框架具有较高的实用性及性能. 展开更多
关键词 任务并行框架 并行计算 嵌套并行算法 SWAN SW26010众核CPU
在线阅读 下载PDF
基于多核处理器的多任务并行处理技术研究 被引量:6
5
作者 汪前进 高勇 李存华 《计算机应用与软件》 CSCD 北大核心 2012年第7期141-143,153,共4页
目前,多核处理器已经越来越普及,但是现有算法并不能有效地并行处理数据,造成硬件资源的浪费。为了提高多核处理器的数据处理能力,针对求两个字符串的公共子串算法,提出一种改进方法,在VS.NET环境使用TPL(任务并行库),调度改进的算法处... 目前,多核处理器已经越来越普及,但是现有算法并不能有效地并行处理数据,造成硬件资源的浪费。为了提高多核处理器的数据处理能力,针对求两个字符串的公共子串算法,提出一种改进方法,在VS.NET环境使用TPL(任务并行库),调度改进的算法处理数据。实验结果表明,改进后的算法可以充分利用多核处理器并行处理数据的特点,提高并行加速比,大大提高数据处理效率。 展开更多
关键词 多核 任务 并行算法 任务并行 VS.NET
在线阅读 下载PDF
细粒度任务并行GPU通用矩阵乘 被引量:5
6
作者 张帅 李涛 +2 位作者 王艺峰 焦晓帆 杨愚鲁 《计算机工程与科学》 CSCD 北大核心 2015年第5期847-856,共10页
稠密线性代数运算对模式识别和生物信息等许多实际应用至关重要,而通用矩阵乘(GEMM)处于稠密线性代数运算的基础地位。在cuBLAS与MAGMA中,GEMM被实现为若干kernel函数,对大型GEMM计算能够达到很高的性能。然而,现有实现对批量的小型GEM... 稠密线性代数运算对模式识别和生物信息等许多实际应用至关重要,而通用矩阵乘(GEMM)处于稠密线性代数运算的基础地位。在cuBLAS与MAGMA中,GEMM被实现为若干kernel函数,对大型GEMM计算能够达到很高的性能。然而,现有实现对批量的小型GEMM计算性能发挥则较为有限。而且,现有实现也不能在多个具有不同性能的GPU之间自动扩展并达到负载均衡。提出任务并行式GEMM(TPGEMM),用细粒度任务并行的方式实现批量矩阵乘和多GPU矩阵乘。一个或多个GEMM的计算能够被拆分为多个任务,动态地调度到一个或多个GPU上。TPGEMM避免了为批量矩阵乘启动多个kernel函数的开销,对批量矩阵乘能够取得显著高于cuBLAS与MAGMA的性能。在低开销细粒度任务调度的基础上,TPGEMM支持单个GEMM计算在多个GPU间的自动并行,在一台具有四个不同性能GPU的工作站上取得了接近100%的扩展效率。 展开更多
关键词 通用矩阵乘 持久化kernel 任务并行 负载均衡
在线阅读 下载PDF
一种支持容错的任务并行程序设计模型 被引量:1
7
作者 王一拙 陈旭 +3 位作者 计卫星 苏岩 王小军 石峰 《软件学报》 EI CSCD 北大核心 2016年第7期1789-1804,共16页
任务并行程序设计模型已成为并行程序设计的主流,其通过发掘任务并行性来提高并行计算机的系统性能.提出一种支持容错的任务并行程序设计模型,将容错技术融入到任务并行程序设计模型中,在保证性能的同时提高系统可靠性.该模型以任务为... 任务并行程序设计模型已成为并行程序设计的主流,其通过发掘任务并行性来提高并行计算机的系统性能.提出一种支持容错的任务并行程序设计模型,将容错技术融入到任务并行程序设计模型中,在保证性能的同时提高系统可靠性.该模型以任务为调度、执行、错误检测与恢复的基本单位,在应用级实现容错支持.采用一种BufferCommit计算模型支持瞬时错误的检测与恢复;采用应用级无盘检查点实现节点故障类型永久错误的恢复;采用一种支持容错的工作窃取任务调度策略获得动态负载均衡.实验结果表明,该模型以较低的性能开销提供了对硬件错误的容错支持. 展开更多
关键词 并行程序设计 容错 任务并行 工作窃取调度 负载均衡
在线阅读 下载PDF
基于多任务并行机制的APF实时监控系统 被引量:1
8
作者 方陆军 韩腾 +4 位作者 卓放 杨君 王兆安 林烽 纪勇 《电气传动》 北大核心 2005年第5期51-54,共4页
介绍了一种用于有源电力滤波器(A ctive Power F ilter,A PF)实时监控与保护的计算机监控系统。该系统运用VC+ +的多线程编程技术,实现了高速不间断采样和实时数据处理的多任务并行机制,从而能对A PF系统进行高采样率的谐波分析和更完... 介绍了一种用于有源电力滤波器(A ctive Power F ilter,A PF)实时监控与保护的计算机监控系统。该系统运用VC+ +的多线程编程技术,实现了高速不间断采样和实时数据处理的多任务并行机制,从而能对A PF系统进行高采样率的谐波分析和更完整可靠的故障实时报警、滤波。此外,软件设计中引入DAQBench工控A ctive X组件,加强了监控软件界面与功能的专业性。 展开更多
关键词 有源电力滤波器 APF 实时监控系统 任务并行机制 电力系统 无功功率补偿
在线阅读 下载PDF
基于线程池的多任务并行处理模型 被引量:4
9
作者 高翔 张金登 《指挥信息系统与技术》 2012年第4期54-56,共3页
通过对大型系统中多线程模式在实际应用中存在的优缺点分析,提出基于线程池的多任务并行处理模型,并在此基础上详细描述了该模型的3个主要功能模块,为解决多线程环境下如何提高任务并行处理效率提供了一种实现方法。
关键词 任务并行处理 多线程技术 线程池
在线阅读 下载PDF
数据并行语言中的任务并行
10
作者 刘振英 方滨兴 张毅 《计算机工程与应用》 CSCD 北大核心 1999年第10期43-45,共3页
数据并行虽然已经获得了广泛的应用,但是,仍然有一些应用程序不适于数据并行语言的并行模式,如树结构算法。数据并行与任务并行的结合可以很好地解决这些问题。该文主要讨论了在数据并行中引入任务并行时,遇到的共享变量、代码生成... 数据并行虽然已经获得了广泛的应用,但是,仍然有一些应用程序不适于数据并行语言的并行模式,如树结构算法。数据并行与任务并行的结合可以很好地解决这些问题。该文主要讨论了在数据并行中引入任务并行时,遇到的共享变量、代码生成和处理器分配等问题,比较和分析了基于编译、基于语言和基于协作库的方法。 展开更多
关键词 任务并行 协作库 数据并行语言 编译器
在线阅读 下载PDF
p-HPF并行编译器对数据并行和任务并行的支持
11
作者 胡长军 余华山 许卓群 《石油大学学报(自然科学版)》 CSCD 北大核心 2002年第1期91-93,99,共4页
p-HPF是一个基于cluster体系结构的HPF并行编译系统 ,它不仅支持数据并行计算范例 ,而且也支持任务并行范例。给出了 p-HPF并行编译系统的体系结构和实现策略 ,介绍了 p-HPF实现数据并行和任务并行的机制 ,包括数据分布方法、外部过程... p-HPF是一个基于cluster体系结构的HPF并行编译系统 ,它不仅支持数据并行计算范例 ,而且也支持任务并行范例。给出了 p-HPF并行编译系统的体系结构和实现策略 ,介绍了 p-HPF实现数据并行和任务并行的机制 ,包括数据分布方法、外部过程调用等。还给出用 p-HPF求解N-body、快速傅立叶变换、单炮地震资料的处理等应用实例。 展开更多
关键词 并行编译器 数据并行 任务并行 IPF语言 并行计算 并行编译
在线阅读 下载PDF
高通量DNA测序数据的多任务并行压缩算法 被引量:2
12
作者 何娜 李家辉 +1 位作者 王婷 罗海飚 《计算机应用研究》 CSCD 北大核心 2015年第7期2014-2017,共4页
研究采用任务并行的方法,对Fast Q格式文件的压缩程序DSRC(DNA sequence reads compression)进行了加速。这一任务并行算法将DSRC分为数据读入和数据压缩两个独立的任务,而后将数据压缩的统计过程进一步细分为title行数据统计和其他数... 研究采用任务并行的方法,对Fast Q格式文件的压缩程序DSRC(DNA sequence reads compression)进行了加速。这一任务并行算法将DSRC分为数据读入和数据压缩两个独立的任务,而后将数据压缩的统计过程进一步细分为title行数据统计和其他数据统计两个独立任务。研究结合CPU多线程、GPU、MIC(many integrated core),针对title行数据设计了高并行度的统计算法,实现title行数据的并行统计。在维持原有压缩比的情况下,本研究得到的最大压缩通量可以达到144 MBps,最大加速比可达三倍。结果表明,多任务并行的方法可以有效地加速DSRC,而协处理器对DSRC的加速效果并不明显。另外本算法在压缩ILLUMINA和SOLi D测序平台下的Fast Q数据时,其加速效果比压缩LS454测序平台的数据更为明显。 展开更多
关键词 任务并行 多线程 GPU MIC FastQ文件 压缩
在线阅读 下载PDF
基于线程池的GPU任务并行计算模式研究 被引量:22
13
作者 李涛 董前琨 +3 位作者 张帅 孔令晏 康宏 杨愚鲁 《计算机学报》 EI CSCD 北大核心 2018年第10期2175-2192,共18页
GPU已经成为具有高并发高内存带宽的通用协处理器,但是GPU与CPU在体系结构和编程模型上存在很大差异,导致CPU-GPU异构计算系统的编程复杂度提高,即使采用统一计算设备架构(CUDA)提供的kernel并发技术和多流技术也较难充分控制和利用GPU... GPU已经成为具有高并发高内存带宽的通用协处理器,但是GPU与CPU在体系结构和编程模型上存在很大差异,导致CPU-GPU异构计算系统的编程复杂度提高,即使采用统一计算设备架构(CUDA)提供的kernel并发技术和多流技术也较难充分控制和利用GPU上的计算资源,难以有效地处理不规则的并行应用问题.为从体系结构角度探索GPU硬件支持的页锁定内存和统一虚拟地址空间等特征,该文提出了CPU辅助任务调度管理下的基于线程池技术的GPU任务并行计算模型CAGTP,实现了CPU-GPU异构计算系统上的共享内存式程序设计.提出并设计了CPU端的任务队列、计算线程块级任务调度器、任务槽和GPU端的任务复用kernel函数等机制,实现了CPU与GPU间的高效细粒度任务交互,避免了原生CUDA程序中多次启停kernel函数的开销,有效地支持了GPU上的细粒度不规则并行任务计算,而且利用模型API接口函数能够降低CPU-GPU异构计算系统的编程难度.实验结果表明,CAGTP模型中任务调度的开销是kernel函数调用的5%,有效提升了通用矩阵乘、乔列斯基分解和K均值、T近邻等典型线性代数和机器学习算法的计算性能;CAGTP模型易于扩展使用多块GPU,且在性能差异较大的多个GPU之间达到负载均衡,能够高效求解混合任务和具有不规则并行性的应用问题. 展开更多
关键词 异构计算系统 统一计算设备架构 线程池 任务并行 任务复用函数
在线阅读 下载PDF
FORTRAN M:支持任务并行的语言 被引量:1
14
作者 陈国顺 鞠九滨 《小型微型计算机系统》 CSCD 北大核心 1996年第5期23-28,共6页
本文介绍FORTRANM的特点、结构、语言设施及其语法和语义,用一个例子说明FORTRANM源程序基本结构的轮廓。
关键词 任务并行 FORTRAN语言 程序语言
在线阅读 下载PDF
基于状态机与线程级多任务并行模型的数据采集传输调度设计 被引量:1
15
作者 王荣杰 孙煜 +3 位作者 刘文军 陈根华 冯祥胜 黄志开 《软件》 2022年第11期50-53,共4页
为解决水质污染物数据采集传输系统中多任务事件响应及数据传输不稳定问题,将数据采集传输功能分为若干子任务模块,引入状态机理论作为多任务调度研究理论基础,设计线程级多任务并行模型作为调度研究支持,由状态机维护多任务、多线程数... 为解决水质污染物数据采集传输系统中多任务事件响应及数据传输不稳定问题,将数据采集传输功能分为若干子任务模块,引入状态机理论作为多任务调度研究理论基础,设计线程级多任务并行模型作为调度研究支持,由状态机维护多任务、多线程数据请求,基于实际数据采集过程中建立采集传输事件与控制任务的关联关系,实现对采集传输事件的快速响应。采用基于线程级多任务并行模型调度方法实现自检、告警、配置和通信等功能,利用互斥锁达到通道隔离目的,提高系统的抗干扰性。最后对采集传输系统进行实地污染物数据采集监测实验。实验表明:基于状态机与线程级多任务并行模型的调度方法可以有效稳定地完成数据的采集和传输。 展开更多
关键词 环保专用 多线程 任务调度 任务判别状态机 线程级多任务并行模型
在线阅读 下载PDF
多任务并行IEEE1394协议栈设计
16
作者 代江波 谭怀亮 梁旭 《计算机工程》 CAS CSCD 北大核心 2011年第8期249-251,255,共4页
为满足嵌入式系统对高可靠性和实时性的要求,利用IEEE1394总线标准的软硬件特性,设计多任务并行IEEE1394协议栈,通过设置不同任务优先级获得不同服务质量的数据传输,从而使IEEE1394子系统任务和命令的执行更具实时性。在VxWorks平台上... 为满足嵌入式系统对高可靠性和实时性的要求,利用IEEE1394总线标准的软硬件特性,设计多任务并行IEEE1394协议栈,通过设置不同任务优先级获得不同服务质量的数据传输,从而使IEEE1394子系统任务和命令的执行更具实时性。在VxWorks平台上实现的基于该协议栈的数字视频解码与SBP2移动存储验证了该设计的可行性。 展开更多
关键词 IEEE1394协议栈 VXWORKS操作系统 任务并行 嵌入式系统
在线阅读 下载PDF
一种基于HiveSQL的增加任务并行度与建立中间表组合的优化查询方法 被引量:3
17
作者 郑灵逸 李擎 《现代计算机》 2021年第36期55-59,共5页
针对大数据时代数据量级随时间不断累积、在大数据环境中查询数据困难且缓慢的问题,提出一种基于HiveSQL的增加任务并行度与建立中间表组合的优化查询方法。本文应用的是Hadoop生态系统中Hive数据库,从Hive数据库里数据量级为Pb的数据当... 针对大数据时代数据量级随时间不断累积、在大数据环境中查询数据困难且缓慢的问题,提出一种基于HiveSQL的增加任务并行度与建立中间表组合的优化查询方法。本文应用的是Hadoop生态系统中Hive数据库,从Hive数据库里数据量级为Pb的数据当中,通过编写SQL语句查询出实验所需要的数据。当在查询数据量级过大、查询指标较多并且SQL查询语句冗长的情况下,都会造成查询时间过长和查询效率低的问题,提出增加SQL任务并行度与建立中间表组合的优化查询方法来解决这一问题。实验结果证明,本文提出的方法将大数据查询时间缩短为原来的25%,并且提高了集群的利用效率。 展开更多
关键词 大数据查询优化 Hive SQL任务并行 建立中间表
在线阅读 下载PDF
任务并行程序设计模型LilyTask在分布存储环境下的设计与实现
18
作者 沈坚 王韬 李晓明 《计算机工程与科学》 CSCD 2005年第2期68-70,共3页
LilyTask是一种以任务为单位、基于任务并行的计算模型和程序设计模型。本文介绍的LilyTask系统基于 LilyTask模型,对在分布内存环境下实现任务池系统进行了有益的尝试,较好地解决了任务并行在分布存储环境下遇到的 任务间关系、嵌套任... LilyTask是一种以任务为单位、基于任务并行的计算模型和程序设计模型。本文介绍的LilyTask系统基于 LilyTask模型,对在分布内存环境下实现任务池系统进行了有益的尝试,较好地解决了任务并行在分布存储环境下遇到的 任务间关系、嵌套任务、一致性等相关问题。此外,本系统还采用函数索引技术实现分布环境下的任务迁移,通过任务窃取 策略有效地实现负载平衡。 展开更多
关键词 任务并行程序设计模型 计算模型 LILY TASK 分布存储环境
在线阅读 下载PDF
运载火箭多任务并行出厂发射管理研究与实践 被引量:4
19
作者 覃艺 金志强 +2 位作者 贾大玲 刘琳 邢晓光 《航天工业管理》 2017年第5期31-35,共5页
作为我闫现役运载火箭的主力军,某运载火箭型号承担了探月工程、“北斗”导航卫星工程等国家重大工程及其它军用、民用和商业卫星的发射任务。自2006年以来,通过优化资源配置、挖掘生产潜能,同时开展了技术创新和管理创新等手段,该... 作为我闫现役运载火箭的主力军,某运载火箭型号承担了探月工程、“北斗”导航卫星工程等国家重大工程及其它军用、民用和商业卫星的发射任务。自2006年以来,通过优化资源配置、挖掘生产潜能,同时开展了技术创新和管理创新等手段,该型火箭网满完成了2006-2007年、2010~2012年2轮高密度发射任务。 展开更多
关键词 运载火箭 发射任务 管理创新 任务并行 出厂 探月工程 卫星工程 商业卫星
在线阅读 下载PDF
建筑预(结)算单机多任务并行操作CAC系统
20
作者 孙扬德 冷大敬 孙东华 《哈尔滨科学技术大学学报》 1994年第4期64-68,共5页
设计了一个可以在一台计算机终端上同时制作多项建筑工程预(结)算文件的系统,该系统能支持多种数据采集、加工、输出打印格式和打印方式。
关键词 建筑预算系统 建筑结算系统 任务并行处理系统 并行操作CAC系统 数据采集 数据加工
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部