期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于状态机与线程级多任务并行模型的数据采集传输调度设计 被引量:1
1
作者 王荣杰 孙煜 +3 位作者 刘文军 陈根华 冯祥胜 黄志开 《软件》 2022年第11期50-53,共4页
为解决水质污染物数据采集传输系统中多任务事件响应及数据传输不稳定问题,将数据采集传输功能分为若干子任务模块,引入状态机理论作为多任务调度研究理论基础,设计线程级多任务并行模型作为调度研究支持,由状态机维护多任务、多线程数... 为解决水质污染物数据采集传输系统中多任务事件响应及数据传输不稳定问题,将数据采集传输功能分为若干子任务模块,引入状态机理论作为多任务调度研究理论基础,设计线程级多任务并行模型作为调度研究支持,由状态机维护多任务、多线程数据请求,基于实际数据采集过程中建立采集传输事件与控制任务的关联关系,实现对采集传输事件的快速响应。采用基于线程级多任务并行模型调度方法实现自检、告警、配置和通信等功能,利用互斥锁达到通道隔离目的,提高系统的抗干扰性。最后对采集传输系统进行实地污染物数据采集监测实验。实验表明:基于状态机与线程级多任务并行模型的调度方法可以有效稳定地完成数据的采集和传输。 展开更多
关键词 环保专用 线程 多任务调度 任务判别状态机 线程多任务并行模型
在线阅读 下载PDF
大数据文件和混合文件的多线程并行下载 被引量:7
2
作者 韦兴柳 钟诚 +2 位作者 李智 蔡德霞 陈清媛 《计算机工程与应用》 CSCD 2012年第14期84-89,共6页
在应用计算机模拟病例训练与考试系统的过程中,客户端时常需要在线下载许多大数据文件、音频和视频混合文件,系统响应速度是一个关键问题。研究了在RIA中实现多线程的技术方案,提出在多核计算机上有效实现多线程并行下载大数据文件、音... 在应用计算机模拟病例训练与考试系统的过程中,客户端时常需要在线下载许多大数据文件、音频和视频混合文件,系统响应速度是一个关键问题。研究了在RIA中实现多线程的技术方案,提出在多核计算机上有效实现多线程并行下载大数据文件、音频和视频混合文件的优化方法。算法分析与实验结果表明,提出的多线程并行下载技术能够加速计算机模拟病例系统模块的在线下载,显著优化了系统运行性能。 展开更多
关键词 线程下载 性能优化 富互联网应用(RIA) 多核计算机 线程级并行
在线阅读 下载PDF
面向线程级前瞻的线程划分方法浅析 被引量:1
3
作者 鲁建壮 王志英 张春元 《计算机科学》 CSCD 北大核心 2006年第5期270-272,281,共4页
正确合理的线程划分方法是提取线程级并行性的必要前提,线程级前瞻技术是简化线程划分复杂度提高系统性能的重要手段。本文讨论了几种支持线程级前瞻的典型线程划分方法,在此基础上提出了线程级划分需要解决的关键问题,并结合一典型自... 正确合理的线程划分方法是提取线程级并行性的必要前提,线程级前瞻技术是简化线程划分复杂度提高系统性能的重要手段。本文讨论了几种支持线程级前瞻的典型线程划分方法,在此基础上提出了线程级划分需要解决的关键问题,并结合一典型自动线程划分算法进行了具体分析,提出了线程划分需要进一步研究的问题。 展开更多
关键词 线程级并行 线程划分 线程前瞻
在线阅读 下载PDF
多核多线程并行求解线性方程组 被引量:2
4
作者 冯佩 钟诚 韦伟 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第2期237-240,250,共5页
线性方程组求解在科学与工程计算领域具有广泛的应用。文章依据多核计算机共享二级缓存和私有一级缓存的容量,采取将线性方程组的增广矩阵按行划分并合理地分布存储到各级缓存中,各个处理核以多线程方式并行计算矩阵行的方法,给出了一... 线性方程组求解在科学与工程计算领域具有广泛的应用。文章依据多核计算机共享二级缓存和私有一级缓存的容量,采取将线性方程组的增广矩阵按行划分并合理地分布存储到各级缓存中,各个处理核以多线程方式并行计算矩阵行的方法,给出了一种在多核计算机上实现的线程级并行求解n阶线性方程组的算法。实验结果表明,与原Gauss-Seidel并行算法相比,文中所提出的算法具有较好的加速比和可扩展性。 展开更多
关键词 线性方程组求解 Gauss-Seidel算法 多核计算 线程级并行 缓存
在线阅读 下载PDF
HL-TLS:支持热点的线程级猜测编译实现
5
作者 金跃 李春强 +1 位作者 尚云海 卢永江 《计算机工程》 CAS CSCD 北大核心 2015年第11期77-83,共7页
猜测并行化编译,即线程级猜测(TLS)编译,可将原来顺序运行的程序并行化。但由于猜测数据的不确定性引起的数据管理开销过大,以及猜测线程失败引起的线程回滚开销,使得并行后的执行性能较低。针对上述问题,提出一种HL-TLS并行化编译优化... 猜测并行化编译,即线程级猜测(TLS)编译,可将原来顺序运行的程序并行化。但由于猜测数据的不确定性引起的数据管理开销过大,以及猜测线程失败引起的线程回滚开销,使得并行后的执行性能较低。针对上述问题,提出一种HL-TLS并行化编译优化框架。HL-TLS能有效地标记并行化的循环体为热点循环体,采用对最高层次热点循环体进行更激进的并行化的方式提高性能,而对非热点循环体采用保守的顺序执行以减少开销。实验结果表明,使用HL-TLS编译优化框架,实验程序的执行效率可以提高20%。 展开更多
关键词 并行计算 线程 猜测执行 线程猜测并行 热点循环 动态转换执行机制
在线阅读 下载PDF
萤火虫2:一种多态并行机的硬件体系结构 被引量:16
6
作者 李涛 杨婷 +5 位作者 易学渊 蒲林 钱博文 黄光新 黄虎才 韩俊刚 《计算机工程与科学》 CSCD 北大核心 2014年第2期191-200,共10页
提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机... 提出了一种新型的多态高效并行阵列机结构——萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机能够实现效率很高的线程级并行运算、数据级并行运算和分布式指令级并行运算。尤其值得指出的是,此种阵列机的流处理性能堪与专用集成电路匹敌。该结构还能有效实现静态与动态数据流计算,可以高效实现图形、图像和数字信号处理任务。 展开更多
关键词 阵列机 多态处理器 计算机图形 图像处理 信号处理 数据并行 线程级并行
在线阅读 下载PDF
H.264并行编码算法的研究 被引量:9
7
作者 蒋兴昌 周军 罗传飞 《电视技术》 北大核心 2008年第2期33-35,共3页
以X264编码器作为研究对象,在指令集并行的基础上对其进行线程级并行优化,在Intel双核处理器平台上,针对非实时编码应用得到近2倍的加速比,针对实时编码应用得到1.5倍的加速比。
关键词 H.264 指令并行 线程级并行 多核
在线阅读 下载PDF
一种基于路径优化的推测多线程划分算法 被引量:1
8
作者 李远成 赵银亮 +1 位作者 李美蓉 杜延宁 《软件学报》 EI CSCD 北大核心 2012年第8期1950-1964,共15页
推测多线程(speculative multithreading,简称SpMT)技术是一种实现非规则程序自动并行化的有效途径.然而,基于控制流图和分支预测技术的线程划分方法,不可避免地会受到划分路径上所存在的控制依赖和数据依赖的制约.目前,在传统的线程划... 推测多线程(speculative multithreading,简称SpMT)技术是一种实现非规则程序自动并行化的有效途径.然而,基于控制流图和分支预测技术的线程划分方法,不可避免地会受到划分路径上所存在的控制依赖和数据依赖的制约.目前,在传统的线程划分算法中存在的一个重要问题是,在对划分路径进行选取时只考虑了控制依赖影响却不能有效地综合考虑数据依赖的影响,进而导致不能选取最佳的划分路径.因此,针对传统方法中这种依赖评估方法效率低下的问题,设计并实现了一种基于路径优化的线程划分算法.该算法通过引入基于程序切片技术的预计算方法,建立一种路径评估方法来评估程序间的控制和数据依赖.同时,引入控制线程体大小的启发式规则,以便有效地解决负载不平衡的问题.基于Olden测试集的测试结果表明,所提出的算法可以有效地对非规则程序进行划分,其平均加速比可以达到1.83. 展开更多
关键词 推测多线程 线程级并行 线程划分 路径优化 自动并行
在线阅读 下载PDF
基于多核并行遗传算法并行生成测试用例 被引量:1
9
作者 陈清媛 钟诚 李智 《微电子学与计算机》 CSCD 北大核心 2013年第11期149-153,共5页
通过将种群划分为多个子种群,对每个子种群执行遗传操作,p个核心并行执行遗传算法搜索测试路径,以加速测试用例的生成;通过在处理核心之间迁移子种群的个体,使得交叉变异后得到的种群个体变得丰富,算法能更好地全局寻优,可以寻找到较多... 通过将种群划分为多个子种群,对每个子种群执行遗传操作,p个核心并行执行遗传算法搜索测试路径,以加速测试用例的生成;通过在处理核心之间迁移子种群的个体,使得交叉变异后得到的种群个体变得丰富,算法能更好地全局寻优,可以寻找到较多能够覆盖全部路径的测试用例.实验结果表明,与基于串行遗传算法生成测试用例相比,多核并行遗传算法并行生成测试用例能够生成较多覆盖全都路径的测试用例且运行时间少. 展开更多
关键词 测试用例生成 并行遗传算法 多核系统 线程级并行
在线阅读 下载PDF
GPGPU上基于运行时特征的动态并行度调度算法
10
作者 于玉龙 王宇新 郭禾 《小型微型计算机系统》 CSCD 北大核心 2015年第12期2798-2802,共5页
调度算法对于保障GPGPU内大规模并发线程的高效运行至关重要.调度器需要根据程序的计算特征和GPGPU内各种逻辑单元的设置情况选择合理的线程并行度.然而现有调度算法或采用静态固化并行度、或调整粒度过粗,均无法在动态调整的同时保持... 调度算法对于保障GPGPU内大规模并发线程的高效运行至关重要.调度器需要根据程序的计算特征和GPGPU内各种逻辑单元的设置情况选择合理的线程并行度.然而现有调度算法或采用静态固化并行度、或调整粒度过粗,均无法在动态调整的同时保持合理的并行度参数.基于两层次调度算法TL,通过对GPGPU运行时特征的动态监测,针对细粒度Warp调度提出了结合运行时资源使用特征和指令特征的动态并行度调度算法DTL和D2TL.在性能模拟器GPGPU-Sim上的仿真实验证明,相对传统TL调度算法,DTL和D2TL分别达到平均14.4%和19.6%的性能加速. 展开更多
关键词 GPGPU 两层次调度 线程级并行 动态并行
在线阅读 下载PDF
多核计算机上的快速傅里叶变换并行算法 被引量:8
11
作者 王刚强 钟诚 柯琦 《计算机工程》 CAS CSCD 北大核心 2011年第16期57-59,共3页
针对现有多核结构上快速傅里叶变换(FFT)并行算法没有利用多级缓存和线程级并行等多核特性问题,通过运用多核多级存储特性合理划分数据,采取子序列FFT计算和多线程并行逐对计算FFT相结合的方法,给出一个N点、一维、有序和基数为2的多核... 针对现有多核结构上快速傅里叶变换(FFT)并行算法没有利用多级缓存和线程级并行等多核特性问题,通过运用多核多级存储特性合理划分数据,采取子序列FFT计算和多线程并行逐对计算FFT相结合的方法,给出一个N点、一维、有序和基数为2的多核多线程并行计算FFT非递归算法。理论分析和实验结果表明,该算法实用、高效,能获得较好的加速比和可扩展性。 展开更多
关键词 快速傅里叶变换 多核计算机 线程级并行 缓存 非递归
在线阅读 下载PDF
支持推测多线程的扩展多核模拟器Prophet+ 被引量:3
12
作者 宋少龙 赵银亮 +3 位作者 冯博琴 韦远科 王旭昊 赵恒星 《西安交通大学学报》 EI CAS CSCD 北大核心 2010年第10期13-17,35,共6页
推测多线程技术是软硬件协同开发非规则应用程序的线程级并行性的有效方法.通过体系结构对推测并行执行模式的支持,编译器产生推测多线程目标代码实现自动并行化加速.文中针对硬件平台如何有效支持程序运行过程的分析及测试,提出了一种... 推测多线程技术是软硬件协同开发非规则应用程序的线程级并行性的有效方法.通过体系结构对推测并行执行模式的支持,编译器产生推测多线程目标代码实现自动并行化加速.文中针对硬件平台如何有效支持程序运行过程的分析及测试,提出了一种支持推测并行执行模式的超标量流水线结构和一种基于独立栈的运行时内存空间管理方法.通过对Prophet模拟器扩展实现,并经Olden基准程序测试表明,扩展后的Prophet+在保持Prophet模拟器性能的前提下,提高了模拟器的精度和灵活性. 展开更多
关键词 线程级并行 推测多线程 片上多处理器 流水线 模拟器
在线阅读 下载PDF
多核同时多线程处理器的线程调度器设计 被引量:3
13
作者 周佳佳 李涛 黄小康 《电子技术应用》 北大核心 2016年第1期19-21,共3页
多核同时多线程处理器(SMT_PAAG)是用于图形、图像及数字信号处理的一种多核处理器。基于这种处理器提出了一种硬件线程调度器,该调度器采用同时多线程技术,最多可同时执行四个线程,支持八个线程阻塞模式下的快速上下文切换。这样避免... 多核同时多线程处理器(SMT_PAAG)是用于图形、图像及数字信号处理的一种多核处理器。基于这种处理器提出了一种硬件线程调度器,该调度器采用同时多线程技术,最多可同时执行四个线程,支持八个线程阻塞模式下的快速上下文切换。这样避免了因阻塞带来的等待问题,能够有效提高处理器的工作效率和资源利用率。通过在处理器上运行图形处理算法进行性能评测。结果表明,SMT-PAAG处理器通过挖掘指令级并行和线程级并行,将处理器的性能提高了69.25%。 展开更多
关键词 多核处理器 同时多线程 阻塞模式 图形处理算法 指令并行 线程级并行
在线阅读 下载PDF
Prophet推测多线程系统设计与实现 被引量:2
14
作者 李钟 赵银亮 杜延宁 《计算机科学》 CSCD 北大核心 2011年第2期296-301,共6页
推测多线程技术通过推测执行的方式开发应用程序的线程级并行性,以提高程序执行性能。该技术一般通过执行模型来检测运行时可能的线程推测错误情况,并采取合适的机制恢复程序正确运行。描述的Prophet是一种基于硬件实现的推测多线程执... 推测多线程技术通过推测执行的方式开发应用程序的线程级并行性,以提高程序执行性能。该技术一般通过执行模型来检测运行时可能的线程推测错误情况,并采取合适的机制恢复程序正确运行。描述的Prophet是一种基于硬件实现的推测多线程执行模型。重点描述了Prophet执行模型针对执行模型设计的关键问题的解决方案,包括Prophet的线程状态控制和多版本的Cache系统,Prophet的多版本Cache系统提供了推测数据缓存功能,并使用基于总线监听的Cache协议实现了数据依赖违规检测。还给出了使用Olden基准程序对Prophet执行模型进行功能和性能测试的结果,并分析说明了Prophet系统可以有效地开发应用程序的线程级并行性。 展开更多
关键词 推测多线程 线程级并行 推测多线程执行模型 推测多线程体系结构
在线阅读 下载PDF
动态图上的最短路径距离并行算法 被引量:4
15
作者 韩硕 邹磊 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第1期112-122,共11页
设计动态图上最短路径距离查询的并行计算框架。通过构建增量图的方法,实现一个批次内的多个查询在不同数据图版本的多线程并发执行。对于每个查询,使用双向宽度优先搜索算法来减少搜索空间,并提出搜索过程中扩展方向的决策函数。利用BS... 设计动态图上最短路径距离查询的并行计算框架。通过构建增量图的方法,实现一个批次内的多个查询在不同数据图版本的多线程并发执行。对于每个查询,使用双向宽度优先搜索算法来减少搜索空间,并提出搜索过程中扩展方向的决策函数。利用BSR对数据图邻接表进行编码,结合SIMD指令和图顶点重标号算法,进一步提升数据级并行度。在真实图数据集下的大量实验验证了所提方法的高效性。 展开更多
关键词 动态图 最短路径距离 增量图 线程级并行 数据并行 双向宽度优先搜索 SIMD
在线阅读 下载PDF
同时多线程处理器的指令调度器设计 被引量:1
16
作者 李乐 李涛 《微电子学与计算机》 CSCD 北大核心 2016年第6期27-31,36,共6页
同时多线程处理器SMT(Simultaneous Multi-Threading)是用于图形、图像及数字信号处理的一种可以实现指令级并行(ILP)和线程级并行(TLP)的轻核处理器.针对这种处理器提出了一种结构简单的动态指令调度器,用于避免四个活跃线程中指令间... 同时多线程处理器SMT(Simultaneous Multi-Threading)是用于图形、图像及数字信号处理的一种可以实现指令级并行(ILP)和线程级并行(TLP)的轻核处理器.针对这种处理器提出了一种结构简单的动态指令调度器,用于避免四个活跃线程中指令间的结构冲突和对一些特殊指令的不同要求的调度.结果表明,SMT处理器中的指令调度器通过调度各线程的执行先后顺序,四个线程被选中的概率均接近25%. 展开更多
关键词 多核处理器 同时多线程 动态调度 图形处理算法 指令并行 线程级并行
在线阅读 下载PDF
并行处理技术在雷达数据处理中的应用研究 被引量:2
17
作者 朱海涛 倪世道 《计算技术与自动化》 2013年第2期109-114,共6页
为了解决雷达数据处理系统数据量日益增大,计算能力逐渐不足的问题,提出两种并行处理方法。第一种方法是对数据处理各步骤中的循环采用多个线程并行处理,属于细粒度并行;第二种方法是根据雷达数据的局部性特征,把雷达探测空域按照径向... 为了解决雷达数据处理系统数据量日益增大,计算能力逐渐不足的问题,提出两种并行处理方法。第一种方法是对数据处理各步骤中的循环采用多个线程并行处理,属于细粒度并行;第二种方法是根据雷达数据的局部性特征,把雷达探测空域按照径向距离划分成多个部分,由多个子任务并行处理,属于粗粒度并行。实验结果显示,4线程细粒度并行雷达数据处理架构性能是原来的3倍,4任务粗粒度并行架构性能是原来的5倍,证明并行处理技术在雷达数据处理中的有效性,并且任务级的粗粒度并行架构更适合雷达数据处理。 展开更多
关键词 雷达数据处理 线程级并行 任务并行 数据局部性
在线阅读 下载PDF
EDGE结构上一种通过超块重组加速单线程应用的方法
18
作者 魏学超 安虹 毛梦捷 《小型微型计算机系统》 CSCD 北大核心 2012年第10期2249-2254,共6页
Explicit Data Graph Execution(EDGE)ISA是一种专门为类数据流驱动的分片式众核处理器而设计的指令集体系结构.相较于传统的采用控制流驱动的处理器,EDGE结构以超块(Hyperblock)而不是单个指令作为其执行单位,在超块内部实现数据流执行... Explicit Data Graph Execution(EDGE)ISA是一种专门为类数据流驱动的分片式众核处理器而设计的指令集体系结构.相较于传统的采用控制流驱动的处理器,EDGE结构以超块(Hyperblock)而不是单个指令作为其执行单位,在超块内部实现数据流执行,超块之间按照推测序保持控制流执行,有利于挖掘指令级并行性.但是,EDGE编译器按照程序的串行执行顺序组织超块,超块间和超块内部受限于数据依赖,削弱了整个程序运行时的潜在数据级并行性和线程级并行性,不利于发挥EDGE分片式结构的优势.本文通过分析EDGE编译器超块组织的特点,结合EDGE结构特有的执行模型,提出一种普适性的超块组织框架来模拟EDGE结构上多线程运行的效果,进一步挖掘EDGE结构运行串行单线程程序时的指令级并行性.本文选用TRIPS微处理器作为EDGE结构的实例处理器,利用矩阵乘法等三个实验验证了我们所提出的框架的可行性,实验结果表明这些应用在TRIPS上获得了较好的性能提升. 展开更多
关键词 众核处理器 EDGE 线程级并行 超块 TRIPS
在线阅读 下载PDF
访存高效并行求解(l,d)-Motif发现问题
19
作者 张静 钟诚 李智 《微电子学与计算机》 CSCD 北大核心 2014年第6期97-102,共6页
充分利用多核结构的共享三级缓存、私有二级和一级缓存,将采用Modeling算法求解(l,d)-Motif发现问题过程中产生的大量不同位置组合的数据,以多轮方式调度分配到各级缓存中,通过线程绑定以平衡核心负载,设计实现了一种访存高效的(l,d)-Mo... 充分利用多核结构的共享三级缓存、私有二级和一级缓存,将采用Modeling算法求解(l,d)-Motif发现问题过程中产生的大量不同位置组合的数据,以多轮方式调度分配到各级缓存中,通过线程绑定以平衡核心负载,设计实现了一种访存高效的(l,d)-Motif发现线程级并行算法.实验结果表明,与已有的并行求解(l,d)-Motif发现算法相比,本文给出的算法更高效、具有较好的加速比和可扩展性,并且能够成功求解更长l的(l,d)-Motif发现问题. 展开更多
关键词 (l d)-Motif发现 Modeling算法 组合计算 缓存 线程级并行
在线阅读 下载PDF
申威同时多线程功能模拟器实现与应用 被引量:2
20
作者 陈伟健 郭勇 尹飞 《计算机工程》 CAS CSCD 北大核心 2016年第6期55-59,67,共6页
同时多线程(SMT)技术允许来自多个线程的不相关指令同时执行,实现线程级并行与指令级并行相结合,提升处理器的性能。在SMT设计中,运用体系结构模拟器进行实现性分析与正确性验证。以申威多核功能模拟器为基础,提出申威SMT功能模拟器设... 同时多线程(SMT)技术允许来自多个线程的不相关指令同时执行,实现线程级并行与指令级并行相结合,提升处理器的性能。在SMT设计中,运用体系结构模拟器进行实现性分析与正确性验证。以申威多核功能模拟器为基础,提出申威SMT功能模拟器设计方法,并实现申威SMT功能模拟器。模拟结果表明了申威SMT功能模拟器设计实现的正确性,并基于申威SMT功能模拟器构建RTL级实时验证平台,在处理器设计验证领域具有较高的应用价值。 展开更多
关键词 申威处理器 功能模拟器 体系结构模拟器 同时多线程 线程级并行
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部