期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
面向多核多线程的移动对象连续K近邻查询 被引量:11
1
作者 赵亮 景宁 +2 位作者 陈荦 廖巍 钟志农 《软件学报》 EI CSCD 北大核心 2011年第8期1805-1815,共11页
针对移动对象的多用户连续K近邻查询处理问题,结合多核多线程技术的发展,提出了一种基于多线程的两阶段多用户连续K近邻查询处理框架.将查询处理分为查询预处理阶段和查询执行阶段,分别执行数据更新任务和查询处理任务.每个阶段都设计... 针对移动对象的多用户连续K近邻查询处理问题,结合多核多线程技术的发展,提出了一种基于多线程的两阶段多用户连续K近邻查询处理框架.将查询处理分为查询预处理阶段和查询执行阶段,分别执行数据更新任务和查询处理任务.每个阶段都设计了优化cache访问命中率,并利用多线程技术提高多用户连续查询处理并行性的方法及数据结构.提出了一种查询执行阶段的查询分组技术,利用查询之间的相关性提高了算法执行时内存访问的时间局部性.基于查询处理框架和移动对象内存格网索引结构提出了K近邻查询处理算法.充分的实验结果表明,采用了多线程和cache优化技术的连续查询处理框架与其他算法相比,在性能上具有较大优势,并且在不同核心数目的CPU平台下具有较好的性能扩展性. 展开更多
关键词 移动对象 连续K近邻查询 多核多线程 CACHE优化 查询分组
在线阅读 下载PDF
多核多线程结构线程调度策略研究 被引量:13
2
作者 王晶 樊晓桠 +1 位作者 张盛兵 王海 《计算机科学》 CSCD 北大核心 2007年第9期256-258,289,共4页
片上多校多线程(CMT)结构兼具了片上多处理(CMP)和同时多线程(SMT)结构的优势,支持片上所有处于执行状态的线程每周期并行执行,导致核内与核间硬件资源共享和争用问题。该文在阐述CMT结构的资源共享特征并简要介绍SMT线程调度发展状况... 片上多校多线程(CMT)结构兼具了片上多处理(CMP)和同时多线程(SMT)结构的优势,支持片上所有处于执行状态的线程每周期并行执行,导致核内与核间硬件资源共享和争用问题。该文在阐述CMT结构的资源共享特征并简要介绍SMT线程调度发展状况的基础上,主要围绕以减少资源争用为目标的线程调度策略和资源划分机制等热点,分析其研究现状,论述已有策略在处理这些问题上的优缺点,并探讨了可能的研究发展方向。 展开更多
关键词 同时多线程 片上多处理 片上多核多线程 线程调度 资源划分
在线阅读 下载PDF
多核多线程处理器存储技术研究进展 被引量:8
3
作者 屈文新 樊晓桠 张盛兵 《计算机科学》 CSCD 北大核心 2007年第4期13-16,23,共5页
多核多线程技术已经成为微处理器发展的趋势,使用多核多线程技术可以使微处理器的性能得到极大的提高,但同时也对存储系统提出了更高的要求。而相对增长的存储器访问延迟已经成为影响多核多线程处理器性能进一步提高的重要因素。本文首... 多核多线程技术已经成为微处理器发展的趋势,使用多核多线程技术可以使微处理器的性能得到极大的提高,但同时也对存储系统提出了更高的要求。而相对增长的存储器访问延迟已经成为影响多核多线程处理器性能进一步提高的重要因素。本文首先介绍了当前常见的几种多核多线程处理器的结构,然后介绍了目前多核多线程处理器存储系统的研究现状,在此基础上讨论了当前多核多线程处理器存储系统研究的热点,并对多核多线程处理器存储系统技术的发展趋势进行了展望。 展开更多
关键词 多核多线程 存储系统 访问延迟
在线阅读 下载PDF
面向实时流处理的多核多线程处理器访存队列 被引量:3
4
作者 田杭沛 高德远 +1 位作者 樊晓桠 朱怡安 《计算机研究与发展》 EI CSCD 北大核心 2009年第10期1634-1641,共8页
针对多核多线程处理器中乱序访存影响计算实时性的问题,在对典型访存队列进行研究的基础上提出了一种新的访存队列构建模型及其硬件结构.该模型采用窗口优化算法控制最差情况下的访存延迟,保证访存的实时性,同时又利用优化的乱序调度策... 针对多核多线程处理器中乱序访存影响计算实时性的问题,在对典型访存队列进行研究的基础上提出了一种新的访存队列构建模型及其硬件结构.该模型采用窗口优化算法控制最差情况下的访存延迟,保证访存的实时性,同时又利用优化的乱序调度策略减少访存延迟.实验证明,该访存队列可控制最大访存延迟,与顺序访存相比,存储器具备更高的带宽,与传统的乱序访存相比较,可以充分满足计算的实时性需求,而存储器有效带宽基本不受影响,解决了多核多线程处理器承担实时流计算的基础难题. 展开更多
关键词 计算机体系结构 实时流处理 多核多线程处理器 访存队列 窗口优化
在线阅读 下载PDF
基于多核多线程处理器的网络设备设计与实现 被引量:2
5
作者 张振华 白中英 陈卉 《电子设计工程》 2009年第12期109-111,共3页
网络中核心设备的数据吞吐量非常大,兼顾高数据量吞吐和业务处理非常重要。提出采用最新的多核多线程处理器,以VCPU为单位部署操作系统,实现两种操作系统共CORE,通过共享内存通信方案,有效解决高数据吞吐率和复杂业务处理的矛盾,细化多... 网络中核心设备的数据吞吐量非常大,兼顾高数据量吞吐和业务处理非常重要。提出采用最新的多核多线程处理器,以VCPU为单位部署操作系统,实现两种操作系统共CORE,通过共享内存通信方案,有效解决高数据吞吐率和复杂业务处理的矛盾,细化多核处理器的分配粒度,从而提升网络核心设备的性能。 展开更多
关键词 多核多线程处理器 共享内存 网络驱动 IPI中断 VCPU
在线阅读 下载PDF
面向数据加密的多核多线程并行研究 被引量:3
6
作者 戴卓臣 陆江东 《电子设计工程》 2018年第8期183-187,共5页
在使用新平台并行开发板实现大数据分组加密的基础上,结合多核多线程技术和AES加密算法,设计出一套高计算速率的并行加密系统。重点讨论了如何实现并行计算,分析了并行平台的数据传输速率,并行加密吞吐率,及平台性能。经实验表明,在并... 在使用新平台并行开发板实现大数据分组加密的基础上,结合多核多线程技术和AES加密算法,设计出一套高计算速率的并行加密系统。重点讨论了如何实现并行计算,分析了并行平台的数据传输速率,并行加密吞吐率,及平台性能。经实验表明,在并行上实现的多核并行加密方式相比单核串行加密有显著的加速效果,且随着数据量的增大效果逐渐明显。本地循环加密时,当加密数据量达450Kbyte,吞吐率峰值接近889.58Mbps。在以最高峰性能运作时,每瓦处理性能达70Gflops/W。并行为密集型计算提供了高效、低耗、处理能力强的新计算平台。 展开更多
关键词 多核多线程 并行平台 数据加密 并行计算 高性能
在线阅读 下载PDF
UCMLib:一种多核多线程编程库
7
作者 杨际祥 《计算机科学》 CSCD 北大核心 2016年第4期188-191,共4页
多核并行编程的开发效率和加速比是影响多核进一步发展的两个重要问题。针对这两个问题,设计并实现了一个轻量级的多核多线程库(UCMLib)。该库基于任务原语概念,提供了数据并行性和任务并行性两种表达逻辑并行性的模式;对多线程编程的... 多核并行编程的开发效率和加速比是影响多核进一步发展的两个重要问题。针对这两个问题,设计并实现了一个轻量级的多核多线程库(UCMLib)。该库基于任务原语概念,提供了数据并行性和任务并行性两种表达逻辑并行性的模式;对多线程编程的复杂性进行了封装和抽象,为开发者提供了高级的编程方法而不必显式地考虑锁和竞争,并降低了并行编程难度以提高开发效率。UCMLib的任务调度器基于对任务队列和工作者线程的有效构建和管理来提高并行程序的加速比。性能测试表明,当计算规模增大时,UCMLib在数据并行性与任务并行性两方面获得了比TPL库略优的加速比。最后给出了可能的性能改进方法以及需要进一步研究的问题。 展开更多
关键词 多核多线程 数据并行性 任务并行性 任务调度器
在线阅读 下载PDF
多核多线程处理器二级Cache预取结构的设计 被引量:4
8
作者 杨可 樊晓桠 王党辉 《计算机工程与应用》 CSCD 北大核心 2009年第10期69-71,91,共4页
合理的设计二级Cache是有效地减少多核多线程处理器存储器访问延迟的方法。针对现有的多核多线程处理器,讨论了二级Cache的混合预取结构设计方案。通过详细设计和仿真分析,结果表明混合预取结构可有效提高处理器的整体性能。特别是采用... 合理的设计二级Cache是有效地减少多核多线程处理器存储器访问延迟的方法。针对现有的多核多线程处理器,讨论了二级Cache的混合预取结构设计方案。通过详细设计和仿真分析,结果表明混合预取结构可有效提高处理器的整体性能。特别是采用不命中混合预取结构的二级Cache性能更佳,适合满足此类结构的多核多线程处理器需求。 展开更多
关键词 混合预取 多核多线程 二级CACHE 命中率
在线阅读 下载PDF
多核多线程处理器的随机测试流量生成技术
9
作者 刘瑞东 安克 张烁 《计算机工程》 CAS CSCD 北大核心 2009年第10期95-97,100,共4页
以可编程多核多线程处理器IXP2400为例,围绕随机测试流量的生成问题进行讨论,推导出随机测试流量生成公式,利用分解法对GI/G/m/∞/FCFS多类型客户输入开放排队网络求解,给出输出流到达时间间隔变异系数的求解方法,通过控制测试帧间时延... 以可编程多核多线程处理器IXP2400为例,围绕随机测试流量的生成问题进行讨论,推导出随机测试流量生成公式,利用分解法对GI/G/m/∞/FCFS多类型客户输入开放排队网络求解,给出输出流到达时间间隔变异系数的求解方法,通过控制测试帧间时延使得生成的测试流量符合多种概率分布。提出的技术应用于"基于IXP2400的网络测试系统",并对其进行测试,实验验证了该技术的可用性及有效性。 展开更多
关键词 多核多线程处理器 排队网络 测试流量 变异系数
在线阅读 下载PDF
多核多线程处理器XLR732的多核间通信
10
作者 张国杰 张毅 《重庆工学院学报(自然科学版)》 2008年第10期148-152,共5页
介绍了CMP、SMP处理器与多核多线程处理器的特点,然后以多核多线程处理器XLR732为例,分析对比了该处理器几种可用的核间通信机制,提出其适用范围,最后在一款使用该处理器的网络设备中实现了多核间通信方案.
关键词 多核多线程处理器 XIR732 间通信
在线阅读 下载PDF
基于多线程归并排序算法设计 被引量:4
11
作者 孙琳琳 侯秀萍 +2 位作者 朱波 孙士明 高灿 《吉林大学学报(信息科学版)》 CAS 2015年第1期105-110,共6页
为解决传统递归方式的归并排序算法串行执行效率低的问题,使用数据依赖关系分析方法对归并排序算法进行并行性分析。通过分析发现算法本身具有并行的特征,在多核处理器下使用Open Mp编译制导语句对算法进行直接并行化处理。在数据量较... 为解决传统递归方式的归并排序算法串行执行效率低的问题,使用数据依赖关系分析方法对归并排序算法进行并行性分析。通过分析发现算法本身具有并行的特征,在多核处理器下使用Open Mp编译制导语句对算法进行直接并行化处理。在数据量较大的情况下,为了使算法执行的速度更快,在多核处理器系统中设置多个线程,并将序列分成多个组,每个线程操作一组数据,最后对多个局部有序的结果进行逐一合并。实验验证结果表明,该并行化算法可使执行速度提高50%以上。 展开更多
关键词 归并排序 多核多线程 OpenMp编译制导语句 数据依赖关系 并行化
在线阅读 下载PDF
采用多线程并行调度的网络仿真加速 被引量:3
12
作者 王文鼐 陈邦文 +1 位作者 韩鹏 王斌 《南京邮电大学学报(自然科学版)》 北大核心 2015年第1期33-37,共5页
将多核多线程技术应用于NS2网络仿真的加速计算,分析离散事件仿真的事件类型,针对空间和时间不相关的分组事件,基于Open MP标准库设计多线程并行的调度算法。运用4核通用计算机验证NS2多线程并行优化的有效性,并引入可调整的计算延时来... 将多核多线程技术应用于NS2网络仿真的加速计算,分析离散事件仿真的事件类型,针对空间和时间不相关的分组事件,基于Open MP标准库设计多线程并行的调度算法。运用4核通用计算机验证NS2多线程并行优化的有效性,并引入可调整的计算延时来模拟不同计算负载下的链路仿真。5节点网络传输2条业务流的实验表明,最大加速比为1.99。 展开更多
关键词 NS2 多核多线程 并行事件分类 最大加速比
在线阅读 下载PDF
基于多核的并行模拟退火放疗计划优化加速方法 被引量:3
13
作者 王慧亮 包尚联 陈国耀 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第6期853-858,共6页
为了满足图像导引(imaging guided radiotherapy,IGRT)的实时四维适形调强逆向放疗计划在临床实施的需要,用一台HP桌面型工作站和OpenMP多线程库,试验了用多核并行计算技术实现的模拟退火逆向治疗计划快速全局优化算法,并将其应用在一... 为了满足图像导引(imaging guided radiotherapy,IGRT)的实时四维适形调强逆向放疗计划在临床实施的需要,用一台HP桌面型工作站和OpenMP多线程库,试验了用多核并行计算技术实现的模拟退火逆向治疗计划快速全局优化算法,并将其应用在一个虚拟体模和4个临床病例的优化中。实验结果表明:基于多核的并行计算技术能大幅度提高逆向放疗技术的优化计算的效率;进一步选用更多核的并行计算机图像工作站,该技术可以满足目前大多数4D医学成像的临床需要。 展开更多
关键词 多核多线程 并行计算 模拟退火算法 逆向优化放疗计划
在线阅读 下载PDF
基于多核的并行操作转换算法
14
作者 黎明丽 蔡维纬 +1 位作者 吕晓 何发智 《计算机科学》 CSCD 北大核心 2016年第6期82-85,共4页
操作转换算法是实时协同编辑系统首选的并发控制算法,它不仅能提供不受限的交互,而且维护分布式操作的意图一致性。然而随着操作数目的增多,操作的响应时间也会延长。结合多核多线程技术的发展,提出了第一个并行的操作转换算法,其能减... 操作转换算法是实时协同编辑系统首选的并发控制算法,它不仅能提供不受限的交互,而且维护分布式操作的意图一致性。然而随着操作数目的增多,操作的响应时间也会延长。结合多核多线程技术的发展,提出了第一个并行的操作转换算法,其能减少远程操作集成到本地站点的时间开销。对传统的串行算法进行了改造,使得具有计算依赖的过程能够并行化。实验结果表明,提出的算法相较于传统算法具有较大的优势,在处理较大操作历史的情况下依然能够保证操作合理的响应时间。 展开更多
关键词 操作转换 并行计算 多核多线程 实时协同编辑 数据一致性
在线阅读 下载PDF
高并行性能Intel Core i7多核处理器及其关键技术研究
15
作者 王文义 王杰 《中原工学院学报》 CAS 2011年第5期23-26,共4页
介绍了Intel Nehalem多核处理器微架构的组成及其独特的三级缓存模式,同时针对并行计算机对处理器在计算性能(Gflops)和能耗比(Mflop/W)两方面的特殊要求,介绍了Nehalem Core i7处理器所采用的一些关键技术,如超线程,QPI总线,内核加速... 介绍了Intel Nehalem多核处理器微架构的组成及其独特的三级缓存模式,同时针对并行计算机对处理器在计算性能(Gflops)和能耗比(Mflop/W)两方面的特殊要求,介绍了Nehalem Core i7处理器所采用的一些关键技术,如超线程,QPI总线,内核加速模式和SSE4.2指令集等,这些技术对高效使用并行计算机是非常必要的. 展开更多
关键词 Nehalem微架构 多核多线程处理器 线程技术 QPI总线
在线阅读 下载PDF
基于粒子群优化算法的多核处理器任务调度研究 被引量:14
16
作者 田佳 胡威 +2 位作者 李琳 柯鹏 张凯 《计算机应用研究》 CSCD 北大核心 2017年第12期3698-3700,共3页
针对多核处理器在调度多个任务时效率不高的问题,提出了一种基于粒子群优化算法的嵌入式多核多线程系统任务调度算法,用来找寻任务调度过程中的最优解,以求取任务的最短完成时间。在算法中通过针对多核多线程任务模型而选择粒子群算法... 针对多核处理器在调度多个任务时效率不高的问题,提出了一种基于粒子群优化算法的嵌入式多核多线程系统任务调度算法,用来找寻任务调度过程中的最优解,以求取任务的最短完成时间。在算法中通过针对多核多线程任务模型而选择粒子群算法的适应度函数,综合利用局部最优极值和全局最优极值的优势,优化了粒子群算法中存在的过早收敛问题,使算法具有较高的收敛效率。实验结果表明,与基于遗传算法的多核多线程任务调度算法相比,该算法能更快地找到最优解。 展开更多
关键词 粒子群优化算法 多核处理器 多核多线程 任务调度
在线阅读 下载PDF
基于SB3500多核处理器的软件无线电系统设计 被引量:3
17
作者 钟达 郭伟 +1 位作者 习勇 唐麒 《现代电子技术》 2014年第21期5-8,共4页
针对基于软件无线电架构的现代移动通信手持终端设计,研究了基于SB3500国产多核多线程数字信号处理器的软件无线电设计方法,实现了基于SB3500的软件无线电硬件系统。在此基础上开发了一套适合该硬件系统的OFDM通信波形软件,用于验证该... 针对基于软件无线电架构的现代移动通信手持终端设计,研究了基于SB3500国产多核多线程数字信号处理器的软件无线电设计方法,实现了基于SB3500的软件无线电硬件系统。在此基础上开发了一套适合该硬件系统的OFDM通信波形软件,用于验证该硬件系统是否满足手持终端小型化和低功耗的要求。研究表明,使用该国产多核多线程处理器进行软件无线电系统的设计开发具有广泛的应用前景。 展开更多
关键词 软件无线电 手持终端 SB3500 多核多线程处理器
在线阅读 下载PDF
基于四阶龙格-库塔法的多弹道并行计算研究
18
作者 范磊 周琳 《航空科学技术》 2024年第9期101-110,共10页
弹道计算是一类典型的计算密集型问题,在飞行器设计及航迹规划中起着至关重要的作用,对该问题的求解通常具有计算量大、耗时长等问题。为实现弹道解算加速,本文利用多线程并行计算技术设计了基于四阶龙格-库塔法的多弹道加速计算架构,... 弹道计算是一类典型的计算密集型问题,在飞行器设计及航迹规划中起着至关重要的作用,对该问题的求解通常具有计算量大、耗时长等问题。为实现弹道解算加速,本文利用多线程并行计算技术设计了基于四阶龙格-库塔法的多弹道加速计算架构,通过任务划分将多弹道解算映射到不同的线程并调度至处理器内核。通过试验分析了多弹道计算关键因素的影响,试验结果验证了利用多核多线程并行加速架构可以在保证高精度要求下有效地提高多弹道计算效率,并且可应用于提高微分方程类问题的解算效率。 展开更多
关键词 弹道计算 微分方程 并行运算 龙格-库塔法 多核多线程技术
在线阅读 下载PDF
基于CMP的指针数据预取方法 被引量:4
19
作者 朱会东 黄永丽 宋宝卫 《计算机工程》 CAS CSCD 北大核心 2011年第6期71-73,共3页
针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理... 针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理器共享高速缓存中以隐藏主线程的存储器延迟。实验结果证明该方法在CMP架构下对以链式结构为主的内存受限程序的性能有一定的改进。 展开更多
关键词 存储墙 链式数据结构 多核多线程 数据预取
在线阅读 下载PDF
网络数据包高性能并行处理技术研究 被引量:4
20
作者 黄益彬 金倩倩 纪元 《计算机与现代化》 2016年第12期57-61,共5页
针对当前多核处理器在对高速网络数据包处理时性能低,不能完全发挥多核优势的问题,分析对高速网络数据包处理的瓶颈所在,提出一种网络数据包并行处理模型。该模型利用多队列网卡,结合并行网络协议栈、多核多线程及无锁编程技术在网络数... 针对当前多核处理器在对高速网络数据包处理时性能低,不能完全发挥多核优势的问题,分析对高速网络数据包处理的瓶颈所在,提出一种网络数据包并行处理模型。该模型利用多队列网卡,结合并行网络协议栈、多核多线程及无锁编程技术在网络数据包的整个收发路径上进行完全并行化处理。实验结果表明,该模型方法能够充分发挥多核处理器优势,大幅提升网络数据包处理效率。 展开更多
关键词 多核多线程 多队列网卡 并行处理 无锁编程
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部