期刊文献+
共找到153篇文章
< 1 2 8 >
每页显示 20 50 100
Dynamic Distribution Model with Prime Granularity for Parallel Computing
1
作者 孙济洲 张绍敏 李小图 《Transactions of Tianjin University》 EI CAS 2005年第5期343-347,共5页
Dynamic distribution model is one of the best schemes for parallel volume rendering. How- ever, in homogeneous cluster system.since the granularity is traditionally identical, all processors communicate almost simulta... Dynamic distribution model is one of the best schemes for parallel volume rendering. How- ever, in homogeneous cluster system.since the granularity is traditionally identical, all processors communicate almost simultaneously and computation load may lose balance. Due to problems above, a dynamic distribution model with prime granularity for parallel computing is presented. Granularities of each processor are relatively prime, and related theories are introduced. A high parallel performance can be achieved by minimizing network competition and using a load balancing strategy that ensures all processors finish almost simultaneously. Based on Master-Slave-Gleaner ( MSG) scheme, the parallel Splatting Algorithm for volume rendering is used to test the model on IBM Cluster 1350 system. The experimental results show that the model can bring a considerable improvement in performance, including computation efficiency, total execution time, speed, and load balancing. 展开更多
关键词 GRANULARITY parallel computing load balancing dynamic distribution model
在线阅读 下载PDF
MDSLB:A new static load balancing method for parallel molecular dynamics simulations 被引量:1
2
作者 武云龙 徐新海 +2 位作者 杨学军 邹顺 任小广 《Chinese Physics B》 SCIE EI CAS CSCD 2014年第2期628-643,共16页
Large-scale parallelization of molecular dynamics simulations is facing challenges which seriously affect the simula- tion efficiency, among which the load imbalance problem is the most critical. In this paper, we pro... Large-scale parallelization of molecular dynamics simulations is facing challenges which seriously affect the simula- tion efficiency, among which the load imbalance problem is the most critical. In this paper, we propose, a new molecular dynamics static load balancing method (MDSLB). By analyzing the characteristics of the short-range force of molecular dynamics programs running in parallel, we divide the short-range force into three kinds of force models, and then pack- age the computations of each force model into many tiny computational units called "cell loads", which provide the basic data structures for our load balancing method. In MDSLB, the spatial region is separated into sub-regions called "local domains", and the cell loads of each local domain are allocated to every processor in turn. Compared with the dynamic load balancing method, MDSLB can guarantee load balance by executing the algorithm only once at program startup without migrating the loads dynamically. We implement MDSLB in OpenFOAM software and test it on TianHe-lA supercomputer with 16 to 512 processors. Experimental results show that MDSLB can save 34%-64% time for the load imbalanced cases. 展开更多
关键词 molecular dynamics static load balancing parallel computing
在线阅读 下载PDF
A self-routing load balancing algorithm in parallel computing: comparison to the central algorithm
3
作者 Razieh Sadat SADJADY Kamran ZAMANIFAR 《Journal of Zhejiang University-Science C(Computers and Electronics)》 SCIE EI 2011年第6期455-463,共9页
Load balancing is an important stage of a system using parallel computing where the aim is the balance of workload among all processors of the system. In this paper, we introduce a new load balancing algorithm with ne... Load balancing is an important stage of a system using parallel computing where the aim is the balance of workload among all processors of the system. In this paper, we introduce a new load balancing algorithm with new capabilities for parallel systems, among which is the independence of a separate route-finder algorithm between the load receiver and sender nodes. In addition to simulation of the new algorithm, due to similarity in behavior to the proposed algorithm, the central algorithm is simulated. Simulation results show that, the system performance increases with the increase of the degree of neighborhood between the processors. These results also indicate the algorithm’s high compatibility with environment changes. 展开更多
关键词 parallel computing load balancing Distributed system
原文传递
LOW-COST HIGH PERFORMANCE CLUSTER OF WORK-STATIONS BASED ON DYNAMIC LOAD BALANCING FOR PARALLEL DEPTH-FIRST SEARCH(DFS)
4
作者 Mohammed A. +2 位作者 M.Ibrahim(加力) LU Xin-da(陆鑫达) 《Journal of Shanghai Jiaotong university(Science)》 EI 2002年第2期223-226,共4页
This paper presented an idea to replace the traditionally expensive parallel machines by heterogeneous cluster of workstations. To emphasise the usability of cluster of workstations platform for parallel and distribut... This paper presented an idea to replace the traditionally expensive parallel machines by heterogeneous cluster of workstations. To emphasise the usability of cluster of workstations platform for parallel and distributed computing, also the paper presented the status report on the effort and experiences for the implementation of a dynamic load balancing for parallel tree computation depth first search(DFS) on the cluster of a workstations project. It compared the speedup performance obtained from our platform with that obtained from the traditional one. The speedup results show that cluster of workstations can be a serious alternative to the expensive parallel machines. 展开更多
关键词 heterogeneous CLUSTERS of WORKSTATION parallel tree computation DFS dynamic load balancing strategy parallel performance
在线阅读 下载PDF
CLUSTER OF WORKSTATIONS BASED ON DYNAMIC LOAD BALANCING FOR PARALLEL TREE COMPUTATION DEPTH-FIRST-SEARCH
5
作者 加力 陆鑫达 张健 《Journal of Shanghai Jiaotong university(Science)》 EI 2002年第1期26-31,共6页
The real problem in cluster of workstations is the changes in workstation power or number of workstations or dynmaic changes in the run time behavior of the application hamper the efficient use of resources. Dynamic l... The real problem in cluster of workstations is the changes in workstation power or number of workstations or dynmaic changes in the run time behavior of the application hamper the efficient use of resources. Dynamic load balancing is a technique for the parallel implementation of problems, which generate unpredictable workloads by migration work units from heavily loaded processor to lightly loaded processors at run time. This paper proposed an efficient load balancing method in which parallel tree computations depth first search (DFS) generates unpredictable, highly imbalance workloads and moves through different phases detectable at run time, where dynamic load balancing strategy is applicable in each phase running under the MPI(message passing interface) and Unix operating system on cluster of workstations parallel platform computing. 展开更多
关键词 cluster of WORKSTATIONS parallel TREE COMPUTATION DFS task migration dynamic load balancing strategy and TERMINATION detection algorithm
在线阅读 下载PDF
Implementation Study of Dynamic Load Balancing Algorithm of Parallel Tree Computation on Clusters of Heterogeneous Workstation
6
作者 Mohammed A.M. Ibrahim M.SaifMokbel 《Journal of Donghua University(English Edition)》 EI CAS 2005年第2期81-86,共6页
The rapid growth of interconnected high performance workstations has produced a new computing paradigm called clustered of workstations computing. In these systems load balance problem is a serious impediment to achie... The rapid growth of interconnected high performance workstations has produced a new computing paradigm called clustered of workstations computing. In these systems load balance problem is a serious impediment to achieve good performance. The main concern of this paper is the implementation of dynamic load balancing algorithm, asynchronous Round Robin (ARR), for balancing workload of parallel tree computation depth-first-search algorithm on Cluster of Heterogeneous Workstations (COW) Many algorithms in artificial intelligence and other areas of computer science are based on depth first search in implicitty defined trees. For these algorithms a load-balancing scheme is required, which is able to evenly distribute parts of an irregularly shaped tree over the workstations with minimal interprocessor communication and without prior knowledge of the tree’s shape. For the (ARR) algorithm only minimal interprocessor communication is needed when necessary and it runs under the MPI (Message passing interface) that allows parallel execution on heterogeneous SUN cluster of workstation platform. The program code is written in C language and executed under UNIX operating system (Solaris version). 展开更多
关键词 cluster of workstations parallel tree computation dynamic load balancing performance metrics
在线阅读 下载PDF
基于分布并行式增广拉格朗日协调的MDO方法
7
作者 桂俊涛 贺岩松 +2 位作者 唐中华 张志飞 徐中明 《计算机集成制造系统》 北大核心 2025年第2期579-589,共11页
鉴于增广拉格朗日协调方法在并行求解上存在一定局限性,为在分布式协调的框架下对子问题进行并行求解,提出分布并行式增广拉格朗日协调的多学科设计优化方法。在分布式协调结构中通过滞后的耦合信息构建一致性约束,采用自适应异步乘子... 鉴于增广拉格朗日协调方法在并行求解上存在一定局限性,为在分布式协调的框架下对子问题进行并行求解,提出分布并行式增广拉格朗日协调的多学科设计优化方法。在分布式协调结构中通过滞后的耦合信息构建一致性约束,采用自适应异步乘子更新策略克服了一致性约束不匹配的问题。根据耦合变量与乘子对惩罚权重进行更新的方案可避免惩罚权重过大的问题。两项改进避免了解发散与振荡的情况,在分布式协调中实现了子问题的并行求解。通过实例仿真证明了所提方法的可行性,与集中式协调方法相比,所提方法无需重构协调关系,并行化程度与求解效率更高。通过求解工程问题进一步验证了所提方法的可行性与有效性,为基于分解的优化方法子问题的并行化求解提供了参考。 展开更多
关键词 增广拉格朗日协调 分布式 并行计算 多学科设计优化 自适应更新策略
在线阅读 下载PDF
基于动态自适应计算引擎的MobileNetV3网络加速器设计
8
作者 项浩斌 杨瑞敏 +2 位作者 吴文涛 李春雷 董燕 《电子技术应用》 2025年第1期8-17,共10页
现有面向高效轻量化MobileNetV3网络的加速方法通常采用高度定制的计算引擎进行模型计算,从而限制了加速器的可扩展性使其仅适用于小型网络或资源丰富的硬件平台。针对此问题,提出了基于动态自适应计算引擎的MobileNetV3网络加速器。首... 现有面向高效轻量化MobileNetV3网络的加速方法通常采用高度定制的计算引擎进行模型计算,从而限制了加速器的可扩展性使其仅适用于小型网络或资源丰富的硬件平台。针对此问题,提出了基于动态自适应计算引擎的MobileNetV3网络加速器。首先,设计了局部感知区域卷积的流水线推理架构实现特征、权重的高度并行处理和缓冲调度。其次,提出全局自适应的点卷积方法优化点卷积,并结合空间探索获得最优的参数配置以实现最大计算并行性。此外,加速器可以根据模型参数变化动态配置以适应不同场景。实验结果显示加速器推理速度为8 F/s,是现有方法速度的2.7倍。 展开更多
关键词 卷积神经网络 并行计算 动态自适应 边缘设备 硬件加速
在线阅读 下载PDF
Dynamic self-adaptive ANP algorithm and its application to electric field simulation of aluminum reduction cell 被引量:1
9
作者 王雅琳 陈冬冬 +2 位作者 陈晓方 蔡国民 阳春华 《Journal of Central South University》 SCIE EI CAS CSCD 2015年第12期4731-4739,共9页
Region partition(RP) is the key technique to the finite element parallel computing(FEPC),and its performance has a decisive influence on the entire process of analysis and computation.The performance evaluation index ... Region partition(RP) is the key technique to the finite element parallel computing(FEPC),and its performance has a decisive influence on the entire process of analysis and computation.The performance evaluation index of RP method for the three-dimensional finite element model(FEM) has been given.By taking the electric field of aluminum reduction cell(ARC) as the research object,the performance of two classical RP methods,which are Al-NASRA and NGUYEN partition(ANP) algorithm and the multi-level partition(MLP) method,has been analyzed and compared.The comparison results indicate a sound performance of ANP algorithm,but to large-scale models,the computing time of ANP algorithm increases notably.This is because the ANP algorithm determines only one node based on the minimum weight and just adds the elements connected to the node into the sub-region during each iteration.To obtain the satisfied speed and the precision,an improved dynamic self-adaptive ANP(DSA-ANP) algorithm has been proposed.With consideration of model scale,complexity and sub-RP stage,the improved algorithm adaptively determines the number of nodes and selects those nodes with small enough weight,and then dynamically adds these connected elements.The proposed algorithm has been applied to the finite element analysis(FEA) of the electric field simulation of ARC.Compared with the traditional ANP algorithm,the computational efficiency of the proposed algorithm has been shortened approximately from 260 s to 13 s.This proves the superiority of the improved algorithm on computing time performance. 展开更多
关键词 finite element parallel computing(FEPC) region partition(RP) dynamic self-adaptive ANP(DSA-ANP) algorithm electric field simulation aluminum reduction cell(ARC)
在线阅读 下载PDF
Thread-Oriented Online Load Balancing
10
作者 Tong Weiqin Zhou Qinghua Gu Zhikui (School of Computer Engineering and Science) 《Advances in Manufacturing》 SCIE CAS 1998年第3期48-50,共3页
Dynamic task assignment and migration are the key technique to load balancing which plays an important role in the achievement of high performance in distributed computing system. In this paper, we describe the design... Dynamic task assignment and migration are the key technique to load balancing which plays an important role in the achievement of high performance in distributed computing system. In this paper, we describe the design and implementation of an online thread scheduling and migration system (S&M) based on a previous work of LWP -MPI. Experimental results show that performance is enhanced. 展开更多
关键词 workstation cluster parallel and distributed computing load balancing SCHEDULING thread migration
在线阅读 下载PDF
高分三号数据分布式自适应负载均衡并行转换算法研究
11
作者 姚术林 《科技资讯》 2024年第17期32-34,共3页
针对PolSARpro软件自带高分三号数据转换模块无法自适应分布式差异化硬件环境问题,提出了一种按照该软件的数据格式要求进行分布式自适应负载均衡并行转换算法,将高分三号多极化数据快速、精确地进行定标与格式转换,对不同硬件配置环境... 针对PolSARpro软件自带高分三号数据转换模块无法自适应分布式差异化硬件环境问题,提出了一种按照该软件的数据格式要求进行分布式自适应负载均衡并行转换算法,将高分三号多极化数据快速、精确地进行定标与格式转换,对不同硬件配置环境自适应,能够抗数据偏斜,并且通过KingMap V10.5平台实现了算法并在实际数据中进行测试,试验结果表明性能提升了约12.7倍,验证了算法的可行性、高效性和正确性。 展开更多
关键词 高分三号 合成孔径雷达 自适应 负载均衡 分布式并行计算
在线阅读 下载PDF
多模块适应性通风的污染物扩散控制性能研究——以应对教室使用情景变化为例
12
作者 张伟荣 庆智喜 +2 位作者 张昊天 张惟佳 李林 《北京工业大学学报》 CAS CSCD 北大核心 2024年第10期1237-1249,共13页
提出了一种多模块适应性通风(multi-module adaptive ventilation, MAV)方法,同时研究其在多场景类型建筑中面对室内场景变化和污染源位置变化时,控制污染物扩散和排除污染物的性能。以一教室为模型,利用计算流体动力学(computational f... 提出了一种多模块适应性通风(multi-module adaptive ventilation, MAV)方法,同时研究其在多场景类型建筑中面对室内场景变化和污染源位置变化时,控制污染物扩散和排除污染物的性能。以一教室为模型,利用计算流体动力学(computational fluid dynamics, CFD)技术模拟教室正常上课和集体讨论场景下的污染物分布情况,并在正常上课场景下进行污染源位置变化的讨论。其中示踪气体CO_(2)用于模拟感染者咳嗽产生的污染物。选用了5种不同的MAV模式和传统混合通风(mixing ventilation, MV)模式,比较了它们在面对教室内不同污染源位置和不同场景时,人员呼吸区的污染物浓度和去除率。结果表明合适的MAV模式下污染物在呼吸区的相对浓度更低、排除率更高,其中MAV平行模式在集体讨论场景下、污染源位置为P3时的呼吸区污染物去除率(contaminant removal efficiency, CRE)是MV模式的7.52倍,呼吸区相对污染物质量浓度C_r为MV模式的52.4%,说明合适的MAV模式能更好地适应场景和污染源位置的变化。 展开更多
关键词 多模块适应性通风 计算流体动力学 场景变化 污染源位置变化 呼吸区 浓度分布
在线阅读 下载PDF
分布式服务资源自适应弹性伸缩研究综述
13
作者 胡程 陈仕鸿 《计算机科学与探索》 CSCD 北大核心 2024年第10期2551-2572,共22页
分布式服务资源环境下,由于峰值负载的整体占比很小,大量服务资源长期处于低利用率甚至闲置状态。通过实现资源自适应弹性伸缩,在高负载时扩充服务资源以应对高需求,在低负载时将其缩减以降低开销,可显著提升系统能效并降低运作开销。... 分布式服务资源环境下,由于峰值负载的整体占比很小,大量服务资源长期处于低利用率甚至闲置状态。通过实现资源自适应弹性伸缩,在高负载时扩充服务资源以应对高需求,在低负载时将其缩减以降低开销,可显著提升系统能效并降低运作开销。但实际负载通常具有很强的波动性,满足服务质量所需的服务资源持续变化,这给服务资源自适应弹性伸缩带来了巨大挑战。尽管现有的商用分布式平台已普遍具有一定的资源弹性伸缩能力,但它们的自适应能力有限、精准性不佳,存在很大提升空间。为促进该领域的研究与应用发展,就该环境下服务资源自适应弹性伸缩研究进行分类分析与探讨。分析并介绍了相应的研究背景及主要存在于需求评估与资源调整上的挑战;就该领域的国内外相关研究,依据其调整的资源对象分为三类,以此进行分类论述并比较了各研究工作的异同,且就各自的特点与效用进行了分析与总结;总述分析了这些研究工作并概括出一个全面而整体的实现,探讨了业界的应用现状、研究面临的挑战以及未来趋势。 展开更多
关键词 并行与分布式计算 分布式服务资源 资源管理与分配 自适应弹性伸缩
在线阅读 下载PDF
基于CPBOA的并行DCNN优化算法
14
作者 温占卿 毛伊敏 彭喆 《计算机工程与设计》 北大核心 2024年第11期3296-3303,共8页
针对大数据环境下并行DCNN算法存在的冗余特征图过多、卷积运算效率低下以及节点负载不均衡等问题,提出一种基于Spark和CPBOA的并行DCNN优化算法PDCNN-SCPBOA。提出一种基于奇异值分解与JS散度的特征压缩策略对特征图进行分组压缩,消除... 针对大数据环境下并行DCNN算法存在的冗余特征图过多、卷积运算效率低下以及节点负载不均衡等问题,提出一种基于Spark和CPBOA的并行DCNN优化算法PDCNN-SCPBOA。提出一种基于奇异值分解与JS散度的特征压缩策略对特征图进行分组压缩,消除过多的冗余特征图;结合Spark提出一种基于蝴蝶优化算法的并行CP分解策略,利用分解后的卷积核并行训练,提高卷积运算效率;提出一种基于簇分割的负载均衡策略,对中间数据簇进行均匀分配后再进行处理,平衡节点负载。实验结果表明,所提算法具有良好的训练效果,适用于大规模图像数据的分类。 展开更多
关键词 深度卷积神经网络算法 并行计算 分布式框架 特征压缩 张量分解 蝴蝶优化算法 负载均衡
在线阅读 下载PDF
一个有效的动态负载平衡方法 被引量:37
15
作者 刘振英 方滨兴 +1 位作者 胡铭曾 张毅 《软件学报》 EI CSCD 北大核心 2001年第4期563-569,共7页
动态负载平衡问题是影响工作站网络并行计算性能的重要因素 .首先分析出在负载平衡中产生额外开销的根本原因是负载的移动 ,进而定性地给出了每次移动负载的粒度公式 .引入益处估计的方法 ,仅在有益的情况下进行负载平衡 .另外还提出了... 动态负载平衡问题是影响工作站网络并行计算性能的重要因素 .首先分析出在负载平衡中产生额外开销的根本原因是负载的移动 ,进而定性地给出了每次移动负载的粒度公式 .引入益处估计的方法 ,仅在有益的情况下进行负载平衡 .另外还提出了一个动态负载平衡算法 .最后 ,通过实验 ,将该算法的运行结果与其他人的负载平衡结果以及不作负载平衡的情况进行了对比 .此负载平衡方法在工作站为空载以及不同的负载和应用问题的数据规模的情况下 ,都优于 Siegell等人提出的方法 . 展开更多
关键词 动态负载平衡 工作站网络 并行计算 数据并行
在线阅读 下载PDF
一个基于网络并行计算环境的动态负载分配算法 被引量:10
16
作者 肖侬 卢宇彤 卢锡城 《计算机研究与发展》 EI CSCD 北大核心 1999年第2期238-241,共4页
网络并行计算系统具有大量的自主的计算资源,如何充分发挥它们的潜在性能,这正是负载平衡的研究内容.文中描述一个基于网络并行计算环境的动态负载分配算法,该算法能够根据系统的状态和任务之间的通信关系动态地分配系统中的负载,... 网络并行计算系统具有大量的自主的计算资源,如何充分发挥它们的潜在性能,这正是负载平衡的研究内容.文中描述一个基于网络并行计算环境的动态负载分配算法,该算法能够根据系统的状态和任务之间的通信关系动态地分配系统中的负载,以实现系统的动态负载平衡.通过应用实例测试说明该算法在稳定性和性能上。 展开更多
关键词 并行计算 动态负载分配 算法 计算机网络
在线阅读 下载PDF
并行与分布式计算动态负载均衡策略综述 被引量:43
17
作者 杨际祥 谭国真 王荣生 《电子学报》 EI CAS CSCD 北大核心 2010年第5期1122-1130,共9页
动态负载均衡(Dynamic Load Balancing,DLB)是提高动态和非规则问题计算效率与规模的一个挑战问题.阐述了DLB的一般性问题,根据DLB策略的主要特征给出了一个综合分类方法,按分类对近30年提出的各种主要DLB策略做了细致的分析和深入的比... 动态负载均衡(Dynamic Load Balancing,DLB)是提高动态和非规则问题计算效率与规模的一个挑战问题.阐述了DLB的一般性问题,根据DLB策略的主要特征给出了一个综合分类方法,按分类对近30年提出的各种主要DLB策略做了细致的分析和深入的比较,并做了策略有效性分析.在总结现有研究成果基础上,分析了该领域的最新发展趋势,为下一步的研究提出了新的问题和思路. 展开更多
关键词 并行与分布式计算 动态负载均衡(DLB) 多核计算
在线阅读 下载PDF
分布式动态负载平衡调度的一个通用模型 被引量:42
18
作者 陈华平 计永昶 陈国良 《软件学报》 EI CSCD 北大核心 1998年第1期25-29,共5页
在大规模并行分布处理系统,特别是网络工作站机群(NOW)系统中,各结点机之间的负载平衡调度是最为常见的关键性问题之一.本文在简单分析了动态负载平衡调度中接收者驱动和发送者驱动这两个常用策略基础上,提出了一个通用的基于... 在大规模并行分布处理系统,特别是网络工作站机群(NOW)系统中,各结点机之间的负载平衡调度是最为常见的关键性问题之一.本文在简单分析了动态负载平衡调度中接收者驱动和发送者驱动这两个常用策略基础上,提出了一个通用的基于混合驱动策略的动态负载平衡调度模型。 展开更多
关键词 分布计划 动态负载平衡 调度模型 NOW系统
在线阅读 下载PDF
多体系统传递矩阵法分布式并行计算研究 被引量:9
19
作者 杨海根 芮筱亭 +2 位作者 刘怡昕 张建书 何斌 《振动工程学报》 EI CSCD 北大核心 2014年第1期9-15,共7页
多体系统传递矩阵法作为一种多体系统动力学新方法,在进行多体系统动力学分析时无需系统总体动力学方程、涉及矩阵阶次低计算速度快的优点,已被广泛用于各种多管火箭、自行火炮、坦克等复杂大型机械系统动力学分析与设计。为了提高多体... 多体系统传递矩阵法作为一种多体系统动力学新方法,在进行多体系统动力学分析时无需系统总体动力学方程、涉及矩阵阶次低计算速度快的优点,已被广泛用于各种多管火箭、自行火炮、坦克等复杂大型机械系统动力学分析与设计。为了提高多体系统传递矩阵法计算速度,研究了分布式并行计算的原理和方法,将MPI(Message Parallel Interface)分布式并行计算环境引入到多体系统传递矩阵法计算中。针对变截面梁的多体系统传递矩阵法动力学计算算例,设计了并行算法,分析了单机多核和分布式网络环境对计算时间的影响,结果显示通过并行计算能够大幅度提高计算效率。 展开更多
关键词 多体系统动力学 并行计算 分布式计算 多体系统传递矩阵法 MPI
在线阅读 下载PDF
基于十亿亿次国产超算系统的流体力学软件众核适应性研究 被引量:10
20
作者 李芳 李志辉 +3 位作者 徐金秀 范昊 褚学森 李新亮 《计算机科学》 CSCD 北大核心 2020年第1期24-30,共7页
国产众核处理器提供了两种移植难度相差较大的众核级并行编程语言。不同流体力学软件对众核架构适应性的不同,决定了它们在移植优化过程中适合于不同的编程语言。首先介绍了国产众核处理器的体系结构、编程模型和并行编程语言;然后分析... 国产众核处理器提供了两种移植难度相差较大的众核级并行编程语言。不同流体力学软件对众核架构适应性的不同,决定了它们在移植优化过程中适合于不同的编程语言。首先介绍了国产众核处理器的体系结构、编程模型和并行编程语言;然后分析了流体力学软件应用于国产众核处理器存在的挑战性问题,包括隐格式带来的数据相关性、大型稀疏矩阵线性代数方程组求解、多重网格方法和非结构网格等,这些问题限制了软件对众核架构的适应性。文中针对这些难题分别提出了创新的优化算法,并通过理论分析和实验得到了几种典型流体力学软件的众核适应性研究结论。实践证明,多数流体力学软件对国产众核处理器的适应性良好,能够采用OpenACC编译器自动移植,并扩展到百万核并行规模,能保持较高的并行效率。 展开更多
关键词 国产 众核架构 流体力学软件 适应性 编程语言 并行算法
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部