期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
K-Dimensional Optimal Parallel Algorithm for the Solution of a General Class of Recurrence Equations 被引量:1
1
作者 高庆狮 刘志勇 《Journal of Computer Science & Technology》 SCIE EI CSCD 1995年第5期417-424,共8页
This paper proposes a parallel algorithm, called KDOP (K-DimensionalOptimal Parallel algorithm), to solve a general class of recurrence equations efficiently. The KDOP algorithm partitions the computation into a serie... This paper proposes a parallel algorithm, called KDOP (K-DimensionalOptimal Parallel algorithm), to solve a general class of recurrence equations efficiently. The KDOP algorithm partitions the computation into a series of sub-computations, each of which is executed in the fashion that all the processors work simultaneously with each one executing an optimal sequential algorithm to solve a subcomputation task. The algorithm solves the equations in O(N/p)steps in EREW PRAM model (Exclusive Read Exclusive Write Parallel Ran-dom Access Machine model) using p<N1-e processors, where N is the size of the problem, and e is a given constant. This is an optimal algorithm (itsspeedup is O(p)) in the case of p<N1-e. Such an optimal speedup for this problem was previously achieved only in the case of p<N0.5. The algorithm can be implemented on machines with multiple processing elements or pipelined vector machines with parallel memory systems. 展开更多
关键词 parallel algorithm optimal algorithm first-order linear recurrence equations recursive doubling algorithm tridiagonal systems of linear equations
原文传递
追赶法并行求解循环三对角方程组 被引量:13
2
作者 李文强 刘晓 《科技导报》 CAS CSCD 北大核心 2009年第18期90-93,共4页
给出了求解循环三对角线性方程组的一种并行算法。在系数矩阵满足对角占优的条件下,利用该方法能够快速、稳定地求解循环三对角线性方程组,在单个进程上的计算量仅为O(17n),与传统算法求解循环三对角线性方程组的计算量相同。而且,本算... 给出了求解循环三对角线性方程组的一种并行算法。在系数矩阵满足对角占优的条件下,利用该方法能够快速、稳定地求解循环三对角线性方程组,在单个进程上的计算量仅为O(17n),与传统算法求解循环三对角线性方程组的计算量相同。而且,本算法可以方便地实施分布式并行计算,各进程仅需向主进程传递8个实数,而主进程向各子进程传递2个实数,通讯量较小。数值实验结果表明:对于大规模的循环三对角线性方程组,利用16个进程计算的并行效率均在0.75以上。求解三对角线性方程组的传统追赶法实则是本文算法的一种特例,因此,该算法也可用于求解三对角线性方程组。 展开更多
关键词 追赶法 循环三对角方程组 并行计算
在线阅读 下载PDF
对称矩阵三对角化的混合并行算法设计 被引量:3
3
作者 赵永华 迟学斌 陈江 《计算机工程》 EI CAS CSCD 北大核心 2005年第22期39-41,53,共4页
基于Householder转换,给出了稠密对称矩阵三对角化的MPI+OpenMP混合并行算法。内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpenMP共享内存并行采用了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。... 基于Householder转换,给出了稠密对称矩阵三对角化的MPI+OpenMP混合并行算法。内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpenMP共享内存并行采用了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。在深腾6800上的试验结果表明,MPI+OpenMP版本比纯MPI版本具有更好的性能和可扩展性。 展开更多
关键词 对称矩阵 并行块算法 三对角矩阵 加速比 MPI+OPENMP
在线阅读 下载PDF
周期块三对角线性方程组的一种并行算法 被引量:3
4
作者 肖曼玉 吕全义 +1 位作者 汪保 欧阳洁 《计算机工程与应用》 CSCD 北大核心 2007年第9期69-71,75,共4页
该文提出了分布式环境下求解周期块三对角线性方程组的一种并行算法,该算法通过对系数矩阵进行一次预处理后,充分利用系数矩阵结构的特殊性,使算法只在相邻处理机间通信两次。并从理论上给出了算法收敛的一个充分条件。最后,在HPrx2600... 该文提出了分布式环境下求解周期块三对角线性方程组的一种并行算法,该算法通过对系数矩阵进行一次预处理后,充分利用系数矩阵结构的特殊性,使算法只在相邻处理机间通信两次。并从理论上给出了算法收敛的一个充分条件。最后,在HPrx2600集群上进行了数值试验,结果表明,实算与理论是一致的,并行性也很好。 展开更多
关键词 周期块三对角线性方程组 预处理 并行算法 HP rx2600集群
在线阅读 下载PDF
高效的带状线性方程组分布式并行算法 被引量:2
5
作者 赵瑛 盛跃宾 宋晓秋 《计算机工程与设计》 CSCD 北大核心 2005年第3期732-734,共3页
提出了一种新的带状线性方程组的分布式并行算法(NewDistributedParallelAlgorithmforBandedLinearEquations, 简称为NDPAB 算法)。当带状线性方程组的系数矩阵满足对角占优时,算法在运行过程中不会中断,算法的加速比接近于处理器数目... 提出了一种新的带状线性方程组的分布式并行算法(NewDistributedParallelAlgorithmforBandedLinearEquations, 简称为NDPAB 算法)。当带状线性方程组的系数矩阵满足对角占优时,算法在运行过程中不会中断,算法的加速比接近于处理器数目。给出了基于局域网的MPI 异构环境下数值实验结果,数值实验结果表明算法是高效的。 展开更多
关键词 线性方程组 分布式并行算法 数值实验 系数矩阵 对角占优 加速比 数目 处理器 MPI 中断
在线阅读 下载PDF
三对角方程组通用性迭代解法 被引量:3
6
作者 李安志 任继念 崔蔚 《四川师范大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第1期57-60,共4页
在文献(四川师范大学学报:自然科学版,2008,31(2):187-188.)的基础上,提出一种对任意相容性三对角方程组均有效的迭代算法,证明该算法的收敛性,并设计并行处理方案和测试用例.该算法基本思想是:利用三对角方程组系数矩阵中行向量的部分... 在文献(四川师范大学学报:自然科学版,2008,31(2):187-188.)的基础上,提出一种对任意相容性三对角方程组均有效的迭代算法,证明该算法的收敛性,并设计并行处理方案和测试用例.该算法基本思想是:利用三对角方程组系数矩阵中行向量的部分正交性,将三对角方程组系数矩阵分为3组,使组内行向量相互正交,通过压缩存储将3组行向量压缩为3个行向量,从第一组开始用文献的方法在3组之间循环迭代,并取加速因子为1.该算法的特点是:对任意相容性三对角方程组均收敛,易于并行且节省存储空间,特别适合大型和超大型方程组的求解. 展开更多
关键词 三对角方程组 相容性 并行迭代算法 加速因子
在线阅读 下载PDF
基于矩阵分解的周期块三对角线性方程组的并行直接解法 被引量:2
7
作者 樊艳红 吕全义 +1 位作者 李纪华 宋东红 《纺织高校基础科学学报》 CAS 2008年第4期483-486,共4页
提出了分布式环境下求解周期块三对角线性方程组的一种并行算法.该算法充分利用系数矩阵结构的特殊性,通过对系数矩阵进行适当分解及近似处理,使算法只在相邻处理机间通信2次,并从理论上给出了算法有效的一个充分条件.最后,在HP rx2600... 提出了分布式环境下求解周期块三对角线性方程组的一种并行算法.该算法充分利用系数矩阵结构的特殊性,通过对系数矩阵进行适当分解及近似处理,使算法只在相邻处理机间通信2次,并从理论上给出了算法有效的一个充分条件.最后,在HP rx2600集群上进行了数值试验,结果表明,实算与理论是一致的,并行性也很好. 展开更多
关键词 周期块三对角线性方程组 矩阵分解 并行算法 并行效率 HP rx2600集群
在线阅读 下载PDF
三次插值样条曲线拟合多核并行算法 被引量:5
8
作者 苗莎 郑晓薇 《计算机应用》 CSCD 北大核心 2010年第A12期3194-3196,共3页
充分利用多核技术提升多核处理器的资源利用率,缩短执行时间,发挥多核系统的优异性能。在多核计算机上设计了解三对角方程组的奇偶约化多线程并行程序,实现了三次样条曲线拟合的快速计算。通过实验结果的加速比对比,可以看出并行后缩短... 充分利用多核技术提升多核处理器的资源利用率,缩短执行时间,发挥多核系统的优异性能。在多核计算机上设计了解三对角方程组的奇偶约化多线程并行程序,实现了三次样条曲线拟合的快速计算。通过实验结果的加速比对比,可以看出并行后缩短了求解方程组的时间,多核资源得到充分利用。结果表明,奇偶约化多核并行算法在三次样条曲线拟合中的应用是有效及可行的。 展开更多
关键词 多核 三对角方程组 并行算法 样条曲线 加速比
在线阅读 下载PDF
弹性波动方程数值解的有限元并行算法 被引量:4
9
作者 王月英 孙成禹 《中国石油大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第5期27-30,共4页
在求解弹性波动方程中,有限元法的高内存量和巨大运算量的需求在基于单CPU串行算法中一直难于满足,制约其优势的发挥。根据有限元法的“化整为零、集零为整”的基本思想与并行处理技术的“分而治之”的原则基本一致,采用基于多CPU的并... 在求解弹性波动方程中,有限元法的高内存量和巨大运算量的需求在基于单CPU串行算法中一直难于满足,制约其优势的发挥。根据有限元法的“化整为零、集零为整”的基本思想与并行处理技术的“分而治之”的原则基本一致,采用基于多CPU的并行算法,从有限元参数矩阵计算和线性方程组求解两个方面入手,把求解区域分到多个CPU上并行计算参数矩阵,对线性方程组采用循环块三对角线方程组进行并行求解。对比了不同大小空间和不同CPU个数下的加速比,证实了多CPU的并行算法能够克服基于单CPU串行算法的物理限制,满足了有限元法的巨大空间量和运算量的需求。此算法具有理论上的正确性和实践上的可行性。 展开更多
关键词 有限元 并行算法 弹性波动方程 数值模拟 块三对角矩阵
在线阅读 下载PDF
块三对角线性方程组的一种有效并行算法 被引量:5
10
作者 肖曼玉 吕全义 《计算机应用与软件》 CSCD 北大核心 2006年第6期107-108,134,共3页
提出了求解系数矩阵为块三对角的线性方程组的一种适合于M IMD分布式存储的并行算法,该算法以系数矩阵分解为基础,充分利用了系数矩阵结构的特殊性,进行了近似处理,使整个计算过程只在相邻处理机间通信两次,具有很高的并行效率,并在理... 提出了求解系数矩阵为块三对角的线性方程组的一种适合于M IMD分布式存储的并行算法,该算法以系数矩阵分解为基础,充分利用了系数矩阵结构的特殊性,进行了近似处理,使整个计算过程只在相邻处理机间通信两次,具有很高的并行效率,并在理论上给出了该算法成立的充分条件。最后,在HP rx2600集群上进行数值试验,结果表明,加速比呈线性增加,并行效率达到90%以上。 展开更多
关键词 块三对角线性方程组 并行算法HP rx2600集群
在线阅读 下载PDF
块三对角线性方程组的并行迭代解法 被引量:4
11
作者 樊艳红 吕全义 《纺织高校基础科学学报》 CAS 2010年第2期174-179,共6页
提出了一种求解系数矩阵为块三对角矩阵的线性方程组的适合于MIMD分布式存储的并行迭代算法.该算法将一个分块三对角线性方程组的系数矩阵进行适合并行计算的不完全分解,从而形成迭代格式.整个计算过程只在相邻处理机之间进行3次通信.... 提出了一种求解系数矩阵为块三对角矩阵的线性方程组的适合于MIMD分布式存储的并行迭代算法.该算法将一个分块三对角线性方程组的系数矩阵进行适合并行计算的不完全分解,从而形成迭代格式.整个计算过程只在相邻处理机之间进行3次通信.并从理论上给出了该算法收敛的一个充分条件,最后在HP rx2600集群上进行了数值实验.结果表明,此算法是可行的,具有较好的收敛性与并行效率. 展开更多
关键词 块三对角线性方程组 并行算法 LU分解 HP rx2600集群
在线阅读 下载PDF
求解大规模三对角线性方程组的GaBP并行算法 被引量:1
12
作者 陈振武 郑汉垣 +1 位作者 兰添才 曾志宏 《计算机工程》 CAS CSCD 北大核心 2016年第10期96-100,共5页
根据大规模三对角线性方程组求解的特性,结合消息传递接口和开放多处理模型,设计分布式共享内存环境下求解大规模三对角线性方程组的GaBP并行算法。在Intel Xeon E5-2650并行计算集群环境上进行数值实验,结果表明,与基于消息传递接口的G... 根据大规模三对角线性方程组求解的特性,结合消息传递接口和开放多处理模型,设计分布式共享内存环境下求解大规模三对角线性方程组的GaBP并行算法。在Intel Xeon E5-2650并行计算集群环境上进行数值实验,结果表明,与基于消息传递接口的GaBP并行算法相比,该算法具有更高的加速比和更好的可扩展性,能充分发挥集群系统的综合计算性能,提高大规模三对角线性方程组的求解速度。 展开更多
关键词 三对角线性方程组 GaBP算法 并行算法 加速比 可扩展性
在线阅读 下载PDF
改进的求解线性方程组的并行Arnoldi方法 被引量:1
13
作者 汪保 吕全义 +1 位作者 樊艳红 聂玉峰 《计算机工程与应用》 CSCD 北大核心 2009年第22期41-43,共3页
以Galerkin原理为基础,提出了求解循环块三对角线性方程组的并行算法。根据系数矩阵的稀疏性,选取适当的子空间的基,使算法不但不会发生中断,并从理论上证明了当系数矩阵对称正定时,该并行算法收敛。最后,在HPrx2600集群上进行的数值实... 以Galerkin原理为基础,提出了求解循环块三对角线性方程组的并行算法。根据系数矩阵的稀疏性,选取适当的子空间的基,使算法不但不会发生中断,并从理论上证明了当系数矩阵对称正定时,该并行算法收敛。最后,在HPrx2600集群上进行的数值实验结果表明,该算法的并行效率很高,理论和实际计算相一致。 展开更多
关键词 循环块三对角线性方程组 并行算法 Arnoldi方法
在线阅读 下载PDF
块三对角线性方程组的并行直接解法 被引量:1
14
作者 樊艳红 吕全义 聂玉峰 《计算机工程与应用》 CSCD 北大核心 2009年第3期60-63,共4页
提出了分布式环境下求解块三对角线性方程组的一种并行算法,该算法充分利用系数矩阵结构的特殊性,通过对系数矩阵进行适当分解及近似处理,使算法只在相邻处理机间通信两次。并从理论上给出了算法有效的一个充分条件。最后,在HPrx2600集... 提出了分布式环境下求解块三对角线性方程组的一种并行算法,该算法充分利用系数矩阵结构的特殊性,通过对系数矩阵进行适当分解及近似处理,使算法只在相邻处理机间通信两次。并从理论上给出了算法有效的一个充分条件。最后,在HPrx2600集群上进行了数值实验,结果表明,实算与理论是一致的,并行性也很好。 展开更多
关键词 块三对角线性方程组 矩阵分解 并行算法 并行效率 HP rx2600集群
在线阅读 下载PDF
近似三对角Toeplitz方程组的快速分布式并行算法
15
作者 单润红 高峰 +1 位作者 宋君强 李晓梅 《计算机研究与发展》 EI CSCD 北大核心 2004年第7期1281-1285,共5页
利用近似三对角Toeplitz矩阵的特殊结构 ,提出了一种新的求解近似三对角Toeplitz方程组的快速算法 在三对角Toeplitz矩阵的近似LU分解的基础上 ,利用“分而治之”的思想 ,并结合秦九韶技术和特殊的数学技巧减少大量的冗余计算 ,提出了... 利用近似三对角Toeplitz矩阵的特殊结构 ,提出了一种新的求解近似三对角Toeplitz方程组的快速算法 在三对角Toeplitz矩阵的近似LU分解的基础上 ,利用“分而治之”的思想 ,并结合秦九韶技术和特殊的数学技巧减少大量的冗余计算 ,提出了求解近似Toeplitz三对角方程组的快速分布式并行算法 ,并在理论上证明了算法具有近似于线性的加速比 最后通过数值实验证明 ,新的并行算法具有较高的并行效率 ,并且当矩阵阶数n足够大时 。 展开更多
关键词 TOEPLITZ 三对角方程组 并行算法 加速比
在线阅读 下载PDF
三对角方程组的分布式SPP算法
16
作者 王正华 车永刚 赵文涛 《国防科技大学学报》 EI CAS CSCD 1999年第5期13-16,共4页
发展了单向并行分裂法(SPP)用于求解三对角和块三对角线性方程组,算法考虑了三对角线性系统求解中文件IO及结果传输通信所占时间比例较大的特点,充分利用了计算、文件IO与通信三者之间的重叠。分析了SPP算法的计算与通信开销。在工作站... 发展了单向并行分裂法(SPP)用于求解三对角和块三对角线性方程组,算法考虑了三对角线性系统求解中文件IO及结果传输通信所占时间比例较大的特点,充分利用了计算、文件IO与通信三者之间的重叠。分析了SPP算法的计算与通信开销。在工作站机群上进行了测试分析。 展开更多
关键词 三对角方程组 并行算法 加速比 分布式 SPP算法
在线阅读 下载PDF
并行求解拟三对角方程组的二分算法 被引量:1
17
作者 李青 周美莲 《中南民族学院学报(自然科学版)》 1997年第2期65-68,共4页
用并行算法设计的基本技术——二分法。
关键词 拟三对角方程组 并行计算 二分法
在线阅读 下载PDF
三对角线性方程组的循环规约对角占优算法
18
作者 李太全 肖柏勋 《计算机应用》 CSCD 北大核心 2013年第A02期73-76,共4页
针对并行求解三对角线性方程组的对角占优(PDD)算法在系数矩阵为弱对角占优时,近似处理引入误差较大,即使是采用迭代PDD算法,收敛速度仍然很慢的问题,提出了一种PDD算法的循环归约方案。该方案采用新的分解方法,生成修正值计算方程组仍... 针对并行求解三对角线性方程组的对角占优(PDD)算法在系数矩阵为弱对角占优时,近似处理引入误差较大,即使是采用迭代PDD算法,收敛速度仍然很慢的问题,提出了一种PDD算法的循环归约方案。该方案采用新的分解方法,生成修正值计算方程组仍为三对角线性方程组,且保持对角占优特性。在修正值计算中采用循环归约方法,随着归约算法展开,系统的对角占优迅速增强,适时忽略非对角元素,取得解的修正值。算法的计算复杂性与迭代PDD算法基本相当,通信复杂性略高于迭代PDD算法,但解的收敛速度显著高于迭代PDD算法。不仅如此,该算法还可直接应用于非对角占优三对角线性方程组的求解。 展开更多
关键词 对角占优算法 循环归约算法 三对角线性方程组 分布式存储 并行计算
在线阅读 下载PDF
求解块三对角线性方程组的一种并行算法
19
作者 汪保 吕全义 《纺织高校基础科学学报》 CAS 2008年第1期93-98,共6页
提出了分布式环境下求解块三对角线性方程组的一种并行混合迭代算法.利用分裂系数矩阵的方式,产生一个简单迭代;然后再利用多方向搜索方法,使得多方向搜索方法收敛速度加快.该算法只在相邻处理机间通信4次,消除了共轭梯度法所需要的内... 提出了分布式环境下求解块三对角线性方程组的一种并行混合迭代算法.利用分裂系数矩阵的方式,产生一个简单迭代;然后再利用多方向搜索方法,使得多方向搜索方法收敛速度加快.该算法只在相邻处理机间通信4次,消除了共轭梯度法所需要的内积运算.从理论上给出了算法收敛的一个充分条件.在HP rx2600集群上进行了数值试验,结果表明,实算与理论是一致的,并行效率也很高且比相关文献的计算效果好. 展开更多
关键词 块三对角线性方程组 并行算法 HP rx2600集群
在线阅读 下载PDF
解三对角Toeplitz方程组的MIMD并行算法
20
作者 陈四清 陈廷槐 周六丁 《重庆大学学报(自然科学版)》 EI CAS CSCD 1992年第4期21-25,共5页
本文把秩1修正技术和一阶线性递推并行消去法结合起来,给出了求解三对角Toeplitz方程组的MIMD并行算法。该算法结构简单,存储省,处理机之间通讯比较少,而且对处理机台数没有特殊要求;相对于追赶法的加速比可接近P/2(P为处理机台数)。值... 本文把秩1修正技术和一阶线性递推并行消去法结合起来,给出了求解三对角Toeplitz方程组的MIMD并行算法。该算法结构简单,存储省,处理机之间通讯比较少,而且对处理机台数没有特殊要求;相对于追赶法的加速比可接近P/2(P为处理机台数)。值得指出的是,本文的算法关键产考虑并组织了一阶常系数线性递推的并行计算。 展开更多
关键词 三对角 Toeplitz方程组 MIMD并行算法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部