期刊文献+
共找到98篇文章
< 1 2 5 >
每页显示 20 50 100
新时期“GPU并行计算”课程体系与教学模式设计
1
作者 谭立湘 李斌 郑重 《信息系统工程》 2024年第8期147-150,共4页
为满足新时期人工智能交叉方向人才培养需求,对“GPU并行计算”课程体系与教学模式进行了积极的探索和实践。理论教学方面,夯实并行计算基本理论,强化并行算法设计、GPU并行编程技巧及优化方法。实践教学方面,通过渐进式实验项目的反复... 为满足新时期人工智能交叉方向人才培养需求,对“GPU并行计算”课程体系与教学模式进行了积极的探索和实践。理论教学方面,夯实并行计算基本理论,强化并行算法设计、GPU并行编程技巧及优化方法。实践教学方面,通过渐进式实验项目的反复迭代,帮助学生建立实践经验和应用信心。新体系通过多样的教学模式使学生紧跟并行计算研究的前沿技术。通过鼓励不断创新和探索的课程评价体系使学生能够自觉、自愿地将并行计算应用于科学研究。 展开更多
关键词 gpu并行计算 体系设计 教学模式 评价体系
在线阅读 下载PDF
基于Seed-PCG法的列车-轨道-地基土三维随机振动GPU并行计算方法
2
作者 朱志辉 冯杨 +2 位作者 杨啸 李昊 邹有 《Journal of Central South University》 SCIE EI CAS CSCD 2024年第1期302-316,共15页
为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随... 为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随机振动分析产生的多右端项线性方程组求解问题,采用Seed-PCG方法进行求解。通过PCG方法求解种子系统得到的Krylov子空间进行投影,以改进其余线性方程组的初始解和对应的初始残量,有效提高了PCG法的收敛速度,最后,在MATLABCUDA混合平台上开发了并行计算程序。数值算例表明:相同计算平台下的该方法相比多点同步算法获得了104.2倍的加速;相比PCG法逐个求解方案减少了18%的迭代次数,获得了1.21倍的加速。 展开更多
关键词 Seed-PCG法 多右端项线性方程组 随机振动 gpu并行计算 列车-轨道-地基土耦合模型
在线阅读 下载PDF
基于GPU并行计算的浅水波运动数值模拟 被引量:14
3
作者 许栋 徐彬 +2 位作者 David PAyet 白玉川 及春宁 《计算力学学报》 CAS CSCD 北大核心 2016年第1期113-120,共8页
利用有限体积法求解描述水流运动的二维浅水方程组,模拟洪水波运动传播过程,并通过GPU并行计算技术对程序进行加速,建立了浅水运动高效模拟方法。数值模拟结果表明,基于本文提出的GPU并行策略以及通用并行计算架构(CUDA)支持,能够实现相... 利用有限体积法求解描述水流运动的二维浅水方程组,模拟洪水波运动传播过程,并通过GPU并行计算技术对程序进行加速,建立了浅水运动高效模拟方法。数值模拟结果表明,基于本文提出的GPU并行策略以及通用并行计算架构(CUDA)支持,能够实现相比CPU单核心最高112倍的加速比,为利用单机实现快速洪水预测以及防灾减灾决策提供有效支撑。此外,对基于GPU并行计算的浅水模拟计算精度进行了论证,并对并行性能优化进行了分析。利用所建模型模拟了溃坝洪水在三维障碍物间的传播过程。 展开更多
关键词 洪水波 二维浅水方程组 gpu并行计算 CUDA
在线阅读 下载PDF
GPU并行计算加速的实时可视外壳三维重建及其虚实交互 被引量:13
4
作者 邵绪强 聂霄 王保义 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第1期52-61,共10页
针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建... 针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建算法和精确行进立方体算法并行遍历每个体素得到体素状态序列;然后并行压缩体素状态序列得到非空体素集合,对非空体素进行并行三角形网格化,并利用图形硬件的多重纹理映射和可编程功能进行基于像素的纹理映射;最后假定虚拟物体的粒子为运动受限的拉格朗日流体粒子,重建物体网格顶点为流体边界,通过流体动力学方程的并行光滑粒子动力学方法求解来计算虚实交互.实验结果表明,该方法在GPU上进行完全并行求解,在32×32×32的空间剖分精度下,实现了实时三维重建和20帧/s左右的虚实交互计算,适用于计算机图形学和虚拟现实等领域中的虚实交互应用. 展开更多
关键词 可视外壳 三维重建 gpu并行计算 虚实交互 实时模拟
在线阅读 下载PDF
一种基于GPU并行计算的无人机影像快速镶嵌方法 被引量:2
5
作者 李朋龙 丁忆 +3 位作者 胡艳 罗鼎 段松江 舒文强 《国土资源遥感》 CSCD 北大核心 2017年第4期57-63,共7页
提出了一种从匀光后无人机影像出发,以Voronoi图为镶嵌线网络,基于GPU并行计算的无人机影像快速镶嵌方法。首先,通过Wallis滤波处理影像间色彩不一致问题;然后,以测区影像位置自动生成Voronoi图镶嵌线网络;最后,基于GPU并行计算将无人... 提出了一种从匀光后无人机影像出发,以Voronoi图为镶嵌线网络,基于GPU并行计算的无人机影像快速镶嵌方法。首先,通过Wallis滤波处理影像间色彩不一致问题;然后,以测区影像位置自动生成Voronoi图镶嵌线网络;最后,基于GPU并行计算将无人机影像快速正射纠正并镶嵌。通过对230张空间分辨率为0.1 m的无人机影像进行快速纠正镶嵌,实验结果表明,该方法较传统方法效率有很大提升。 展开更多
关键词 影像匀光 无人机影像 正射纠正 影像镶嵌 gpu并行计算
在线阅读 下载PDF
基于SPH方法与GPU并行计算的复杂阶梯流数值模拟 被引量:3
6
作者 吴建松 李娜 +1 位作者 刘文雨 周世禄 《安全与环境学报》 CAS CSCD 北大核心 2019年第3期774-779,共6页
为了更有效地模拟和分析地铁站内复杂楼梯上洪水流动的动力学特征,采用光滑粒子流体动力学方法(SPH)并借助GPU并行计算技术对复杂形态(带1、2、3个休息平台的直行、直角转弯L型)阶梯上洪水流动特征和漫延过程进行数值建模和计算分析。基... 为了更有效地模拟和分析地铁站内复杂楼梯上洪水流动的动力学特征,采用光滑粒子流体动力学方法(SPH)并借助GPU并行计算技术对复杂形态(带1、2、3个休息平台的直行、直角转弯L型)阶梯上洪水流动特征和漫延过程进行数值建模和计算分析。基于SPH方法和GPU并行加速的复杂阶梯流模型的数值模拟结果表明:该模型不但可以计算获得更好的阶梯流流态,而且具有较高的计算效率;不同休息平台数、不同形态阶梯上洪水水流呈现差别较大的水流特征;该模型借助GPU并行加速,适合研究大尺度复杂楼梯上洪水漫延问题,可为分析和评估洪水水流对地铁站楼梯上被困人员疏散过程的影响提供有力的工具。 展开更多
关键词 安全工程 地铁站 洪水 阶梯流 光滑粒子流体动力学 gpu并行计算
在线阅读 下载PDF
基于光滑粒子流体动力学方法与GPU并行计算的阶梯流数值模拟 被引量:3
7
作者 吴建松 许声弟 胡啸峰 《科学技术与工程》 北大核心 2016年第23期59-63,共5页
为了更好地模拟分析地下空间阶梯流动力学规律和提升数值计算效率,利用光滑粒子流体动力学方法(SPH),并借助GPU并行计算技术对地下空间阶梯流进行数值建模和计算。基于GPU并行化加速的SPH地下空间阶梯流模型的数值计算结果表明:该模型... 为了更好地模拟分析地下空间阶梯流动力学规律和提升数值计算效率,利用光滑粒子流体动力学方法(SPH),并借助GPU并行计算技术对地下空间阶梯流进行数值建模和计算。基于GPU并行化加速的SPH地下空间阶梯流模型的数值计算结果表明:该模型不仅计算获得较好的阶梯流流态,而且计算效率大幅度提高,比串行SPH模型和移动粒子半隐方法(MPS)模型快数百倍,为研究大尺度城市街区洪水提供了一个比较有前景的研究途径。 展开更多
关键词 地下空间 阶梯流 光滑粒子流体动力学 gpu并行计算
在线阅读 下载PDF
基于GPU并行计算的地下结构非线性动力分析软件平台开发 被引量:5
8
作者 曹胜涛 路德春 +2 位作者 杜修力 赵密 程星磊 《工程力学》 EI CSCD 北大核心 2019年第2期53-65,86,共14页
为解决地下结构隐式非线性动力分析收敛性差和计算效率低的技术瓶颈,该文建立了基于GPU并行计算的地下结构显式动力分析软件平台。在此平台中提出并实现了一种混凝土弥散开裂模型;给出并实现了一种钢筋纤维与实体单元的耦合方法;基于等... 为解决地下结构隐式非线性动力分析收敛性差和计算效率低的技术瓶颈,该文建立了基于GPU并行计算的地下结构显式动力分析软件平台。在此平台中提出并实现了一种混凝土弥散开裂模型;给出并实现了一种钢筋纤维与实体单元的耦合方法;基于等参元思想,提出了人工边界节点的单元从属面积的计算方法;为实现节点不协调情况下的土与结构相互作用分析,开发实现了一种实体单元间的两节点接触单元。利用该文开发的软件对日本大开地铁站进行了重力场分析、线性和非线性动力分析。将重力场和线性动力分析结果与ABAQUS分析结果进行了对比,结果表明该文软件计算结果与ABAQUS计算结果一致,且计算效率约为ABAQUS计算效率的5.68倍,验证了软件各模块的正确性和效率。另外,通过将非线性计算结果与灾害调查结果进行对比分析,验证了软件非线性分析的稳定性和合理性。 展开更多
关键词 地下结构 非线性动力分析 gpu并行计算 本构模型 软件平台
在线阅读 下载PDF
基于GPU并行计算的雷达杂波模拟研究 被引量:5
9
作者 徐国伟 陈建 成怡 《计算机工程》 CAS CSCD 北大核心 2020年第11期306-314,共9页
现代雷达杂波模拟需使用杂波数据实时分析与处理回波信号,然而传统球不变随机过程(SIRP)方法生成杂波数据耗时较长。通过对SIRP方法进行改进,提出一种利用图形处理器(GPU)并行计算提升杂波生成实时性的方法。在计算统一设备架构(CUDA)下... 现代雷达杂波模拟需使用杂波数据实时分析与处理回波信号,然而传统球不变随机过程(SIRP)方法生成杂波数据耗时较长。通过对SIRP方法进行改进,提出一种利用图形处理器(GPU)并行计算提升杂波生成实时性的方法。在计算统一设备架构(CUDA)下,对相关相干K分布杂波算法进行多任务串-并行分析,采用cuBLAS库对细粒度卷积计算进行优化,利用OpenMP+CUDA多任务调度机制改进粗粒度任务并行计算,以提高CPU-GPU利用率并减少数据等待时间。实验结果表明,该方法生成杂波数据的实时性显著提升,且随着杂波数据量增大其加速效果更好,相较传统GPU方法计算速率提高61%。 展开更多
关键词 雷达杂波 gpu并行计算 球不变随机过程法 卷积计算 cuBLAS库
在线阅读 下载PDF
一种非线性显式分层壳单元及其GPU并行计算实现 被引量:2
10
作者 曹胜涛 李志山 杨志勇 《振动与冲击》 EI CSCD 北大核心 2019年第22期60-69,84,共11页
通用有限元程序ABAQUS的钢筋混凝土显式分层壳单元被广泛应用于剪力墙抗震性能分析,但存在两个缺陷:①只能得到混凝土受压损伤和受拉损伤,无法反映混凝土剪切损坏,因此不易根据损伤类型对结构进行优化;②基于CPU并行计算,大规模计算效... 通用有限元程序ABAQUS的钢筋混凝土显式分层壳单元被广泛应用于剪力墙抗震性能分析,但存在两个缺陷:①只能得到混凝土受压损伤和受拉损伤,无法反映混凝土剪切损坏,因此不易根据损伤类型对结构进行优化;②基于CPU并行计算,大规模计算效率较低。基于平面应力条件下的混凝土弹塑性损伤本构模型,根据混凝土损伤发展时的受力状态和工程实践需要将损伤分为受拉损伤、受压损伤和受剪损伤。结合可损伤分类的塑性损伤模型,给出了非线性壳元物理沙漏力和面内旋转力的构造方法,进而得到一种含面内旋转自由度的4节点24自由度四边形非线性显式分层壳单元。将该研究壳元在自主研发的基于CPU+GPU异构并行计算的非线性分析软件中完成开发实现;通过与ABAQUS benchmark算例结果对比,验证了开发内容的正确性;通过与剪力墙单调加载试验对比,验证了该研究壳元的合理性。分别采用自主研发软件和ABAQUS对上海地区某框架核心筒体系的超高层结构进行了罕遇地震非线性时程分析,结果表明:①自主研发软件与ABAQUS结果基本一致,而计算效率为ABAQUS计算效率的5.69倍;②自主研发软件得到的受拉损伤、受压损伤和受剪损伤损伤可更清晰地揭示核心筒在罕遇地震作用下的损坏演化规律和破坏模式。 展开更多
关键词 弹塑性损伤模型 混凝土损伤类型 非线性显式分层壳单元 剪力墙损坏模式 CPU+gpu并行计算
在线阅读 下载PDF
二维结构拓扑优化的GPU并行计算方法研究 被引量:1
11
作者 刘家彤 王春洁 +1 位作者 吴健 付志方 《机械设计与制造》 北大核心 2020年第1期123-126,131,共5页
针对结构拓扑优化中存在的计算量大,计算效率低的问题,以二维结构拓扑优化问题为研究对象,提出了一种GPU并行计算方法。通过对已有串行算法进行研究,结合GPU并行计算的基本特点,采用节点刚度方法计算结构刚度矩阵,相对于MATLAB向量化计... 针对结构拓扑优化中存在的计算量大,计算效率低的问题,以二维结构拓扑优化问题为研究对象,提出了一种GPU并行计算方法。通过对已有串行算法进行研究,结合GPU并行计算的基本特点,采用节点刚度方法计算结构刚度矩阵,相对于MATLAB向量化计算,该算法加速效果显著。以固体各向同性材料惩罚法进行结构拓扑优化为例,在CUDA平台下实现了对结构化网格二维拓扑优化问题的GPU并行计算,得到了清晰的拓扑构型,将该方法与现有计算方法进行对比,GPU并行计算速度有较大提升。 展开更多
关键词 拓扑优化 gpu并行计算 节点刚度 固体各向同性材料惩罚法 CUDA
在线阅读 下载PDF
基于GPU并行计算的风沙流SPH数值分析
12
作者 梁岚博 金阿芳 +1 位作者 闻腾腾 楚花明 《机床与液压》 北大核心 2021年第7期122-127,共6页
在研究风沙流动方面,光滑粒子流体动力学方法(SPH)的无网格性有着独有的优势。利用SPH方法研究风沙流动时,需要将整个计算区域离散成数量庞大的单个粒子,因此计算规模大、计算效率低。为提高SPH方法的计算效率,采用支持并行计算的CUDA平... 在研究风沙流动方面,光滑粒子流体动力学方法(SPH)的无网格性有着独有的优势。利用SPH方法研究风沙流动时,需要将整个计算区域离散成数量庞大的单个粒子,因此计算规模大、计算效率低。为提高SPH方法的计算效率,采用支持并行计算的CUDA平台,利用GPU大规模并行计算技术,实现SPH方法数值模拟时的加速运算。以二维气沙两相耦合模型作为数值算例,利用GPU并行计算详细分析颗粒群的运动规律。比较在不同粒子数下CPU与GPU的计算效率以及GPU线程数对计算效率的影响。对所得结果进行统计分析后,得到了单颗沙粒的典型抛物线形和变异的跃移轨迹。模拟结果证明:SPH-GPU并行计算技术能够应用在风沙流结构的数值模拟研究中。 展开更多
关键词 光滑粒子流体动力学方法 gpu并行计算 风沙流 跃移轨迹 数值模拟
在线阅读 下载PDF
基于GPU并行计算的智能体个性化信息系统研究
13
作者 赵玉芹 鹿艳晶 《信息通信》 2018年第9期32-33,共2页
传统的智能信息系统通常使用FPGA混合串联架构进行设计,难以达到对数据进行有效采集和处理的设计要求,存在信息系统运行效果较差等局限。为解决上述问题对智能体个性化信息系统进行研究。利用GPU并行计算方法对信息系统数据进行处理,并... 传统的智能信息系统通常使用FPGA混合串联架构进行设计,难以达到对数据进行有效采集和处理的设计要求,存在信息系统运行效果较差等局限。为解决上述问题对智能体个性化信息系统进行研究。利用GPU并行计算方法对信息系统数据进行处理,并创新了智能体个性化信息系统,在智能体个性化信息系统中有效利用GPU并行计算进行图形数据特征信号进行处理,提高对图形数据特征信息的采集和处理的能力,保障智能体个性化信息系统的有效运行。 展开更多
关键词 gpu并行计算 FPGA混合串联架构 智能体个性化信息系统 均值归一化相关系数计算方法
在线阅读 下载PDF
主动学习高光谱图像分类算法GPU并行计算优化
14
作者 谭雪敏 《数字技术与应用》 2015年第1期132-132,共1页
本文利用高光谱图像的空间-光谱维信息,结合主动学习算法实现高光谱图像分类。该算法利用较少的训练样本获得较高的分类精度,与此同时,该算法的运算过程复杂度高且计算效率非常低。针对这一特点,本文提出了一种利用图像处理器(Graphic p... 本文利用高光谱图像的空间-光谱维信息,结合主动学习算法实现高光谱图像分类。该算法利用较少的训练样本获得较高的分类精度,与此同时,该算法的运算过程复杂度高且计算效率非常低。针对这一特点,本文提出了一种利用图像处理器(Graphic processing units,GPUs)对算法进行数据级并行计算优化。并且利用真实场景的高光谱图像对文中提出的并行计算优化方案进行了实验验证,结果表明该方法在保证与串行分类精度一致的情况下,其计算加速比达到34倍左右,验证了基于GPU的高光谱图像分类算法的有效性。 展开更多
关键词 高光谱 gpu主动学习并行计算
在线阅读 下载PDF
CPU+GPU并行计算技术在复杂结构非线性分析中的应用 被引量:5
15
作者 乔保娟 李志山 +3 位作者 曹胜涛 刘春明 侯晓武 杨志勇 《建筑结构》 CSCD 北大核心 2015年第23期86-90,共5页
探讨了PKPM-SAUSAGE软件所采用的CPU+GPU并行计算技术,结合钢材和混凝土本构模型、纤维梁单元与分层壳单元、瑞利阻尼和振型阻尼模型及显式分析方法,详述了其并行计算实现要点,并对并行计算效率进行了测试。测试表明,CPU+GPU并行计算技... 探讨了PKPM-SAUSAGE软件所采用的CPU+GPU并行计算技术,结合钢材和混凝土本构模型、纤维梁单元与分层壳单元、瑞利阻尼和振型阻尼模型及显式分析方法,详述了其并行计算实现要点,并对并行计算效率进行了测试。测试表明,CPU+GPU并行计算技术的应用极大地提高了复杂结构非线性分析的计算效率。以某实际钢筋混凝土框架-核心筒结构为例,采用PKPM-SAUSAGE软件与ABAQUS软件对其进行罕遇地震作用下的动力弹塑性时程分析,验证了PKPM-SAUSAGE软件CPU+GPU并行计算的正确性与高效性。 展开更多
关键词 CPU+gpu并行计算 弹塑性时程分析 PKPM-SAUSAGE软件 ABAQUS软件
原文传递
三维连续-非连续并行计算方法及其在岩爆过程模拟中的应用 被引量:1
16
作者 王学滨 杜轩 +3 位作者 薛承宇 陈双印 廖裴彬 余保健 《水资源与水工程学报》 CSCD 北大核心 2024年第1期177-185,共9页
随着深部岩石工程的发展,岩爆变得越发严重。在岩爆的数值模拟方面,连续方法和非连续方法均具有一定的局限性。兼具二者优势的连续-非连续方法更具优势,且正在快速发展。基于CUDA对自主开发的三维拉格朗日元与离散元耦合连续-非连续方... 随着深部岩石工程的发展,岩爆变得越发严重。在岩爆的数值模拟方面,连续方法和非连续方法均具有一定的局限性。兼具二者优势的连续-非连续方法更具优势,且正在快速发展。基于CUDA对自主开发的三维拉格朗日元与离散元耦合连续-非连续方法进行了GPU并行加速。为了探索岩爆的机理和过程,模拟了不同静水压力、侧压系数和单元数目(最多达100×10^(4))条件下圆形洞室围岩V形坑的演化规律和单元弹射现象。考察了洞室围岩中裂纹的定量演化规律。研究表明:当静水压力较大时,基于芬纳公式的支护设计偏于不安全。由于V形坑的位置发生改变,V形坑的平均最大深度随着静水压力的增加先缓慢增加后快速增加。关于洞室围岩V形坑的模拟结果能与有关的实验结果、数值结果和现场观测结果吻合。上述研究很好地体现了岩爆并行计算较串行计算和商业软件计算的优势。 展开更多
关键词 岩爆 gpu并行计算 三维连续-非连续方法 V形坑 静水压力 侧压系数 洞室
在线阅读 下载PDF
基于GPU的车辆-轨道-地基土耦合系统3D随机振动并行计算方法 被引量:2
17
作者 朱志辉 夏禹涛 +1 位作者 王力东 刘禹兵 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第7期79-88,共10页
针对轨道不平顺随机特征导致车辆-轨道-地基土耦合系统随机分析计算效率低的问题,采用虚拟激励法降低大样本分析的计算量;针对耦合系统等效刚度矩阵的稀疏特性,采用行压缩(Compressed Sparse Row,CSR)格式存储大型稀疏矩阵,采用预处理... 针对轨道不平顺随机特征导致车辆-轨道-地基土耦合系统随机分析计算效率低的问题,采用虚拟激励法降低大样本分析的计算量;针对耦合系统等效刚度矩阵的稀疏特性,采用行压缩(Compressed Sparse Row,CSR)格式存储大型稀疏矩阵,采用预处理共轭梯度法(Preconditioned Conjugate Gradient,PCG)求解对称正定的等效静力平衡方程,最后通过MATLAB-CUDA(Compute Unified Device Architecture)混合平台开发基于GPU的并行计算程序.数值算例表明:基于MATLAB-CUDA混合平台求解等效静力平衡方程的效率是串行多点同步算法的86.13倍,大大缩短了随机振动分析的总计算时间,且内存占用小、易于在个人计算机上实施;采用PCG法求解车辆-轨道-地基土耦合系统形成的大型稀疏线性方程组时,建议以加速度指标作为迭代收敛精度的控制指标;可通过选取适当的迭代收敛精度,以达到计算精度和计算效率的平衡. 展开更多
关键词 随机振动 gpu并行计算 3D有限元法 虚拟激励法 车辆-轨道-地基土耦合模型
在线阅读 下载PDF
基于GPU的分布式并行CFD计算方法 被引量:1
18
作者 丁一丹 吴之南 +2 位作者 范志君 潘雅欣 汪龙飞 《民用飞机设计与研究》 2024年第2期33-43,共11页
计算流体力学(computational fluid dynamic,简称CFD)是一种通过数值求解控制方程来模拟流体的流动和热传导的方法。在民用飞机设计中,CFD被广泛应用于翼型设计优化、风洞试验验证、全机气动布局优化和燃油消耗评估等领域。这些问题涉... 计算流体力学(computational fluid dynamic,简称CFD)是一种通过数值求解控制方程来模拟流体的流动和热传导的方法。在民用飞机设计中,CFD被广泛应用于翼型设计优化、风洞试验验证、全机气动布局优化和燃油消耗评估等领域。这些问题涉及复杂的湍流、反应流和多相流,涉及到大网格量级计算和大批量状态计算,因此需要大量的计算资源。为了提高计算效率,提出了一种基于图形处理单元(graphic processing unit,简称GPU)的分布式并行计算方法。该方法利用统一计算设备架构(compute unified device architecture,简称CUDA)和消息传递接口技术(message passing interface,简称MPI),在GPU上进行并行计算,并使用MPI在多GPU之间进行通信。该方法实现了计算任务和数据传输的并行化,并进行了多流并行优化和非阻塞通信优化,实现了GPU之间的负载均衡。同时将该方法应用于超音速平板流这个典型的CFD案例中,与CPU串行计算相比,单GPU获取了204倍的加速比,4GPU实现了近640倍的加速比,两节点8GPU获得了900倍以上的加速比。这表明该方法具有较好的并行效率和计算性能,在一定程度上解决了CFD应用的计算资源需求问题。 展开更多
关键词 CFD gpu并行计算 CUDA MPI 分布式
在线阅读 下载PDF
油气勘探地震资料处理GPU/CPU协同并行计算 被引量:21
19
作者 刘国峰 刘钦 +2 位作者 李博 佟小龙 刘洪 《地球物理学进展》 CSCD 北大核心 2009年第5期1671-1678,共8页
随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算... 随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算效率得以大幅度提升的关健所在.文中以地震资料处理中的叠前时间偏移和Gazdag深度偏移为切入点,展示样机测试结果的图像显示.显而易见,生产实践中,时常面临对诸多算法进行算法精度和计算速度之间的折中选择.本文阐明GPU/CPU样机协同计算具有高并行度,进而可在算法精度与计算速度的优化配置协调上获得广阔空间.笔者认为,本文的台式协同并行机研制思路及架构,或可作为地球物理配置高性能计算机全新选择的一项依据. 展开更多
关键词 gpu/gpu协同并行计算 叠前时间偏移 Gazdag深度偏移
在线阅读 下载PDF
层流扩散燃烧在GPU上的并行计算和数值分析
20
作者 魏浩洋 曾国荪 丁春玲 《计算机应用》 CSCD 北大核心 2013年第9期2428-2431,2435,共5页
在实际工程应用中,使用传统的CPU串行计算来开展燃烧数值模拟往往难以满足对模拟速度的要求。利用GPU比CPU更强的计算能力,通过在交错网格上将燃烧物理方程离散化,使用预处理稳定双共轭梯度法(PBiCGSTAB)求解离散化方程,并且探索面向GP... 在实际工程应用中,使用传统的CPU串行计算来开展燃烧数值模拟往往难以满足对模拟速度的要求。利用GPU比CPU更强的计算能力,通过在交错网格上将燃烧物理方程离散化,使用预处理稳定双共轭梯度法(PBiCGSTAB)求解离散化方程,并且探索面向GPU编程的矩阵向量乘并行算法和逆矩阵向量乘并行算法,从而给出一种在GPU上数值求解层流扩散燃烧的可行方法。实验结果表明,GPU并行程序获得了相对串行CPU程序约10倍以上的加速效果,且计算结果与实际情况相符,因而所提方法是可行且高效的。 展开更多
关键词 层流扩散燃烧 数值模拟 gpu并行计算 预处理稳定双共轭梯度法 加速比
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部