期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
23
篇文章
<
1
2
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
图形处理器通用计算的实现与验证
被引量:
3
1
作者
齐记
杨孔庆
杨磊
《计算机工程与应用》
CSCD
北大核心
2009年第33期67-69,共3页
讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提...
讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提供了可能。
展开更多
关键词
图形
处理器
(GPU)
图形
处理器
通用
计算
技术(GPGPU)
中央
处理器
(CPU)
在线阅读
下载PDF
职称材料
不规则任务在图形处理器集群上的调度策略
被引量:
2
2
作者
平凡
汤小春
+1 位作者
潘彦宇
李战怀
《计算机应用》
CSCD
北大核心
2021年第11期3295-3301,共7页
针对大量的资源需求少且并行度高的不规则任务集合,利用图形处理器(GPU)来加速处理是目前的主流。然而现有的不规则任务调度策略要么采用独占GPU的方式,要么使用传统的优化方法将任务映射到GPU设备上。前者导致GPU资源的闲置,后者不能...
针对大量的资源需求少且并行度高的不规则任务集合,利用图形处理器(GPU)来加速处理是目前的主流。然而现有的不规则任务调度策略要么采用独占GPU的方式,要么使用传统的优化方法将任务映射到GPU设备上。前者导致GPU资源的闲置,后者不能最大限度利用GPU计算资源。在分析了现存问题的基础上,采用多背包优化思想,使更多的不规则任务以最佳的方式共享GPU设备。首先,针对GPU集群的特点,给出了由调度器、执行器组成的分布式GPU作业调度框架;然后,以GPU显存为代价,设计了一种基于GPU计算资源的扩展贪心调度(EGS)算法,该算法将尽可能多的不规则任务调度到多个可用的GPU上,以最大限度地利用GPU计算资源,并解决了GPU资源的闲置问题;最后,使用实际基准程序随机生成目标任务集来验证所提调度策略的有效性。实验结果表明,与传统的贪心算法、最早完成时间(MCT)算法和Min-min算法相比,当任务数量等于1000时,EGS算法的执行时长分别平均降低至原来的58%、64%和80%,并且能有效提升GPU资源利用率。
展开更多
关键词
图形
处理器
通用
计算
独立任务
任务调度策略
调度框架
资源利用率
在线阅读
下载PDF
职称材料
基于图形处理器的涪江中段流域降雨汇流模拟方法研究
被引量:
1
3
作者
吕朝阳
陈军
+2 位作者
刘意
孙伟
肖俊文
《成都信息工程大学学报》
2019年第3期316-322,共7页
为增加径流汇流模型的时效性,提出一种基于图形处理器通用计算的汇流模型。首先,在稳定水源供给的条件下,通过对模型修改和完善生成流域前期水环境。最后,将小时降水数据叠加到前期水环境进行径流汇流模拟得到模拟结果。通过验证发现,...
为增加径流汇流模型的时效性,提出一种基于图形处理器通用计算的汇流模型。首先,在稳定水源供给的条件下,通过对模型修改和完善生成流域前期水环境。最后,将小时降水数据叠加到前期水环境进行径流汇流模拟得到模拟结果。通过验证发现,模型模拟结果具有更小的水位变化误差,模拟精度进一步提高,模拟速度更快,满足实时计算要求。精度和性能的同时提升,证实汇流模型在流域暴雨洪涝灾害实时评估中具有重要的应用价值。
展开更多
关键词
图形
处理器
通用
计算
汇流模型
稳定水源
前期水环境
涪江中段
3S集成与气象应用
气象地理信息系统工程
在线阅读
下载PDF
职称材料
用于迭代法潮流计算的改进Jacobi预处理方法
被引量:
8
4
作者
唐灿
董树锋
+2 位作者
任雪桂
尹璐
鞠力
《电力系统自动化》
EI
CSCD
北大核心
2018年第12期81-86,共6页
为提高潮流计算速度,满足实时计算的要求,线性方程组迭代法被用于电力系统潮流计算。但是当系数矩阵谱分布较为分散时,迭代法求解线性方程组存在收敛速度慢甚至不收敛等问题,为了解决这个问题,需对系数矩阵进行预处理。首先,分析电力系...
为提高潮流计算速度,满足实时计算的要求,线性方程组迭代法被用于电力系统潮流计算。但是当系数矩阵谱分布较为分散时,迭代法求解线性方程组存在收敛速度慢甚至不收敛等问题,为了解决这个问题,需对系数矩阵进行预处理。首先,分析电力系统潮流计算时Jacobi矩阵的特点,对其按PV,PQ节点进行分块处理,找出其中数值上较大的元素作为预处理子。然后,将预处理子的逆矩阵分别与系数矩阵A和常量项b相乘,将原线性方程组转换为新的更容易求解的等价线性方程组,大幅提高了潮流计算中线性方程组求解的速度。实验表明,该方法能有效解决大规模电网潮流求解问题。
展开更多
关键词
潮流
计算
稀疏线性方程组
预
处理
稀疏矩阵
图形
处理器
通用
计算
在线阅读
下载PDF
职称材料
基于GPGPU的大整数矩阵行列式快速准确计算方法
被引量:
1
5
作者
魏渐俊
陈良育
《计算机工程》
CAS
CSCD
北大核心
2018年第3期47-54,共8页
传统计算数值矩阵行列式的方法多数基于串行计算,存在初等变换频繁、计算缓慢等问题。为此,提出基于通用计算图形处理器(GPGPU)的计算方法,以快速准确解决大整数矩阵行列式计算问题。在众核环境下利用GPGPU和模方法并行求解整数矩阵行列...
传统计算数值矩阵行列式的方法多数基于串行计算,存在初等变换频繁、计算缓慢等问题。为此,提出基于通用计算图形处理器(GPGPU)的计算方法,以快速准确解决大整数矩阵行列式计算问题。在众核环境下利用GPGPU和模方法并行求解整数矩阵行列式,以加速计算过程并避免浮点运算误差,同时运用中国剩余定理得到准确计算结果。实验结果表明,与常用Maple、NTL等计算软件相比,该方法计算速度快,消耗内存少,可解决计算过程中内存膨胀的问题,对于高阶整数矩阵行列式优势较为明显。
展开更多
关键词
通用计算图形处理器
行列式
高性能
计算
并行算法
模方法
在线阅读
下载PDF
职称材料
基于CUDA的细粒度并行计算模型研究
被引量:
1
6
作者
肖汉
肖波
+1 位作者
冯娜
杨锦锦
《计算机与数字工程》
2013年第5期801-804,共4页
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻。但随着具备细粒度并行计算能力的图形处理器(GPU)进入主流市场,与之相适应的编程模型发展却相对滞后。Nvidia在GeForce 8系列显卡上推出的统一计算设备...
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻。但随着具备细粒度并行计算能力的图形处理器(GPU)进入主流市场,与之相适应的编程模型发展却相对滞后。Nvidia在GeForce 8系列显卡上推出的统一计算设备架构(CUDA)技术,使得通用计算图形处理单元(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。论文从特性、组成和并行架构等几个方面对CUDA并行计算模型进行了研究,充分表明基于GPU进行高性能并行计算,是适应目前大规模计算需求的一个重要发展途径。
展开更多
关键词
图形
处理器
图形
处理器
的
通用
计算
统一
计算
设备架构
细粒度并行
计算
单指令多数据
在线阅读
下载PDF
职称材料
细粒度并行计算编程模型研究
被引量:
10
7
作者
刘伟峰
王智广
《微电子学与计算机》
CSCD
北大核心
2008年第10期103-106,共4页
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻.但随着具备细粒度并行计算能力的多核心微处理器进入主流市场,与之相适应的编程模型发展却相对滞后.对细粒度的并行计算编程模型进行研究.首先,介绍3种...
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻.但随着具备细粒度并行计算能力的多核心微处理器进入主流市场,与之相适应的编程模型发展却相对滞后.对细粒度的并行计算编程模型进行研究.首先,介绍3种典型的多核心微处理器体系结构;其次,介绍3个已有的细粒度并行计算编程模型;最后,探讨并行计算编程模型的必备条件.
展开更多
关键词
细粒度并行
计算
图形
处理器
图形
处理器
的
通用
计算
CELL
统一
计算
设备架构
在线阅读
下载PDF
职称材料
基于光线投射的电磁态势实时可视化
被引量:
5
8
作者
高颖
陈旭
+1 位作者
周士军
郭淑霞
《兵工学报》
EI
CAS
CSCD
北大核心
2015年第12期2306-2314,共9页
战场电磁环境态势具有复杂、多维、时变特性,研究战场电磁态势实时可视化技术,对于作战指挥员了解战场态势,作出科学指挥、决策意义重大。目前,表征战场电磁态势的数学模型并不完善,以场强为例,建立了多辐射源空间场强合成的数学模型,...
战场电磁环境态势具有复杂、多维、时变特性,研究战场电磁态势实时可视化技术,对于作战指挥员了解战场态势,作出科学指挥、决策意义重大。目前,表征战场电磁态势的数学模型并不完善,以场强为例,建立了多辐射源空间场强合成的数学模型,为电磁态势三维体数据场的构建提供数据来源;战场态势的复杂性,使得与体数据场相关的数学模型也相对复杂,传统基于中央处理器(CPU)的实现方法无法达到实时解算的要求,鉴于此,提出了基于通用计算图形处理器(GPGPU)的体数据场加速生成技术,实验结果表明该技术能够满足实时可视化的需求;设计了一种体绘制传递函数,并利用基于图形处理器(GPU)的光线投射算法,实现了电磁态势实时可视化。
展开更多
关键词
兵器科学与技术
电磁态势
数据场建模
通用计算图形处理器
光线投射算法
体可视化
在线阅读
下载PDF
职称材料
面向CPU-GPU架构的源到源自动映射方法
被引量:
2
9
作者
朱正东
刘袁
+3 位作者
魏洪昌
颜康
王寅峰
董小社
《计算机工程与应用》
CSCD
北大核心
2015年第21期41-47,共7页
针对GPU上应用开发移植困难的问题,提出了一种串行计算源程序到并行计算源程序的映射方法。该方法从串行源程序中获得可并行化循环的层次信息,建立循环体结构与GPU线程的对应关系,生成GPU端核心函数代码;根据变量引用读写属性生成CPU端...
针对GPU上应用开发移植困难的问题,提出了一种串行计算源程序到并行计算源程序的映射方法。该方法从串行源程序中获得可并行化循环的层次信息,建立循环体结构与GPU线程的对应关系,生成GPU端核心函数代码;根据变量引用读写属性生成CPU端控制代码。基于该方法实现了一个编译原型系统,完成了C语言源程序到CUDA源程序的自动生成。对原型系统在功能和性能方面的测试结果表明,该系统生成的CUDA源程序与C语言源程序在功能上一致,其性能有显著提高,在一定程度上解决了计算密集型应用向CPU-GPU异构多核系统移植困难的问题。
展开更多
关键词
通用计算图形处理器
(GPGPU)
统一
计算
架构(CUDA)
自动映射
源到源编译
在线阅读
下载PDF
职称材料
GPU加速的分段Top-k查询算法
被引量:
1
10
作者
黄玉龙
邹循进
+1 位作者
刘奎
苏本跃
《计算机应用》
CSCD
北大核心
2014年第11期3112-3116,共5页
现有Top-k查询优化算法无法充分利用图形处理器(GPU)强大的并行吞吐量及时获取查询结果,为此提出了一种基于统一计算设备架构(CUDA)模型的大规模分段查询算法。通过划分查询过程以及采用分段并行处理策略,该算法可最大限度地提升查询过...
现有Top-k查询优化算法无法充分利用图形处理器(GPU)强大的并行吞吐量及时获取查询结果,为此提出了一种基于统一计算设备架构(CUDA)模型的大规模分段查询算法。通过划分查询过程以及采用分段并行处理策略,该算法可最大限度地提升查询过程中的计算和比较效率。实验结果表明,与4线程多核优化算法相比,所提算法具有明显的性能优势,当有序列表数量为6,遍历步长为120时,性能达到最优,此时比多核算法快40倍。
展开更多
关键词
TOP-K查询
通用计算图形处理器
分段
处理
并行优化
禁止随机访问
在线阅读
下载PDF
职称材料
CPU-GPU协同加速Kriging插值的负载均衡方法
被引量:
2
11
作者
姜春雷
张树清
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2015年第5期35-39,148,共6页
Kriging插值算法被广泛应用于地学各领域,有着极其重要的现实意义,但在面对大规模输出网格及大量输入采样点时,不可避免地遇到了性能瓶颈。利用Open CL和Open MP在异构平台上实现了CPU与GPU协同加速普通Kriging插值。针对Kriging插值中...
Kriging插值算法被广泛应用于地学各领域,有着极其重要的现实意义,但在面对大规模输出网格及大量输入采样点时,不可避免地遇到了性能瓶颈。利用Open CL和Open MP在异构平台上实现了CPU与GPU协同加速普通Kriging插值。针对Kriging插值中采样点的不规则分布及CPU和GPU由于体系结构差异对其的不同适应性,提出一种基于不同设备间计算性能的差异和数据分布特点的负载均衡方法。试验结果表明,该方法能有效提高普通Kriging插值速度,同时还能节约存储空间和提高访存效率。
展开更多
关键词
通用计算图形处理器
开放运算语言
KRIGING插值
负载均衡
在线阅读
下载PDF
职称材料
基于GPU加速的实时视频超分辨率重建
被引量:
1
12
作者
陈湘骥
韩国强
张芝源
《计算机应用》
CSCD
北大核心
2013年第12期3540-3543,共4页
基于稀疏表示的超分辨率算法的图像重建质量好,但算法复杂,现有的CPU串行执行算法无法满足视频实时处理的需要。为此提出了基于GPU加速的稀疏表示的实时视频超分辨率算法。该算法着重于优化数据并行处理流程,提高GPU资源利用率,通过设...
基于稀疏表示的超分辨率算法的图像重建质量好,但算法复杂,现有的CPU串行执行算法无法满足视频实时处理的需要。为此提出了基于GPU加速的稀疏表示的实时视频超分辨率算法。该算法着重于优化数据并行处理流程,提高GPU资源利用率,通过设置视频帧队列、提高显存访问并发率、采用主成分分析(PCA)降维、优化字典查找等手段,使算法执行速度比现有CPU串行算法提高了2个数量级,在显示分辨率为669×546的视频回放测试中达到每秒33帧。
展开更多
关键词
视频
实时
超分辨率
稀疏表示
通用计算图形处理器
在线阅读
下载PDF
职称材料
利用GPGPU进行快速稀疏磁共振数据重建
13
作者
王聪
冯衍秋
《计算机工程与应用》
CSCD
北大核心
2011年第17期203-206,209,共5页
利用GPGPU(General Purpose GPU)强大的并行处理能力,基于NVIDIA CUDA框架对已有的稀疏磁共振(Sparse MRI)重建算法进行了并行化改造,使其能够适应实际应用的要求。稀疏磁共振成像的重建算法包含大量的浮点运算,计算耗时严重,难以应用...
利用GPGPU(General Purpose GPU)强大的并行处理能力,基于NVIDIA CUDA框架对已有的稀疏磁共振(Sparse MRI)重建算法进行了并行化改造,使其能够适应实际应用的要求。稀疏磁共振成像的重建算法包含大量的浮点运算,计算耗时严重,难以应用于实际,必须对其进行加速和优化。实验结果显示,NVIDIA GTX275 GPU使运算时间从4分多钟缩短到3.4秒左右,与Intel Q8200 CPU相比,达到了76倍的加速。
展开更多
关键词
通用计算图形处理器
(GPGPU)
统一
计算
设备架构(CUDA)
并行
计算
压缩传感
稀疏磁共振
在线阅读
下载PDF
职称材料
动态模式识别算法的GPU平台实现
14
作者
林文愉
王聪
《计算技术与自动化》
2013年第1期68-72,共5页
研究动态模式识别算法在GPU并行计算平台的实现。随着GPGPU(通用计算图形处理器)硬件的发展,基于GPU的大规模并行计算技术将有效地处理动态模式识别算法带来的海量计算问题。文中通过介绍动态模式识别算法,对算法中涉及的巨大计算量进...
研究动态模式识别算法在GPU并行计算平台的实现。随着GPGPU(通用计算图形处理器)硬件的发展,基于GPU的大规模并行计算技术将有效地处理动态模式识别算法带来的海量计算问题。文中通过介绍动态模式识别算法,对算法中涉及的巨大计算量进行分析,并针对性地对其中密集计算部分进行并行化分解,移除原算法中在执行中存在的依赖关系,最终得到算法在特定的GPU平台———Jacket上的并行计算实现。实例验证表明,相比于原CPU串行程序,在GPU上运行的并行化程序能实现明显加速,因而具有很好的工程应用价值。
展开更多
关键词
动态模式识别
神经网络
通用计算图形处理器
Jacket平台
并行实现
在线阅读
下载PDF
职称材料
基于分布式框架的并行PSO算法
被引量:
2
15
作者
桑渊博
曾建潮
+1 位作者
谭瑛
孙超利
《中北大学学报(自然科学版)》
CAS
2019年第2期126-130,136,共6页
在使用微粒群算法对大规模优化问题求解时往往需要大量的目标函数评价次数,从而耗费大量的计算时间,而分布式计算和通用计算图形处理器(General Purpose GPU)可以减少耗时.本文通过将微粒群算法在分布式框架下GPU并行计算实现,将粒子分...
在使用微粒群算法对大规模优化问题求解时往往需要大量的目标函数评价次数,从而耗费大量的计算时间,而分布式计算和通用计算图形处理器(General Purpose GPU)可以减少耗时.本文通过将微粒群算法在分布式框架下GPU并行计算实现,将粒子分到各个计算节点进行异步计算,而每个节点中的粒子实行同步进化,从而提高微粒群算法求解大规模优化问题的效率.实验方法采用5个标准测试函数进行测试,实验结果表明本文方法在在求解大规模优化问题时在计算效率上有了数倍至数十倍的提升.
展开更多
关键词
微粒群算法
大规模优化问题
分布式
计算
通用计算图形处理器
技术
异步
计算
在线阅读
下载PDF
职称材料
基于GPU的全波形并行LM分解算法
被引量:
1
16
作者
张军军
邢帅
+1 位作者
李鹏程
夏琴
《测绘科学技术学报》
CSCD
北大核心
2016年第4期421-425,共5页
波形分解是机载激光雷达全波形数据处理的重要基础工作,通过求解波形函数模型的参数,将波形数据利用具体的函数模型拟合出来,实现对全波形及其中各个子波形函数表达。LM(Levenberg-Marquardt)算法及其改进的算法是波形分解中对参数进行...
波形分解是机载激光雷达全波形数据处理的重要基础工作,通过求解波形函数模型的参数,将波形数据利用具体的函数模型拟合出来,实现对全波形及其中各个子波形函数表达。LM(Levenberg-Marquardt)算法及其改进的算法是波形分解中对参数进行拟合求解的常用方法。针对LM算法在参数拟合计算的过程中存在大量迭代和矩阵运算,提出了基于线程块组和线程两级并行粒度的并行计算方案。将串行多次循环迭代求解参数改为单次并行计算取最佳值实现对参数的选择,将矩阵运算进行线程块的协同并行计算,实现了LM算法在通用计算图形处理器上的并行计算。实验证明,在规定阈值条件下,并行LM降低了算法的迭代次数,提高了波形分解LM算法的计算效率,为提高波形分解的处理效率提供了研究思路。
展开更多
关键词
全波形激光雷达
波形分解
通用计算图形处理器
LEVENBERG-MARQUARDT算法
并行
在线阅读
下载PDF
职称材料
基于GPGPU的Lattice-Boltzmann数值模拟算法
被引量:
11
17
作者
周季夫
钟诚文
+2 位作者
尹世群
解建飞
张勇
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2008年第7期912-918,共7页
对Lattice Boltzmann方法(LBM)在GPGPU下的建模和算法进行了一系列研究,使得该方法在GPU下的计算加速比提升,大大缩短计算过程的时间消耗.重新设计了GPU的计算流程,在舍弃pixel buffer离屏渲染的同时,采用最新的帧缓存对象,多重纹理、...
对Lattice Boltzmann方法(LBM)在GPGPU下的建模和算法进行了一系列研究,使得该方法在GPU下的计算加速比提升,大大缩短计算过程的时间消耗.重新设计了GPU的计算流程,在舍弃pixel buffer离屏渲染的同时,采用最新的帧缓存对象,多重纹理、多通道渲染和乒乓技术来设计一套基于方腔的LBM数值模拟程序,最终使GPU的计算时间缩短到CPU计算时间的六分之一.
展开更多
关键词
基于
图形
处理器
的
通用
计算
帧缓存扩展
多重渲染目标
Lattice-Boltzmann方法
反弹边界
乒乓技术
在线阅读
下载PDF
职称材料
基于GPGPU的并行影像匹配算法
被引量:
44
18
作者
肖汉
张祖勋
《测绘学报》
EI
CSCD
北大核心
2010年第1期46-51,共6页
提出一种基于GPGPU的CUDA架构快速影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化数据存储结构,提高数据访问效率。实...
提出一种基于GPGPU的CUDA架构快速影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化数据存储结构,提高数据访问效率。实验结果表明,并行算法充分利用GPU的并行处理能力,在处理1280×1024分辨率的8位灰度图像时可达到最高多处理器warp占有率,速度是基于CPU实现的7倍。CUDA在高运算强度数据处理中呈现出的实时处理能力和计算能力,为进一步加速影像匹配性能和GPU通用计算提供了新的方法和思路。
展开更多
关键词
细粒度并行
计算
图形
处理器
的
通用
计算
统一
计算
设备架构
影像匹配
单指令多线程
在线阅读
下载PDF
职称材料
基于GPU的3D距离变换
19
作者
田绪红
司徒志远
+1 位作者
陈茂资
韩国强
《计算机应用研究》
CSCD
北大核心
2008年第9期2847-2849,共3页
距离变换在图像处理中有着非常广泛的应用。由于3D图像数据的复杂性,传统基于CPU的3D距离变换效率较低。为此,研究了将3D图像数据有效地组织到纹理中存储的方法,设计并实现了基于GPU的3D距离变换并行算法。实验结果表明,相对基于CPU的算...
距离变换在图像处理中有着非常广泛的应用。由于3D图像数据的复杂性,传统基于CPU的3D距离变换效率较低。为此,研究了将3D图像数据有效地组织到纹理中存储的方法,设计并实现了基于GPU的3D距离变换并行算法。实验结果表明,相对基于CPU的算法,该方法具有非常高的加速比。
展开更多
关键词
三维距离变换
图形
处理器
通用
计算
并行算法
在线阅读
下载PDF
职称材料
流式缩减技术在GPU上的研究与应用
被引量:
1
20
作者
曲洋
黄永忠
王磊
《计算机工程与设计》
CSCD
北大核心
2008年第5期1268-1270,1275,共4页
随着GPU通用计算技术应用的不断深入,如何把某些并行计算任务从传统的CPU平台向GPU平台转移,把串行编程模型向并行的流式编程模型转变等,已经成为了研究的热点。讨论了基于GPU的流式编程模型,探讨了基于流式编程模型的GPU与CPU编程之间...
随着GPU通用计算技术应用的不断深入,如何把某些并行计算任务从传统的CPU平台向GPU平台转移,把串行编程模型向并行的流式编程模型转变等,已经成为了研究的热点。讨论了基于GPU的流式编程模型,探讨了基于流式编程模型的GPU与CPU编程之间的差别与联系,最后描述了一种在GPU上的流式缩减操作算法的设计与实现。为把图形处理器应用在通用计算领域提供参考和帮助。
展开更多
关键词
图形
处理器
通用
计算
技术
流式编程
流式缩减
在线阅读
下载PDF
职称材料
题名
图形处理器通用计算的实现与验证
被引量:
3
1
作者
齐记
杨孔庆
杨磊
机构
集美大学理学院复杂系统研究中心
中国科学院近代物理研究所
出处
《计算机工程与应用》
CSCD
北大核心
2009年第33期67-69,共3页
基金
国家自然科学基金No.10775157
国家高技术研究发展计划(863)No.2006A09A102-08
国家重点基础研究发展规划(973)No.2007CB209603~~
文摘
讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提供了可能。
关键词
图形
处理器
(GPU)
图形
处理器
通用
计算
技术(GPGPU)
中央
处理器
(CPU)
Keywords
Graphics Processing Uni(tGPU)
General Purpose Graphic Process Uni(tGPGPU)
Central Processing Uni(tCPU)
分类号
TP303 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
不规则任务在图形处理器集群上的调度策略
被引量:
2
2
作者
平凡
汤小春
潘彦宇
李战怀
机构
西北工业大学计算机学院
工信部大数据存储与管理重点实验室(西北工业大学)
出处
《计算机应用》
CSCD
北大核心
2021年第11期3295-3301,共7页
基金
国家重点研发计划项目(2018YFB1003400)。
文摘
针对大量的资源需求少且并行度高的不规则任务集合,利用图形处理器(GPU)来加速处理是目前的主流。然而现有的不规则任务调度策略要么采用独占GPU的方式,要么使用传统的优化方法将任务映射到GPU设备上。前者导致GPU资源的闲置,后者不能最大限度利用GPU计算资源。在分析了现存问题的基础上,采用多背包优化思想,使更多的不规则任务以最佳的方式共享GPU设备。首先,针对GPU集群的特点,给出了由调度器、执行器组成的分布式GPU作业调度框架;然后,以GPU显存为代价,设计了一种基于GPU计算资源的扩展贪心调度(EGS)算法,该算法将尽可能多的不规则任务调度到多个可用的GPU上,以最大限度地利用GPU计算资源,并解决了GPU资源的闲置问题;最后,使用实际基准程序随机生成目标任务集来验证所提调度策略的有效性。实验结果表明,与传统的贪心算法、最早完成时间(MCT)算法和Min-min算法相比,当任务数量等于1000时,EGS算法的执行时长分别平均降低至原来的58%、64%和80%,并且能有效提升GPU资源利用率。
关键词
图形
处理器
通用
计算
独立任务
任务调度策略
调度框架
资源利用率
Keywords
Graphics Processing Unit(GPU)general computing
independent task
task scheduling strategy
scheduling framework
resource utilization
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于图形处理器的涪江中段流域降雨汇流模拟方法研究
被引量:
1
3
作者
吕朝阳
陈军
刘意
孙伟
肖俊文
机构
成都信息工程大学资源与环境学院
出处
《成都信息工程大学学报》
2019年第3期316-322,共7页
基金
四川省科技厅资助项目(2017JY0157)
四川省科技厅支撑计划资助项目(2015SZ0214)
四川省国土资源厅科学研究计划资助项目(KJ-2015-18)
文摘
为增加径流汇流模型的时效性,提出一种基于图形处理器通用计算的汇流模型。首先,在稳定水源供给的条件下,通过对模型修改和完善生成流域前期水环境。最后,将小时降水数据叠加到前期水环境进行径流汇流模拟得到模拟结果。通过验证发现,模型模拟结果具有更小的水位变化误差,模拟精度进一步提高,模拟速度更快,满足实时计算要求。精度和性能的同时提升,证实汇流模型在流域暴雨洪涝灾害实时评估中具有重要的应用价值。
关键词
图形
处理器
通用
计算
汇流模型
稳定水源
前期水环境
涪江中段
3S集成与气象应用
气象地理信息系统工程
Keywords
graphics processing unit general computation
confluence model
stable water supply
early stage water environment
the middle section of Fujiang River
3S integration and meteorological application
meteorological geographic information system engineering
分类号
P426.6 [天文地球—大气科学及气象学]
在线阅读
下载PDF
职称材料
题名
用于迭代法潮流计算的改进Jacobi预处理方法
被引量:
8
4
作者
唐灿
董树锋
任雪桂
尹璐
鞠力
机构
浙江大学电气工程学院
北京电力经济技术研究院
出处
《电力系统自动化》
EI
CSCD
北大核心
2018年第12期81-86,共6页
文摘
为提高潮流计算速度,满足实时计算的要求,线性方程组迭代法被用于电力系统潮流计算。但是当系数矩阵谱分布较为分散时,迭代法求解线性方程组存在收敛速度慢甚至不收敛等问题,为了解决这个问题,需对系数矩阵进行预处理。首先,分析电力系统潮流计算时Jacobi矩阵的特点,对其按PV,PQ节点进行分块处理,找出其中数值上较大的元素作为预处理子。然后,将预处理子的逆矩阵分别与系数矩阵A和常量项b相乘,将原线性方程组转换为新的更容易求解的等价线性方程组,大幅提高了潮流计算中线性方程组求解的速度。实验表明,该方法能有效解决大规模电网潮流求解问题。
关键词
潮流
计算
稀疏线性方程组
预
处理
稀疏矩阵
图形
处理器
通用
计算
Keywords
power flow calculation
sparse linear equations
pre-treatment
sparse matrix
general calculation of graphicsprocessor
分类号
TM744 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
基于GPGPU的大整数矩阵行列式快速准确计算方法
被引量:
1
5
作者
魏渐俊
陈良育
机构
华东师范大学上海高可信计算重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第3期47-54,共8页
基金
国家自然科学基金(11471209)
中央高校基本科研业务费专项资金(78210152)
文摘
传统计算数值矩阵行列式的方法多数基于串行计算,存在初等变换频繁、计算缓慢等问题。为此,提出基于通用计算图形处理器(GPGPU)的计算方法,以快速准确解决大整数矩阵行列式计算问题。在众核环境下利用GPGPU和模方法并行求解整数矩阵行列式,以加速计算过程并避免浮点运算误差,同时运用中国剩余定理得到准确计算结果。实验结果表明,与常用Maple、NTL等计算软件相比,该方法计算速度快,消耗内存少,可解决计算过程中内存膨胀的问题,对于高阶整数矩阵行列式优势较为明显。
关键词
通用计算图形处理器
行列式
高性能
计算
并行算法
模方法
Keywords
General Purpose Graphic Process Units (GPGPU)
determination
high performance computing
parallelalgorithm
modular method
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于CUDA的细粒度并行计算模型研究
被引量:
1
6
作者
肖汉
肖波
冯娜
杨锦锦
机构
郑州大学信息工程学院
郑州师范学院信息科学与技术学院
郑州二中
郑州市档案馆
出处
《计算机与数字工程》
2013年第5期801-804,共4页
基金
国家自然科学基金项目(编号:41171357)
中国博士后科学基金项目(编号:2012M510176)
河南省信息技术教育研究项目(编号:ITE12130)资助
文摘
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻。但随着具备细粒度并行计算能力的图形处理器(GPU)进入主流市场,与之相适应的编程模型发展却相对滞后。Nvidia在GeForce 8系列显卡上推出的统一计算设备架构(CUDA)技术,使得通用计算图形处理单元(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。论文从特性、组成和并行架构等几个方面对CUDA并行计算模型进行了研究,充分表明基于GPU进行高性能并行计算,是适应目前大规模计算需求的一个重要发展途径。
关键词
图形
处理器
图形
处理器
的
通用
计算
统一
计算
设备架构
细粒度并行
计算
单指令多数据
Keywords
graphic processor unit(GPU)
general purpose computing on graphics processing units(GPGPU)
compute unified device architecture(CUDA)
fine-grained parallel computing
single instruction multiple data(SIMD)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
细粒度并行计算编程模型研究
被引量:
10
7
作者
刘伟峰
王智广
机构
中国石油化工股份有限公司石油勘探开发研究院信息技术研究所
中国石油大学(北京)计算机科学与技术系
出处
《微电子学与计算机》
CSCD
北大核心
2008年第10期103-106,共4页
文摘
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻.但随着具备细粒度并行计算能力的多核心微处理器进入主流市场,与之相适应的编程模型发展却相对滞后.对细粒度的并行计算编程模型进行研究.首先,介绍3种典型的多核心微处理器体系结构;其次,介绍3个已有的细粒度并行计算编程模型;最后,探讨并行计算编程模型的必备条件.
关键词
细粒度并行
计算
图形
处理器
图形
处理器
的
通用
计算
CELL
统一
计算
设备架构
Keywords
fine-grained parallel computing
GPU
GPGPU
cell
CUDA
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于光线投射的电磁态势实时可视化
被引量:
5
8
作者
高颖
陈旭
周士军
郭淑霞
机构
西北工业大学航海学院
西北工业大学无人机特种技术重点实验室
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2015年第12期2306-2314,共9页
基金
国家自然科学基金项目(61571368)
国防技术基础科研项目(2014年)
文摘
战场电磁环境态势具有复杂、多维、时变特性,研究战场电磁态势实时可视化技术,对于作战指挥员了解战场态势,作出科学指挥、决策意义重大。目前,表征战场电磁态势的数学模型并不完善,以场强为例,建立了多辐射源空间场强合成的数学模型,为电磁态势三维体数据场的构建提供数据来源;战场态势的复杂性,使得与体数据场相关的数学模型也相对复杂,传统基于中央处理器(CPU)的实现方法无法达到实时解算的要求,鉴于此,提出了基于通用计算图形处理器(GPGPU)的体数据场加速生成技术,实验结果表明该技术能够满足实时可视化的需求;设计了一种体绘制传递函数,并利用基于图形处理器(GPU)的光线投射算法,实现了电磁态势实时可视化。
关键词
兵器科学与技术
电磁态势
数据场建模
通用计算图形处理器
光线投射算法
体可视化
Keywords
ordnance science and technology
electromagnetic situation
data field modeling
general purpose graphics processing unit
ray-casting algorithm
volume visualization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
面向CPU-GPU架构的源到源自动映射方法
被引量:
2
9
作者
朱正东
刘袁
魏洪昌
颜康
王寅峰
董小社
机构
西安交通大学电子与信息工程学院
深圳信息职业技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2015年第21期41-47,共7页
基金
国家自然科学基金(No.61173039)
青年基金项目(No.61202041)
+2 种基金
国家高技术研究发展计划(863)(No.2012AA010904
No.2012AA01A306)
深圳市科技计划(No.JCYJ20120615101127404)
文摘
针对GPU上应用开发移植困难的问题,提出了一种串行计算源程序到并行计算源程序的映射方法。该方法从串行源程序中获得可并行化循环的层次信息,建立循环体结构与GPU线程的对应关系,生成GPU端核心函数代码;根据变量引用读写属性生成CPU端控制代码。基于该方法实现了一个编译原型系统,完成了C语言源程序到CUDA源程序的自动生成。对原型系统在功能和性能方面的测试结果表明,该系统生成的CUDA源程序与C语言源程序在功能上一致,其性能有显著提高,在一定程度上解决了计算密集型应用向CPU-GPU异构多核系统移植困难的问题。
关键词
通用计算图形处理器
(GPGPU)
统一
计算
架构(CUDA)
自动映射
源到源编译
Keywords
General Purpose Graphic Processing Unit (GPGPU)
Compute Unified Device Architecture (CUDA)
auto-matic mapping
source to source compile
分类号
TP303 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
GPU加速的分段Top-k查询算法
被引量:
1
10
作者
黄玉龙
邹循进
刘奎
苏本跃
机构
安庆师范学院计算机与信息学院
江西省国土资源厅信息中心
出处
《计算机应用》
CSCD
北大核心
2014年第11期3112-3116,共5页
基金
国家自然科学基金资助项目(61340016)
文摘
现有Top-k查询优化算法无法充分利用图形处理器(GPU)强大的并行吞吐量及时获取查询结果,为此提出了一种基于统一计算设备架构(CUDA)模型的大规模分段查询算法。通过划分查询过程以及采用分段并行处理策略,该算法可最大限度地提升查询过程中的计算和比较效率。实验结果表明,与4线程多核优化算法相比,所提算法具有明显的性能优势,当有序列表数量为6,遍历步长为120时,性能达到最优,此时比多核算法快40倍。
关键词
TOP-K查询
通用计算图形处理器
分段
处理
并行优化
禁止随机访问
Keywords
Top-k query
General Purpose GPU(GPGPU)
segmented process
parallel optimization
No Random Access(NRA)
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
TP319.3 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
CPU-GPU协同加速Kriging插值的负载均衡方法
被引量:
2
11
作者
姜春雷
张树清
机构
中国科学院东北地理与农业生态研究所
中国科学院大学
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2015年第5期35-39,148,共6页
基金
国家自然科学基金资助项目(41271196)
中国科学院重点部署资助项目(KZZD-EW-07-02)
文摘
Kriging插值算法被广泛应用于地学各领域,有着极其重要的现实意义,但在面对大规模输出网格及大量输入采样点时,不可避免地遇到了性能瓶颈。利用Open CL和Open MP在异构平台上实现了CPU与GPU协同加速普通Kriging插值。针对Kriging插值中采样点的不规则分布及CPU和GPU由于体系结构差异对其的不同适应性,提出一种基于不同设备间计算性能的差异和数据分布特点的负载均衡方法。试验结果表明,该方法能有效提高普通Kriging插值速度,同时还能节约存储空间和提高访存效率。
关键词
通用计算图形处理器
开放运算语言
KRIGING插值
负载均衡
Keywords
general purpose graphics processor units
open computing language
Kriging interpolation
load balancing
分类号
F209 [经济管理—国民经济]
在线阅读
下载PDF
职称材料
题名
基于GPU加速的实时视频超分辨率重建
被引量:
1
12
作者
陈湘骥
韩国强
张芝源
机构
华南农业大学信息学院
华南理工大学计算机科学与工程学院
出处
《计算机应用》
CSCD
北大核心
2013年第12期3540-3543,共4页
基金
国家自然科学基金资助项目(61070090
61003270)
+2 种基金
国家自然科学广东联合基金资助项目(U1035004)
广东省工业科技计划项目(2009B030803004
2008B080701052)
文摘
基于稀疏表示的超分辨率算法的图像重建质量好,但算法复杂,现有的CPU串行执行算法无法满足视频实时处理的需要。为此提出了基于GPU加速的稀疏表示的实时视频超分辨率算法。该算法着重于优化数据并行处理流程,提高GPU资源利用率,通过设置视频帧队列、提高显存访问并发率、采用主成分分析(PCA)降维、优化字典查找等手段,使算法执行速度比现有CPU串行算法提高了2个数量级,在显示分辨率为669×546的视频回放测试中达到每秒33帧。
关键词
视频
实时
超分辨率
稀疏表示
通用计算图形处理器
Keywords
video
real-time
Super-Resolution (SR)
sparse representation
General Purpose Graphic Processing Unit
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
利用GPGPU进行快速稀疏磁共振数据重建
13
作者
王聪
冯衍秋
机构
南方医科大学医学信息研究所
出处
《计算机工程与应用》
CSCD
北大核心
2011年第17期203-206,209,共5页
基金
国家自然科学基金No.30800254
No.30730036
国家重点基础研究发展规划(973)(No.2010CB732502)~~
文摘
利用GPGPU(General Purpose GPU)强大的并行处理能力,基于NVIDIA CUDA框架对已有的稀疏磁共振(Sparse MRI)重建算法进行了并行化改造,使其能够适应实际应用的要求。稀疏磁共振成像的重建算法包含大量的浮点运算,计算耗时严重,难以应用于实际,必须对其进行加速和优化。实验结果显示,NVIDIA GTX275 GPU使运算时间从4分多钟缩短到3.4秒左右,与Intel Q8200 CPU相比,达到了76倍的加速。
关键词
通用计算图形处理器
(GPGPU)
统一
计算
设备架构(CUDA)
并行
计算
压缩传感
稀疏磁共振
Keywords
General Purpose GPU(GPGPU)
Compute Unified Device Architecture(CUDA)
parallel computing
compressed sensing
sparse Magnetic Resonance Imaging(MR/)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
动态模式识别算法的GPU平台实现
14
作者
林文愉
王聪
机构
华南理工大学自动化科学与工程学院
出处
《计算技术与自动化》
2013年第1期68-72,共5页
基金
国家自然科学基金重大研究计划重点项目(90816028
60934001)
文摘
研究动态模式识别算法在GPU并行计算平台的实现。随着GPGPU(通用计算图形处理器)硬件的发展,基于GPU的大规模并行计算技术将有效地处理动态模式识别算法带来的海量计算问题。文中通过介绍动态模式识别算法,对算法中涉及的巨大计算量进行分析,并针对性地对其中密集计算部分进行并行化分解,移除原算法中在执行中存在的依赖关系,最终得到算法在特定的GPU平台———Jacket上的并行计算实现。实例验证表明,相比于原CPU串行程序,在GPU上运行的并行化程序能实现明显加速,因而具有很好的工程应用价值。
关键词
动态模式识别
神经网络
通用计算图形处理器
Jacket平台
并行实现
Keywords
dynamical pattern recognition
neural network
GPGPU
jacket platform
parallel implementation
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于分布式框架的并行PSO算法
被引量:
2
15
作者
桑渊博
曾建潮
谭瑛
孙超利
机构
太原科技大学计算机科学与技术学院
中北大学计算机与控制工程学院
出处
《中北大学学报(自然科学版)》
CAS
2019年第2期126-130,136,共6页
基金
国家自然科学基金面上项目(61472269)
文摘
在使用微粒群算法对大规模优化问题求解时往往需要大量的目标函数评价次数,从而耗费大量的计算时间,而分布式计算和通用计算图形处理器(General Purpose GPU)可以减少耗时.本文通过将微粒群算法在分布式框架下GPU并行计算实现,将粒子分到各个计算节点进行异步计算,而每个节点中的粒子实行同步进化,从而提高微粒群算法求解大规模优化问题的效率.实验方法采用5个标准测试函数进行测试,实验结果表明本文方法在在求解大规模优化问题时在计算效率上有了数倍至数十倍的提升.
关键词
微粒群算法
大规模优化问题
分布式
计算
通用计算图形处理器
技术
异步
计算
Keywords
particle swarm optimization(PSO)
large-scale optimization problems
distributed computing
GPGPU technique
asynchronous computing
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于GPU的全波形并行LM分解算法
被引量:
1
16
作者
张军军
邢帅
李鹏程
夏琴
机构
信息工程大学
出处
《测绘科学技术学报》
CSCD
北大核心
2016年第4期421-425,共5页
基金
国家自然科学基金项目(41371436)
信息工程大学地理空间信息学院学位论文创新与创优基金项目(XS201506)
文摘
波形分解是机载激光雷达全波形数据处理的重要基础工作,通过求解波形函数模型的参数,将波形数据利用具体的函数模型拟合出来,实现对全波形及其中各个子波形函数表达。LM(Levenberg-Marquardt)算法及其改进的算法是波形分解中对参数进行拟合求解的常用方法。针对LM算法在参数拟合计算的过程中存在大量迭代和矩阵运算,提出了基于线程块组和线程两级并行粒度的并行计算方案。将串行多次循环迭代求解参数改为单次并行计算取最佳值实现对参数的选择,将矩阵运算进行线程块的协同并行计算,实现了LM算法在通用计算图形处理器上的并行计算。实验证明,在规定阈值条件下,并行LM降低了算法的迭代次数,提高了波形分解LM算法的计算效率,为提高波形分解的处理效率提供了研究思路。
关键词
全波形激光雷达
波形分解
通用计算图形处理器
LEVENBERG-MARQUARDT算法
并行
Keywords
full-waveform LiDAR
decomposition of waveforms
GPU
Levenberg-Marquardt algorithm
parallel
分类号
P237 [天文地球—摄影测量与遥感]
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于GPGPU的Lattice-Boltzmann数值模拟算法
被引量:
11
17
作者
周季夫
钟诚文
尹世群
解建飞
张勇
机构
西北工业大学高性能计算研究与发展中心
西南大学计算机与信息科学学院
西北工业大学翼型
中国人民解放军
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2008年第7期912-918,共7页
基金
航空科学基金(20061453020)
西北工业大学基础科学研究基金重点项目
文摘
对Lattice Boltzmann方法(LBM)在GPGPU下的建模和算法进行了一系列研究,使得该方法在GPU下的计算加速比提升,大大缩短计算过程的时间消耗.重新设计了GPU的计算流程,在舍弃pixel buffer离屏渲染的同时,采用最新的帧缓存对象,多重纹理、多通道渲染和乒乓技术来设计一套基于方腔的LBM数值模拟程序,最终使GPU的计算时间缩短到CPU计算时间的六分之一.
关键词
基于
图形
处理器
的
通用
计算
帧缓存扩展
多重渲染目标
Lattice-Boltzmann方法
反弹边界
乒乓技术
Keywords
general purpose graphic processing unit (GPGPU)
frame buffer object
multiple render target
Lattice-Boltzmann method
rebound boundary
ping-pang technique
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于GPGPU的并行影像匹配算法
被引量:
44
18
作者
肖汉
张祖勋
机构
武汉大学遥感信息工程学院
郑州师范高等专科学校
出处
《测绘学报》
EI
CSCD
北大核心
2010年第1期46-51,共6页
基金
国家自然科学基金(40771177)
国家863计划(2006AA12Z136)
河南省重点科技攻关项目(072102360026)
文摘
提出一种基于GPGPU的CUDA架构快速影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化数据存储结构,提高数据访问效率。实验结果表明,并行算法充分利用GPU的并行处理能力,在处理1280×1024分辨率的8位灰度图像时可达到最高多处理器warp占有率,速度是基于CPU实现的7倍。CUDA在高运算强度数据处理中呈现出的实时处理能力和计算能力,为进一步加速影像匹配性能和GPU通用计算提供了新的方法和思路。
关键词
细粒度并行
计算
图形
处理器
的
通用
计算
统一
计算
设备架构
影像匹配
单指令多线程
Keywords
fine-grained parallel computing
GPGPU
CUDA
image matching
SlMT
分类号
TP338.6 [自动化与计算机技术—计算机系统结构]
P237 [天文地球—摄影测量与遥感]
在线阅读
下载PDF
职称材料
题名
基于GPU的3D距离变换
19
作者
田绪红
司徒志远
陈茂资
韩国强
机构
华南农业大学信息学院
华南理工大学计算机科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2008年第9期2847-2849,共3页
基金
国家自然科学基金资助项目(60573019)
广东省科技计划资助项目(2007B020706006
2007B020715001)
文摘
距离变换在图像处理中有着非常广泛的应用。由于3D图像数据的复杂性,传统基于CPU的3D距离变换效率较低。为此,研究了将3D图像数据有效地组织到纹理中存储的方法,设计并实现了基于GPU的3D距离变换并行算法。实验结果表明,相对基于CPU的算法,该方法具有非常高的加速比。
关键词
三维距离变换
图形
处理器
通用
计算
并行算法
Keywords
3D distance transform
GPGPU
parallel algorithm
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
流式缩减技术在GPU上的研究与应用
被引量:
1
20
作者
曲洋
黄永忠
王磊
机构
解放军信息工程大学信息工程学院计算机系
出处
《计算机工程与设计》
CSCD
北大核心
2008年第5期1268-1270,1275,共4页
文摘
随着GPU通用计算技术应用的不断深入,如何把某些并行计算任务从传统的CPU平台向GPU平台转移,把串行编程模型向并行的流式编程模型转变等,已经成为了研究的热点。讨论了基于GPU的流式编程模型,探讨了基于流式编程模型的GPU与CPU编程之间的差别与联系,最后描述了一种在GPU上的流式缩减操作算法的设计与实现。为把图形处理器应用在通用计算领域提供参考和帮助。
关键词
图形
处理器
通用
计算
技术
流式编程
流式缩减
Keywords
GPGPU
style of stream programming
streaming curtailment
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
图形处理器通用计算的实现与验证
齐记
杨孔庆
杨磊
《计算机工程与应用》
CSCD
北大核心
2009
3
在线阅读
下载PDF
职称材料
2
不规则任务在图形处理器集群上的调度策略
平凡
汤小春
潘彦宇
李战怀
《计算机应用》
CSCD
北大核心
2021
2
在线阅读
下载PDF
职称材料
3
基于图形处理器的涪江中段流域降雨汇流模拟方法研究
吕朝阳
陈军
刘意
孙伟
肖俊文
《成都信息工程大学学报》
2019
1
在线阅读
下载PDF
职称材料
4
用于迭代法潮流计算的改进Jacobi预处理方法
唐灿
董树锋
任雪桂
尹璐
鞠力
《电力系统自动化》
EI
CSCD
北大核心
2018
8
在线阅读
下载PDF
职称材料
5
基于GPGPU的大整数矩阵行列式快速准确计算方法
魏渐俊
陈良育
《计算机工程》
CAS
CSCD
北大核心
2018
1
在线阅读
下载PDF
职称材料
6
基于CUDA的细粒度并行计算模型研究
肖汉
肖波
冯娜
杨锦锦
《计算机与数字工程》
2013
1
在线阅读
下载PDF
职称材料
7
细粒度并行计算编程模型研究
刘伟峰
王智广
《微电子学与计算机》
CSCD
北大核心
2008
10
在线阅读
下载PDF
职称材料
8
基于光线投射的电磁态势实时可视化
高颖
陈旭
周士军
郭淑霞
《兵工学报》
EI
CAS
CSCD
北大核心
2015
5
在线阅读
下载PDF
职称材料
9
面向CPU-GPU架构的源到源自动映射方法
朱正东
刘袁
魏洪昌
颜康
王寅峰
董小社
《计算机工程与应用》
CSCD
北大核心
2015
2
在线阅读
下载PDF
职称材料
10
GPU加速的分段Top-k查询算法
黄玉龙
邹循进
刘奎
苏本跃
《计算机应用》
CSCD
北大核心
2014
1
在线阅读
下载PDF
职称材料
11
CPU-GPU协同加速Kriging插值的负载均衡方法
姜春雷
张树清
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2015
2
在线阅读
下载PDF
职称材料
12
基于GPU加速的实时视频超分辨率重建
陈湘骥
韩国强
张芝源
《计算机应用》
CSCD
北大核心
2013
1
在线阅读
下载PDF
职称材料
13
利用GPGPU进行快速稀疏磁共振数据重建
王聪
冯衍秋
《计算机工程与应用》
CSCD
北大核心
2011
0
在线阅读
下载PDF
职称材料
14
动态模式识别算法的GPU平台实现
林文愉
王聪
《计算技术与自动化》
2013
0
在线阅读
下载PDF
职称材料
15
基于分布式框架的并行PSO算法
桑渊博
曾建潮
谭瑛
孙超利
《中北大学学报(自然科学版)》
CAS
2019
2
在线阅读
下载PDF
职称材料
16
基于GPU的全波形并行LM分解算法
张军军
邢帅
李鹏程
夏琴
《测绘科学技术学报》
CSCD
北大核心
2016
1
在线阅读
下载PDF
职称材料
17
基于GPGPU的Lattice-Boltzmann数值模拟算法
周季夫
钟诚文
尹世群
解建飞
张勇
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2008
11
在线阅读
下载PDF
职称材料
18
基于GPGPU的并行影像匹配算法
肖汉
张祖勋
《测绘学报》
EI
CSCD
北大核心
2010
44
在线阅读
下载PDF
职称材料
19
基于GPU的3D距离变换
田绪红
司徒志远
陈茂资
韩国强
《计算机应用研究》
CSCD
北大核心
2008
0
在线阅读
下载PDF
职称材料
20
流式缩减技术在GPU上的研究与应用
曲洋
黄永忠
王磊
《计算机工程与设计》
CSCD
北大核心
2008
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部