期刊文献+

基于CUDA的高速FFT计算 被引量:22

High performance FFT computation based on CUDA
在线阅读 下载PDF
导出
摘要 针对快速傅里叶算法FFT在图形图像处理和科学计算领域的重要作用,提出了一种基于CUDA的高速FFT计算方法,在分析GPU硬件平台执行模式及FFT算法并行性特征的基础上,采用多线程并行的映射方法实现算法,并从存储层次优化算法。实验结果表明了该算法的高效性,且优化后的FFT加速比能达到CUFFT库加速比的2~6倍。 The Fourier transform is essential for many image processing and scientific computing techniques.This paper presented an implementation to accelerate FFT computation based on CUDA.Based on the analysis of the GPU architecture and algorithm parallelism feature,brought a mapping strategy used multithread,and explored the optimization in memory hierarchy.The results on CUDA show an improvement,the average speedup reaches 2~6X compared with CUFFT supplied by NVIDIA library.
出处 《计算机应用研究》 CSCD 北大核心 2011年第4期1556-1559,共4页 Application Research of Computers
基金 国家"863"计划资助项目(2009AA01Z110) 西北工业大学研究生创新资助项目(09024)
关键词 图形处理器 统一计算架构 映射策略 存储层次 GPU(graphics processor units) CUDA(compute unified device architecture) mapping strategy memory hie-rarchy
  • 相关文献

参考文献9

  • 1JAMES W C, JOHN W T. An algorithm for the machine calculation of complex Fourier series[J]. Mathematics of Computation,1965, 19(2) :297-301.
  • 2HPC challenge benchmark[ EB/OL]. [2010- 11-01 ]. http://icl. cs. utk. edu./hpcc/.
  • 3NAS parallel benchmarks [ EB/OL ]. [ 2010- 05- 23 ]. http ://www. nas. nasa. gov/Resources/Soflware/npb, html.
  • 4General-purpose computation using graphics hardware [ EB/OL 1. [2010-05-23 ]. http ://www. gpgpu, org/.
  • 5KENNETH M, EDWARD A. The FFT on a GPU[ C]//Proc of the ACM SIGGRAPH/EUROGRAPHICS Conference on Graphics Hardware, San Diego, California: Eurographies Association, 2003: 112- 119.
  • 6CUDA programming guide version 3.0 [ K]. [ S.L ] : NVIDIA Corp, 2009.
  • 7CUDA CUFFr Library[R]. [S.L]: NVIDIA Corp, 2007.
  • 8FFTWE EB/OL]. [2010-05-23]. http://www, fftw. org/.
  • 9MUTHU M B, RAJESH B. Optimizing sparse matrix-vector multiplication on GPUs[ R]. [S.L ]: IBM,2008.

同被引文献192

引证文献22

二级引证文献77

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部