期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于ARM SVE的光滑粒子流体动力学SIMD加速方法 被引量:4
1
作者 范小康 夏泽宇 +1 位作者 龙思凡 杨灿群 《计算机工程与科学》 CSCD 北大核心 2021年第6期989-996,共8页
光滑粒子流体动力学(SPH)是近年来兴起的一种无网格的粒子方法,SPH在处理大变形、运动物质表面以及自由表面等问题时优势明显,在数值模拟领域得到了非常广泛的应用,是一种典型的科学计算应用。作为一种显式的粒子方法,SPH在每一个迭代... 光滑粒子流体动力学(SPH)是近年来兴起的一种无网格的粒子方法,SPH在处理大变形、运动物质表面以及自由表面等问题时优势明显,在数值模拟领域得到了非常广泛的应用,是一种典型的科学计算应用。作为一种显式的粒子方法,SPH在每一个迭代步都需要计算大量的粒子间相互作用,计算量非常大,如何提高SPH的计算效率成为研究热点。可伸缩矢量扩展(SVE)是ARM针对高性能计算推出的下一代SIMD指令集,基于SVE研究了SPH方法的SIMD加速方法,取得了显著的加速效果。 展开更多
关键词 可伸缩矢量扩展 光滑粒子流体动力学 向量化
在线阅读 下载PDF
基于便笺式存储器的向量化SpMV算法的性能评估与分析
2
作者 张宗茂 董德尊 +3 位作者 王子聪 常俊胜 张晓云 王绍聪 《计算机工程与科学》 CSCD 北大核心 2024年第9期1521-1528,共8页
便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算... 便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算过程中对稠密输入向量的不规则访问操作会导致大量Cache访问请求失效,从而影响SpMV算法执行效率。为了评估便笺式存储器对SpMV向量算法的性能影响,使用ARM SVE指令对基于CSR格式的SpMV算法向量化,并将算法中的热点数据即稠密输入向量存储在便笺式存储器中,在集成了便笺式存储器的ARM架构处理器中对SpMV向量算法进行了性能分析。在gem5模拟器中针对来自真实应用程序的2562个稀疏矩阵进行了实验。实验结果表明,集成了便笺式存储器的处理器与传统多级Cache处理器相比,针对向量化SpMV算法能够实现的最大加速比为7.45,平均加速比为1.11。 展开更多
关键词 稀疏矩阵向量乘 便笺式存储器 CSR arm sve
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部