期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于ARM SVE的光滑粒子流体动力学SIMD加速方法
被引量:
4
1
作者
范小康
夏泽宇
+1 位作者
龙思凡
杨灿群
《计算机工程与科学》
CSCD
北大核心
2021年第6期989-996,共8页
光滑粒子流体动力学(SPH)是近年来兴起的一种无网格的粒子方法,SPH在处理大变形、运动物质表面以及自由表面等问题时优势明显,在数值模拟领域得到了非常广泛的应用,是一种典型的科学计算应用。作为一种显式的粒子方法,SPH在每一个迭代...
光滑粒子流体动力学(SPH)是近年来兴起的一种无网格的粒子方法,SPH在处理大变形、运动物质表面以及自由表面等问题时优势明显,在数值模拟领域得到了非常广泛的应用,是一种典型的科学计算应用。作为一种显式的粒子方法,SPH在每一个迭代步都需要计算大量的粒子间相互作用,计算量非常大,如何提高SPH的计算效率成为研究热点。可伸缩矢量扩展(SVE)是ARM针对高性能计算推出的下一代SIMD指令集,基于SVE研究了SPH方法的SIMD加速方法,取得了显著的加速效果。
展开更多
关键词
可伸缩矢量扩展
光滑粒子流体动力学
向量化
在线阅读
下载PDF
职称材料
基于便笺式存储器的向量化SpMV算法的性能评估与分析
2
作者
张宗茂
董德尊
+3 位作者
王子聪
常俊胜
张晓云
王绍聪
《计算机工程与科学》
CSCD
北大核心
2024年第9期1521-1528,共8页
便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算...
便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算过程中对稠密输入向量的不规则访问操作会导致大量Cache访问请求失效,从而影响SpMV算法执行效率。为了评估便笺式存储器对SpMV向量算法的性能影响,使用ARM SVE指令对基于CSR格式的SpMV算法向量化,并将算法中的热点数据即稠密输入向量存储在便笺式存储器中,在集成了便笺式存储器的ARM架构处理器中对SpMV向量算法进行了性能分析。在gem5模拟器中针对来自真实应用程序的2562个稀疏矩阵进行了实验。实验结果表明,集成了便笺式存储器的处理器与传统多级Cache处理器相比,针对向量化SpMV算法能够实现的最大加速比为7.45,平均加速比为1.11。
展开更多
关键词
稀疏矩阵向量乘
便笺式存储器
CSR
arm
sve
在线阅读
下载PDF
职称材料
题名
基于ARM SVE的光滑粒子流体动力学SIMD加速方法
被引量:
4
1
作者
范小康
夏泽宇
龙思凡
杨灿群
机构
国防科技大学计算机学院
出处
《计算机工程与科学》
CSCD
北大核心
2021年第6期989-996,共8页
基金
国家重点研发计划(2018YFB0204301)。
文摘
光滑粒子流体动力学(SPH)是近年来兴起的一种无网格的粒子方法,SPH在处理大变形、运动物质表面以及自由表面等问题时优势明显,在数值模拟领域得到了非常广泛的应用,是一种典型的科学计算应用。作为一种显式的粒子方法,SPH在每一个迭代步都需要计算大量的粒子间相互作用,计算量非常大,如何提高SPH的计算效率成为研究热点。可伸缩矢量扩展(SVE)是ARM针对高性能计算推出的下一代SIMD指令集,基于SVE研究了SPH方法的SIMD加速方法,取得了显著的加速效果。
关键词
可伸缩矢量扩展
光滑粒子流体动力学
向量化
Keywords
scalable
vector
extension
(
sve
)
smoothed particle hydrodynamics
vector
ization
分类号
O351.2 [理学—流体力学]
在线阅读
下载PDF
职称材料
题名
基于便笺式存储器的向量化SpMV算法的性能评估与分析
2
作者
张宗茂
董德尊
王子聪
常俊胜
张晓云
王绍聪
机构
国防科技大学计算机学院
出处
《计算机工程与科学》
CSCD
北大核心
2024年第9期1521-1528,共8页
基金
湖南省杰出青年科学基金(2021JJ10050)
国防科技大学科研计划项目(ZK22-23)。
文摘
便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算过程中对稠密输入向量的不规则访问操作会导致大量Cache访问请求失效,从而影响SpMV算法执行效率。为了评估便笺式存储器对SpMV向量算法的性能影响,使用ARM SVE指令对基于CSR格式的SpMV算法向量化,并将算法中的热点数据即稠密输入向量存储在便笺式存储器中,在集成了便笺式存储器的ARM架构处理器中对SpMV向量算法进行了性能分析。在gem5模拟器中针对来自真实应用程序的2562个稀疏矩阵进行了实验。实验结果表明,集成了便笺式存储器的处理器与传统多级Cache处理器相比,针对向量化SpMV算法能够实现的最大加速比为7.45,平均加速比为1.11。
关键词
稀疏矩阵向量乘
便笺式存储器
CSR
arm
sve
Keywords
sparse matrix
vector
multiplication
scratchpad memory
compressed sparse row(CSR)
arm
scalable
vector
extension
(
sve
)
分类号
TP302 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于ARM SVE的光滑粒子流体动力学SIMD加速方法
范小康
夏泽宇
龙思凡
杨灿群
《计算机工程与科学》
CSCD
北大核心
2021
4
在线阅读
下载PDF
职称材料
2
基于便笺式存储器的向量化SpMV算法的性能评估与分析
张宗茂
董德尊
王子聪
常俊胜
张晓云
王绍聪
《计算机工程与科学》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部