期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于重复数据删除技术的云中云存储系统
被引量:
14
1
作者
毛波
叶阁焰
+2 位作者
蓝琰佳
张杨松
吴素贞
《计算机研究与发展》
EI
CSCD
北大核心
2015年第6期1278-1287,共10页
随着云存储技术的快速发展和应用,越来越多的企业和用户都开始将数据从本地转移到云存储服务提供商进行存储.但是,在享受云存储高质量服务的同时,将数据仅仅存储于单个云存储服务商中会带来一定的风险,例如云存储服务提供商的垄断、数...
随着云存储技术的快速发展和应用,越来越多的企业和用户都开始将数据从本地转移到云存储服务提供商进行存储.但是,在享受云存储高质量服务的同时,将数据仅仅存储于单个云存储服务商中会带来一定的风险,例如云存储服务提供商的垄断、数据可用性和安全性等问题.为了解决这个问题,提出了一种基于重复数据删除技术的云中云存储系统架构,首先消除云存储系统中的冗余数据量,然后基于重复数据删除集中的数据块引用率将数据块以复制和纠删码2种数据布局方式存储在多个云存储服务提供商中.基于复制的数据布局方式易于实现部署,但是存储开销大;基于纠删码的数据布局方式存储开销小,但是需要编码和解码,计算开销大.为了充分挖掘复制和纠删码数据布局的优点并结合重复数据删除技术中数据引用的特点,新方法用复制方式存储高引用数据块,用纠删码方式存储其他数据块,从而使系统整体性能和成本达到较优.通过原型系统的实现和测试验证了相比现有云中云存储策略,新方法在性能和成本上都有大幅度提高.
展开更多
关键词
云中云
重复数据删除
数据布局
复制
纠删码
在线阅读
下载PDF
职称材料
基于随机采样的方差缩减优化算法
2
作者
郭振华
闫瑞栋
+2 位作者
邱志勇
赵雅倩
李仁刚
《计算机科学与探索》
北大核心
2025年第3期667-681,共15页
随机梯度下降(SGD)算法因其性能优异而引起了机器学习和深度学习等领域研究人员的广泛关注。然而,SGD使用单样本随机梯度近似样本全梯度导致算法在迭代过程中引入了额外的方差,使得算法的收敛曲线震荡甚至发散,导致其收敛速率缓慢。因此...
随机梯度下降(SGD)算法因其性能优异而引起了机器学习和深度学习等领域研究人员的广泛关注。然而,SGD使用单样本随机梯度近似样本全梯度导致算法在迭代过程中引入了额外的方差,使得算法的收敛曲线震荡甚至发散,导致其收敛速率缓慢。因此,有效减小方差成为当前关键挑战。提出了一种基于小批量随机采样的方差缩减优化算法(DM-SRG),并应用于求解凸优化及非凸优化问题。算法主要特征在于设计了内外双循环结构:外循环结构采用小批量随机样本计算梯度近似全梯度,以达到减少梯度计算开销的目的;内循环结构采用小批量随机样本计算梯度并代替单样本随机梯度,提升算法收敛稳定性。针对非凸目标函数与凸目标函数,理论分析证明了DMSRG算法具有次线性收敛速率。此外,设计了基于计算单元性能评估模型的动态样本容量调整策略,以提高系统训练效率。为评估算法的有效性,分别在不同规模的真实数据集上开展了数值模拟实验。实验结果表明算法较对比算法损失函数减少18.1%并且平均耗时降低8.22%。
展开更多
关键词
随机梯度下降
方差缩减
凸优化
非凸优化
收敛速率
在线阅读
下载PDF
职称材料
分布式训练系统及其优化算法综述
被引量:
8
3
作者
王恩东
闫瑞栋
+1 位作者
郭振华
赵雅倩
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第1期1-28,共28页
人工智能利用各种优化技术从海量训练样本中学习关键特征或知识以提高解的质量,这对训练方法提出了更高要求.然而,传统单机训练无法满足存储与计算性能等方面的需求.因此,利用多个计算节点协同的分布式训练系统成为热点研究方向之一.本...
人工智能利用各种优化技术从海量训练样本中学习关键特征或知识以提高解的质量,这对训练方法提出了更高要求.然而,传统单机训练无法满足存储与计算性能等方面的需求.因此,利用多个计算节点协同的分布式训练系统成为热点研究方向之一.本文首先阐述了单机训练面临的主要挑战.其次,分析了分布式训练系统亟需解决的三个关键问题.基于上述问题归纳了分布式训练系统的通用框架与四个核心组件.围绕各个组件涉及的技术,梳理了代表性研究成果.在此基础之上,总结了基于并行随机梯度下降算法的中心化与去中心化架构研究分支,并对各研究分支优化算法与应用进行综述.最后,提出了未来可能的研究方向.
展开更多
关键词
分布式训练系统
(去)中心化架构
中心化架构算法
(异)同步算法
并行随机梯度下降
收敛速率
在线阅读
下载PDF
职称材料
可重构高速数据加密系统设计和实现
被引量:
4
4
作者
王凯
刘凯
+3 位作者
李拓
符云越
刘唐
王骞
《电子测量技术》
北大核心
2021年第19期8-15,共8页
为解决SM4传统加解密方式存在的速度慢、效率低、占用CPU计算资源的问题,提出了一种可重构高速数据加密系统。该系统基于Xilinx Virtex UltraScale VU9p FPGA,利用PCIe热插拔特性,可快速应用于办公主机或服务器,通过PCIe高速接口实现数...
为解决SM4传统加解密方式存在的速度慢、效率低、占用CPU计算资源的问题,提出了一种可重构高速数据加密系统。该系统基于Xilinx Virtex UltraScale VU9p FPGA,利用PCIe热插拔特性,可快速应用于办公主机或服务器,通过PCIe高速接口实现数据的快速传输,在FPGA内实现并行可调度SM4算法逻辑,设计有专用DMA模块,实现旁路主机CPU传输明文密文,减少主机端资源占用;采用FPGA实现的加解密系统具备可重构性,大大降低了算法迭代的硬件成本。系统分析测试和实验结果表明,该系统实现了数据的高速可靠传输与加密,总线速率达到8 GT/s,能有效满足大容量数据快速加解密的需求;采用并行可调度流水线加解密,较CPU实现方式,加解密速率提升约25.78倍。
展开更多
关键词
PCIe高速总线
SM4加解密
直接存储器访问
高速数据传输
现场可编程门阵列(FPGA)
在线阅读
下载PDF
职称材料
基于SystemVerilog的图像采集压缩卡芯片验证平台设计
被引量:
2
5
作者
王凯
王骞
+2 位作者
符云越
李拓
刘凯
《电子测量技术》
北大核心
2021年第20期29-36,共8页
验证平台对视频采集压缩卡芯片的开发设计有重要作用。针对传统的验证平台在代码覆盖率以及测试效率方面存在的不足,设计了一款基于SystemVerilog搭建的验证平台,该验证平台采用面向对象程序语言设计,其中,PCIe host(RP)端采用Xilinx I...
验证平台对视频采集压缩卡芯片的开发设计有重要作用。针对传统的验证平台在代码覆盖率以及测试效率方面存在的不足,设计了一款基于SystemVerilog搭建的验证平台,该验证平台采用面向对象程序语言设计,其中,PCIe host(RP)端采用Xilinx IP建模链路层和物理层,保证了PCIe总线环境与真实主机板卡环境相同;外部验证环境采用SystemVerilog分层设计的方法,并采用类思想进行上层验证环境设计,使较多验证组件能够移植至同一接口协议的不同类SoC;此外,在自动化验证阶段,通过仿真报告自动判断case状态,调整随机基准以及在覆盖率报告中追踪未覆盖模块路径,极大地改善了代码的边角覆盖情况,加速了回归收敛。从采集压缩仿真过程、验证自动化以及覆盖率3个方面对该验证平台进行了分析,结果表明,该验证平台可快速完成相似设计的验证模组横向移植,提高相似功能芯片的验证可靠性,节省人力,加快仿真进度,加速覆盖率收敛,缩短验证周期,增加流片成功率。
展开更多
关键词
SYSTEMVERILOG
功能验证
自动化验证
覆盖率收敛
在线阅读
下载PDF
职称材料
题名
一种基于重复数据删除技术的云中云存储系统
被引量:
14
1
作者
毛波
叶阁焰
蓝琰佳
张杨松
吴素贞
机构
厦门大学软件学院
厦门大学
信息
科学与
技术
学院计算机科学系
高效能服务器和存储
技术
国家重点实验室(
山东海量信息技术研究院
)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第6期1278-1287,共10页
基金
国家自然科学基金项目(61472336
61402385)
+3 种基金
国家科技支撑计划基金项目(2015BAH16F02)
教育部留学回国人员科研启动基金
高效能服务器和存储技术国家重点实验室开放课题(2014HSSA04)
中央高校基本科研业务费专项资金项目(20720140515)
文摘
随着云存储技术的快速发展和应用,越来越多的企业和用户都开始将数据从本地转移到云存储服务提供商进行存储.但是,在享受云存储高质量服务的同时,将数据仅仅存储于单个云存储服务商中会带来一定的风险,例如云存储服务提供商的垄断、数据可用性和安全性等问题.为了解决这个问题,提出了一种基于重复数据删除技术的云中云存储系统架构,首先消除云存储系统中的冗余数据量,然后基于重复数据删除集中的数据块引用率将数据块以复制和纠删码2种数据布局方式存储在多个云存储服务提供商中.基于复制的数据布局方式易于实现部署,但是存储开销大;基于纠删码的数据布局方式存储开销小,但是需要编码和解码,计算开销大.为了充分挖掘复制和纠删码数据布局的优点并结合重复数据删除技术中数据引用的特点,新方法用复制方式存储高引用数据块,用纠删码方式存储其他数据块,从而使系统整体性能和成本达到较优.通过原型系统的实现和测试验证了相比现有云中云存储策略,新方法在性能和成本上都有大幅度提高.
关键词
云中云
重复数据删除
数据布局
复制
纠删码
Keywords
cloud-of-clouds
data deduplication
data layout
replication
erasure code
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于随机采样的方差缩减优化算法
2
作者
郭振华
闫瑞栋
邱志勇
赵雅倩
李仁刚
机构
山东海量信息技术研究院
出处
《计算机科学与探索》
北大核心
2025年第3期667-681,共15页
基金
新一代人工智能国家科技重大专项(2021ZD0113001)。
文摘
随机梯度下降(SGD)算法因其性能优异而引起了机器学习和深度学习等领域研究人员的广泛关注。然而,SGD使用单样本随机梯度近似样本全梯度导致算法在迭代过程中引入了额外的方差,使得算法的收敛曲线震荡甚至发散,导致其收敛速率缓慢。因此,有效减小方差成为当前关键挑战。提出了一种基于小批量随机采样的方差缩减优化算法(DM-SRG),并应用于求解凸优化及非凸优化问题。算法主要特征在于设计了内外双循环结构:外循环结构采用小批量随机样本计算梯度近似全梯度,以达到减少梯度计算开销的目的;内循环结构采用小批量随机样本计算梯度并代替单样本随机梯度,提升算法收敛稳定性。针对非凸目标函数与凸目标函数,理论分析证明了DMSRG算法具有次线性收敛速率。此外,设计了基于计算单元性能评估模型的动态样本容量调整策略,以提高系统训练效率。为评估算法的有效性,分别在不同规模的真实数据集上开展了数值模拟实验。实验结果表明算法较对比算法损失函数减少18.1%并且平均耗时降低8.22%。
关键词
随机梯度下降
方差缩减
凸优化
非凸优化
收敛速率
Keywords
stochastic gradient descent
variance reduction
convex optimization
non-convex optimization
convergence rate
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
分布式训练系统及其优化算法综述
被引量:
8
3
作者
王恩东
闫瑞栋
郭振华
赵雅倩
机构
山东海量信息技术研究院
浪潮(北京)电子
信息
产业有限公司
浪潮电子
信息
产业股份有限公司
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第1期1-28,共28页
基金
山东省自然科学基金项目(ZR2021QF073)资助。
文摘
人工智能利用各种优化技术从海量训练样本中学习关键特征或知识以提高解的质量,这对训练方法提出了更高要求.然而,传统单机训练无法满足存储与计算性能等方面的需求.因此,利用多个计算节点协同的分布式训练系统成为热点研究方向之一.本文首先阐述了单机训练面临的主要挑战.其次,分析了分布式训练系统亟需解决的三个关键问题.基于上述问题归纳了分布式训练系统的通用框架与四个核心组件.围绕各个组件涉及的技术,梳理了代表性研究成果.在此基础之上,总结了基于并行随机梯度下降算法的中心化与去中心化架构研究分支,并对各研究分支优化算法与应用进行综述.最后,提出了未来可能的研究方向.
关键词
分布式训练系统
(去)中心化架构
中心化架构算法
(异)同步算法
并行随机梯度下降
收敛速率
Keywords
distributed training system
decentralized algorithms
centralized algorithms
(a)synchro-nous algorithms
parallel stochastic gradient descent
convergence rate
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
可重构高速数据加密系统设计和实现
被引量:
4
4
作者
王凯
刘凯
李拓
符云越
刘唐
王骞
机构
山东海量信息技术研究院
浪潮电子
信息
产业股份有限公司高效能服务器和存储
技术
国家重点实验室
山东
浪潮人工智能
研究院
有限公司
出处
《电子测量技术》
北大核心
2021年第19期8-15,共8页
基金
山东省重大科技创新工程(2019JZZY010103)项目资助。
文摘
为解决SM4传统加解密方式存在的速度慢、效率低、占用CPU计算资源的问题,提出了一种可重构高速数据加密系统。该系统基于Xilinx Virtex UltraScale VU9p FPGA,利用PCIe热插拔特性,可快速应用于办公主机或服务器,通过PCIe高速接口实现数据的快速传输,在FPGA内实现并行可调度SM4算法逻辑,设计有专用DMA模块,实现旁路主机CPU传输明文密文,减少主机端资源占用;采用FPGA实现的加解密系统具备可重构性,大大降低了算法迭代的硬件成本。系统分析测试和实验结果表明,该系统实现了数据的高速可靠传输与加密,总线速率达到8 GT/s,能有效满足大容量数据快速加解密的需求;采用并行可调度流水线加解密,较CPU实现方式,加解密速率提升约25.78倍。
关键词
PCIe高速总线
SM4加解密
直接存储器访问
高速数据传输
现场可编程门阵列(FPGA)
Keywords
PCIe high-speed bus
SM4 encryption and decryption
direct memory access
high-speed data transmission
field programmable gate array(FPGA)
分类号
TP303 [自动化与计算机技术—计算机系统结构]
TP309 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于SystemVerilog的图像采集压缩卡芯片验证平台设计
被引量:
2
5
作者
王凯
王骞
符云越
李拓
刘凯
机构
山东海量信息技术研究院
浪潮电子
信息
产业股份有限公司高效能服务器和存储
技术
国家重点实验室
山东
浪潮人工智能
研究院
有限公司
出处
《电子测量技术》
北大核心
2021年第20期29-36,共8页
基金
山东省重大科技创新工程项目(2019JZZY010103)资助。
文摘
验证平台对视频采集压缩卡芯片的开发设计有重要作用。针对传统的验证平台在代码覆盖率以及测试效率方面存在的不足,设计了一款基于SystemVerilog搭建的验证平台,该验证平台采用面向对象程序语言设计,其中,PCIe host(RP)端采用Xilinx IP建模链路层和物理层,保证了PCIe总线环境与真实主机板卡环境相同;外部验证环境采用SystemVerilog分层设计的方法,并采用类思想进行上层验证环境设计,使较多验证组件能够移植至同一接口协议的不同类SoC;此外,在自动化验证阶段,通过仿真报告自动判断case状态,调整随机基准以及在覆盖率报告中追踪未覆盖模块路径,极大地改善了代码的边角覆盖情况,加速了回归收敛。从采集压缩仿真过程、验证自动化以及覆盖率3个方面对该验证平台进行了分析,结果表明,该验证平台可快速完成相似设计的验证模组横向移植,提高相似功能芯片的验证可靠性,节省人力,加快仿真进度,加速覆盖率收敛,缩短验证周期,增加流片成功率。
关键词
SYSTEMVERILOG
功能验证
自动化验证
覆盖率收敛
Keywords
SystemVerilog
functional verification
automated verification
coverage convergence
分类号
TN402 [电子电信—微电子学与固体电子学]
TP391.9 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于重复数据删除技术的云中云存储系统
毛波
叶阁焰
蓝琰佳
张杨松
吴素贞
《计算机研究与发展》
EI
CSCD
北大核心
2015
14
在线阅读
下载PDF
职称材料
2
基于随机采样的方差缩减优化算法
郭振华
闫瑞栋
邱志勇
赵雅倩
李仁刚
《计算机科学与探索》
北大核心
2025
0
在线阅读
下载PDF
职称材料
3
分布式训练系统及其优化算法综述
王恩东
闫瑞栋
郭振华
赵雅倩
《计算机学报》
EI
CAS
CSCD
北大核心
2024
8
在线阅读
下载PDF
职称材料
4
可重构高速数据加密系统设计和实现
王凯
刘凯
李拓
符云越
刘唐
王骞
《电子测量技术》
北大核心
2021
4
在线阅读
下载PDF
职称材料
5
基于SystemVerilog的图像采集压缩卡芯片验证平台设计
王凯
王骞
符云越
李拓
刘凯
《电子测量技术》
北大核心
2021
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部