期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
安全自主可控的国产化FPGA神经网络部署框架研究 被引量:1
1
作者 刘济源 王保平 +1 位作者 汤勇明 李鹤 《集成电路与嵌入式系统》 2024年第9期25-35,共11页
针对现有的深度学习边缘应用依赖非国产FPGA架构和加密IP实现产生潜在的安全问题,并且难以快速部署在IP不足、尚在发展中的国产化FPGA平台,设计了一种基于国产FPGA的神经网络硬件部署框架,配备独立于FPGA厂商的硬件IP库,实现国产FPGA神... 针对现有的深度学习边缘应用依赖非国产FPGA架构和加密IP实现产生潜在的安全问题,并且难以快速部署在IP不足、尚在发展中的国产化FPGA平台,设计了一种基于国产FPGA的神经网络硬件部署框架,配备独立于FPGA厂商的硬件IP库,实现国产FPGA神经网络部署的安全自主可控,并以此为基础进行了验证性实验。实验结果表明,本文所提出的神经网络部署框架具备实用功能,基于所提出框架能够实现国产FPGA神经网络快速部署,并且基于框架实现的16位精度Lenet5网络推理速度提高了6.67倍,仅为0.024 ms,GOPS吞吐率提升了5.13倍,达到147.8 GOPS;框架针对卷积计算转矩阵的数据降维进行了特定优化,相比基于Intel Xeon E 2276M CPU,进行卷积数据预转换加速了124.9倍。 展开更多
关键词 FPGA 神经网络 硬件部署框架 Lenet5 DSP
在线阅读 下载PDF
基于MPSoC的轻量化汽车检测系统及硬件加速平台设计与优化
2
作者 王伟 王坤 +1 位作者 许圳兴 付相为 《国外电子测量技术》 2024年第6期161-169,共9页
针对车辆分类检测在精度和实时性方面存在的挑战,提出了一项改进方案,以优化YOLOv5s模型,旨在实现轻量化的汽车检测。通过在MPSoC硬件架构的现场可编程门阵列(FPGA)上设计系统,成功打造了一个具备高精度、快速检测和低能耗的解决方案。... 针对车辆分类检测在精度和实时性方面存在的挑战,提出了一项改进方案,以优化YOLOv5s模型,旨在实现轻量化的汽车检测。通过在MPSoC硬件架构的现场可编程门阵列(FPGA)上设计系统,成功打造了一个具备高精度、快速检测和低能耗的解决方案。为了使得模型更适合嵌入式设备部署,采用了MobileNetv3 Small替代YOLOv5s的主干网络,并引入卷积块注意力模块(CBAM)注意力机制和Inner-IoU Loss优化方法,使模型在轻量化的同时提升了检测精度和速度。改进后的模型相较于原始Yolov5s模型,平均精度均值(mAP)提升了14.8%,参数量减少了49.7%,模型体积减小了40.7%,计算量减少了48.9%,在NVIDIA 3060上,改进后的检测速度提升了48.8%,达到了82 fps。此外,还利用FPGA对YOLOv5s进行了硬件加速。经过优化的系统达到了45 fps的检测帧率,并保持了较高的精度和速度,这一系统易于部署,适用于智能交通系统,满足其高效实时监测的需求。 展开更多
关键词 车辆分类 YOLOv5s轻量化 MobileNetv3 Small FPGA 硬件部署
在线阅读 下载PDF
基于数据流架构的雷达信号调制方式识别加速 被引量:1
3
作者 黄湘松 王振 潘大鹏 《实验技术与管理》 CAS 北大核心 2024年第5期23-30,共8页
在雷达电子战中,快速并准确地识别敌方雷达信号调制技术对于获得战术优势至关重要,而传统依赖于图形处理单元(graphics processing unit,GPU)的识别方法难以满足此应用场景的低延迟要求。为此,该文设计了一种基于数据流架构(dataflow ar... 在雷达电子战中,快速并准确地识别敌方雷达信号调制技术对于获得战术优势至关重要,而传统依赖于图形处理单元(graphics processing unit,GPU)的识别方法难以满足此应用场景的低延迟要求。为此,该文设计了一种基于数据流架构(dataflow architecture,DF)的雷达信号调制方式识别加速系统。该系统通过对卷积神经网络权值进行二值化来减少模型参数,便于将算法部署到现场可编程门阵列(field-programmablegatearray,FPGA),同时采用数据流架构加快雷达信号调制方式的识别过程。实验结果表明,在确保整体识别准确率的前提下,该加速系统的推理速度相比i7-11800H CPU提升44.43倍,相比RTX 3050Ti GPU提升2.59倍,系统功耗仅为1.724 W。 展开更多
关键词 调制方式识别 深度学习 数据流架构 二值化神经网络 硬件部署
在线阅读 下载PDF
基于深度学习算法的智能成票技术研究与应用
4
作者 张远德 《通讯世界》 2024年第12期109-111,共3页
为做好变电站的智能运检工作,对深度学习算法支持下的智能成票技术及其应用进行研究。分析基于深度学习算法的智能成票技术基本情况、技术特点,以及智能成票技术支持下的智能防误系统概况及基本功能,以期为此项技术的研究与应用提供参考... 为做好变电站的智能运检工作,对深度学习算法支持下的智能成票技术及其应用进行研究。分析基于深度学习算法的智能成票技术基本情况、技术特点,以及智能成票技术支持下的智能防误系统概况及基本功能,以期为此项技术的研究与应用提供参考,进一步提升现代变电站的智能运检工作质量。 展开更多
关键词 深度学习算法 智能成票技术 智能防误系统 硬件部署 软件功能
在线阅读 下载PDF
Coremail邮件系统在酒钢的应用
5
作者 杨梅 水碧明 《酒钢科技》 2018年第3期90-93,共4页
如今企业邮箱以其强大的功能和推广优势日渐成为了企业运营中不可或缺的重要工具。酒钢采用Coremail邮件系统,本文从系统硬件部署,软件体系结构等方面,详细阐述Coremail邮件系统在酒钢的应用。
关键词 Coremail邮件系统 硬件部署 软件体系
在线阅读 下载PDF
基于人体关键点与迁移学习的口罩佩戴检测研究 被引量:1
6
作者 叶永雪 马鸿雁 《计算机仿真》 北大核心 2023年第6期234-239,共6页
为解决口罩佩戴检测精度低、部署情况差等问题,提出基于人体关键点检测技术结合领域自适应迁移学习的口罩佩戴检测算法。将人脸图像进行关键点检测后进行图像分割,并对分割后的图像进行预处理;处理后使用数据增强技术并建立基于迁移学... 为解决口罩佩戴检测精度低、部署情况差等问题,提出基于人体关键点检测技术结合领域自适应迁移学习的口罩佩戴检测算法。将人脸图像进行关键点检测后进行图像分割,并对分割后的图像进行预处理;处理后使用数据增强技术并建立基于迁移学习的口罩佩戴检测模型;最终将训练好的模型嵌入至可移动设备中,实现口罩佩戴检测算法的部署。仿真结果表明,未经过人体关键点检测并人脸分割的口罩检测模型准确率为92.84%,经过人体关键点检测并分割图像的模型准确率为98.86%。实际硬件部署使用结果显示,经过人体关键点检测并分割图像的口罩佩戴检测精度超过95%。提出的算法在口罩佩戴检测中检测精度高,硬件部署情况好。 展开更多
关键词 人体关键点检测 数据增强 迁移学习 口罩佩戴检测 硬件部署
在线阅读 下载PDF
基于深度学习的眼底图像辅助诊断系统设计 被引量:1
7
作者 林静敏 魏松林 《安徽电子信息职业技术学院学报》 2022年第6期25-31,共7页
目前多数眼底图像分类方法主要针对单一类别疾病不同级别进行分类,且网络模型存在参数量大、计算复杂等问题。基于轻量化的SqueezeNet深度学习模型,设计了一种实现多标签眼底图像辅助诊断系统。在公开数据集ODIR上进行训练和验证,实验... 目前多数眼底图像分类方法主要针对单一类别疾病不同级别进行分类,且网络模型存在参数量大、计算复杂等问题。基于轻量化的SqueezeNet深度学习模型,设计了一种实现多标签眼底图像辅助诊断系统。在公开数据集ODIR上进行训练和验证,实验结果表明该系统具备强大的特征提取能力,可以在非大幅降低模型精度的情况下最大程度地提高系统的运行速度、降低系统内存消耗。该基于深度学习的眼底图像辅助诊断系统适合于硬件部署,可以为人工智能应用于计算机辅助医疗设备中提供一定的参考价值。 展开更多
关键词 深度学习 眼底图像 轻量化 硬件部署
在线阅读 下载PDF
浅谈财政管理一体化信息系统建设的总体思路和技术路线
8
作者 官华东 《海峡科学》 2016年第11期46-48,共3页
该文分析了财政管理一体化信息系统采用全省集中部署模式的优势,对该系统所采用的J2EE三层架构技术优缺点以及B/S技术与C/S技术优缺点进行分析比较,并简单介绍该系统选用的应用技术架构及其优点,对技术线路中的关键技术进行分析。
关键词 财政管理 信息系统 硬件部署 系统设计 系统安全 系统架构
在线阅读 下载PDF
临沂市地震信息节点的建设与应用
9
作者 孔令爱 胡子超 王银龙 《地震科学进展》 2022年第9期447-452,共6页
市级地震信息节点是地震监测预报系统的重要组成元素,它汇集和传输地震台站的监测数据,并向省级信息节点共享地震信息,在省级信息节点与县级信息节点之间起着中间枢纽作用。对市级信息节点进行标准化改造是对地震数据分析预报的有力保... 市级地震信息节点是地震监测预报系统的重要组成元素,它汇集和传输地震台站的监测数据,并向省级信息节点共享地震信息,在省级信息节点与县级信息节点之间起着中间枢纽作用。对市级信息节点进行标准化改造是对地震数据分析预报的有力保障。本文通过概述临沂市地震信息节点在网络结构、软硬件设备部署、日常维护管理、安全管理等方面的标准化改造情况,为其他市级地震信息节点的升级改造提供了很好的借鉴和参考,具有一定的实用价值。 展开更多
关键词 市级地震信息节点 标准化改造 网络结构 硬件部署 维护管理 安全管理
在线阅读 下载PDF
Baseband Design for 5G UDN Base Stations:Methods and Implementation 被引量:3
10
作者 Zhaoyun Cai Dake Liu 《China Communications》 SCIE CSCD 2017年第5期59-77,共19页
Baseband design and implementation for micro/pico base stations (mBS) in 5G ultra-dense network (UDN) is studied. Low cost is an essential requirement for mBS baseband in UDN. Digital baseband cost of ASIC/ASIP (... Baseband design and implementation for micro/pico base stations (mBS) in 5G ultra-dense network (UDN) is studied. Low cost is an essential requirement for mBS baseband in UDN. Digital baseband cost of ASIC/ASIP (Application Specific Integrated Circuit / Instruction-set processor) is of the most uncertainty in roBS system. However. the actual costs and hardware feasibility of the baseband are yet unknown to network deployers and researchers. In this paper, we studied the baseband hardware system design and implementation for low-cost roBS. We analyzed popular baseband algorithms and architectures for both full-digital and hybrid beamforming (BF) for UDN. We then proposed feasible chip-level solutions for the baseband with up to 128-antenna BS system, and estimated their implementation cost. Results show that among lull-digital BF algorithms, zero-forcing is a choice of high performance and low cost; for hybrid BF, 4×32 architecture (32 RF chains) provides good reduction in baseband cost with acceptable performance loss, thus it can be a preferable solution under low cost consider- ation. The proposed system planning method can also be used for the design of other related systems. 展开更多
关键词 5G Communication ASIC/ASIP UDN baseband implementation massive MIMO
在线阅读 下载PDF
基于LangChain与DeepSeek的JavaScript教学辅助智能体的研究
11
作者 刘安骞 《现代信息科技》 2025年第7期76-82,共7页
文章提出了一种基于LangChain与DeepSeek-7B-R1的本地化智能教学系统,旨在解决JavaScript和jQuery教学中的异步编程理解与DOM操作错误检测难题。针对传统方案在语义理解、隐私安全与硬件需求上的矛盾,设计双引擎架构(规则预筛+大模型精... 文章提出了一种基于LangChain与DeepSeek-7B-R1的本地化智能教学系统,旨在解决JavaScript和jQuery教学中的异步编程理解与DOM操作错误检测难题。针对传统方案在语义理解、隐私安全与硬件需求上的矛盾,设计双引擎架构(规则预筛+大模型精调),集成动态AST解析与改进的RAG检索机制,构建覆盖57类典型错误的教学知识图谱。实验表明,系统在NVIDIA RTX 3060设备上实现平均2.8 s响应速度,教学建议准确率达91.2%,较传统LSTM方案提升43.7%。企业内训场景部署验证其可将学员问题解决效率提升41%,同时减少76%的教师人工干预。研究为编程教育领域提供了首个支持消费级硬件的高精度本地化智能教学框架,并开源核心组件以降低开发门槛。 展开更多
关键词 本地化智能教学系统 LangChain规则引擎 DeepSeek-7B-R1精调 RAG增强检索机制 JavaScript教学知识图谱 AST动态解析 消费级硬件部署 编程教育效能优化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部