期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
基于感受野注意力卷积的自动驾驶多任务感知算法 被引量:1
1
作者 刘云翔 马海力 +2 位作者 朱建林 张晴 金婍 《计算机工程与应用》 CSCD 北大核心 2024年第20期133-141,共9页
可行驶区域分割、车道线检测及交通目标检测等作为自动驾驶感知的关键部分,并行执行对智能车辆的算力要求较高,多任务感知算法能够实现实际应用中精度与速度的权衡。针对多任务感知算法中路况复杂、目标受遮挡等难点,通过改进YOLOP网络... 可行驶区域分割、车道线检测及交通目标检测等作为自动驾驶感知的关键部分,并行执行对智能车辆的算力要求较高,多任务感知算法能够实现实际应用中精度与速度的权衡。针对多任务感知算法中路况复杂、目标受遮挡等难点,通过改进YOLOP网络,提出一种基于感受野注意力卷积(RFAConv)的多任务感知算法。将主干网络中的部分卷积替换为感受野注意力卷积,根据感受野中图像特征的重要程度动态分配卷积核权重以提高网络的特征提取能力;重构特征金字塔网络,使用高效跨尺度融合模块替换原有的跨阶段层次模块,充分保留特征融合的有效信息,并使用内容感知特征重组模块作为上采样方法,减少特征融合时上采样的信息丢失;使用MPDIoU函数计算回归损失,解决真实框与预测框之间同比例但不同大小的问题,进一步提高对交通目标的检测能力。在BDD100K数据集上的测试结果表明,该模型在可行驶区域分割、车道线检测及交通目标检测方面检测精度优于其他多任务模型甚至单任务模型,同时保证了网络实时推理性能。 展开更多
关键词 多任务感知 自动驾驶 目标检测 语义分割 感受注意力卷积(rfaconv)
在线阅读 下载PDF
基于对称视觉注意力网络的高效图像超分辨率重建
2
作者 吴承旭 胡靖 《软件导刊》 2025年第1期109-114,共6页
高效超分辨率的研究重点是改进深度小核卷积来降低模型复杂度、提升效率,但较小的感受野会限制网络细节重建能力,大核卷积虽能提供更大的感受野、提升图像重建质量,但计算成本过高。为了减少模型参数数量并实现高效超分辨率重建,提出一... 高效超分辨率的研究重点是改进深度小核卷积来降低模型复杂度、提升效率,但较小的感受野会限制网络细节重建能力,大核卷积虽能提供更大的感受野、提升图像重建质量,但计算成本过高。为了减少模型参数数量并实现高效超分辨率重建,提出一种对称视觉注意力网络SVAN。首先将大核卷积分解为3种不同的轻量高效卷积,在卷积组合中借助不同卷积的感受野尺寸形成瓶颈结构,并与注意力机制结合成瓶颈注意力模块来增强网络对特征的关注能力;其次,将瓶颈注意力模块对称排布构成对称大核注意力块,以进一步提升网络提取深层特征的能力。实验表明,所提模型相较于其他轻量化超分辨率方法定量指标提升明显,重建的图像纹理细节更丰富,参数量仅为183 K,是一个具有竞争力的轻量化高质量超分辨模型,为高效超分辨率提供了新的解决思路。 展开更多
关键词 图像超分辨率重建 大核卷积 感受 视觉注意力
在线阅读 下载PDF
基于渐进结构感受野和全局注意力的显著性检测 被引量:2
3
作者 董波 周燕 王永雄 《电子科技》 2021年第1期23-30,共8页
当前的显著性检测算法在复杂场景下难以分割出完整显著性区域以及锐利的边缘细节。针对这一问题,文中提出了一种新颖的特征融合算法。该方法利用全卷积神经网络获取多个层次粗糙的初始特征并结合特征金字塔结构对其深度解析。设计渐进... 当前的显著性检测算法在复杂场景下难以分割出完整显著性区域以及锐利的边缘细节。针对这一问题,文中提出了一种新颖的特征融合算法。该方法利用全卷积神经网络获取多个层次粗糙的初始特征并结合特征金字塔结构对其深度解析。设计渐进结构感受野模块将特征转换至不同尺度的空间进行优化,实现特征的渐进融合与传递,有选择性地增强显著性区域。采用全局注意力机制消除背景噪声并建立显著性像素之间的长距离依赖,以提高显著性区域的有效性,突出显著性目标,再通过学习融合个层次特征得到显著图。综合实验表明,在绝对误差减小的情况下,F-measure指标远超出其他7种主流方法。所提的显著性模型综合了全卷积神经网络和特征金字塔结构的优点,结合文中设计的渐进结构感受野和全局注意力机制,使得显著图更接近真值图。 展开更多
关键词 显著性检测 卷积神经网络 特征金字塔 渐进结构感受 全局注意力 F-measure指标
在线阅读 下载PDF
基于空洞卷积和注意力机制的深度伪造检测 被引量:6
4
作者 张时润 彭勃 +1 位作者 王伟 董晶 《现代电子技术》 2022年第5期42-48,共7页
人脸深度伪造图像的生成过程是对目标人脸进行替换,由于不同图片的肤色和光照等差异,在人脸周围会产生比较分散的伪影边界,且对人脸进行裁剪之后会包含部分背景信息的干扰。针对深度伪造图像的生成特点,区别于常规的CNN分类识别网络,设... 人脸深度伪造图像的生成过程是对目标人脸进行替换,由于不同图片的肤色和光照等差异,在人脸周围会产生比较分散的伪影边界,且对人脸进行裁剪之后会包含部分背景信息的干扰。针对深度伪造图像的生成特点,区别于常规的CNN分类识别网络,设计了一种符合伪造痕迹特点的检测网络。首先,利用Resnet34卷积神经网络对待检测的图像提取初步的伪造特征;其次,经过空洞卷积提高网络模型的感受野来更好地捕获比较分散的伪造痕迹;再由空间注意力模块进行权重的重加权,减少其他背景信息的干扰;最后使用多层全连接神经网络对特征进行分类,达到对深度伪造图片进行准确分类的目的。在Faceforensics++、Celeb-DF、DFDC三个主流数据集上进行实验,并取得比当前其他方法更好的效果。实验结果表明,所提方法结合了空洞卷积和注意力机制,应对不同人脸截取比例的伪造图像拥有更好的适应性。 展开更多
关键词 图像深度伪造 空洞卷积 注意力机制 深度学习 图像分类 伪造特征提取 感受
在线阅读 下载PDF
基于注意力机制和图像轮廓的实例分割算法
5
作者 顾登华 顾春华 《电子科技》 2024年第4期62-68,共7页
基于图像轮廓的实例分割方法利用少量轮廓顶点来表示物体,减少了算法的参数量,提高了算法的运行效率,但导致算法的精度低于传统逐像素处理的分割算法,获得的分割结果质量较差。为提升算法的准确性,文中提出一种基于图像轮廓结合注意力... 基于图像轮廓的实例分割方法利用少量轮廓顶点来表示物体,减少了算法的参数量,提高了算法的运行效率,但导致算法的精度低于传统逐像素处理的分割算法,获得的分割结果质量较差。为提升算法的准确性,文中提出一种基于图像轮廓结合注意力机制的实例分割模型(Attend the Contour snake,AC-snake)。在主干网络中加入改进的大卷积核(Largekernel+)提升模型的感受野,提取更加丰富的特征信息。改进轮廓顶点变形阶段的网络结构,结合双通道注意力模块(Dual Channel attention,DC-attentio)加强轮廓顶点的有效信息,减少训练网络中的无效参数,提升检测精度和训练速度。实验结果表明,在Cityscapes验证数据集中,相较于原始模型,文中提出的改进模型性能有所提升。 展开更多
关键词 实例分割 图像轮廓 轮廓顶点 逐像素 注意力机制 卷积 感受 特征信息
在线阅读 下载PDF
基于注意力机制和多空间金字塔池化的实时目标检测算法 被引量:1
6
作者 王国刚 李泽欣 董志豪 《计算机测量与控制》 2024年第2期56-64,共9页
YOLOv4计算复杂度高,空间金字塔池化模块仅一次增强特征融合网络的深层区域特征图的表征能力、检测头网络的特征图难以突出重要通道特征;针对以上问题,提出一种基于注意力机制和多空间金字塔池化的实时目标检测算法;该算法采用多空间金... YOLOv4计算复杂度高,空间金字塔池化模块仅一次增强特征融合网络的深层区域特征图的表征能力、检测头网络的特征图难以突出重要通道特征;针对以上问题,提出一种基于注意力机制和多空间金字塔池化的实时目标检测算法;该算法采用多空间金字塔池化,提取局部特征和全局特征,融合多重感受野,加强特征融合网络的浅、中、深层特征图的表征能力;引入压缩激励通道注意力机制,建模通道间的相关性,自适应调整特征图各个通道的权重,从而使网络更加关注重要特征;特征融合和检测头网络中使用深度可分离卷积,减少了网络参数量;实验结果表明,所提算法的均值平均精度均高于其他7种主流对比算法;与YOLOv4相比,参数量、模型大小分别减少了27.85 M和106.25 MB,所提算法在降低复杂度的同时,提高了检测准确度,且该算法的检测速率达到33.70帧/秒,满足实时性要求。 展开更多
关键词 YOLOv4 通道注意力 空间金字塔池化 感受 深度可分离卷积 实时性
在线阅读 下载PDF
融合注意力及增强感受野的桥隧表面病害深度网络检测
7
作者 黄志海 罗海涛 郭波 《中国图象图形学报》 北大核心 2025年第2期467-484,共18页
目的在桥梁缆索和隧道环境中进行表面病害检测面临多重挑战:人工病害定位在复杂结构中的高投入成本;隧道内存在光照不足、病害区域的表面特征复杂、范围广阔和易遭遮挡等问题,这些因素使得传统图像处理技术在病害区域检测上表现出较低... 目的在桥梁缆索和隧道环境中进行表面病害检测面临多重挑战:人工病害定位在复杂结构中的高投入成本;隧道内存在光照不足、病害区域的表面特征复杂、范围广阔和易遭遮挡等问题,这些因素使得传统图像处理技术在病害区域检测上表现出较低的抗干扰能力、识别精度不足和分割效果欠佳,鉴于此,提出一种基于融合注意力及增强感受野的深度网络模型。方法该模型使用融合Transformer注意力机制的骨干网络提取目标特征信息,获得更为密切联系的全局特征表示,以解决光照不足导致局部特征缺少的问题;引入空间序列缩减法降低骨干网络的参数量;改进使用具有串并联关系的空洞卷积池化金字塔(series-parallel atrous convolutional pyramid,SACP)模块,使得卷积感受野进一步扩大并且彼此融合,更好地感知完整的病害范围;解码阶段融合卷积注意力模块(concentration-based attention module,CBAM),提高浅层特征的有效边界特征权重。改进损失函数加快模型收敛速度。结果本文实地采集隧道内衬以及桥梁缆索病害部位图像构建数据集展开实验,结果表明:本文模型在隧道内衬病害提取上准确率(accuracy,Acc)达到94.4%,平均交并比(mean intersection over union,mIoU)达到78.14%,F1分数(F1-score)达到76.45%。在桥梁缆索病害提取上Acc达到97.15%,mIoU达到80.41%,F1分数达到77.92%。结论相较于主流的分割网络,本文模型在桥隧表面病害提取的精度上均有提升,具有更优秀的提取效果和抗干扰能力,能更好地满足复杂环境下病害检测工程需求。 展开更多
关键词 深度学习 注意力机制 卷积感受 图像分析 自动化病害检测 工程表面病害识别
原文传递
结合全局注意力机制的实时语义分割网络 被引量:5
8
作者 李涛 高志刚 +2 位作者 管晟媛 徐久成 马媛媛 《智能系统学报》 CSCD 北大核心 2023年第2期282-292,共11页
针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic s... 针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。 展开更多
关键词 实时语义分割 全局注意力机制 多尺度特征融合 混合空洞卷积 卷积神经网络 金字塔池化 感受 特征提取
在线阅读 下载PDF
基于多感受野的生成对抗网络医学MRI影像超分辨率重建 被引量:3
9
作者 刘朋伟 高媛 +2 位作者 秦品乐 殷喆 王丽芳 《计算机应用》 CSCD 北大核心 2022年第3期938-945,共8页
针对医学磁共振成像(MRI)过程中由于噪声、成像技术和成像原理等干扰因素引起的图像细节丢失、纹理不清晰等问题,提出了基于多感受野的生成对抗网络医学MRI影像超分辨率重建算法。首先,利用多感受野特征提取块获取不同感受野下图像的全... 针对医学磁共振成像(MRI)过程中由于噪声、成像技术和成像原理等干扰因素引起的图像细节丢失、纹理不清晰等问题,提出了基于多感受野的生成对抗网络医学MRI影像超分辨率重建算法。首先,利用多感受野特征提取块获取不同感受野下图像的全局特征信息,为避免感受野过小或过大导致图像的细节纹理丢失,将每组特征分为两组,其中一组用于反馈不同尺度感受野下的全局特征信息,另一组用于丰富下一组特征的局部细节纹理信息;然后,使用多感受野特征提取块构建特征融合组,并在每个特征融合组中添加空间注意力模块,充分获取图像的空间特征信息,减少了浅层和局部特征在网络中的丢失,在图像的细节上取得了更逼真的还原度;其次,将低分辨率图像的梯度图转化为高分辨率图像的梯度图辅助重建超分辨率图像;最终将恢复后的梯度图集成到超分辨率分支中,为超分辨率重建提供结构先验信息,有助于生成高质量的超分辨率图像。实验结果表明,相比基于梯度引导的结构保留超分辨率算法(SPSR),所提算法在×2、×3、×4尺度下的峰值信噪比(PSNR)分别提升了4.8%、2.7%、3.5%,重建出的医学MRI影像纹理细节更加丰富、视觉效果更加逼真。 展开更多
关键词 超分辨率 感受 空洞卷积 空间注意力机制 梯度图
在线阅读 下载PDF
融合多注意力机制的光学遥感图像目标检测方法 被引量:15
10
作者 付宏建 白宏阳 +2 位作者 郭宏伟 原瑜蔓 秦伟伟 《光子学报》 EI CAS CSCD 北大核心 2022年第12期304-312,共9页
针对光学遥感图像因目标尺度差异大、目标分布密集和背景复杂所导致的检测效果不佳的问题,提出了一种融合多注意力机制的遥感目标检测方法。设计了一种自适应感受野大小的坐标注意力模块,以加强网络对多尺度目标特征的提取能力,提升网... 针对光学遥感图像因目标尺度差异大、目标分布密集和背景复杂所导致的检测效果不佳的问题,提出了一种融合多注意力机制的遥感目标检测方法。设计了一种自适应感受野大小的坐标注意力模块,以加强网络对多尺度目标特征的提取能力,提升网络对复杂背景下目标的定位效果。基于Swin Transformer自注意力机制模块改进了YOLOv5网络的预测头,增强了网络对密集分布目标的识别能力。在DOTA公开遥感图像数据集上进行训练与测试,实验对比结果表明,所提方法在检测精度上比YOLOv5网络提高了3.6%,且优于多类典型对比方法;在Nvidia GTX 1080Ti平台上检测速度达49帧/s,证明该方法具有较好的实时检测能力。 展开更多
关键词 光学遥感图像 目标检测 深度学习 注意力机制 感受 多尺度 卷积神经网络
在线阅读 下载PDF
基于改进注意力机制的交通标志检测算法 被引量:7
11
作者 张新宇 丁胜 杨治佩 《计算机应用》 CSCD 北大核心 2022年第8期2378-2385,共8页
针对交通标志在某些场景中存在分辨率过低、被覆盖等环境因素影响导致在目标检测任务中出现漏检、误检的情况,提出一种基于改进注意力机制的交通标志检测算法。首先,针对交通标志因破损、光照等环境影响造成图像分辨率低从而导致网络提... 针对交通标志在某些场景中存在分辨率过低、被覆盖等环境因素影响导致在目标检测任务中出现漏检、误检的情况,提出一种基于改进注意力机制的交通标志检测算法。首先,针对交通标志因破损、光照等环境影响造成图像分辨率低从而导致网络提取图像特征信息有限的问题,在主干网络中添加注意力模块以增强目标区域的关键特征;其次,特征图中相邻通道间的局部特征由于感受野重叠而存在一定的相关性,用大小为k的一维卷积代替通道注意力模块中的全连接层,以达到聚合不同通道信息和减少额外参数量的作用;最后,在路径聚合网络(PANet)的中、小尺度特征层引入感受野模块来增大特征图的感受野以融合目标区域的上下文信息,从而提升网络对交通标志的检测能力。在中国交通标志检测数据集(CCTSDB)上的实验结果表明,所提出的YOLOv4(YouOnlyLookOncev4)改进算法在引进极少的参数量与原算法检测速度相差不大的情况下,平均精确率均值(mAP)达96.88%,mAP提升了1.48%;而与轻量级网络YOLOv5s相比,在单张检测速度慢10 ms的情况下,所提算法mAP比YOLOv5s高3.40个百分点,检测速度达到40frame/s,说明该算法完全满足目标检测实时性的要求。 展开更多
关键词 注意力机制 一维卷积 感受模块 特征提取网络 YOLOv4
在线阅读 下载PDF
动态感受野特征选择去雾网络 被引量:1
12
作者 查俊伟 张洪艳 《电子科技》 2023年第7期56-63,共8页
基于深度学习的去雾模型大多在网络参数固定后,感受野也就随之固定。这导致去雾网络无法针对每个具体的场景采用最优的模式进行去雾,从而造成结果中存在模糊和失真。针对这些问题,文中提出动态感受野特征选择去雾网络。该网络以带有空... 基于深度学习的去雾模型大多在网络参数固定后,感受野也就随之固定。这导致去雾网络无法针对每个具体的场景采用最优的模式进行去雾,从而造成结果中存在模糊和失真。针对这些问题,文中提出动态感受野特征选择去雾网络。该网络以带有空洞卷积的特征注意力空洞模块为基础组件,并行使用多个空洞率不同的特征注意力空洞模块来提取多尺度特征,并进行动态特征融合,构成动态感受野模块。文中将多个动态感受野模块搭配残差连接组成深度网络,对不同层次的特征进行动态混合,最终解码得到去雾图像。实验结果表明,文中所提算法对室内和室外的合成雾图以及真实含雾图像均具有良好的去雾效果,可以生成清晰、自然的去雾图像。 展开更多
关键词 图像去雾 动态感受 多尺度特征 动态特征融合 空洞卷积 注意力机制 动态神经网络 动态参数
在线阅读 下载PDF
扩增感受野特征融合的小目标检测算法 被引量:8
13
作者 魏文晓 刘洁瑜 +1 位作者 徐军辉 沈强 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第1期48-54,共7页
为了解决小目标检测在实际应用中的高漏检率、低准确率、低召回率等问题,提出一种基于感受野扩增特征融合的小目标检测算法.首先,对全卷积单阶段目标检测算法(fully convolutional one-stage object detection,FCOS)基础网络特征提取部... 为了解决小目标检测在实际应用中的高漏检率、低准确率、低召回率等问题,提出一种基于感受野扩增特征融合的小目标检测算法.首先,对全卷积单阶段目标检测算法(fully convolutional one-stage object detection,FCOS)基础网络特征提取部分增加感受野扩增模块,改善基础网络ResNet-50特征信息提取较少、浅层特征层信息利用率偏低等问题;其次,在特征金字塔部分利用门控思想筛选信息融合,降低无效信息融合的干扰;最后,对7个特征层增加注意力机制模块,提升目标定位精度和分类精度.在COCO2017数据集上的实验结果表明,该算法比传统FCOS算法的检测精度提升2.4%.其中,小目标检测精度提升3.2%,具有更好的检测效果. 展开更多
关键词 特征融合 感受扩增 串联空洞卷积 注意力机制 无锚框算法
在线阅读 下载PDF
基于全局时空感受野的高效视频分类方法
14
作者 王辉涛 胡燕 《小型微型计算机系统》 CSCD 北大核心 2020年第8期1768-1775,共8页
在现有混合卷积神经网络架构(2D+3D)的视频分类方法中,卷积滤波器都是对局部区域进行操作,无法捕获大范围的时空依赖关系,特征通道之间缺乏相互依赖关系,传统的三维卷积核无法很好地建模时空特征.针对这些问题,提出了一种基于全局时空... 在现有混合卷积神经网络架构(2D+3D)的视频分类方法中,卷积滤波器都是对局部区域进行操作,无法捕获大范围的时空依赖关系,特征通道之间缺乏相互依赖关系,传统的三维卷积核无法很好地建模时空特征.针对这些问题,提出了一种基于全局时空感受野的高效视频分类方法(CS-NL-SECO).首先将传统的三维卷积核分解成空域卷积核和时域卷积核,来更好地学习时空特征.然后在已有混合架构中的底层二维网络引入通道和空间注意力,通过学习自动获取每个特征通道的权重,依照权重关注重要的特征而抑制不相关的背景.最后在高层三维网络中引入全局时空感受野,学习全局时空特征表示自动捕获大范围的时空依赖关系.并在UCF101、HMDB51、Kinetics以及Something-something这四个视频分类常用的公有数据集上进行了实验,结果表明该方法无论在速度和精度上都远好于原方法,并且整体性能达到了最新方法的基准. 展开更多
关键词 视频分类 卷积神经网络 通道和空间注意力 全局时空感受 三维卷积核分解
在线阅读 下载PDF
基于SE-ResNet的实时抓取姿态估计
15
作者 王震洲 王刚 宿景芳 《物联网技术》 2025年第4期146-150,156,共6页
针对在非结构化抓取环境中机器人抓取成功率低和速度慢的问题,提出了一种基于SE-ResNet的生成残差卷积神经网络模型。首先,该模型在生成残差卷积神经网络(GR-ConvNet)模型的基础上引入了挤压和激励模块的残差网络来增强有效信息,抑制无... 针对在非结构化抓取环境中机器人抓取成功率低和速度慢的问题,提出了一种基于SE-ResNet的生成残差卷积神经网络模型。首先,该模型在生成残差卷积神经网络(GR-ConvNet)模型的基础上引入了挤压和激励模块的残差网络来增强有效信息,抑制无效信息,并进行了深层次特征提取,提高了神经网络对抓取姿态中心的敏感性;其次,引入多尺度并行空洞卷积模块,用于提取不同尺度的特征,在不减少感受野的情况下提高了信息利用率,同时,其并行结构避免了多尺度特征之间的冗余;最后,针对单物体场景和多物体场景进行实验。实验结果表明,该方法可以帮助网络为机器人抓取检测任务学习更好的视觉特征。经验证,该方法的抓取准确率达98.3%,处理速度较快,满足了实时性的要求。 展开更多
关键词 机器人 通道注意力机制 多尺度空洞卷积 抓取检测 残差网络 感受
在线阅读 下载PDF
基于改进YOLOv8s模型的机械零件视觉检测算法
16
作者 荣国林 晁永生 +1 位作者 蒋潇 王传钊 《组合机床与自动化加工技术》 北大核心 2025年第3期31-35,40,共6页
针对非结构环境下机械零件检测任务高精度的需求,提出了一种改进YOLOv8s目标算法。通过引入可变形卷积优化骨干C2f结构(C2f_DCNV2),帮助模型快速地提取更细粒的空间特征;引入空间注意力改造空间金字塔池化层(SPPF_RFA),增加不同层级特... 针对非结构环境下机械零件检测任务高精度的需求,提出了一种改进YOLOv8s目标算法。通过引入可变形卷积优化骨干C2f结构(C2f_DCNV2),帮助模型快速地提取更细粒的空间特征;引入空间注意力改造空间金字塔池化层(SPPF_RFA),增加不同层级特征间的信息交融能力和识别复杂细节的能力,提升目标零件的检测精度;使用α-DIoU改进边界框回归损失函数,提高模型边界框定位的精确性和收敛速度。实验结果表明,改进YOLOv8s算法在98帧/秒(FPS)下实现了97.6%的平均精度均值(mAP),相较原算法表现出了更高的准确率和更快的推理速度。 展开更多
关键词 机械零件 目标检测 YOLOv8s 感受注意力 可变形卷积
在线阅读 下载PDF
多尺度YOLOv5算法检测锂离子电池表面缺陷
17
作者 朱永平 程博 +1 位作者 熊聪 丁聪 《电池》 北大核心 2025年第1期71-77,共7页
针对软包装锂离子电池表面缺陷特征尺度不一、缺陷检测时小目标检测效果差的问题,提出基于改进YOLOv5的软包装锂离子电池表面缺陷检测算法。首先,将感受野注意力卷积(RFCAConv)融合到Bottleneck结构中,并替换主干网络中的卷积层(Conv),... 针对软包装锂离子电池表面缺陷特征尺度不一、缺陷检测时小目标检测效果差的问题,提出基于改进YOLOv5的软包装锂离子电池表面缺陷检测算法。首先,将感受野注意力卷积(RFCAConv)融合到Bottleneck结构中,并替换主干网络中的卷积层(Conv),通过有效提取感受野空间特征,提升模型整体性能;其次,将大型可分离核注意力(LSKA)融合到快速空间金字塔池化(SPPF)模块中,增强多尺度特征的提取能力;最后,将P2目标检测层融入路径聚合网络(PANet),提高模型对边缘细节信息的抓取能力,增强模型对小尺度缺陷特征的提取能力。改进后的YOLOv5s算法,均值平均精度为89.1%,较原模型提高4.8个百分点,每秒帧数达40.0,能够满足软包锂离子电池表面缺陷实时检测的需求。 展开更多
关键词 YOLOv5算法 锂离子电池 缺陷检测 感受注意力卷积(RFCAConv) 可分离大核注意力 P2检测层
在线阅读 下载PDF
多维度卷积的两阶段脊柱三维实例分割方法 被引量:2
18
作者 程敏 沈林鹏 罗作煌 《传感器与微系统》 CSCD 北大核心 2022年第12期134-138,共5页
为实现对人体脊椎CT 3D图像精确实例分割,提出了一种融合2D与3D卷积神经网络(CNN)的2阶段脊柱3D实例分割关键技术。第一阶段采用ResNet—101 2D CNN作为骨干网络,引入可变感受野卷积模块对卷积结构主干特征网络优化,并加入损失函数平衡... 为实现对人体脊椎CT 3D图像精确实例分割,提出了一种融合2D与3D卷积神经网络(CNN)的2阶段脊柱3D实例分割关键技术。第一阶段采用ResNet—101 2D CNN作为骨干网络,引入可变感受野卷积模块对卷积结构主干特征网络优化,并加入损失函数平衡机制,较好地解决了对脊柱CT数字重建图像(DRR) 2D图像实例分割,准确获取脊柱各椎节2D实例信息;第二阶段以3D Unet为主要框架,融入Dense CRF条件随机场模块、空间与通道注意力方法,分割精度最高达到98.53%。该研究为脊椎手术导航机器人精准完成术前与术中导航与配准提供了有意义的参考。 展开更多
关键词 感受 注意力机制 鲁棒性 实例分割 三维卷积
在线阅读 下载PDF
轻量化超参数卷积神经网络的安全帽检测算法 被引量:2
19
作者 李青云 李燕 +1 位作者 卢峥松 林思伟 《现代计算机》 2022年第11期60-66,共7页
目前工地安全帽检测任务中基于深度学习的安全帽识别方法由于底层特征缺少语义与全局信息,从而导致误检与漏检的情况发生。为在保证检测网络具备实时性的情况下,使得网络具有较高的监测性能,本文提出一种轻量化超参数卷积神经网络的安... 目前工地安全帽检测任务中基于深度学习的安全帽识别方法由于底层特征缺少语义与全局信息,从而导致误检与漏检的情况发生。为在保证检测网络具备实时性的情况下,使得网络具有较高的监测性能,本文提出一种轻量化超参数卷积神经网络的安全帽检测算法。该算法以RFB-MobileNet网络为基础,在骨干网络中增加多频谱通道注意力网络(Frequency Channel Attention Networks,FcaNet),增强了网络对于不同尺寸目标特征的提取能力,大幅度提升了算法网络的检测精度,实现了常规施工环境下不同形态大小安全帽的识别。此外,本文将网络中感受野(Receptive Field Block,RFB)模块和FcaNet网络中的常规卷积替换为深度超参数化卷积(Depthwise Over-parameterized Convolutional,DO-Conv),在不增加计算复杂性的情况下,进一步提升模型的检测性能。实验结果表明,本文模型(DO-RFB-Mobilenet)的mAP较RFB-MobileNet的mAP提高了7.08%,检测精度达到74.27%,检测速度达到100帧/秒。 展开更多
关键词 卷积神经网络 感受结构 注意力机制 安全帽检测
在线阅读 下载PDF
多感受野增强的爆破现场安全帽检测算法
20
作者 王新良 王璐莹 《计算机工程与应用》 2025年第7期315-324,共10页
针对安全帽检测任务中存在的目标面积小、目标被不同程度遮挡、复杂背景干扰目标等问题,提出了基于YOLOX的多感受野增强的安全帽检测算法(multiple receptive field enhancement-YOLOX,MRFE-YOLOX)。在特征融合网络中增加浅层特征融合分... 针对安全帽检测任务中存在的目标面积小、目标被不同程度遮挡、复杂背景干扰目标等问题,提出了基于YOLOX的多感受野增强的安全帽检测算法(multiple receptive field enhancement-YOLOX,MRFE-YOLOX)。在特征融合网络中增加浅层特征融合分支,提升小目标特征信息流通效率,提高了小目标的检测精度;设计基于空洞卷积组与卷积注意力机制的感受野增强模块(receptive field augmentation module,RFAM),捕获了更大范围的感受野和图像特征,改善了遮挡目标漏检率高的问题;根据三分支注意力机制构建特征增强网络(feature enhancement network,FENet),抑制背景噪音对目标区域的干扰,降低了复杂背景下的目标误检率;引入空间到深度卷积(space to depth-conv,SPD-Conv)得到无信息损失的二倍下采样特征图,保留了更多的特征信息,同时减少了模型的参数量。实验结果表明,所提算法的均值平均精度相较于基线算法提升了2.78个百分点,FPS达到了102.67,满足了爆破现场安全帽实时检测的需要。 展开更多
关键词 安全帽检测 YOLOX-s算法 感受 空洞卷积 注意力机制
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部