期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于注意力机制和迁移学习的服装分类方法 被引量:1
1
作者 陈金广 黄晓菊 马丽丽 《西安工程大学学报》 CAS 2024年第3期109-116,共8页
针对服装图像分类效率低、准确率不高等问题,提出了一种基于注意力机制和迁移学习的服装图像分类方法。主要采用预训练的ResNet50网络模型在服装数据集上进行迁移学习,以降低对数据集的依赖,并减少网络训练时间;通过几何变换和颜色抖动... 针对服装图像分类效率低、准确率不高等问题,提出了一种基于注意力机制和迁移学习的服装图像分类方法。主要采用预训练的ResNet50网络模型在服装数据集上进行迁移学习,以降低对数据集的依赖,并减少网络训练时间;通过几何变换和颜色抖动2种数据增强手段处理数据集,提高模型的泛化能力;以ResNet50为基础网络,加入卷积注意力机制模块(convolutional block attention module, CBAM),依次从通道和空间2个维度提高对服装不同区域的关注度,增强了特征表达能力。在CD和IDFashion两类背景干扰信息不同的数据集上进行验证,实验结果表明:所提出的模型能够提取更多服装特征信息,在IDFashion数据集的平均分类准确率为95.60%,分别高于ResNet50、ResNet50+STN和ResNet50+ECA模型6.65%、6.69%、6.62%,一定程度上提高了服装图像分类的准确率和效率。 展开更多
关键词 服装图像分类 ResNet50 卷积注意力机制模块(CBAM) 注意力机制 迁移学习
在线阅读 下载PDF
基于注意力机制轻量化模型的植物病害识别方法
2
作者 苏航 陈旭昊 +3 位作者 寿德荣 张朝阳 许彪 孙丙宇 《江苏农业学报》 CSCD 北大核心 2024年第8期1389-1399,共11页
针对现有植物病害识别模型存在响应速度慢、参数量多、计算机内存资源消耗大等问题,本研究提出了一种轻量化神经网络模型,该模型由特征提取层、特征增强层和分类器组成。为了减小模型大小并提高网络响应速度,在特征提取层中使用深度可... 针对现有植物病害识别模型存在响应速度慢、参数量多、计算机内存资源消耗大等问题,本研究提出了一种轻量化神经网络模型,该模型由特征提取层、特征增强层和分类器组成。为了减小模型大小并提高网络响应速度,在特征提取层中使用深度可分离卷积进行特征提取。为了防止网络传播过程中的梯度消失并增强病害像素特征融合,在特征提取层中引入了大卷积核倒置残差结构(IRBCKS)模块。此外,在特征增强层集成了轻量级卷积块注意力模块(CBAM)注意力机制,以捕捉植物病害相关图像中像素之间的关系,增强关键信息的提取。最后,采用剪枝技术剔除模型中冗余特征信息,从而再次减少模型参数量,形成最终的轻量级网络模型Cut-MobileNet。为验证该模型的先进性,将其与轻量化模型(MobileNet V2、SqueezeNet、GoogLeNet)和非轻量化模型(Vision Transformer、AlexNet)进行性能对比,研究结果表明,Cut-MobileNet在浮点运算量、准确率、单张图片推理时间、参数量、F1值和模型大小等性能指标上都取得了较优的效果。 展开更多
关键词 模型剪枝 卷积注意力模块(CBAM)注意力机制 卷积核倒置残差结构(IRBCKS)模块 植物病害 轻量化网络
在线阅读 下载PDF
嵌入注意力机制残差网络的人脸表情识别方法 被引量:4
3
作者 钟瑞 蒋斌 +1 位作者 李南星 崔晓梅 《计算机工程与应用》 CSCD 北大核心 2023年第11期88-97,共10页
针对非可控环境下人脸图像易受光照、姿态变化等复杂因素的影响,进而造成人脸表情识别中人脸检测率低、表情识别精度差的问题,提出了一种嵌入注意力机制残差网络的表情识别方法。在人脸检测阶段,采用改进的RetinaFace算法完成多视角人... 针对非可控环境下人脸图像易受光照、姿态变化等复杂因素的影响,进而造成人脸表情识别中人脸检测率低、表情识别精度差的问题,提出了一种嵌入注意力机制残差网络的表情识别方法。在人脸检测阶段,采用改进的RetinaFace算法完成多视角人脸检测,获取人脸区域。在特征提取阶段,使用ResNet-50作为特征提取的主干网络。将预处理后的人脸图片,依次通过该网络的通道注意力网络和空间注意力网络,显式地建模全局图像的相互依赖性。在虚线残差单元的快捷连接中,加入平均池化层进行下采样操作,通过微调残差模块的操作,加强输入特征之间的映射,使提取的表情特征能够较完整地在网络之间传递,以减小特征信息的损失;在网络中再次传入卷积注意力机制模块,增强局部表情特征的通道维度信息和空间维度信息,加强特征图中与表情相关性高的特征区域的重点信息,同时抑制特征图中无关区域的干扰,进而加快网络的收敛速度,提高表情识别率。与基线算法相比,该方法在RAF-DB和FER2013表情数据集上分别取得了87.65%和73.57%的准确率。 展开更多
关键词 注意力机制 残差网络 表情识别 卷积注意力机制模块 RetinaFace
在线阅读 下载PDF
深度迁移学习与注意力机制的垃圾图像分类方法
4
作者 王策仁 彭亚雄 陆安江 《计算机与数字工程》 2023年第12期2959-2965,共7页
垃圾分类对节约资源和改善环境有着重大的意义。针对日益增长的消费能力带来的垃圾种类的增长,提出基于深度学习神经网络和迁移学习并引入注意力机制的垃圾分类图像识别方法。首先,建立以可回收垃圾、厨余垃圾、有害垃圾和其他垃圾四大... 垃圾分类对节约资源和改善环境有着重大的意义。针对日益增长的消费能力带来的垃圾种类的增长,提出基于深度学习神经网络和迁移学习并引入注意力机制的垃圾分类图像识别方法。首先,建立以可回收垃圾、厨余垃圾、有害垃圾和其他垃圾四大分类为基础,其中包括210种子分类的二级分类数据集;其次,采用自训练加迁移学习融合的方式,先搭建自训练卷积神经网络,后建立VGG16、ResNet50和ResNeSt50卷积神经网络,迁移同构模型下的预训练特征模型,把两个网络提取的特征融合,再添加基于CBAM注意力机制的改进模型,最后再接入微调网络再训练。分析得出最好的垃圾分类模型。实验数据表明,论文方法对比非迁移学习网络,时间消耗平均节约了29.4%,模型准确度平均提升8.06%,准确度最高达到92.2%。该方式可以显著地提升垃圾分类自动化的效率。 展开更多
关键词 深度学习 垃圾分类 卷积注意力机制模块 迁移学习 微调网络
在线阅读 下载PDF
基于多监督注意力机制神经网络的脑胶质瘤循环肿瘤细胞分割算法
5
作者 袁红杰 杨艳 +1 位作者 张东 杨双 《中国医学物理学杂志》 CSCD 2022年第7期828-833,共6页
为了提升脑胶质瘤循环肿瘤细胞的分割准确率,解决人工分割中肉眼分辨边界困难、目标占比小和操作流程繁琐等问题,提出一种端到端的像素级分割算法。针对数据特征,提出一种基于多监督机制的混合损失函数用以提升预测区域与目标区域的交并... 为了提升脑胶质瘤循环肿瘤细胞的分割准确率,解决人工分割中肉眼分辨边界困难、目标占比小和操作流程繁琐等问题,提出一种端到端的像素级分割算法。针对数据特征,提出一种基于多监督机制的混合损失函数用以提升预测区域与目标区域的交并比,同时训练网络向预测正确目标个数的方向收敛;其次,在网络中逐层加入卷积块注意力机制模块,使得网络能在空间、通道层面重点学习数据特征,进一步提升预测准确率;最后,通过采用混合训练的方式,只需一个网络模型就能直接分割出细胞核、细胞质区域,缩减训练流程。实验结果表明,此分割算法对比U-Net网络在召回率、精确率以及Dice系数方面均有显著提升,在细胞核分割方面,分别达到92.20%、86.56%、88.27%;在细胞质分割方面,分别达到89.33%、85.31%、86.33%。 展开更多
关键词 脑胶质瘤 循环肿瘤细胞 多监督 卷积注意力机制模块 小目标分割
在线阅读 下载PDF
基于注意力残差U-Net的皮肤镜图像分割方法 被引量:2
6
作者 沈鑫 魏利胜 《智能系统学报》 CSCD 北大核心 2023年第4期699-707,共9页
针对皮肤镜图像类内差异性、类间相似性、数据集不平衡等问题,本文提出了一种基于注意力残差U-Net(attention residual block-UNet,ARB-UNet)的皮肤镜图像分割方法。将卷积块注意力机制模块(convolutional block attention module,CBAM... 针对皮肤镜图像类内差异性、类间相似性、数据集不平衡等问题,本文提出了一种基于注意力残差U-Net(attention residual block-UNet,ARB-UNet)的皮肤镜图像分割方法。将卷积块注意力机制模块(convolutional block attention module,CBAM)引入到U-Net模型的“跳过连接”中;同时将CBAM模块集成到残差模块DRB(dilated residual networks)中得到注意力残差结构(attention residual block,ARB);且选取Focal Tversky Loss作为该模型的损失函数;在ISIC2016数据集上对所提ARB-UNet模型进行训练和测试,并与传统方法和UNet等经典方法进行了对比实验,实验结果中灵敏度(sensitivity,SE)达到了92.9%,特异性(specificity,SP)达到了94.1%,Dice相似指数(dice similarity cofficient,DSC)达到了92.1%,整体上均优于其他对比方法,从而验证了本文方法是有效的和可行的。 展开更多
关键词 图像分割 皮肤镜 卷积神经网络 注意力残差U-Net 注意力机制 卷积注意力机制模块 深度学习 残差网络
在线阅读 下载PDF
基于卷积模块注意力机制深度学习模型的激光熔覆裂纹识别 被引量:6
7
作者 崔陆军 李海洋 +4 位作者 郭士锐 李晓磊 崔英浩 郑博 孙满盈 《激光与光电子学进展》 CSCD 北大核心 2021年第20期329-335,共7页
为改进传统人工方法对熔覆区域裂纹检测耗时、准确率低的现状,提出了一种融合注意力模型的熔覆区裂纹自动识别方法,以便对裂纹进行标识和检测。基于U-net网络构造的熔覆裂纹语义分割网络存在对局部小特征提取能力不足的问题,而通过增加... 为改进传统人工方法对熔覆区域裂纹检测耗时、准确率低的现状,提出了一种融合注意力模型的熔覆区裂纹自动识别方法,以便对裂纹进行标识和检测。基于U-net网络构造的熔覆裂纹语义分割网络存在对局部小特征提取能力不足的问题,而通过增加注意力模型(CBAM)层,提取特征空间和特征通道的权重信息,就可以对激光熔覆区微观裂纹进行实时的像素级标注和检测。实验结果表明:引入注意力模型的深度学习模型可使熔覆裂纹的识别和检测准确率提升2.7个百分点;融合注意力模型的网络在熔覆区域裂纹测试集上的准确率为79.8%。深度学习模型标注的准确度和速度均已超过人工标注,为激光熔覆裂纹的识别提供了有效方法。 展开更多
关键词 图像处理 熔覆区裂纹 卷积模块注意力机制 语义分割 U-net网络
原文传递
基于CABFAM-Transformer的输电线路在线测距实测行波预分类方法
8
作者 唐玉涛 束洪春 +3 位作者 刘皓铭 苏萱 韩一鸣 代月 《电工技术学报》 北大核心 2025年第5期1455-1470,共16页
行波采集装置是电力系统保护与测距的重要设备,广泛应用于110 kV及以上输电线路,且正向配电网延拓。由于启动灵敏,非故障信息的采集给故障辨识与行波测距带来了挑战。该文提出了一种基于卷积注意力机制的特征聚合模块(CABFAM)与自适应Tr... 行波采集装置是电力系统保护与测距的重要设备,广泛应用于110 kV及以上输电线路,且正向配电网延拓。由于启动灵敏,非故障信息的采集给故障辨识与行波测距带来了挑战。该文提出了一种基于卷积注意力机制的特征聚合模块(CABFAM)与自适应Transformer模型的输电线路实测故障性质识别方法。首先,通过CBAM机制增强卷积层提取特征信息的表达与理解能力;然后,构建自适应编码层级调整机制的Transformer模型库,以获取多层次差异化特征信息;最后,利用云南电网110~220 kV输电线路的5076条实测数据及220 kV DL站H-P线的15924条伪实测数据进行训练与测试,针对16种典型行波数据进行分类。测试结果表明,该方法降低了模型参数量,提高了准确度,算法的多个关键指标均有不同幅度的提升,表现出优异的检测精度与识别效率。 展开更多
关键词 行波采集装置 基于卷积注意力机制的特征聚合模块 CABFAM 自适应Transformer 实测数据故障辨识
在线阅读 下载PDF
基于卷积神经网络的遮挡目标图像检测识别技术研究 被引量:1
9
作者 秦晨曦 于洋 《电脑编程技巧与维护》 2023年第2期153-155,共3页
为了尽可能降低图像目标的重复识别概率、错误率,提出了利用卷积神经网络算法对图像识别信息的重复识别进行分析的实验研究。遮挡目标的数据集经过图像增强后输入给卷积层卷积,初始化得到的图像数据经过卷积层卷积后,提交至池化层进行... 为了尽可能降低图像目标的重复识别概率、错误率,提出了利用卷积神经网络算法对图像识别信息的重复识别进行分析的实验研究。遮挡目标的数据集经过图像增强后输入给卷积层卷积,初始化得到的图像数据经过卷积层卷积后,提交至池化层进行进一步处理,提取图像特征数据,将提取的图像特征数据经过池化层处理后进行压缩,提取遮挡目标的关键特征信息。最后经过TensorFlow深度机器学习框架的实验测试,进一步证明使用注意模块后可以通过引导网络去关注被遮挡目标图像上的可视细节部分,并完善对遮挡目标图像检测进行验证研究。 展开更多
关键词 卷积神经网络 卷积注意力机制模块 遮挡目标识别
在线阅读 下载PDF
融合Inception V1-CBAM-CNN的轴承剩余寿命预测模型 被引量:4
10
作者 余江鸿 彭雄露 +2 位作者 刘涛 杨文 叶帅 《机电工程》 北大核心 2024年第1期107-114,共8页
针对现有的滚动轴承剩余寿命(RUL)预测方法精度低、轴承健康指标(HI)构建困难等问题,提出了一种基于卷积神经网络(CNN)并融合Inception V1模块和卷积注意力机制模块(CBAM)的滚动轴承RUL预测模型。首先,在CNN中添加了CBAM机制,并进行了... 针对现有的滚动轴承剩余寿命(RUL)预测方法精度低、轴承健康指标(HI)构建困难等问题,提出了一种基于卷积神经网络(CNN)并融合Inception V1模块和卷积注意力机制模块(CBAM)的滚动轴承RUL预测模型。首先,在CNN中添加了CBAM机制,并进行了加权处理,在通道和空间维度对重要特征进行了强化,对次要特征进行了抑制,通过添加改进的InceptionV1模块,提高了CNN通道间信息交互水平,全面提取了退化特征;然后,进行了网络优化,采用全局最大池化(GMP)方法对模型进行了简化,采用Dropout和批量归一化(BN)方法,避免了过拟合,提高了精度,且克服了训练时出现的梯度消失问题;最后,对数据进行了处理,将降噪后的信号重组为三维张量,将其作为HI,构建了退化标签,引入了评价指标,采用PHM2012轴承数据集进行了实验验证,在3种工况下将其与深度神经网络(DNN)、CNN方法、结合注意力机制的残差网络方法(ResNet)进行了对比。研究结果表明:该方法在变负载条件下的平均RMSE为0.033,较其他方法的RMSE值分别降低了86%、78%和69%,在预测精度和泛化能力方面具有明显优势。 展开更多
关键词 滚动轴承 剩余使用寿命 Inception V1模块 卷积注意力机制模块 卷积神经网络 全局最大池化 批量归一化
在线阅读 下载PDF
基于时序特征灰度图与多任务学习的综合能源负荷短期预测 被引量:2
11
作者 倪建辉 张菁 +2 位作者 张昊立 陈龙 高典 《电气工程学报》 CSCD 北大核心 2024年第2期186-199,共14页
准确预测综合能源系统(Integrated energy system,IES)中的电、冷、热多元负荷是提高各类能源综合效率、获得更大经济效益的关键。因此,提出一种基于时序特征灰度图与多任务学习的综合能源负荷短期预测方法。首先将初始特征集通过最大... 准确预测综合能源系统(Integrated energy system,IES)中的电、冷、热多元负荷是提高各类能源综合效率、获得更大经济效益的关键。因此,提出一种基于时序特征灰度图与多任务学习的综合能源负荷短期预测方法。首先将初始特征集通过最大互信息系数(Maximum information coefficient,MIC)改进的快速相关滤波算法(Fast correlation-based filter,FCBF)对IES时序特征数据集进行相关性分析和冗余性分析;然后将特征选择结果利用因数重构法与MIC-gamma图像增强的方法重构为时序特征灰度图,能够直观有效地反映实际数据的特征相关性;其次采用基于多任务学习框架的(Convolutional block attention module-convolutional neural network-deep bidirectional gated recurrent unit,CBAM-CNN-DBiGRU)网络进行训练,嵌入的卷积注意力机制模块(Convolutional block attention module,CBAM)与(Deep bidirectional gated recurrent unit,DBiGRU)结构能有效加强共享层的关键信息提取和时序信息处理能力;最后以美国亚利桑那州立大学的IES数据为例对提出的方法进行测试。选取典型工作日和典型休息日并对比多种深度网络模型,测试结果表明,该模型在典型工作日的加权平均绝对百分比误差与加权均方根误差分别最大降低了0.8813%与229.2593 kW,在典型休息日则分别最大降低了0.9942%与360.8007 kW,能够有效提升IES多元负荷预测精度。 展开更多
关键词 多元负荷预测 最大互信息系数 快速相关滤波算法 特征冗余性 MIC-gamma图像增强 卷积注意力机制模块 深度双向门控循环单元
在线阅读 下载PDF
基于双目视觉的吊卡识别及其方位检测方法 被引量:1
12
作者 李进付 《石油机械》 北大核心 2024年第4期11-17,共7页
针对钻井自动化中的吊卡方位需要人工参与,存在识别定位缓慢和准确性差等问题,建立了基于双目视觉的吊卡自动识别和方位检测系统。通过搭建双目相机视觉检测系统,对获取的吊卡图像进行标定、立体校正和立体匹配,进而获取吊卡图像的深度... 针对钻井自动化中的吊卡方位需要人工参与,存在识别定位缓慢和准确性差等问题,建立了基于双目视觉的吊卡自动识别和方位检测系统。通过搭建双目相机视觉检测系统,对获取的吊卡图像进行标定、立体校正和立体匹配,进而获取吊卡图像的深度图。在原YOLOv5s目标检测算法的主干网络中引入卷积注意力机制模块,将要识别的目标即吊卡图像进行增强,进一步提高吊卡的识别准确率,结合深度图计算出吊卡中心位置相对机械手的距离和偏转角度,从而实现自动送管。通过在钻井平台的试验,验证了吊卡识别和检测方法的有效性。所得结论可为钻井平台自动化程度的进一步提高提供技术借鉴。 展开更多
关键词 吊卡识别 方位检测 双目相机 YOLOv5s算法 卷积注意力机制模块 试验验证
在线阅读 下载PDF
基于CBAM-YOLO腰椎间盘突出症MRI图像的自动诊断体系
13
作者 李亚浩 沈学强 +1 位作者 姜宏 俞鹏飞 《中西医结合慢性病杂志》 2024年第1期63-69,共7页
目的腰椎间盘突出症(lumbar disc herniation,LDH)是脊柱退行性疾病的常见类型,可导致腰痛和下肢神经症状。MRI图像在诊断中至关重要,但存在依赖经验和缺乏标准化机制的问题。研究旨在开发基于卷积块注意力模块-视觉目标检测算法(convol... 目的腰椎间盘突出症(lumbar disc herniation,LDH)是脊柱退行性疾病的常见类型,可导致腰痛和下肢神经症状。MRI图像在诊断中至关重要,但存在依赖经验和缺乏标准化机制的问题。研究旨在开发基于卷积块注意力模块-视觉目标检测算法(convolutional block attention module-you only look once,CBAM-YOLO)的深度学习模型,以辅助自动诊断LDH MRI图像,从而提高诊断的准确性和效率。方法研究采纳了一个包含643例LDH患者MRI图像数据的公开数据集,每张图像均详细标注了包括椎间盘等在内的多种结构信息,并提出了一种新型模型CBAM-YOLO,它是在原有YOLO-v8模型的基础上,通过嵌入卷积注意力模块CBAM进行改良。此改进有助于模型更精确地识别突出椎间盘的特征位置及空间分布信息。为了充分验证模型的性能,研究使用CBAM-YOLO模型对经过数据增强的训练集进行了系统训练,共进行了100个训练周期。在模型评估环节,研究采用了Precision、Recall、F1-Score、Accuracy以及mAP等多个评价指标,以全面而严谨地评估模型的性能表现。结果CBAM-YOLO模型在诊断腰椎间盘突出症MRI影像方面展现出了卓越的性能。相较于原YOLO-v8模型,研究所构建的CBAM-YOLO模型在Precision达到了89.9%,Recall高达100.0%,F1-Score为94.6%,Accuracy为89.9%,以及mAP达到了97.1%,均表现出了明显的优势。结论测试结果充分凸显了基于深度学习的自动诊断体系在腰椎MRI图像中椎间盘识别与分割方面的巨大潜力,同时在临床应用中可提高疾病诊断的准确性和效率,进而减轻医疗专业人员的负担。 展开更多
关键词 深度学习 腰椎间盘突出症 目标检测 卷积注意力机制模块
在线阅读 下载PDF
基于改进YOLOv8的工厂行人检测算法
14
作者 陈思涵 刘勇 何祥 《现代电子技术》 北大核心 2024年第24期160-166,共7页
针对工厂中行人检测算法精度不足,存在误检、漏检等问题,提出一种基于改进YOLOv8的工厂行人检测算法。首先,在YOLOv8的C2f模块中引入卷积块注意力机制模块(CBAM),以帮助主干网络聚焦于关键特征并抑制非关键特征,从而提升模型对遮挡物和... 针对工厂中行人检测算法精度不足,存在误检、漏检等问题,提出一种基于改进YOLOv8的工厂行人检测算法。首先,在YOLOv8的C2f模块中引入卷积块注意力机制模块(CBAM),以帮助主干网络聚焦于关键特征并抑制非关键特征,从而提升模型对遮挡物和小目标的检测准确度;其次,在Neck网络中将卷积神经网络Conv模块替换成CoordConv模块,以充分利用该模块的定位能力,从而解决目标检测中的定位准确性问题,提升模型对空间位置的感知能力;最后,采用Inner-IoU损失函数替代原始的CIoU损失函数,来提高目标检测边界框的回归精度。在自制的工厂行人图像数据集(3 600张图像)上进行了训练和测试,实验结果表明:相较于基础YOLOv8算法,改进YOLOv8算法在平均精度均值(mAP)和每秒帧率(FPS)方面分别提高了2.26%和35.6 f/s,验证了改进算法在检测性能上的提升。 展开更多
关键词 行人检测 YOLOv8算法 深度学习 卷积注意力机制模块(CBAM) CoordConv Inner-IoU损失函数
在线阅读 下载PDF
基于YOLOv5-CBAM模型的划痕智能检测
15
作者 朱哲维 李珂 +3 位作者 匡璐 曹国栋 刘紫权 史旭阳 《无线电工程》 2024年第12期2789-2799,共11页
带钢作为现代钢铁产业的核心产品,划痕检测对于确保产品质量、提升生产效率和降低成本至关重要,广泛应用于汽车制造、金属加工、电子产品生产等领域。然而,划痕形态各异且易受光照、背景和噪声等因素影响,使得检测任务极具挑战性。近年... 带钢作为现代钢铁产业的核心产品,划痕检测对于确保产品质量、提升生产效率和降低成本至关重要,广泛应用于汽车制造、金属加工、电子产品生产等领域。然而,划痕形态各异且易受光照、背景和噪声等因素影响,使得检测任务极具挑战性。近年来,随着空间数据智能技术的不断进步,基于深度学习的目标检测算法(如Faster R-CNN、SSD、YOLO等)在检测任务中表现出色,通过自动学习、特征检测和精准目标定位,在复杂背景下也能准确检测。基于YOLOv5模型进行了算法结构的改进,将空间金字塔池化(Spatial Pyramid Pooling,SPP)模块替换为快速空间金字塔池化(Spatial Pyramid Pooling-Fast,SPPF)模块,引入注意力机制,改进现有的目标检测算法,提升划痕检测的准确性和鲁棒性。结合卷积块注意力机制模块(Convolutional Block Attention Module,CBAM)构建了YOLOv5-CBAM模型。CBAM通过关注通道和空间维度上的信息,使模型更精准地聚焦于划痕区域,提升了检测效果。实验结果显示,YOLOv5-CBAM模型在各类交并比(Intersection over Union,IoU)阈值下相较于YOLOv5,精确率、召回率和mAP@0.5有着较好的表现,分别提升了5.6%、9.1%和5.9%。随着空间数据智能技术的不断进步,未来有望为划痕检测提供更多创新思路和解决方案。 展开更多
关键词 划痕检测 YOLOv5 卷积注意力机制模块 模型构建与训练
在线阅读 下载PDF
一种基于YOLOv4的密集人群小目标检测方法
16
作者 王翀 王同军 周正一 《应用科技》 CAS 2024年第2期82-89,共8页
针对密集人群中由于视觉受阻和目标被遮挡导致小目标检测精度不佳的问题,本文基于YOLOv4模型将卷积块–像素块注意力机制模块(convolutional-pixel block attention module,CBAM-PIX)融入主干网络CSPDarknet53,并利用级联思想改进特征... 针对密集人群中由于视觉受阻和目标被遮挡导致小目标检测精度不佳的问题,本文基于YOLOv4模型将卷积块–像素块注意力机制模块(convolutional-pixel block attention module,CBAM-PIX)融入主干网络CSPDarknet53,并利用级联思想改进特征融合网络。注意力机制方法和特征融合方法不仅提升了数据的丰富性,而且提高了空间通道像素提取信息的能力和目标检测的准确性。此外,通过减少网络层数降低计算量和减少参数,提高了网络模型在有限计算资源和设备需求下的适应能力。实验结果表明,改进的模型算法在用于密集人群小目标检测时精确度提升了1.96%,且鲁棒性强。该算法为解决复杂背景下密集人群小目标检测提供了有效的解决方案,具有应用价值。 展开更多
关键词 小目标检测 YOLOv4 特征提取 卷积块–像素块注意力机制模块 密集人群 多尺度特征网络 WiderPerson数据集 特征融合
在线阅读 下载PDF
基于CBAM Faster R-CNN的食道癌检测 被引量:8
17
作者 佘逸飞 高军峰 +3 位作者 闵祥德 徐胜舟 盘安思 蓝文威 《中南民族大学学报(自然科学版)》 CAS 北大核心 2021年第6期631-638,共8页
为解决钡餐造影图像经Faster R-CNN的骨干网络得出的特征图中的食管区域不明显以及背景区域占比较大等问题,提出了CBAM Faster R-CNN,它是在原Faster R-CNN模型的基础上添加卷积注意力模块CBAM,以提升特征图中食管区域的特征的显著性.采... 为解决钡餐造影图像经Faster R-CNN的骨干网络得出的特征图中的食管区域不明显以及背景区域占比较大等问题,提出了CBAM Faster R-CNN,它是在原Faster R-CNN模型的基础上添加卷积注意力模块CBAM,以提升特征图中食管区域的特征的显著性.采用CBAM Faster R-CNN模型对数据增强后的训练集进行了训练,并采用Recall值、Precision值、AP值进行了评价分析.实验结果表明:在不同的IOU阈值下,CBAM Faster R-CNN模型的检测效果明显优于Faster R-CNN,且对实际的临床研究具有一定的意义. 展开更多
关键词 食道癌 目标检测 更快速的R-CNN 卷积注意力机制模块 计算机视觉
在线阅读 下载PDF
基于改进YOLOv5算法的密集遮挡零件检测 被引量:4
18
作者 张新伟 陈东 +1 位作者 闫昊 马兆昆 《工具技术》 北大核心 2023年第10期150-155,共6页
针对零件在密集遮挡等复杂场景下存在视觉识别难度大、检测精度低和实时性差的问题,提出YOLOv5零件目标检测的改进算法。在YOLOv5的主干网络中添加卷积注意力机制模块,进而增强算法对零件的特征提取能力;将抑制准则改为考虑真实框与预... 针对零件在密集遮挡等复杂场景下存在视觉识别难度大、检测精度低和实时性差的问题,提出YOLOv5零件目标检测的改进算法。在YOLOv5的主干网络中添加卷积注意力机制模块,进而增强算法对零件的特征提取能力;将抑制准则改为考虑真实框与预测框重叠区域且同时计算两个框之间中心点距离的DIoU-NMS,并以此作为后处理方法,进而提高零件检测精度。试验结果表明,相比原始YOLOv5算法,本改进算法将mAP@0.5提升1.6%,识别速度达58.8帧/s,可以更好地完成检测密集遮挡零件的任务,同时保证了实时性。 展开更多
关键词 目标检测 YOLOv5 卷积注意力机制模块 DIoU-NMS
在线阅读 下载PDF
面向密集场景结合TC-YOLOX的小目标检测方法 被引量:2
19
作者 李翔宇 王伟 +1 位作者 王峰萍 韩岩江 《电子测量技术》 北大核心 2023年第15期133-142,共10页
密集场景下小目标的高效精确检测是目标检测领域的关键问题。为了解决环境的多样性和小目标自身复杂性存在着特征难以提取、检测精度低等问题,提出一种面向密集场景结合TC-YOLOX的小目标检测方法。首先,通过在CSPNet中引入Transformer E... 密集场景下小目标的高效精确检测是目标检测领域的关键问题。为了解决环境的多样性和小目标自身复杂性存在着特征难以提取、检测精度低等问题,提出一种面向密集场景结合TC-YOLOX的小目标检测方法。首先,通过在CSPNet中引入Transformer Encode模块,不断更新目标权重实现增强目标特征信息,提高网络的特征提取能力;其次,在特征金字塔网络中增加卷积注意力机制模块,关注重要特征并抑制不必要特征,提高不同尺度目标的检测准确度;然后,采用CIoU代替IoU作为回归损失函数,使得模型训练过程中网络收敛更快,性能更好;最后在PASCAL VOC 2007数据集上验证。实验结果表明,所设计的TC-YOLOX模型能够有效的检测出多样化场景中正常、密集、稀疏、黑暗条件下的小目标物体,mAP和检测速度可以达到94.6%和38 fps,与原始模型相比提升了10.9%和1 fps,对多种密集场景下的小目标检测任务均具有较好的适用性。 展开更多
关键词 小目标检测 YOLOX 卷积注意力机制模块 Transformer Encode CIoU回归损失函数
在线阅读 下载PDF
基于改进YOLOv5s的小麦赤霉病检测方法 被引量:1
20
作者 高君 张正华 +2 位作者 邵明 廖瑾薇 蔡涵杰 《信息与电脑》 2023年第12期61-65,共5页
针对目前小麦赤霉病检测依赖人工和实时性较低等缺点,提出一种基于改进YOLOv5s的小麦赤霉病检测算法。首先使用数据增强方式扩充样本集合,增强模型的训练效果,其次引入GhostConv卷积来代替原有Conv卷积,提升计算速度,再次引入卷积注意... 针对目前小麦赤霉病检测依赖人工和实时性较低等缺点,提出一种基于改进YOLOv5s的小麦赤霉病检测算法。首先使用数据增强方式扩充样本集合,增强模型的训练效果,其次引入GhostConv卷积来代替原有Conv卷积,提升计算速度,再次引入卷积注意力机制模块(Convolutional Block Attention Module,CBAM)提升检测精度,最后引入TensorRT网络进行模型检测加速。实验结果表明:改进后的YOLOv5s模型经TensorRT加速后平均精度均值达到0.938,提升了2.6个百分点;单幅图像处理时间为77.8 ms,检测速度提升1.45倍。综上,本次提出的检测方法可以基本满足小麦赤霉病检测对精度和实时性的要求。 展开更多
关键词 小麦赤霉病 YOLOv5s 卷积注意力机制模块(CBAM) TensorRT
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部