期刊文献+
共找到211篇文章
< 1 2 11 >
每页显示 20 50 100
基于坐标注意力和软化非极大值抑制的密集安全帽检测
1
作者 尹向雷 苏妮 +1 位作者 解永芳 屈少鹏 《现代电子技术》 北大核心 2025年第2期153-161,共9页
为解决现有的安全帽检测算法对密集小目标的检测精度低的问题,提出一种基于坐标注意力和软化非极大值抑制的安全帽检测算法。引入坐标注意力机制,聚焦训练安全帽相关目标特征以提高准确率。采用软化非极大值抑制算法对候选框的置信度进... 为解决现有的安全帽检测算法对密集小目标的检测精度低的问题,提出一种基于坐标注意力和软化非极大值抑制的安全帽检测算法。引入坐标注意力机制,聚焦训练安全帽相关目标特征以提高准确率。采用软化非极大值抑制算法对候选框的置信度进行优化,提升模型对密集小目标的检测精度。通过WIoU优化边界框损失函数,使得模型聚焦于困难样例而减少简单示例对损失值的贡献,提升模型的泛化性能。实验结果表明:与基准模型YOLOv5s相比,所提算法的mAP@0.5达到88.4%,提升了3.0%;mAP@0.5:0.95达到65.6%,提升了6.8%;在召回率和准确率上分别提升了2.4%和0.5%。所提算法为密集小目标的检测提供了一定参考。 展开更多
关键词 安全帽检测 坐标注意力机制 软化非极大值抑制 YOLOv5s WIoU 边界框损失函数
在线阅读 下载PDF
基于坐标注意力机制增强的CenterNet模型在烟草甲检测中的应用
2
作者 孙俊峰 王保录 +1 位作者 黄琰淦 黄滔 《湖北农业科学》 2024年第11期191-196,215,共7页
通过在CenterNet模型中引入坐标注意力机制,使CAM-CenterNet模型更多地关注对烟草甲(Lasioderma serricorne)(以下简称烟虫)表征能力好的通道和位置,降低烟丝、烟末等杂质的干扰,将精确率(Precision)、召回率(Recall)、平均精度(mAP)、... 通过在CenterNet模型中引入坐标注意力机制,使CAM-CenterNet模型更多地关注对烟草甲(Lasioderma serricorne)(以下简称烟虫)表征能力好的通道和位置,降低烟丝、烟末等杂质的干扰,将精确率(Precision)、召回率(Recall)、平均精度(mAP)、每秒帧率(FPS)以及模型参数量(Params size)作为评价指标,对CAM-CenterNet模型、CenterNet模型、YOLOv3模型和Faster R-CNN模型的烟虫检测性能进行对比。结果表明,在召回率和平均精度方面,YOLOv3模型表现最好,CAM-CenterNet模型稍落后于YOLOv3模型,但高于其他模型;在帧率方面,CAM-CenterNet模型检测烟虫图像的速度较YOLOv3模型更快,且模型参数量更少,对设备配置要求更低。在检测个体较小的烟虫时,CAM-CenterNet模型的烟虫检出数量高于Faster R-CNN模型、YOLOv3模型。CAM-CenterNet模型不仅能更多地关注烟虫目标特征,而且能很好地抑制烟丝、烟末等杂质带来的干扰,实现烟虫的有效检测。CAM-CenterNet模型能满足卷烟厂对烟虫检测速度和精度的要求,可以为烟厂的烟虫整治提供技术支持。 展开更多
关键词 坐标注意力机制 CenterNet模型 caM-CenterNet模型 烟草甲(Lasioderma serricorne)检测
在线阅读 下载PDF
噪声环境下基于域对抗图卷积网络和坐标注意力的说话人确认方法
3
作者 陈家辉 葛子瑞 +2 位作者 王天朗 郭海燕 杨震 《南京邮电大学学报(自然科学版)》 北大核心 2025年第1期57-67,共11页
为了减弱背景噪声对说话人确认(Speaker Verification,SV)性能的影响,提出一种基于域对抗图卷积网络(Domain Adversarial Graph Convolution Network,DA⁃GCN)和坐标注意力(Coordinate Attention,CA)的SV方法来提升噪声环境下的SV性能。... 为了减弱背景噪声对说话人确认(Speaker Verification,SV)性能的影响,提出一种基于域对抗图卷积网络(Domain Adversarial Graph Convolution Network,DA⁃GCN)和坐标注意力(Coordinate Attention,CA)的SV方法来提升噪声环境下的SV性能。首先,针对噪声环境下局部特征变得不稳定这个问题,提出引入CA模块,将全局时间信息和全局频率信息编码到通道注意力中,以强调有用通道,提取鲁棒性的说话人特征。其次,提出构建DA⁃GCN来辅助主网络提取与噪声相关性更小的说话人特征来进行后续的分类。具体而言,将语音信号映射为图信号,利用GCN分别对干净语音图信号特征和含噪语音图信号特征进行聚合,通过域对抗(Domain Adversarial,DA)训练,辅助主网络提取干净语音域和含噪语音域共享的说话人特征,从而降低噪声对SV性能的影响。在VoxCeleb1数据集上的实验结果表明,所提CA⁃DA⁃GCN的性能优于基线模型ExU⁃Net且表现出良好的泛化能力。 展开更多
关键词 噪声环境 说话人确认 域对抗 坐标注意力机制 图卷积神经网络
在线阅读 下载PDF
基于坐标注意力的细胞分割模型CR-UNet
4
作者 林卉 齐苏敏 +1 位作者 孟静 张梦琦 《曲阜师范大学学报(自然科学版)》 2025年第1期63-70,共8页
由于细胞图像中存在边界模糊、细胞重叠交织以及细胞图像与背景区域对比不明显等问题,导致细胞分割精度降低、难度变大.针对这些问题,提出了一种改进的网络模型CR-UNet来提升分割精度.CR-UNet将融合坐标注意力的残差模块(CR block)应用... 由于细胞图像中存在边界模糊、细胞重叠交织以及细胞图像与背景区域对比不明显等问题,导致细胞分割精度降低、难度变大.针对这些问题,提出了一种改进的网络模型CR-UNet来提升分割精度.CR-UNet将融合坐标注意力的残差模块(CR block)应用到U-Net网络的编码器与解码器中,能够提取更多的细胞细节特征,降低复杂背景对细胞图像分割的影响.2个公开数据集和1个自建数据集上的实验结果表明,与其他先进的图像分割网络相比,CR-UNet性能均有所提升;尤其在自建数据集上,相较于U-Net模型,CR-UNet的准确率提升了2.3%,Hd指标降低了0.29,Dice相似系数达到了96.15%. 展开更多
关键词 医学图像分割 U-Net 坐标注意力 残差机制
在线阅读 下载PDF
融合坐标与多头注意力机制的交互语音情感识别 被引量:1
5
作者 高鹏淇 黄鹤鸣 樊永红 《计算机应用》 CSCD 北大核心 2024年第8期2400-2406,共7页
语音情感识别(SER)是人机交互系统中一项重要且充满挑战性的任务。针对目前SER系统中存在特征单一和特征间交互性较弱的问题,提出多输入交互注意力网络MIAN。该网络由特定特征坐标残差注意力网络和共享特征多头注意力网络两个子网络组... 语音情感识别(SER)是人机交互系统中一项重要且充满挑战性的任务。针对目前SER系统中存在特征单一和特征间交互性较弱的问题,提出多输入交互注意力网络MIAN。该网络由特定特征坐标残差注意力网络和共享特征多头注意力网络两个子网络组成。前者利用Res2Net和坐标注意力模块学习从原始语音中获取的特定特征,并生成多尺度特征表示,增强模型对情感相关信息的表征能力;后者融合前向网络所获取的特征,组成共享特征,并经双向长短时记忆(BiLSTM)网络输入至多头注意力模块,能同时关注不同特征子空间中的相关信息,增强特征之间的交互性,以捕获判别性强的特征。通过2个子网络间的协同作用,能增加模型特征的多样性,增强特征之间的交互能力。在训练过程中,应用双损失函数共同监督,使同类样本更紧凑、不同类样本更分离。实验结果表明,MIAN在EMO-DB和IEMOCAP语料库上分别取得了91.43%和76.33%的加权平均精度,相较于其他主流模型,具有更好的分类性能。 展开更多
关键词 语音情感识别 坐标注意力机制 多头注意力机制 特定特征学习 共享特征学习
在线阅读 下载PDF
数字信号调制识别下坐标注意力机制方案研究
6
作者 张兢 兰思源 +1 位作者 曹阳 彭小峰 《无线电工程》 2024年第6期1398-1406,共9页
针对低信噪比下神经网络难以提取数字信号空间特征的问题,提出一种基于坐标注意力机制的数字信号识别方案。将8种数字信号进行正交调制,根据其幅度、相位信息序列进行预编码处理,在不同的训练步长下,提取分析数字信号幅度和相位的关键特... 针对低信噪比下神经网络难以提取数字信号空间特征的问题,提出一种基于坐标注意力机制的数字信号识别方案。将8种数字信号进行正交调制,根据其幅度、相位信息序列进行预编码处理,在不同的训练步长下,提取分析数字信号幅度和相位的关键特征,选取合适的神经网络超参数,使网络达到拟合面。坐标注意力机制将数字信号特征进行2个一维特征编码,分别沿纵向和横向捕获幅度和相位的远程依赖关系;将生成的数字信号特征编码为一对方向感知和位置敏感的权重系数,进行数字信号特征的重标定。仿真结果表明,8种数字信号下,调制方式识别率高于95%时,卷积神经网络(Convolutional Neural Network,CNN)中坐标注意力机制信噪比增益约为4 dB,残差神经网络中坐标注意力机制信噪比增益约为8 dB。坐标注意力机制取得了较高的识别率以及更好的信噪比增益,与通道注意力机制、空间注意力机制相比更适用于数字信号解调的应用。 展开更多
关键词 数字信号 调制识别 坐标注意力机制 权重系数
在线阅读 下载PDF
基于坐标注意力机制和残差网络的苹果外观品质检测
7
作者 齐永兰 李仁惠 李学伟 《现代食品》 2024年第10期193-195,共3页
随着机器视觉技术的发展,利用卷积神经网络实现苹果品质分级已成为较优的应用技术。本研究以苹果外观品质特征为对象,提出了一种基于残差神经网络和坐标注意力机制的苹果品质检测方法。实验结果显示,引入坐标注意力机制后的Res Net18网... 随着机器视觉技术的发展,利用卷积神经网络实现苹果品质分级已成为较优的应用技术。本研究以苹果外观品质特征为对象,提出了一种基于残差神经网络和坐标注意力机制的苹果品质检测方法。实验结果显示,引入坐标注意力机制后的Res Net18网络模型平均准确率达到91.4%,损失值为0.1。该方法在各项性能上优于ResNet18、34、50网络模型,能够有效实现苹果品质分级。 展开更多
关键词 坐标注意力机制 残差神经网络 机器视觉 水果分级
在线阅读 下载PDF
基于改进卷积注意力机制的触觉图像识别 被引量:5
8
作者 熊鹏文 陈志远 +1 位作者 廖俊杰 宋爱国 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期175-182,共8页
为了改善传统轻量化网络对触觉图像全局特征提取能力差的问题,提出一种基于轻量化网络提高触觉图像感知分类的新算法,通过将卷积块注意力模块(CBAM)引入坐标注意力机制(CA)来增强特征信息表达能力.利用CA采取空间全局信息并嵌入通道注意... 为了改善传统轻量化网络对触觉图像全局特征提取能力差的问题,提出一种基于轻量化网络提高触觉图像感知分类的新算法,通过将卷积块注意力模块(CBAM)引入坐标注意力机制(CA)来增强特征信息表达能力.利用CA采取空间全局信息并嵌入通道注意中,使卷积网络能够在较全面的区域捕获注意力权重.结果表明:所提算法优于现有轻量化网络算法;该算法对GelSight数据集、多模态传感器数据集2种触觉图像进行分类识别测试,在分类表现中分辨正确率分别达到了88.2%和94.4%;相比于传统的CBAM注意力模型、自注意力模型(SENet)和仅有LeNet的神经网络,该算法对触觉图像的识别能力在GelSight数据集上分别提高了8.7%、8.7%和3.0%,在多模态传感器数据集上分别提高了13.3%、13.4%和4.8%. 展开更多
关键词 触觉图像 轻量化 注意力机制 坐标注意力
在线阅读 下载PDF
基于多尺度与坐标注意力机制的交通标志识别研究
9
作者 胡腾 杨毅强 +2 位作者 邹显迪 孙潇 毛国斌 《齐齐哈尔大学学报(自然科学版)》 2024年第5期8-15,共8页
针对智能交通识别系统需要具备较高的检测速度和识别精度的要求,在YOLOv4-tiny算法的基础上提出一种基于多尺度与坐标注意力机制融合的改进型轻量化YOLOv4-3RSCtiny算法。首先将主干网络中的Resblock_body模块改进为参数量更少的Resblo... 针对智能交通识别系统需要具备较高的检测速度和识别精度的要求,在YOLOv4-tiny算法的基础上提出一种基于多尺度与坐标注意力机制融合的改进型轻量化YOLOv4-3RSCtiny算法。首先将主干网络中的Resblock_body模块改进为参数量更少的ResblockD轻量化模块,用于提高算法的检测速度;其次引入特征金字塔池化网络,丰富深层特征图的空间信息,在预测阶段引入坐标注意力机制,降低背景信息的干扰;最后利用具有多次跨级融合的路径增强特征金字塔网络,提高算法对小型目标物体的识别率。在TT100K数据集上进行测试,实验结果表明,相较于YOLOv4-tiny算法,YOLOv4-3RSCtiny算法具有较高的准确性和较好的实时性。 展开更多
关键词 ResblockD模块 特征金字塔池化网络 路径增强特征金字塔网络 坐标注意力机制
在线阅读 下载PDF
基于坐标注意力机制融合的反无人机系统图像识别方法 被引量:9
10
作者 薛珊 陈宇超 +1 位作者 吕琼莹 曹国华 《红外与激光工程》 EI CSCD 北大核心 2022年第9期407-417,共11页
反无人机系统是识别和打击“黑飞”无人机的有效手段,图像识别无人机是反无人机系统的关键之一。针对采集的无人机样本属于小样本、提取特征不够多,识别准确率不够高的问题,提出了一种基于迁移学习、密集卷积网络和坐标注意力机制融合... 反无人机系统是识别和打击“黑飞”无人机的有效手段,图像识别无人机是反无人机系统的关键之一。针对采集的无人机样本属于小样本、提取特征不够多,识别准确率不够高的问题,提出了一种基于迁移学习、密集卷积网络和坐标注意力机制融合的反无人机系统图像识别方法。首先,运用自制设备采集了多种无人机在不同背景下的图片,建立数据样本;其次,设计针对无人机小样本识别的基于迁移学习、坐标注意力机制和密集卷积网络融合的网络TL-CA4-DenseNet-121、基于通道注意力机制融合的网络TL-SE4-DenseNet-121等网络,运用设计的网络对小样本进行识别,并进行对比,然后分别进行了基于不同位置和不同个数的坐标注意力模块和通道注意力模块的网络识别实验;最后,将识别效果最优的网络与经典卷积神经网络模型进行对比实验。实验结果表明,提出的TL-CA4-DenseNet-121网络识别效果优于其他网络,识别的平均准确率为97.93%,F1-Score为0.982 6,网络训练时间为6 832 s。结果表明了该网络在识别小样本无人机方面的优越性和可行性。 展开更多
关键词 无人机 图像识别 坐标注意力机制 密集卷积网络
在线阅读 下载PDF
一种坐标通道注意力深度学习网络的军用飞机识别方法 被引量:1
11
作者 杨环宇 王军 +3 位作者 吴祥 薄煜明 马立丰 陆金磊 《兵工学报》 EI CAS CSCD 北大核心 2024年第7期2128-2143,共16页
战场态势瞬息万变,利用可见光图像对敌方用于军事行动的飞机类型进行有效区分,对提供军事作战信息具有重要意义。针对现有军用飞机识别方法存在小目标飞机和环境背景复杂导致的模型特征提取困难、数据样本数量不足导致的模型训练不充分... 战场态势瞬息万变,利用可见光图像对敌方用于军事行动的飞机类型进行有效区分,对提供军事作战信息具有重要意义。针对现有军用飞机识别方法存在小目标飞机和环境背景复杂导致的模型特征提取困难、数据样本数量不足导致的模型训练不充分的问题,提出一种坐标通道注意力(ConvNeXt-Coordinate Attention,ConvNeXt-CA)深度学习网络军用飞机目标识别方法。该方法在ConvNeXt网络可以保留小目标飞机特征的基础上,引入CA机制设计CA-Stage模块,提升网络对于背景和前景的区分能力;采用数据增强的方式扩充数据集,以及使用迁移学习的策略提高模型的泛化能力,训练得到具备最优超参数的ConvNeXt-CA网络。实验结果表明,与传统的军用飞机识别方法和其他深度学习模型相比,基于迁移学习的ConvNeXt-CA网络在预测准确率上有明显的提升,且具备较强的泛化能力。 展开更多
关键词 军用飞机识别 深度卷积神经网络 坐标注意力机制 迁移学习
在线阅读 下载PDF
基于特征融合注意力机制的樱桃缺陷检测识别研究 被引量:1
12
作者 代东南 马睿 +2 位作者 刘起 孙孟研 马德新 《山东农业科学》 北大核心 2024年第3期154-162,共9页
针对现有樱桃缺陷检测识别中存在的问题,为实现移动端智能化快速检测与精准识别,本研究提出了一种基于卷积神经网络对樱桃图像进行缺陷检测识别的轻量化模型,可为开发樱桃的移动端无损化智能检测系统奠定理论基础。首先,将采集到的完好... 针对现有樱桃缺陷检测识别中存在的问题,为实现移动端智能化快速检测与精准识别,本研究提出了一种基于卷积神经网络对樱桃图像进行缺陷检测识别的轻量化模型,可为开发樱桃的移动端无损化智能检测系统奠定理论基础。首先,将采集到的完好樱桃、刺激生长樱桃、双胞胎樱桃和腐烂樱桃4类樱桃图像经预处理后按比例划分训练集、验证集和测试集。其次,基于迁移学习对比分析NASNet-Mobile、MobileNetV2、ResNet18、InceptionV3、VGG-16网络模型后,选择各方面性能表现良好的MobileNetV2为基线模型,通过微调构建I-MobileNetV2模型;然后在I-MobileNetV2基础上,嵌入坐标注意力(CA)模块,构建ICA-MobileNetV2模型,该模型平均准确率达到97.09%,相比于基线模型(90.02%)提高7.85%,比I-MobileNetV2模型(94.34%)提高2.91%。可见,ICA-MobileNetV2作为可部署移动端的轻量化模型,具有较高准确率和较少参数,适用于樱桃缺陷检测与多分类任务,为樱桃缺陷检测与品质分级研究提供了新思路。 展开更多
关键词 樱桃 缺陷检测 卷积神经网络 坐标注意力机制
在线阅读 下载PDF
基于坐标注意力关系网络的小样本轴承故障诊断
13
作者 郭敏 陈鹏 +2 位作者 周超 胡国宾 范青荣 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第4期332-340,共9页
轴承故障诊断对保障机械设备正常运转具有重要价值,基于机器学习的轴承故障诊断是其中一类常用方法,主要包括Alexnet、Resnet-18、关系网络、基于通道注意力SENet的关系网络(SERN)以及基于混合注意力CBAM的关系网络(CBRN)等.在实际应用... 轴承故障诊断对保障机械设备正常运转具有重要价值,基于机器学习的轴承故障诊断是其中一类常用方法,主要包括Alexnet、Resnet-18、关系网络、基于通道注意力SENet的关系网络(SERN)以及基于混合注意力CBAM的关系网络(CBRN)等.在实际应用中,小样本、变工况等可能导致这些方法出现泛化性能差、精度降低及过拟合等问题.本文提出了一种基于坐标注意力关系网络的小样本轴承故障诊断方法 .在该方法中,坐标注意力关系网络通过坐标信息的嵌入和坐标注意力的生成来解决关系网络模型无法建立特征图的长距离依赖关系及故障的特征位置信息难以获得的问题,增强模型在目标区域对故障特征的表达,进而重构出更具判别性的故障样本特征.该方法还采用特征嵌入模块来生成样本的特征向量,并通过对已标记样本和未标记样本的特征向量的拼接来生成特征向量组.最后,该方法利用关系得分模块对特征向量组进行非线性距离度量和生成关系得分,判断未标记样本的类别、实现故障分类.模拟实验表明,相比已有方法,该方法具有更好的分类能力. 展开更多
关键词 小样本学习 关系网络 故障诊断 坐标注意力机制 轴承
在线阅读 下载PDF
KMeans++与注意力机制融合的苹果叶片病害识别方法
14
作者 黄贻望 王国帅 +1 位作者 毛志 刘声 《江苏农业科学》 北大核心 2024年第20期190-198,共9页
为解决复杂环境下小尺度苹果叶片病害识别精度不高、鲁棒性不强的问题,在YOLO v5s的基础上提出一种新的改进方法。该方法首先在模型训练之前使用KMeans++聚类算法生成更接近真实框的锚框;其次在骨干网络中加入卷积块注意几模块(convolut... 为解决复杂环境下小尺度苹果叶片病害识别精度不高、鲁棒性不强的问题,在YOLO v5s的基础上提出一种新的改进方法。该方法首先在模型训练之前使用KMeans++聚类算法生成更接近真实框的锚框;其次在骨干网络中加入卷积块注意几模块(convolutional block attention module,CBAM),来提升复杂环境下小目标特征的提取能力;再次为了增强颈部网络对不同大小病害多尺度特征的有效识别,选择ConvNeXtBlock模块替换C3(CSP bottleneck with 3 convolutions)模块,并在颈部网络中融入坐标注意力模块(coordinate attention,CA),来加强模型对关键空间位置的响应,使得不同尺度的特征都能被更有效地利用;最后使用ECIoU损失函数替换原始的CIoU损失函数,来提高模型的收敛速度和精度。与Faster R-CNN、SSD、YOLO v5s、YOLO v7、YOLO v8目标检测模型相比,改进后模型的平均精度均值(mean average precision,mAP 0.5)值分别提升0.6、4.6、6.3、1.7、1.3百分点,同时在强光照、模糊、暗光的复杂场景下具有较强的鲁棒性。该模型可以为复杂环境下苹果叶片病害的识别提供行之有效的方案。 展开更多
关键词 苹果 叶片病害 病害检测 注意力机制 ConvNeXtBlock 卷积块注意力模块(CBAM) ca
在线阅读 下载PDF
结合注意力机制的轻量化人脸表情识别方法
15
作者 白武尚 何秋生 +1 位作者 王凯 曹京威 《太原科技大学学报》 2024年第5期474-479,486,共7页
针对目前人脸表情识别方法存在参数量多、计算资源消耗大和识别精度低的问题,研究一种轻量化的人脸表情识别方法。首先,对MobileNet V3L网络层数进行缩减,同时将倒残差结构中间通道数和输出通道数增大至原来的1.5~3.2倍。其次,引入改进... 针对目前人脸表情识别方法存在参数量多、计算资源消耗大和识别精度低的问题,研究一种轻量化的人脸表情识别方法。首先,对MobileNet V3L网络层数进行缩减,同时将倒残差结构中间通道数和输出通道数增大至原来的1.5~3.2倍。其次,引入改进的条件坐标注意力机制,在坐标信息嵌入中根据中间通道的数量,选择平均池化或最大池化进行编码,提取面部表情在空间和通道位置上的详细信息。最后,使用Mish代替h-swish激活函数,实现特征提取后的非线性化。在公开数据集FERPlus和RAF-DB进行实验,结果表明,所提方法比原始MobileNet系列模型识别精度分别提高0.60%和1.07%以上。所提方法比Ada-CM网络推理速度提升21.94%,识别精度提高0.49%以上,实验表明该方法具有良好的识别性能。 展开更多
关键词 表情识别 轻量化 条件坐标注意力机制 Mish激活函数
在线阅读 下载PDF
基于坐标注意力机制和残差网络的水稻叶片病虫害识别 被引量:1
16
作者 廖媛珺 杨乐 +1 位作者 邵鹏 余小云 《福建农业学报》 CAS CSCD 北大核心 2023年第10期1220-1229,共10页
【目的】针对在自然条件下水稻叶片病虫害的识别效率不高、准确率较低的问题,探索基于ResNet深度学习网络的水稻叶片病虫害识别模型(ResNet50-CA)。【方法】在ResNet-50的残差卷积模块下引入坐标注意力机制(CA),采用LeakyReLU激活函数替... 【目的】针对在自然条件下水稻叶片病虫害的识别效率不高、准确率较低的问题,探索基于ResNet深度学习网络的水稻叶片病虫害识别模型(ResNet50-CA)。【方法】在ResNet-50的残差卷积模块下引入坐标注意力机制(CA),采用LeakyReLU激活函数替代ReLU激活函数,使用3个3×3的卷积核替换ResNet-50模型首层卷积层中的7×7卷积核。【结果】在使用传统卷积神经网络进行水稻叶片病虫害研究发现,ResNet-50能够较好地平衡识别准确率和模型复杂度之间的关系,因此选择在ResNet-50网络模型的基础上加以改进。使用改进后的网络通过微调参数进行水稻叶片病虫害对比性能试验,研究发现在批量样本数为16和学习率为0.0001时,ResNet50-CA获得最高的识别准确率(99.21%),优于传统的深度学习算法。【结论】改进后的网络能够提取出水稻病虫害更加细微的特征信息,从而取得更高的识别准确率,为水稻叶片病虫害识别提供新思路和方法。 展开更多
关键词 深度学习 ResNet50 水稻病虫害识别 坐标注意力机制
在线阅读 下载PDF
一种基于通道注意力机制的交通监控视频超分辨率算法
17
作者 林哲显 《上海船舶运输科学研究所学报》 2024年第1期66-72,共7页
为提升交通监控视频的显示质量,进而提高监控视频车牌识别成功率,提出一种基于通道注意力机制(Channel-wise Attention,CA)和BasicVSR模型的监控视频超分辨率模型。在BasicVSR模型中引入CA,使模型能学习不同通道之间的非线性依赖关系,... 为提升交通监控视频的显示质量,进而提高监控视频车牌识别成功率,提出一种基于通道注意力机制(Channel-wise Attention,CA)和BasicVSR模型的监控视频超分辨率模型。在BasicVSR模型中引入CA,使模型能学习不同通道之间的非线性依赖关系,从而有效提升监控视频超分辨率图像的质量。在某交通监控场景下开展车牌识别试验,对该CA-BasicVSR模型的有效性进行验证,结果表明:在交通监控画面还原任务中,该模型对画面还原的峰值信噪比相比EDVR-L模型和BasicVSR模型能分别提高约1.3 dB和0.3 dB;在车牌识别任务中,使用该模型处理的交通监控视频画面作为输入,相比原始低分辨率的视频画面,能提高车牌识别的成功率。 展开更多
关键词 视频超分辨率 BasicVSR模型 通道注意力机制(ca) 车牌识别
在线阅读 下载PDF
基于坐标注意力机制和YOLO v5s模型的山羊脸部检测方法 被引量:9
18
作者 郭阳阳 洪文浩 +1 位作者 丁屹 黄小平 《农业机械学报》 EI CAS CSCD 北大核心 2023年第7期313-321,共9页
山羊的脸部检测对羊场的智能化管理有着重要的意义。针对实际饲养环境中,羊群存在多角度、分布随机、灵活多变、羊脸检测难度大的问题,以YOLO v5s为基础目标检测网络,提出了一种结合坐标信息的山羊脸部检测模型。首先,通过移动设备获取... 山羊的脸部检测对羊场的智能化管理有着重要的意义。针对实际饲养环境中,羊群存在多角度、分布随机、灵活多变、羊脸检测难度大的问题,以YOLO v5s为基础目标检测网络,提出了一种结合坐标信息的山羊脸部检测模型。首先,通过移动设备获取舍内、舍外、单头以及多头山羊的图像并构建数据集。其次,在YOLO v5s的主干网络融入坐标注意力机制,以充分利用目标的位置信息,提高遮挡区域、小目标、多视角样本的检测精度。试验结果表明,改进YOLO v5s模型的检测精确率为95.6%,召回率为83.0%,mAP0.5为90.2%,帧速率为69 f/s,模型内存占用量为13.2 MB;与YOLO v5s模型相比,检测精度提高1.3个百分点,模型所占内存空间减少1.2 MB;且模型的整体性能远优于Faster R-CNN、YOLO v4、YOLO v5s模型。此外,本文构建了不同光照和相机抖动的数据集,来进一步验证本文方法的可行性。改进后的模型可快速有效地对复杂场景下山羊的脸部进行精准检测及定位,为动物精细化养殖时目标检测识别提供了检测思路和技术支持。 展开更多
关键词 羊脸检测 YOLO v5s 坐标注意力机制 精准畜牧
在线阅读 下载PDF
融合Xception特征提取和坐标注意力机制的血细胞分割 被引量:5
19
作者 颜玉松 尹芳洁 王彩玲 《计算机系统应用》 2023年第1期275-280,共6页
人体血细胞的检测与分割可以辅助医生快速对人体当前健康情况做出简单判断,对诊断疾病具有重要意义.为了解决传统图像分割算法在血细胞分割任务中出现错误分割目标、无法完全分割目标等问题,提出了一种融合Xception特征提取和坐标注意... 人体血细胞的检测与分割可以辅助医生快速对人体当前健康情况做出简单判断,对诊断疾病具有重要意义.为了解决传统图像分割算法在血细胞分割任务中出现错误分割目标、无法完全分割目标等问题,提出了一种融合Xception特征提取和坐标注意力机制的血细胞分割算法XCA-Unet++.该算法在Unet++网络结构的基础上,在编码器部分引入Xception特征提取网络以更好地提取低层特征信息.设计了一种以坐标注意力机制为基础的注意力细胞检测模块,增强了网络对血细胞模糊边缘和不完整细胞的特征提取能力.采用DiceLoss作为损失函数以优化数据集正负样本不均衡问题和提高网络的收敛能力.在公开血细胞数据集上的实验对比表明,XCA-Unet++网络在IoU、Acc和F1评估指标下分别取得94.44%、96.78%和97.12%的结果,分割性能优于其他分割网络,满足血细胞分割任务的精度要求. 展开更多
关键词 血细胞分割 Unet++ Xception 坐标注意力机制 DiceLoss 深度学习 图像分割
在线阅读 下载PDF
融合双分支特征和注意力机制的葡萄病虫害识别模型 被引量:15
20
作者 彭红星 徐慧明 刘华鼐 《农业工程学报》 EI CAS CSCD 北大核心 2022年第10期156-165,共10页
葡萄病虫害识别是精细化防治的前提。针对现有研究中存在的数据集少、识别精度低、模型参数量大等问题,该研究构建包含健康叶片、3类病害叶片和16类虫害的葡萄病虫害数据集,提出基于改进MobileNet V2模型的葡萄病虫害识别模型。首先在Mo... 葡萄病虫害识别是精细化防治的前提。针对现有研究中存在的数据集少、识别精度低、模型参数量大等问题,该研究构建包含健康叶片、3类病害叶片和16类虫害的葡萄病虫害数据集,提出基于改进MobileNet V2模型的葡萄病虫害识别模型。首先在MobileNet V2模型的反向残差模块中嵌入坐标注意力(Coordinate Attention,CA)机制,提升模型的信息表征能力;然后使用深度可分离卷积设计双分支特征融合模块,加强模型的特征提取能力;最后对模型的通道数进行调整,精简模型结构。试验结果表明:MobileNet_Vitis在葡萄病虫害数据集上的识别准确率和F1分数为89.16%和80.44%,相比改进前的MobileNet V2提高了1.83和9.31个百分点,而模型参数大小为7.85 MB,减少了8.5%。与ResNet101、ShuffleNetV2、MobileNetV3和GhostNet相比,MobileNet_Vitis的识别精度和F1分数更高,参数量更小。MobileNet_Vitis对单张葡萄病虫害图像的推理时间为17.53 ms,可以达到快速识别的要求。该研究提出的模型能够较好地识别葡萄病虫害,并且较大幅度地减少模型的参数量。将MobileNet_Vitis模型部署到移动端的小程序上,可为葡萄病虫害的防治提供帮助。 展开更多
关键词 病虫害 图像识别 葡萄 MobileNet V2 双分支特征融合 坐标注意力机制
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部