期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
基于卷积神经网络的轻量高效图像隐写
1
作者 段新涛 白鹿伟 +4 位作者 徐凯欧 张萌 保梦茹 武银行 秦川 《应用科学学报》 北大核心 2025年第1期80-93,共14页
基于深度学习的图像隐写方法,因存在模型参数量和计算量大等问题,而面临高参数和计算负载的挑战,为此提出了一种轻量高效的图像隐写方法。首先在编码器和解码器中引入Ghost模块,降低了编码器和解码器的参数量和计算量。其次提出了一个... 基于深度学习的图像隐写方法,因存在模型参数量和计算量大等问题,而面临高参数和计算负载的挑战,为此提出了一种轻量高效的图像隐写方法。首先在编码器和解码器中引入Ghost模块,降低了编码器和解码器的参数量和计算量。其次提出了一个多尺度特征融合模块,用以捕捉多维数据中的复杂关系。最后提出了一个新颖的混合损失函数,可在保持模型不变的情况下提升图像隐写质量。实验结果表明,所提方法在256×256像素的图像上峰值信噪比达到47.59 dB。与目前最优的图像隐写方法相比,所提方法的隐写质量提升1.7 dB,参数量减少77%,计算量减少91%,在隐写质量上有较优的表现,同时模型的参数量和计算量大大降低,实现了模型的轻量高效化。 展开更多
关键词 图像隐写 深度学习 多尺度特征融合 混合损失函数
在线阅读 下载PDF
基于改进YOLOv4的车辆检测算法
2
作者 赖颖 巨志勇 叶雨新 《电子科技》 2025年第1期81-87,94,共8页
在交通监控中进行车辆检测过程时,存在车辆互相遮挡和远距离目标尺寸不足的问题,导致在检测中存在漏检和误检情况。针对此问题,文中提出一种基于YOLOv4(You Only Look Once version 4)的多尺度融合与注意力机制的交通车辆检测算法。在YO... 在交通监控中进行车辆检测过程时,存在车辆互相遮挡和远距离目标尺寸不足的问题,导致在检测中存在漏检和误检情况。针对此问题,文中提出一种基于YOLOv4(You Only Look Once version 4)的多尺度融合与注意力机制的交通车辆检测算法。在YOLOv4的路径聚合网络中增加一个新的特征层进行多尺度特征融合,提升模型对底层纹理特征的提取能力。在YOLO Head检测头前嵌入ECA(Efficient Channel Attention)通道注意力模块,对聚合后的特征进行合理的抑制和增强,将CIoU(Complete Intersection over Union)损失函数替换为Soft-CIoU损失函数,提高小目标车辆对损失函数的贡献度。在公开车辆数据集UA-DETRAC与KITTI中的实验结果表明,相较于原YOLOv4算法,所提算法的平均精度分别提升了2.45百分点和1.14百分点,检测速度达到41.67 frame·s^(-1)。相较于其他先进算法,所提算法在检测精度上表现良好。 展开更多
关键词 车辆检测 多尺度特征融合 注意力机制 Soft-CIOU损失函数 YOLOv4 深度学习 目标检测 小目标
在线阅读 下载PDF
基于改进YOLOv7的输电线路多类缺陷目标检测
3
作者 毕含嘉 杨楚睿 +1 位作者 王小雨 黄悦华 《电子科技》 2025年第4期16-24,共9页
针对在复杂背景下输电线路多尺度缺陷目标检测精度较低的问题,文中提出一种基于改进YOLOv7(You Only Look Once version 7)的输电线路多类缺陷目标检测模型。对于复杂背景造成缺陷目标较低的问题,在Backbone部分引入改进的Swin Transfor... 针对在复杂背景下输电线路多尺度缺陷目标检测精度较低的问题,文中提出一种基于改进YOLOv7(You Only Look Once version 7)的输电线路多类缺陷目标检测模型。对于复杂背景造成缺陷目标较低的问题,在Backbone部分引入改进的Swin Transformer模块,通过使用多头注意力机制提升对全局特征的提取效果来提高模型的检测精度。对于待检测目标的多尺度特性,在特征金字塔基础上引入自适应特征融合模块,提升了Neck部分特征融合网络对多类不同尺度缺陷目标的检测能力。使用SIoU(Structured Intersection over Union)损失函数在提高预测框回归精度的同时加快了模型的收敛。实验结果表明,相较于YOLOv5、YOLOv7和Faster R-CNN(Faster Region with Convolutional Neural Network)模型,改进YOLOv7模型具有较高的检测精度,其平均检测精度可达96.4%,检测速度为29.6 frame·s^(-1),能够为输电线路多类缺陷目标检测提供参考。 展开更多
关键词 YOLOv7 深度学习 输电线路缺陷检测 小目标检测 多尺度融合 Swin Transformer β-dropout 自适应特征融合 损失函数
在线阅读 下载PDF
基于改进残差网络的运动目标模糊图像复原方法 被引量:1
4
作者 孙灵 《现代电子技术》 北大核心 2024年第15期86-90,共5页
传统的残差网络在复原运动目标模糊图像时,在模糊程度较严重的情况下,存在特征提取不充分、噪声干扰等问题,导致恢复出的图像无法完全达到原始图像的清晰度和细节。对此,提出基于改进残差网络的运动目标模糊图像复原方法。对采集到的运... 传统的残差网络在复原运动目标模糊图像时,在模糊程度较严重的情况下,存在特征提取不充分、噪声干扰等问题,导致恢复出的图像无法完全达到原始图像的清晰度和细节。对此,提出基于改进残差网络的运动目标模糊图像复原方法。对采集到的运动目标模糊图像,采用多损失函数融合方法改进传统残差块结构,构建编码器-解码器网络训练结构,训练损失函数,提升网络的特征学习能力。通过完成训练的网络,输出运动目标模糊图像复原结果。实验结果表明,该方法复原运动目标模糊图像的峰值信噪比高于30 dB,结构相似性高于0.9。 展开更多
关键词 改进残差网络 运动目标 多损失函数融合 模糊图像 编辑器-解码器网络 复原方法
在线阅读 下载PDF
窗口锚定的偏移受限动态蛇形卷积网络航拍小目标检测
5
作者 张荣国 秦震 +2 位作者 胡静 王丽芳 刘小君 《模式识别与人工智能》 EI CSCD 北大核心 2024年第8期663-677,共15页
为了从小目标有限特征中获取关键的有效信息,提升小目标的定位能力和检测精度,文中提出窗口锚定的偏移受限动态蛇形卷积网络航拍小目标检测方法.首先,构造偏移受限动态蛇形卷积,在不同方位动态偏移,受限蛇形卷积核自适应地关注不同大小... 为了从小目标有限特征中获取关键的有效信息,提升小目标的定位能力和检测精度,文中提出窗口锚定的偏移受限动态蛇形卷积网络航拍小目标检测方法.首先,构造偏移受限动态蛇形卷积,在不同方位动态偏移,受限蛇形卷积核自适应地关注不同大小和形状的特征区域,使特征提取聚焦于微小局部结构,促进小目标特征的捕获.然后,采用双阶段多尺度特征融合方法,对不同层阶特征图进行特征对齐、融合和注入,增强底层细节信息与高层语义信息的融合,并强化不同尺寸目标信息传输,提高小目标的检测能力.与此同时,设计窗口锚定的边界框回归损失函数,基于辅助边界框和最小点距离进行边界回归,获得准确的回归结果,提高小目标的定位能力.最后,在3个航拍数据集上的实验表明,文中方法对小目标的检测性能有不同程度的改善和提高. 展开更多
关键词 小目标检测 特征提取 特征融合 多尺度特征 边界框回归损失函数
在线阅读 下载PDF
多尺度和卷积注意力相结合的红外与可见光图像融合
6
作者 祁艳杰 侯钦河 《红外技术》 CSCD 北大核心 2024年第9期1060-1069,共10页
针对红外与可见光图像融合时,单一尺度特征提取不足、红外目标与可见光纹理细节丢失等问题,提出一种多尺度和卷积注意力相结合的红外与可见光图像融合算法。首先,设计多尺度特征提取模块和可变形卷积注意力模块相结合的编码器网络,多感... 针对红外与可见光图像融合时,单一尺度特征提取不足、红外目标与可见光纹理细节丢失等问题,提出一种多尺度和卷积注意力相结合的红外与可见光图像融合算法。首先,设计多尺度特征提取模块和可变形卷积注意力模块相结合的编码器网络,多感受野提取红外与可见光图像的重要特征信息。然后,采用基于空间和通道双注意力机制的融合策略,进一步融合红外和可见光图像的典型特征。最后,由3层卷积层构成解码器网络,用于重构融合图像。此外,设计基于均方误差、多尺度结构相似度和色彩的混合损失函数约束网络训练,进一步提高融合图像与源图像的相似性。本算法在公开数据集上与7种图像融合算法进行比较,在主观评价和客观评价方面,所提算法相较其它对比算法具有较好的边缘保持性、源图像信息保留度,较高的融合图像质量。 展开更多
关键词 红外与可见光图像 混合损失函数 多尺度特征提取 注意力机制 图像融合
在线阅读 下载PDF
多层特征融合与语义增强的盲图像质量评价
7
作者 赵文清 许丽娇 +1 位作者 陈昊阳 李梦伟 《智能系统学报》 CSCD 北大核心 2024年第1期132-141,共10页
针对现有盲图像质量评价算法在面对真实失真图像时性能较差的问题,本文提出多层特征融合和语义信息增强相结合的无参考图像质量评价算法。提取图像的局部和全局失真特征,利用特征融合模块对特征进行多层融合;利用多层扩张卷积增强语义信... 针对现有盲图像质量评价算法在面对真实失真图像时性能较差的问题,本文提出多层特征融合和语义信息增强相结合的无参考图像质量评价算法。提取图像的局部和全局失真特征,利用特征融合模块对特征进行多层融合;利用多层扩张卷积增强语义信息,进而指导失真图像到质量分数的映射过程;考虑预测分数和主观分数之间的相对排名关系,对L_(1)损失函数和三元组排名损失函数进行融合,构建新的损失函数L_(mix)。为了验证本文方法的有效性,在野生图像质量挑战数据集上进行了验证和对比实验,该算法的斯皮尔曼等级相关系数与皮尔逊线性相关系数指标相比原算法分别提升2.3%和2.3%;在康斯坦茨真实图像质量数据数据集和野生图像质量挑战数据集上进行了跨数据集实验,该算法在面对真实失真图像时表现出了良好的泛化性能。 展开更多
关键词 深度学习 图像质量 卷积神经网络 特征提取 通道注意力结构 多层次特征融合 扩张卷积 三元组损失函数
在线阅读 下载PDF
多尺度特征融合的铁轨异物入侵检测研究 被引量:2
8
作者 王楠 侯涛 牛宏侠 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第9期139-153,共15页
针对铁路轨道异物检测中不同尺度异物目标的检测易受复杂环境的影响,导致出现检测精度低及检测速度慢等问题,提出一种多尺度特征融合的铁轨异物检测(RMF-YOLO)算法。首先,设计并引入改进的卷积注意力模块(ICBAM),结合YOLOv7特征提取网络... 针对铁路轨道异物检测中不同尺度异物目标的检测易受复杂环境的影响,导致出现检测精度低及检测速度慢等问题,提出一种多尺度特征融合的铁轨异物检测(RMF-YOLO)算法。首先,设计并引入改进的卷积注意力模块(ICBAM),结合YOLOv7特征提取网络,以增强复杂场景下的特征提取能力。其次,在所有高效层聚合网络模块中采用GhostConv替代普通卷积层,以降低计算复杂度,提高特征输出效率;设计一种改进的加权双向特征金字塔网络N-BiFPN结构,加强多尺度特征融合能力,平衡不同层级特征信息,提高多尺度检测能力。最后,为进一步提升检测精度,采用WIoU损失函数结合动态非单调聚集机制,有效应对低质量锚框产生的梯度,提高模型对不同尺度异物检测的整体性能。实验结果表明:在自制的铁轨异物数据集上,RMF-YOLO算法减少了原网络模型的参数量,有效提升了模型的检测精度与检测速度,改善了漏检与误检问题,平均精度提升了5.5%,检测速度提升了5.88%,计算量减少了12.25%,能满足铁轨入侵异物检测中对检测精度和实时性的需求。 展开更多
关键词 铁轨异物检测 特征融合 多尺度 YOLOv7 损失函数
在线阅读 下载PDF
基于多层特征融合的行人检测方法研究
9
作者 黄玲娃 崔文成 邵虹 《计算机科学》 CSCD 北大核心 2024年第S02期479-485,共7页
针对遮挡行人检测识别困难、检测精度低,以及漏检率高等问题,在YOLOv7方法的基础上进行结构优化,提出了一种基于多层特征融合的行人检测网络模型,旨在提高遮挡行人检测的准确性。该方法是在主干网络特征提取部分采用ELAN-C模块,以增强... 针对遮挡行人检测识别困难、检测精度低,以及漏检率高等问题,在YOLOv7方法的基础上进行结构优化,提出了一种基于多层特征融合的行人检测网络模型,旨在提高遮挡行人检测的准确性。该方法是在主干网络特征提取部分采用ELAN-C模块,以增强行人特征信息的提取能力,从而提高行人检测的准确性。同时,在多尺度特征融合部分引入全局注意力机制构成多层特征融合,通过跨维度的信息交互,特别是对位置信息的关注,增强检测目标特征的表征,提高行人检测的准确性。此外,为了加速模型的收敛速度,采用EIoU作为损失函数,进一步提升检测框的定位精度。在公开数据集CityPresons上进行训练验证,模型对数平均漏检率MR-2下降,Bare,Partial,Reasonable,Heavy分别下降0.55%,0.91%,1.78%,1.68%,有效减少了漏检率。 展开更多
关键词 YOLOv7 行人检测 特征提取 多尺度融合 损失函数优化
在线阅读 下载PDF
基于改进YOLOv5的带钢表面缺陷检测
10
作者 杨威 杨俊 许聪源 《计量学报》 CSCD 北大核心 2024年第11期1671-1680,共10页
针对带钢表面缺陷检测方法存在检测精度低和检测速度慢的问题,提出一种基于改进YOLOv5的带钢表面缺陷检测方法。首先,采用内容感知特征重组CARAFE作为多尺度特征融合的上采样算子,构建具有通道缩放的自适应空间特征融合CS-ASFF结构,以... 针对带钢表面缺陷检测方法存在检测精度低和检测速度慢的问题,提出一种基于改进YOLOv5的带钢表面缺陷检测方法。首先,采用内容感知特征重组CARAFE作为多尺度特征融合的上采样算子,构建具有通道缩放的自适应空间特征融合CS-ASFF结构,以增强多尺度特征融合并控制模型复杂度。其次,在模型的卷积层和跨层级结构引入GSConv和VoVGSCSP模块,以减小计算量并提高检测精度。最后,采用Focal-GIOU Loss作为损失函数来解决带钢缺陷图像中难易样本不平衡的问题,并提升模型对复杂数据的适应能力。实验结果表明,在NEU-DET数据集上该方法达到了80.6%的均值平均精度(P_(mAP)),计算量为14.8 GFLOPs。与YOLOv5相比,P_(mAP)提高了4.3%且计算量减少了6.33%。与当前主流目标检测网络相比,在更低的计算量下该方法具有最高的检测精度,能够满足真实工业场景下的带钢表面缺陷实时检测。 展开更多
关键词 机器视觉 带钢表面缺陷检测 YOLOv5 多尺度融合 损失函数
在线阅读 下载PDF
面向复杂场景密集行人检测的YOLOv8改进模型
11
作者 胡伟超 皮建勇 +2 位作者 胡倩 黄昆 王娟敏 《电子测量技术》 北大核心 2024年第14期159-169,共11页
针对当前行人检测面临的环境复杂、目标尺寸多变和严重遮挡等挑战,导致现有检测技术在识别密集行人时容易发生误判和遗漏的问题,本文提出一种高效的面向复杂场景密集行人检测的YOLOv8改进模型。在骨干网络引入DCNv2设计C2f_DCNetv2替换... 针对当前行人检测面临的环境复杂、目标尺寸多变和严重遮挡等挑战,导致现有检测技术在识别密集行人时容易发生误判和遗漏的问题,本文提出一种高效的面向复杂场景密集行人检测的YOLOv8改进模型。在骨干网络引入DCNv2设计C2f_DCNetv2替换C2f模块,提升骨干网络的特征提取能力;通过在架构中加入小目标检测头,增强模型对小尺寸目标的检测能力,提高对小目标的检测识别精度;基于四检测头改进AFPN设计出AFPN-4H,优化特征层之间的信息融合,提高了模型对不同尺度目标的适应性和检测精度;最后,通过结合Wise-IoU、Focaler-IoU和MPDIoU得到WFM-IoU,进一步提高了目标定位的准确性。实验结果表明,与原始的YOLOv8n模型相比,在P、R、AP50以及AP50:95等关键指标上分别提升1.6%、4.0%、3.6%和3.8%,也优于其他算法。验证了本文改进算法在复杂场景密集行人检测任务中具有较好的性能。 展开更多
关键词 密集行人检测 YOLOv8 可变形卷积 多尺度特征融合 损失函数
在线阅读 下载PDF
反向加权融合多尺度特征的X射线图像违禁品检测
12
作者 马昌嵩 裴晓芳 +2 位作者 周磊 周进 杨继海 《国外电子测量技术》 2024年第4期170-180,共11页
针对现阶段违禁品检测方法存在的混叠效应以及在类内变化显著的场景下检测精度较低等问题,提出一种反向加权融合多尺度特征的X射线图像违禁品检测算法,通过反向自适应地引导融合多尺度上下文特征来实现准确的违禁品目标检测。首先,使用... 针对现阶段违禁品检测方法存在的混叠效应以及在类内变化显著的场景下检测精度较低等问题,提出一种反向加权融合多尺度特征的X射线图像违禁品检测算法,通过反向自适应地引导融合多尺度上下文特征来实现准确的违禁品目标检测。首先,使用多尺度场景感知模块获取从局部到全局的目标表征信息,帮助处理显著的类内变化。其次,利用反向加权融合结构采用特征引导加权的方式,高效融合蕴含丰富上下文特征的多级特征,缓解融合过程中易出现的混叠效应。最后,设计了一种Focal-SIOU损失函数,用于平衡不同质量违禁品目标预测框之间的贡献差异,并结合角度和边长损失进一步提升预测框的收敛速度和回归精度。本文方法在SIXray、OPIXray、PIDray等3个非常具有挑战性的基准数据集上进行了广泛的评测实验,平均精度均值(mAP)分别达到93.2%、90.7%和85.1%。实验结果充分表明,方法相比于最新方法性能更优,并且能够满足实时目标检测的实际应用需求。 展开更多
关键词 违禁品检测 多尺度融合 上下文特征 损失函数
在线阅读 下载PDF
基于改进YOLOv7的无人机图像目标检测算法 被引量:4
13
作者 梁秀满 贾梓涵 +1 位作者 于海峰 刘振东 《无线电工程》 2024年第4期937-946,共10页
针对无人机图像中由于目标微小且相互遮挡、特征信息少导致检测精度低的问题,提出一种基于改进YOLOv7的无人机图像目标检测算法。在颈部和检测头中加入了坐标卷积,能更好地感受特征图中目标的位置信息;增加P2检测层,减少小目标特征丢失... 针对无人机图像中由于目标微小且相互遮挡、特征信息少导致检测精度低的问题,提出一种基于改进YOLOv7的无人机图像目标检测算法。在颈部和检测头中加入了坐标卷积,能更好地感受特征图中目标的位置信息;增加P2检测层,减少小目标特征丢失、提高小目标检测能力;提出多信息流融合注意力机制——Spatial and Channel Attention Mechanism(SCA),动态调整注意力对空间信息流和语义信息流的关注,获得更丰富的特征信息以提高捕获目标的能力;更换损失函数为SIoU,加快模型收敛速度。在公开数据集VisDrone2019上进行对比实验,改进后算法的mAP50值相比YOLOv7提高了4%,达到了52.4%,FPS为37,消融实验验证了每个模块均提升了检测精度。实验表明,改进后的算法能较好地检测无人机图像中的目标。 展开更多
关键词 无人机 小目标检测 多信息流融合注意力机制 YOLOv7 损失函数
在线阅读 下载PDF
保留细节特征的图像任意风格迁移 被引量:1
14
作者 蒋亨畅 张笃振 《计算机系统应用》 2024年第3期118-125,共8页
一些主流的图像任意风格迁移模型在保持内容图像的显著性信息和细节特征方面依然有局限性,生成的图像往往具有内容模糊、细节失真等问题.针对以上问题,本文提出一种可以有效保留内容图像细节特征的图像任意风格迁移模型.模型包括灵活地... 一些主流的图像任意风格迁移模型在保持内容图像的显著性信息和细节特征方面依然有局限性,生成的图像往往具有内容模糊、细节失真等问题.针对以上问题,本文提出一种可以有效保留内容图像细节特征的图像任意风格迁移模型.模型包括灵活地融合从编码器提取到的浅层至深层的多层级图像特征;提出一种新的特征融合模块,该模块可以高质量地融合内容特征和风格特征.此外,还提出一个新的损失函数,该损失函数可以很好地保持内容和风格全局结构,消除伪影.实验结果表明,本文提出的图像任意风格迁移模型可以很好地平衡风格和内容,保留内容图像完整的语义信息和细节特征,生成视觉效果更好的风格化图像. 展开更多
关键词 图像任意风格迁移 保留细节特征 多层级图像特征 特征融合 损失函数 注意力机制
在线阅读 下载PDF
基于改进ConvMixer和动态焦点损失的视听情感识别
15
作者 师硕 覃嘉俊 +1 位作者 于洋 郝小可 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2824-2835,共12页
视听双模态情感识别是情感计算领域的研究热点.目前情感识别方法存在无法同时提取视频局部和全局特征,多模态数据融合简单,损失函数在模型优化中无法关注错分样本等问题,导致情感识别结果精确度不高.本文提出一种基于改进的ConvMixer和... 视听双模态情感识别是情感计算领域的研究热点.目前情感识别方法存在无法同时提取视频局部和全局特征,多模态数据融合简单,损失函数在模型优化中无法关注错分样本等问题,导致情感识别结果精确度不高.本文提出一种基于改进的ConvMixer和动态权重焦点损失函数的视听情感识别方法.采用空间和时间邻接矩阵代替ConvMixer中的深度分离卷积,提取视频时域空域上的全局和局部特征.提出跨模态时间注意力模块,以对称结构捕捉模态间的时间相关性,提高特征融合效果.结合混淆矩阵计算具有动态权重的焦点损失函数,差异化地加大错分样本在损失中的占比,优化模型参数.在公开数据集上的实验结果表明,本文方法能提取到代表性特征,可有效优化网络结构,提高了情感识别的准确率. 展开更多
关键词 情感识别 ConvMixer 注意力机制 多模态特征融合 焦点损失函数
在线阅读 下载PDF
MSViT:融合多尺度特征的轻量化图像分类混合模型
16
作者 覃晓 彭磊 +6 位作者 廖惠仙 元昌安 赵剑波 邓超 钱泉梅 卢虹妃 龚远旭 《广西科学》 北大核心 2024年第5期912-924,共13页
针对现有Vision Transformer (ViT)模型在局部特征捕捉和多尺度特征融合方面的局限性,本文提出一种新型的融合多尺度特征的轻量化图像分类混合模型(Multi-Scale Vision Transformer, MSViT)。首先,在编码器中设计捕获通道特征的多尺度... 针对现有Vision Transformer (ViT)模型在局部特征捕捉和多尺度特征融合方面的局限性,本文提出一种新型的融合多尺度特征的轻量化图像分类混合模型(Multi-Scale Vision Transformer, MSViT)。首先,在编码器中设计捕获通道特征的多尺度前馈神经网络(Multi-Scale Feed Forward Network, MSFFN)模块,该模块能有效提取空间和多尺度通道特征。其次,设计一个新的级联特征融合解码器(Cascade Feature Fusion Decoder, CFFD),通过整合特征金字塔网络(Feature Pyramid Network, FPN)和多阶段特征融合解码器,显著提升模型对不同尺度特征的交互和融合能力。最后,模型引入多阶损失函数,以全面优化不同尺度特征在图像分类任务中的表现。为了验证MSViT的有效性,在4个实验数据集[ImageNet-1k的1个子集(Small_ImageNet)、Cifar 100、糖尿病视网膜病变数据集(APTOS 2019)、蘑菇数据集(Mushroom 66)]上进行大量的实验。其中在Small_ImageNet数据集上的实验结果显示,MSViT实现了87.58%的Top-1准确率,较EdgeViT-XXS提升了2.27%。实验结果证明了MSViT在图像分类任务中的有效性。 展开更多
关键词 图像分类 多尺度特征融合 多阶损失函数 特征金字塔网络(FPN) TRANSFORMER
在线阅读 下载PDF
基于改进YOLOv7的吸烟行为识别算法研究
17
作者 梁皖 柯海森 李孝禄 《中国计量大学学报》 2024年第2期333-340,356,共9页
目的:提出了一种基于改进YOLOv7的吸烟行为识别方法,以提高人工智能对吸烟行为识别X效率和准确率。方法:在YOLOv7算法的基础上,采用GhostNet网络结构替换其主干网络,减少了网络模型参数量和计算量。引入CBAM注意力机制来改善特征提取的... 目的:提出了一种基于改进YOLOv7的吸烟行为识别方法,以提高人工智能对吸烟行为识别X效率和准确率。方法:在YOLOv7算法的基础上,采用GhostNet网络结构替换其主干网络,减少了网络模型参数量和计算量。引入CBAM注意力机制来改善特征提取的效果。加入多尺度特征融合模块和改进损失函数以提高模型在复杂环境中的检测效果。结果:以吸烟数据集进行测试,结果表明,改进后的模型参数量和计算量分别下降了16.6%和37.4%,检测速度提升至103.4帧/s,精度提高了2.8%。结论:提出的轻量化网络模型可满足视频监控实时监测的要求,并可在低功耗的嵌入式设备上完成实时检测。 展开更多
关键词 吸烟行为 YOLOv7 轻量化网络 注意力机制 多尺度特征融合 损失函数
在线阅读 下载PDF
基于注意力机制与多尺度特征融合的行人重识别方法 被引量:13
18
作者 宋晓茹 杨佳 +2 位作者 高嵩 陈超波 宋爽 《科学技术与工程》 北大核心 2022年第4期1526-1533,共8页
针对行人重识别中因遮挡、姿态变化使模型特征无法充分表达行人信息的问题,提出了基于注意力机制与多尺度特征融合的行人重识别方法。首先使用改进的骨干网络R-ResNet50提取图像特征;其次,抽取网络不同尺度的特征层嵌入注意力机制DANet... 针对行人重识别中因遮挡、姿态变化使模型特征无法充分表达行人信息的问题,提出了基于注意力机制与多尺度特征融合的行人重识别方法。首先使用改进的骨干网络R-ResNet50提取图像特征;其次,抽取网络不同尺度的特征层嵌入注意力机制DANet,使模型更关注于重点信息;最后,对提取出的关键特征进行多尺度特征融合,实现特征间的优势互补,并使用联合交叉熵损失、难样本采样三元组损失和中心损失的多损失函数策略对网络模型进行训练。实验结果表明,所提方法在Market1501、DukeMTMC-ReID数据集上的首位命中率Rank-1和平均精度均值mAP分别达到了92.7%、80.4%和86.4%、71.0%,模型提取的特征更具有判别性,识别率更高。 展开更多
关键词 行人重识别 注意力机制 多尺度特征融合 多损失函数策略
在线阅读 下载PDF
多模态融合的深度学习脑肿瘤检测方法 被引量:3
19
作者 姚红革 沈新霞 +2 位作者 李宇 喻钧 雷松泽 《光子学报》 EI CAS CSCD 北大核心 2019年第7期159-170,共12页
针对目前传统方法脑肿瘤检测准确率低的问题,提出一种基于深度学习的三维脑肿瘤检测方法.首先将不同模态的脑肿瘤磁共振成像影像进行融合,获取不同模态下的脑肿瘤病灶三维空间特征;然后在卷积层和池化层之间增加实列归一化层,提高网络... 针对目前传统方法脑肿瘤检测准确率低的问题,提出一种基于深度学习的三维脑肿瘤检测方法.首先将不同模态的脑肿瘤磁共振成像影像进行融合,获取不同模态下的脑肿瘤病灶三维空间特征;然后在卷积层和池化层之间增加实列归一化层,提高网络的收敛速度,缓解过拟合的问题;并对损失函数进行改进,采用加权损失函数加强对病灶区域的特征学习;最后结合后处理方法解决假阳脑肿瘤病灶多的问题.实验结果表明:提出的脑肿瘤检测方法可有效进行肿瘤病灶定位;相关性系数、敏感性和特异性三种评价指标分别达到了0.9267、0.9281和0.9977,与二维检测网络相比,提高了4.6%、3.96%和0.04%,较初始的单模态脑肿瘤检测方法提升了13.2%、10.42%和0.12%. 展开更多
关键词 磁共振 脑肿瘤检测 多模态融合 实列归一化 加权损失函数
在线阅读 下载PDF
加权特征融合的密集连接网络人脸识别算法 被引量:9
20
作者 王小玉 韩昌林 胡鑫豪 《计算机科学与探索》 CSCD 北大核心 2019年第7期1195-1205,共11页
在非约束条件下人脸识别常受到表情变化、视角偏差、不同程度的遮挡和曝光等各种综合因素的影响;并且深度卷积神经网络几乎都存在参数过多,训练时梯度扩散或消失等问题。针对上述问题,提出了FuseNet网络模型。该模型有效地利用了人的眼... 在非约束条件下人脸识别常受到表情变化、视角偏差、不同程度的遮挡和曝光等各种综合因素的影响;并且深度卷积神经网络几乎都存在参数过多,训练时梯度扩散或消失等问题。针对上述问题,提出了FuseNet网络模型。该模型有效地利用了人的眼睛、鼻子、嘴巴等局部特征信息,同时又包含面部轮廓等全局特征信息,并提出了多损失函数进一步缩小类内特征差距和扩大类间特征距离,有效地增强了非约束条件下人脸识别的鲁棒性。通过使用加权密集连接卷积神经网络来提取人脸的全局特征,密集连接模块可有效地解决深层网络所引起的参数冗余以及梯度扩散等问题。不同的连接权值使得网络能够充分地利用各部分特征。实验结果表明,无论是在闭集的CASIA-WebFace数据集上,还是开集的FLW数据集、MegaFace数据集上,提出的FuseNet网络都具有较好的识别率和泛化能力。 展开更多
关键词 人脸识别 加权密集连接 加权特征融合 多损失函数
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部