期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于特征金字塔的多尺度特征融合网络 被引量:9
1
作者 郭启帆 刘磊 +2 位作者 张珹 徐文娟 靖稳峰 《工程数学学报》 CSCD 北大核心 2020年第5期521-530,共10页
特征金字塔网络(FPN)是CNN网络对图像信息进行表达输出的一种有效方法,在目标检测网络中广泛应用.然而,FPN没有充分地将浅层的细节信息传递到深层的语义特征,存在特征融合不足的缺陷,因而只能依靠深层语义信息来进行预测,从而忽略了网... 特征金字塔网络(FPN)是CNN网络对图像信息进行表达输出的一种有效方法,在目标检测网络中广泛应用.然而,FPN没有充分地将浅层的细节信息传递到深层的语义特征,存在特征融合不足的缺陷,因而只能依靠深层语义信息来进行预测,从而忽略了网络低层细节信息,对各种视觉学习的效果造成了一定的影响.针对FPN存在的以上问题,本文提出基于特征金字塔的多尺度特征融合网络模型,在FPN主干网络的基础上,设计了混合特征金字塔和金字塔融合模块,并结合注意力机制,对特征金字塔进行了多尺度的深度融合.本文在PASCAL VOC2012和MS COCO2014数据集上,以Faster R-CNN作为基础检测器进行实验,验证了MFPN对特征融合的有效性. 展开更多
关键词 特征金字塔网络 多尺度特征融合网络 注意力机制
在线阅读 下载PDF
基于多尺度特征融合网络的苹果病害叶片检测 被引量:6
2
作者 刘敏 周丽 《中国农机化学报》 北大核心 2023年第8期184-190,共7页
准确地检测出苹果叶片的病害对提高苹果产量和质量具有重要意义。针对现有苹果叶片病害检测模型信息利用不充分,导致检测性能不佳的问题,提出一种基于多尺度特征融合网络的苹果病害叶片检测方法。首先,利用深度可分离卷积改进传统Vgg-1... 准确地检测出苹果叶片的病害对提高苹果产量和质量具有重要意义。针对现有苹果叶片病害检测模型信息利用不充分,导致检测性能不佳的问题,提出一种基于多尺度特征融合网络的苹果病害叶片检测方法。首先,利用深度可分离卷积改进传统Vgg-16网络,并作为苹果叶片病害图片的全局特征提取器;其次,利用Swin Transformer网络作为局部特征提取器;然后,提出一种多尺度特征融合网络将局部和全局特征进行融合,构造多尺度特征;最后,将融合的多尺度特征作为全连接网络的输入,实现苹果病害叶片的检测。实验结果表明,所提出方法可以实现93.98%的准确率、94.11%的精准率、93.93%的召回率和94.62%的F_(1)值。相比当前主流的苹果病害叶片检测模型,在检测精度和模型参数计算量等方面,均具有很强的竞争力。 展开更多
关键词 苹果病害 叶片检测 全局特征 局部特征 多尺度特征融合网络 病害识别
在线阅读 下载PDF
基于多尺度卷积神经网络特征融合的植株叶片检测技术 被引量:4
3
作者 李颖 陈龙 +2 位作者 黄钊宏 孙杨 蔡国榕 《智能科学与技术学报》 2021年第3期304-311,共8页
植株叶片检测是植株科学培育和精准农业过程中重要的环节之一。传统植株叶片检测的做法对操作人员的专业知识提出了较高要求,且人工成本高、耗时周期长。基于此,提出基于多尺度卷积神经网络特征融合(MCFF)的植株叶片检测技术。从深度学... 植株叶片检测是植株科学培育和精准农业过程中重要的环节之一。传统植株叶片检测的做法对操作人员的专业知识提出了较高要求,且人工成本高、耗时周期长。基于此,提出基于多尺度卷积神经网络特征融合(MCFF)的植株叶片检测技术。从深度学习技术辅助植株培育的需求出发,基于多尺度卷积神经网络特征融合,针对莲座模式植物、拟南芥和烟草3种不同类型、不同分辨率的植株进行叶片计数检测。经过与其他主流算法的比较,发现MCFF具备较高的检测精确度,平均精度均值(mAP)为0.662,实现了高度竞争的性能(AP=0.946),各项指标接近实用水平。 展开更多
关键词 深度学习 目标检测 多尺度卷积神经网络特征融合 植株叶片检测技术
在线阅读 下载PDF
基于多尺度深度图自适应融合的单目深度估计 被引量:1
4
作者 郑游 王磊 杨紫文 《武汉工程大学学报》 CAS 2024年第1期85-90,共6页
深度估计网络通常具有较多的网络层数,图像特征在网络编码和解码过程中会丢失大量信息,因此预测的深度图缺乏对象结构细节且边缘轮廓不清晰。本文提出了一种基于多尺度深度图自适应融合的单目深度估计方法,可有效保留对象的细节和几何... 深度估计网络通常具有较多的网络层数,图像特征在网络编码和解码过程中会丢失大量信息,因此预测的深度图缺乏对象结构细节且边缘轮廓不清晰。本文提出了一种基于多尺度深度图自适应融合的单目深度估计方法,可有效保留对象的细节和几何轮廓。首先,引入压缩与激励残差网络(SE-ResNet),利用注意力机制对不同通道的特征进行编码,从而保留远距离平面深度图的更多细节信息。然后,利用多尺度特征融合网络,融合不同尺度的特征图,得到具有丰富几何特征和语义信息的特征图。最后,利用多尺度自适应深度融合网络为不同尺度特征图生成的深度图添加可学习的权重参数,对不同尺度的深度图进行自适应融合,增加了预测深度图中的目标信息。本文方法在NYU Depth V2数据集上预测的深度图具有更高的准确度和丰富的物体信息,绝对相对误差为0.115,均方根误差为0.525,精确度最高达到99.3%。 展开更多
关键词 单目深度估计 注意力机制 多尺度特征融合网络 多尺度深度自适应融合网络
在线阅读 下载PDF
Infrasound Event Classification Fusion Model Based on Multiscale SE-CNN and BiLSTM 被引量:1
5
作者 Hongru Li Xihai Li +3 位作者 Xiaofeng Tan Chao Niu Jihao Liu Tianyou Liu 《Applied Geophysics》 SCIE CSCD 2024年第3期579-592,620,共15页
The classification of infrasound events has considerable importance in improving the capability to identify the types of natural disasters.The traditional infrasound classification mainly relies on machine learning al... The classification of infrasound events has considerable importance in improving the capability to identify the types of natural disasters.The traditional infrasound classification mainly relies on machine learning algorithms after artificial feature extraction.However,guaranteeing the effectiveness of the extracted features is difficult.The current trend focuses on using a convolution neural network to automatically extract features for classification.This method can be used to extract signal spatial features automatically through a convolution kernel;however,infrasound signals contain not only spatial information but also temporal information when used as a time series.These extracted temporal features are also crucial.If only a convolution neural network is used,then the time dependence of the infrasound sequence will be missed.Using long short-term memory networks can compensate for the missing time-series features but induces spatial feature information loss of the infrasound signal.A multiscale squeeze excitation–convolution neural network–bidirectional long short-term memory network infrasound event classification fusion model is proposed in this study to address these problems.This model automatically extracted temporal and spatial features,adaptively selected features,and also realized the fusion of the two types of features.Experimental results showed that the classification accuracy of the model was more than 98%,thus verifying the effectiveness and superiority of the proposed model. 展开更多
关键词 infrasound classification channel attention convolution neural network bidirectional long short-term memory network multiscale feature fusion
在线阅读 下载PDF
像素级的皮肤分割与面色分级 被引量:3
6
作者 吴从中 侯国松 +2 位作者 丁正龙 许良凤 詹曙 《计算机工程与科学》 CSCD 北大核心 2019年第11期1985-1990,共6页
皮肤是人体最大的器官,面色相对于人体其他生物属性具有更便捷、更稳定的特性。因此,设计一个完整有效的面色分级系统是非常有意义的。本文中,面色分级系统被分为皮肤分割和面色分级2部分。针对皮肤分割任务,在生成对抗网络框架下搭建... 皮肤是人体最大的器官,面色相对于人体其他生物属性具有更便捷、更稳定的特性。因此,设计一个完整有效的面色分级系统是非常有意义的。本文中,面色分级系统被分为皮肤分割和面色分级2部分。针对皮肤分割任务,在生成对抗网络框架下搭建了一个多尺度特征融合网络,相对于传统的语义分割网络,本文的分割模型充分地利用了每一层特征图的信息。在面色分级实验中,首先在归一化rgb、HSV和Lab颜色空间下使用1000幅图像分别训练了支持向量机(SVM)和BP神经网络分类器,128幅皮肤图像被用作测试集,正确率在73%~76%;之后将颜色特征与皮肤区域纹理特征融合进行学习,使用SVM分类的正确率为85%,使用BP神经网络分类的正确率达到了91%。 展开更多
关键词 多尺度特征融合网络 生成对抗网络 皮肤分割 面色分级
在线阅读 下载PDF
基于MSSA+IESN+MFFN组合算法的齿轮箱早期故障智能诊断 被引量:1
7
作者 冯贺平 杨敬娜 +2 位作者 吴梅梅 薛林雁 王德永 《中国工程机械学报》 北大核心 2023年第2期172-177,共6页
齿轮箱故障诊断存在变速工况、样本数量偏少以及会形成强噪声情况,提出了一种通过多尺度特征融合网络(MFFN)实现故障诊断技术。对初始时域信号拓展形成多特征域,建立造多维堆栈稀疏自编码器(MSSA)对不同特征域进行故障采集,通过粒子群... 齿轮箱故障诊断存在变速工况、样本数量偏少以及会形成强噪声情况,提出了一种通过多尺度特征融合网络(MFFN)实现故障诊断技术。对初始时域信号拓展形成多特征域,建立造多维堆栈稀疏自编码器(MSSA)对不同特征域进行故障采集,通过粒子群算法优化回声状态网络(IESN)进行信号处理。研究结果表明:样本充足条件下,MFFN模型诊断时,定速工况为99.15%,变速工况为98.46%,达到了更高准确率并降低了标准差。在样本不足条件下,深度特征融合网络(DEFN)和MFFN对于样本数量减少表现出了优异鲁棒性,MFFN达到了更优的性能。在噪声干扰场景下,采用MFFN依然能够达到85%的准确率。该算法具备更优抗干扰性能,采用多维特征提取能够更好地适应处于强噪声干扰环境。该研究为实现传动系统的稳定运行提供了理论参考。 展开更多
关键词 齿轮箱 故障诊断 深度学习 多堆栈稀疏自编码器(MSSA) 多尺度特征融合网络(MFFN)
在线阅读 下载PDF
E-Y-slim:轻量级小目标快速检测方法
8
作者 胡耀 黄忠涛 +2 位作者 何元清 李雪 杨丽君 《计算机应用》 CSCD 北大核心 2022年第S01期276-280,共5页
针对目前机场鸟类目标检测模型存在实时检测效率低和在嵌入式设备中难以部署的问题,提出了一种基于改进YOLOv4的轻量级小目标快速检测方法E-Y-slim。首先,将轻量化的EfficientNet-B0作为模型的特征提取网络,降低网络参数量和计算复杂度... 针对目前机场鸟类目标检测模型存在实时检测效率低和在嵌入式设备中难以部署的问题,提出了一种基于改进YOLOv4的轻量级小目标快速检测方法E-Y-slim。首先,将轻量化的EfficientNet-B0作为模型的特征提取网络,降低网络参数量和计算复杂度,提高检测速度;然后,裁剪特征融合网络中部分卷积层,并将检测层中标准卷积改为深度可分离卷积,进一步提升检测速度;最后,加入空间金字塔池化(SPP)结构以及交并比(IoU)预测分支,在保持算法检测效率情况下,提升算法检测精度。所提方法在PASCALVOC鸟类数据集上平均精度(AP)为75.2%,检测速度达到50帧/秒,相较于YOLOv4的AP下降了7个百分点,但检测速度提升了42.9%。在实际机场鸟类数据集上AP为75.0%,检测速度达到49帧/秒,在AP相当的情况下,与YOLOv4相比模型参数量减少91.1%,检测速度提升了63.3%。实验结果表明,E-Y-slim能够满足在嵌入式设备上对机场鸟类活动目标快速检测的需求。 展开更多
关键词 鸟击防范 目标检测 轻量化神经网络 EfficientNet 多尺度特征融合网络
在线阅读 下载PDF
Neighborhood fusion-based hierarchical parallel feature pyramid network for object detection 被引量:3
9
作者 Mo Lingfei Hu Shuming 《Journal of Southeast University(English Edition)》 EI CAS 2020年第3期252-263,共12页
In order to improve the detection accuracy of small objects,a neighborhood fusion-based hierarchical parallel feature pyramid network(NFPN)is proposed.Unlike the layer-by-layer structure adopted in the feature pyramid... In order to improve the detection accuracy of small objects,a neighborhood fusion-based hierarchical parallel feature pyramid network(NFPN)is proposed.Unlike the layer-by-layer structure adopted in the feature pyramid network(FPN)and deconvolutional single shot detector(DSSD),where the bottom layer of the feature pyramid network relies on the top layer,NFPN builds the feature pyramid network with no connections between the upper and lower layers.That is,it only fuses shallow features on similar scales.NFPN is highly portable and can be embedded in many models to further boost performance.Extensive experiments on PASCAL VOC 2007,2012,and COCO datasets demonstrate that the NFPN-based SSD without intricate tricks can exceed the DSSD model in terms of detection accuracy and inference speed,especially for small objects,e.g.,4%to 5%higher mAP(mean average precision)than SSD,and 2%to 3%higher mAP than DSSD.On VOC 2007 test set,the NFPN-based SSD with 300×300 input reaches 79.4%mAP at 34.6 frame/s,and the mAP can raise to 82.9%after using the multi-scale testing strategy. 展开更多
关键词 computer vision deep convolutional neural network object detection hierarchical parallel feature pyramid network multi-scale feature fusion
在线阅读 下载PDF
基于改进ACV模型的视差估计方法
10
作者 秦伦明 余斌 +2 位作者 崔昊杨 边后琴 王悉 《激光与光电子学进展》 CSCD 北大核心 2024年第24期131-140,共10页
双目立体匹配作为计算机视觉领域的一个热点问题,在距离感知、遥感、自动驾驶等诸多场景中有着广泛的应用。针对目前方法在深度不连续以及边界区域存在视差预测不准确的问题,提出一种基于改进注意力拼接代价体网络的端到端视差估计方法... 双目立体匹配作为计算机视觉领域的一个热点问题,在距离感知、遥感、自动驾驶等诸多场景中有着广泛的应用。针对目前方法在深度不连续以及边界区域存在视差预测不准确的问题,提出一种基于改进注意力拼接代价体网络的端到端视差估计方法。首先引入多尺度特征融合网络,将浅层与深层包含丰富信息的多尺度特征图融合,增强图像细节的细粒度表示,缓解图像中深度不连续区域视差预测不准确的问题。接着设计Sobel边缘平滑损失,建立视差图边界与场景边缘轮廓对应的约束关系,缓解图像中目标边界区域视差预测不准确的问题。在Sceneflow数据集上的实验结果表明,所提方法在EPE和D1指标上分别达到0.467和1.51%,在KITTI数据集上,所提方法在3-All和D1-All指标上分别达到1.44%和1.61%。与注意力拼接代价体网络相比,所提方法在EPE和D1指标上分别降低3.51%和5.63%,在3-All与D1-All指标上分别降低2.04%和2.42%,可获得更好的视差估计效果。 展开更多
关键词 双目立体匹配 注意力拼接代价体网络 端到端视差估计 多尺度特征融合网络 Sobel边缘平滑损失
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部