期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于多路层次化混合专家模型的轴承故障诊断方法 被引量:1
1
作者 徐欣然 张绍兵 +2 位作者 成苗 张洋 曾尚 《计算机应用》 北大核心 2025年第1期59-68,共10页
针对滚动轴承故障诊断中处理复杂工况准确率较低的问题,提出一个多任务学习(MTL)模型,即多路层次化混合专家(MHMoE)模型,以及对应的层次化训练模式。该模型结合多阶段、多任务联合训练,实现了层次化的信息共享模式,并在普通MTL模式的基... 针对滚动轴承故障诊断中处理复杂工况准确率较低的问题,提出一个多任务学习(MTL)模型,即多路层次化混合专家(MHMoE)模型,以及对应的层次化训练模式。该模型结合多阶段、多任务联合训练,实现了层次化的信息共享模式,并在普通MTL模式的基础上进一步提升了模型的泛化性和故障识别准确率,使模型能同时在复杂与简单的数据集上出色地完成任务,同时,结合一维ResNet的瓶颈层结构,在保证网络深度的同时,也规避梯度爆炸与梯度消失等问题,从而能充分地提取数据集的相关特征。以帕德博恩大学轴承故障数据集(PU)为测试数据集设计的实验的结果表明,在不同工况复杂度下,与不使用MTL的单任务混合专家单元结构(OMoE)-ResNet18模型相比,所提模型的准确率提升5.45~9.30个百分点;而与集成经验模态分解的Hilbert谱变换方法(EEMD-Hilbert)、MMoE(Multigate Mixture-of-Experts)和多尺度多任务注意力卷积神经网络(MSTACNN)等模型相比,所提模型的准确率至少提升3.21~16.45个百分点。 展开更多
关键词 轴承故障诊断 预测性维护 多任务学习 深度学习 卷积神经网络
在线阅读 下载PDF
工业场景下基于秩信息对YOLOv4的剪枝 被引量:2
2
作者 秦晓 成苗 +4 位作者 张绍兵 何莲 石向文 王品学 曾尚 《计算机应用》 CSCD 北大核心 2022年第5期1417-1423,共7页
在工业场景无线射频识别(RFID)实时缺陷检测任务中,为了保证检测精度以及速度常采用YOLO这类深度学习目标检测算法,然而这些算法仍然难以满足工业检测中的速度要求,且无法将相应的网络模型部署到资源受限的设备上。针对以上问题,需要对Y... 在工业场景无线射频识别(RFID)实时缺陷检测任务中,为了保证检测精度以及速度常采用YOLO这类深度学习目标检测算法,然而这些算法仍然难以满足工业检测中的速度要求,且无法将相应的网络模型部署到资源受限的设备上。针对以上问题,需要对YOLO模型进行剪枝压缩,提出了一种基于秩信息的特征信息丰富性和特征信息多样性加权融合的新型网络剪枝方法。首先,加载未剪枝模型进行推理,并在前向传播中获取滤波器对应特征图的秩信息来衡量特征信息丰富性;然后,根据不同大小的剪枝率对秩信息进行聚类或者相似度计算来衡量特征信息的多样性;最后,加权融合得到对应滤波器的重要性程度并对其进行排序后,剪除重要性排序靠后的滤波器。实验结果表明,对于YOLOv4,在剪枝率为28.87%且特征信息丰富性权重为0.75的情况下,所提方法相较于单一使用特征图秩信息的方法提高了2.6%~8.9%的平均精度均值(mAP),所提方法剪枝后的模型甚至相较于未剪枝模型提高了0.4%的mAP并减少了35.0%的模型参数,表明该方法有利于模型部署。 展开更多
关键词 无线射频识别 YOLO 网络剪枝 特征信息丰富性 特征信息多样性 秩信息
在线阅读 下载PDF
基于多尺度门控膨胀卷积网络的时间序列预测算法 被引量:1
3
作者 曾渝 张洋 +3 位作者 曾尚 付茂栗 何启学 曾林隆 《计算机应用》 CSCD 北大核心 2024年第11期3427-3434,共8页
针对当前时间序列预测任务存在的高维特征、大规模数据以及对预测准确性高要求等问题,提出一种基于多尺度趋势-周期分解的多头门控膨胀卷积网络模型。该模型采用多尺度分解方法,将原始协变量序列和预测变量序列分解为各自的周期项和趋势... 针对当前时间序列预测任务存在的高维特征、大规模数据以及对预测准确性高要求等问题,提出一种基于多尺度趋势-周期分解的多头门控膨胀卷积网络模型。该模型采用多尺度分解方法,将原始协变量序列和预测变量序列分解为各自的周期项和趋势项,从而实现独立的预测。对于周期项,引入多头门控膨胀卷积网络的编码器,以提取各自的周期信息;在解码器阶段,使用交叉注意力机制进行通道信息的交互融合,并将预测变量的周期信息采样对齐后通过时间注意力与通道融合信息进行周期预测。对趋势项则采用自回归方式进行趋势预测。最后将趋势预测与周期预测的结果相加得到预测序列。与长短期记忆(LSTM)、Informer等多个主流基准模型进行比较,所提模型在ETTm1、ETTh1等5个数据集上的均方误差(MSE)平均下降了19.2%~52.8%,平均绝对误差(MAE)平均下降了12.1%~33.8%。通过消融实验验证了所提出的多尺度分解模块、多头门控膨胀卷积以及时间注意力模块能提升时序预测的准确度。 展开更多
关键词 时间序列预测 序列分解 膨胀卷积 编码器 解码器 注意力机制
在线阅读 下载PDF
基于分解和频域特征提取的多变量长时间序列预测模型 被引量:1
4
作者 范艺扬 张洋 +2 位作者 曾尚 曾渝 付茂栗 《计算机应用》 CSCD 北大核心 2024年第11期3442-3448,共7页
针对现有基于Transformer的多变量长时间序列预测(MLTSF)模型主要从时域中提取特征,难以直接从长时间序列分散的时间点中找出可靠依赖关系的问题,提出一种新的基于分解和频域特征提取的模型。首先,提出基于频域的周期项-趋势项的分解方... 针对现有基于Transformer的多变量长时间序列预测(MLTSF)模型主要从时域中提取特征,难以直接从长时间序列分散的时间点中找出可靠依赖关系的问题,提出一种新的基于分解和频域特征提取的模型。首先,提出基于频域的周期项-趋势项的分解方法,以降低分解过程的时间复杂度;其次,在利用周期项-趋势项分解提取序列趋势性特征的基础上,利用基于Gabor变换进行频域特征提取的Transformer网络捕捉周期性的依赖,提高预测的稳定性和鲁棒性。在5个基准数据集上的实验结果显示,与现有的先进方法相比,所提模型在MLTSF上的均方误差(MSE)平均减小了7.6%,最多减小了18.9%,有效提升了预测精度。 展开更多
关键词 多变量长时间序列预测 频域特征提取 GABOR变换 TRANSFORMER 时间序列 深度学习
在线阅读 下载PDF
基于反向蒸馏的衍射光变图像异常检测算法
5
作者 周荣成 廖世鹏 +1 位作者 张绍兵 龚庆凯 《计算机应用》 CSCD 北大核心 2024年第S2期223-228,共6页
为防止伪造,钞票、证卡和产品包装等各类高安全或高附加值印刷品中广泛采用衍射光变图像的光学防伪元件。这种光学防伪元件具有光变特性,即在白光照明条件下该原件产生的具有立体效果、动态变化的图像会对异常检测产生严重干扰,使人们... 为防止伪造,钞票、证卡和产品包装等各类高安全或高附加值印刷品中广泛采用衍射光变图像的光学防伪元件。这种光学防伪元件具有光变特性,即在白光照明条件下该原件产生的具有立体效果、动态变化的图像会对异常检测产生严重干扰,使人们无法及时发现工业生产过程中的异常情况。针对现有无监督异常检测算法无法适应衍射光变图像的光变特性的问题,提出一种基于反向蒸馏(RD)的衍射光变图像异常检测算法。所提算法对正常样本添加噪声以生成伪异常样本,并模拟工业现场可能出现的异常现象,随后将正常样本与伪异常样本作为图像对输入网络,并基于孪生网络架构提出对比重建模块(CRM)。该模块通过特征重建层对编码器提取的正常样本及伪异常样本的特征进行对比学习以及重建,既避免了异常信息流入解码器中导致蒸馏失败,又使重建后的特征符合样本的正常分布。然后,将复原后的特征输入特征融合层以及特征压缩层进行特征融合和维度压缩,并使用解码器对压缩后的特征逐层解码。最后,对解码后的特征与编码器提取的特征基于协同差异优化算法进行蒸馏,识别并定位样本中的异常信息。实验结果表明,所提算法在某防伪标数据集上较现有的先进异常检测算法提升了对于衍射光变图像的光变特性的适应能力,并保持了对于样本异常区域的检测精度,在图像层面接收者特性曲线下的面积(Image-AUROC)、像素层面接收者特性曲线下的面积(Pixel-AUROC)以及连通域重叠(PRO)指标上分别达到了100%、95.02%和92.98%,满足工业现场对衍射光变图像异常检测的要求。 展开更多
关键词 对比学习 特征重建 异常模拟 反向蒸馏 衍射光变图像 异常检测
在线阅读 下载PDF
基于改进DFVDFF网络的变焦深度测量
6
作者 赵涂昊 夏小东 +1 位作者 付茂栗 王觅 《计算机应用》 CSCD 北大核心 2024年第S01期223-228,共6页
针对差分聚焦体(DFV)与变焦深度测量(DFF)联合应用的网络(简称为DFVDFF)精度较低的问题,首先,将特征提取模块的网络结构替换为UNet++,并在深度信息提取模块内增加注意力机制,通过关注重要的特征并融合深层特征和浅层特征提升网络预测的... 针对差分聚焦体(DFV)与变焦深度测量(DFF)联合应用的网络(简称为DFVDFF)精度较低的问题,首先,将特征提取模块的网络结构替换为UNet++,并在深度信息提取模块内增加注意力机制,通过关注重要的特征并融合深层特征和浅层特征提升网络预测的精度;然后,针对DFVDFF生成的深度图纹理边界模糊的问题,使用结构相似度和平滑平均绝对误差融合的损失函数替换原有的平滑平均绝对误差损失函数,通过提升损失函数对纹理边界的敏感程度引导网络生成更清晰的边界。实验结果表明,改进后的网络在有噪声的DDFF-12数据集上,相较于原始DFVDFF网络,均方误差下降了7.40%;在无噪声的FoD500数据集上,相较于原始DFVDFF网络,均方误差下降了19.07%。并且,改进后的网络在两个数据集上生成的深度图比DFVDFF网络生成的深度图具有更清晰的纹理边界。 展开更多
关键词 深度学习 变焦深度测量 DFVDFF 结构相似度 损失函数
在线阅读 下载PDF
基于FastFlow的复杂纹理图像异常检测
7
作者 张果 夏小东 +1 位作者 付茂栗 魏麟 《计算机应用》 CSCD 北大核心 2024年第S01期256-261,共6页
为了提高FastFlow的缺陷检测准确率和分割能力,分析FastFlow在复杂图像异常检测上性能下降的原因,提出一种基于FastFlow的改进模型SAFlow(Self-Attention-Flow)。为了解决异常检测准确率低的问题,首先,采用ResNet18为特征提取器,FastFlo... 为了提高FastFlow的缺陷检测准确率和分割能力,分析FastFlow在复杂图像异常检测上性能下降的原因,提出一种基于FastFlow的改进模型SAFlow(Self-Attention-Flow)。为了解决异常检测准确率低的问题,首先,采用ResNet18为特征提取器,FastFlow为主干网络,均值方差阈值分割作为分割方法;其次,添加一条特征信息添加分支,包含特征金字塔(FP)模块与自注意力(SA)机制模块,旨在给予网络更多的特征信息参考;最后,采用K-sigma动态阈值作为生成的热力图分割阈值,使分割结果更准确。实验结果表明,与FastFlow模型相比,SAFlow在4个复杂纹理图像数据集上的Pixel-AUC(Area Under Receiver Operating Characteristic Curve)精度分别提升了4.98、3.05、1.44和3.88个百分点;在总数据集上,Pixel-AUC平均精度提升了3.34个百分点。所提网络结构使样本数据最后形成的正态分布更具有代表性、更集中,分布中异常负对数似然得分更高,异常检测准确率更高,解决了复杂纹理图像中异常缺陷的检测问题难点。 展开更多
关键词 深度学习 FastFlow 自注意力 复杂纹理图像 特征金字塔
在线阅读 下载PDF
基于3D归一化流的双分支点云异常检测模型
8
作者 王布凡 张绍兵 +1 位作者 成苗 何莲 《计算机应用》 CSCD 北大核心 2024年第S01期71-76,共6页
当前基于三维点云的工业异常检测仍处于起步阶段,较先进的方法将点云栅格化成2D图片或采用传统算子提取点云特征,有待进一步研究。对此,提出一种基于3D归一化流的双分支点云异常检测模型。以3D归一化流作为整体框架,结合双分支交互融合... 当前基于三维点云的工业异常检测仍处于起步阶段,较先进的方法将点云栅格化成2D图片或采用传统算子提取点云特征,有待进一步研究。对此,提出一种基于3D归一化流的双分支点云异常检测模型。以3D归一化流作为整体框架,结合双分支交互融合模块进行局部特征聚合,以并行结构聚合由Transformer和卷积神经网络(Convs)架构提取的不同焦点的点云特征;通过3D归一化流对特征金字塔在欧氏空间和潜在空间之间的可逆映射进行建模,基于受试者曲线下面积,所提模型从分布学习的角度实现了图像级(I-AUROC)的高效异常检测。在MVTec-3D AD数据集上进行的实验结果表明,所提模型在点云异常检测中取得了比目前先进方法更好的性能,相较于M3DM(Multi-3D-Memory)、AST(Asymmetric Student-Teacher Networks),I-AUROC(Image-level Area Under the Receiver Operating Characteristiccurve)指标分别提升了1.8和5.9个百分点。 展开更多
关键词 点云异常检测 3D归一化流 局部特征聚合 特征金字塔 可逆映射
在线阅读 下载PDF
基于逐层扩张卷积的3D牙颌实例分割
9
作者 唐瑞成 成苗 +5 位作者 何莲 石向文 郭静 赵铱民 王胜朝 余快 《计算机应用》 CSCD 北大核心 2024年第S01期235-241,共7页
在计算机辅助的正畸手术规划和牙齿识别中,准确地从3D牙颌模型中分割出每颗牙齿至关重要。无需候选区域的分割方法虽然高效且易用,但存在诸多限制:在局部特征聚合时,现有方法依赖欧氏距离寻找特征空间内最近的多个网格单元,只能实现较... 在计算机辅助的正畸手术规划和牙齿识别中,准确地从3D牙颌模型中分割出每颗牙齿至关重要。无需候选区域的分割方法虽然高效且易用,但存在诸多限制:在局部特征聚合时,现有方法依赖欧氏距离寻找特征空间内最近的多个网格单元,只能实现较小的感受野,这可能导致对牙齿网格的错误预测;此外,现有方法未充分考虑3D牙颌模型的方向性和同一牙齿实例的网格单元间的潜在信息。针对上述问题,提出一种名为“逐层扩张卷积”的卷积方法,它能在有效提取特征的同时,不增加任何计算成本;同时,提出方向特征对齐模块和潜在信息挖掘模块,以进一步优化牙颌分割结果。在真实采集的3D牙颌内口扫描数据集上的实验结果表明,所提方法在总体准确率(OA)和平均交并比(mIoU)方面分别达到了98.46%和94.47%,相较于TSGCNet(Two-Stream Graph Convolutional Network),分别提升了3.27个百分点和10.45个百分点。 展开更多
关键词 3D牙颌实例分割 计算机辅助规划 感受野 局部特征聚合 牙颌方向性
在线阅读 下载PDF
基于模糊核估计和交替Transformer的二维码图像去运动模糊算法
10
作者 石彬 成苗 +1 位作者 张绍兵 曾尚 《计算机应用》 CSCD 北大核心 2024年第S2期234-239,共6页
在生产生活中,运动模糊的存在增加了二维码(QR code)识别的难度。针对这一问题,提出一种基于模糊核估计和交替Transformer的QR code图像去运动模糊算法。首先,针对目前去运动模糊算法对中间退化过程缺少解释的问题,使用一个模糊核估计网... 在生产生活中,运动模糊的存在增加了二维码(QR code)识别的难度。针对这一问题,提出一种基于模糊核估计和交替Transformer的QR code图像去运动模糊算法。首先,针对目前去运动模糊算法对中间退化过程缺少解释的问题,使用一个模糊核估计网络(KEN)动态估计模糊核的形状和参数,并在将KEN的输出和原图做维纳滤波后,指导后续复原网络更好地去运动模糊;其次,针对基于窗口的Transformer捕捉全局特征的能力较弱,传统Transformer计算复杂度较高的问题,提出一个基于局部窗口的Transformer块(LTB)和基于全局轴的Transformer块(GTB)结合的交替Transformer模块(ATB),交替提取局部和全局的特征;最后,针对输入为单一尺度图像时模型无法处理不同层次模糊的问题,提出一个多尺度特征融合模块(MSFFB)。这样,模型能从多尺度输入图像提取特征,有效利用上下文信息,并更好地保留和恢复图像细节。在运动模糊QR code图像数据集上的实验结果表明,对于线性模糊核测试集,所提算法相较于复原效果第2名的Uformer(U-shaped Transformer)-B在峰值信噪比(PSNR)、结构相似度(SSIM)上分别提升了3.11%、1.23%;对于非线性模糊核测试集,所提算法相较于Uformer-B在PSNR和SSIM上分别提升了7.13%、2.19%,同时,在乘加累积操作量(MAC)上减少了77.22%,在所有对比算法中取得最优,在模型参数量(Param)上下降了83.5%。此外,采用YOLOv4和ZBar进行目标检测和识别实验,结果表明所提算法对提高QR code检测和识别效率具有一定实际意义。 展开更多
关键词 TRANSFORMER 二维码 运动模糊图像复原 模糊核估计 多尺度
在线阅读 下载PDF
面向边缘部署的高分辨率实时语义分割算法
11
作者 曾林隆 成苗 +1 位作者 张绍兵 曾渝 《计算机应用》 CSCD 北大核心 2024年第S2期159-163,共5页
在机器视觉领域经典的任务中,语义分割是计算量较大的一类,使得在边缘计算系统中部署执行分割的卷积神经网络(CNN)比较困难。现场可编程逻辑门阵列(FPGA)是工业视觉传感器中广泛使用的数据流处理硬件,而近年来有研究实现了在FPGA上部署... 在机器视觉领域经典的任务中,语义分割是计算量较大的一类,使得在边缘计算系统中部署执行分割的卷积神经网络(CNN)比较困难。现场可编程逻辑门阵列(FPGA)是工业视觉传感器中广泛使用的数据流处理硬件,而近年来有研究实现了在FPGA上部署CNN。然而,受限于有限的算力,目前的技术在FPGA上实现高分辨率图像的语义分割时,难以达到可接受的速度和精度。通过分析FPGA上深度学习加速器的特性,提出一种新的分割网络——三分支分割网络(TriSeNet),所提网络能端到端地在边缘加速器上推理高分辨率图像的语义分割任务。将TriSeNet部署到赛灵思Kria K26SOM上推理CityScapes语义分割时取得了75%的平均交并比(mIoU),同时在输入分辨率为512×1 024时,推理速度达到了32 FPS。TriSeNet能高效利用边缘端的计算资源,实现了62.6%的运算器利用率,表明TriSeNet是一种成功适应加速器硬件特点的模型。 展开更多
关键词 边缘计算 图像分割 卷积神经网络 智能计算系统 现场可编程逻辑门阵列
在线阅读 下载PDF
基于改进YOLOv8的小目标与细长目标检测模型
12
作者 周子渊 成苗 +1 位作者 何莲 张佳成 《计算机应用》 CSCD 北大核心 2024年第S2期286-295,共10页
实时、准确的玻璃缺陷检测至关重要;然而,尺度多变的缺陷形态以及特征微弱的小目标和长宽比例极端的细长目标让这个任务极具挑战性。针对上述需求,提出一种基于改进YOLOv8(You Only Look Once version 8)的小目标与细长目标检测模型YOLO... 实时、准确的玻璃缺陷检测至关重要;然而,尺度多变的缺陷形态以及特征微弱的小目标和长宽比例极端的细长目标让这个任务极具挑战性。针对上述需求,提出一种基于改进YOLOv8(You Only Look Once version 8)的小目标与细长目标检测模型YOLO-WANI(WPAN+AMFI+NWD&Inner-CIoU)。首先,设计WPAN(Weighted Path Aggregation Network)减小小目标和细长目标信息在网络传播过程中发生的损失,从而平衡不同尺度信息的重要性;其次,引入基于注意力的多尺度特征交互模块(AMFI),以捕捉深层特征中聚焦对象的语义信息;再次,使用归一化沃瑟斯坦距离(NWD)和Inner-CIoU损失替换原始的CIoU(Complete Intersection over Union)损失,从而提高对小目标和细长目标的检测效率;最后,制作玻璃缺陷检测数据集验证模型性能。实验结果表明,相较于YOLOv8n,YOLO-WANI在玻璃缺陷检测数据集上的mAP50:95提高了1.9个百分点、mAP50提高了4.6个百分点,分别达到了42.6%、81.7%;在NEU-DET(the NorthEastern University surface defect database for defect DETection task)钢材缺陷检测数据集上mAP50:95提高了1.5个百分点、mAP50提高了1.9个百分点,分别达到了40.3%、76.1%。所提模型和各个量级的实时缺陷检测模型相比都有着最高的精度,同时只有4.1×106的参数量和9.9 GFLOPs的计算量,且FPS(Frames Per Second)达到138、单图推理时间为(7.16±0.17) ms,满足轻量化和高精度的需求。 展开更多
关键词 缺陷检测 多尺度特征融合 注意力机制 边界框回归 目标检测
在线阅读 下载PDF
基于动态图卷积和离散哈特莱转换差异性池化的点云数据分类分割网络 被引量:7
13
作者 史怡 魏东 +2 位作者 宋强 何莲 王竟爽 《计算机应用》 CSCD 北大核心 2022年第S01期292-297,共6页
针对目前可以直接处理原始点云数据的深度学习网络PointNet,忽略了点与点之间的拓扑关系和全局特征信息单一的缺陷,提出一种基于动态图卷积和离散哈特莱转换(DHT)差异性池化的点云数据分类分割网络。首先,设计动态图卷积模块构建局部邻... 针对目前可以直接处理原始点云数据的深度学习网络PointNet,忽略了点与点之间的拓扑关系和全局特征信息单一的缺陷,提出一种基于动态图卷积和离散哈特莱转换(DHT)差异性池化的点云数据分类分割网络。首先,设计动态图卷积模块构建局部邻域图结构,通过图卷积网络获得点与点之间的位置关系,同时采用动态更新图结构的方式,增强网络表征能力;然后,通过离散哈特莱转换将特征转换到指定维度;最后,通过最大池化和平均池化并联通道获得全局特征。实验结果证明:提出的网络模型与PointNet网络模型在同样的数据集和评价标准上对比,点云分类任务上总体精度提高2.6个百分点,部件分割任务平均交并比(mIoU)提高4.1个百分点,场景语义分割任务mIoU提高8.6个百分点。通过运用该网络模型能有效提升点云数据分类分割的准确率,同时该网络具有更强的鲁棒性。 展开更多
关键词 点云数据 深度学习 分类分割 图卷积 离散哈特莱转换
在线阅读 下载PDF
基于可变形卷积和自适应空间特征融合的硬币表面缺陷检测算法 被引量:5
14
作者 王品学 张绍兵 +2 位作者 成苗 何莲 秦小山 《计算机应用》 CSCD 北大核心 2022年第2期638-645,共8页
针对硬币表面缺陷较小、形状多变且易与背景混淆而不易检出的问题,改进YOLOv3算法并提出基于可变形卷积和自适应空间特征融合的硬币表面缺陷检测算法DCA-YOLO。首先,由于缺陷形状的多变设计了3种在主干网络中不同位置添加可变形卷积模... 针对硬币表面缺陷较小、形状多变且易与背景混淆而不易检出的问题,改进YOLOv3算法并提出基于可变形卷积和自适应空间特征融合的硬币表面缺陷检测算法DCA-YOLO。首先,由于缺陷形状的多变设计了3种在主干网络中不同位置添加可变形卷积模块的网络结构,通过卷积学习偏移量和调节参数来提高缺陷的提取能力;然后,使用自适应空间特征融合网络学习权重参数来调整不同尺度特征图中各像素点的贡献度以更好地适应不同尺度的目标;最后,改进先验锚框比例,动态调节类别权重,优化并对比网络性能,从而提出在主干网络输出特征进行多尺度融合的上采样前增加可变形卷积的模型网络。实验结果表明,在硬币缺陷数据集上,DCA-YOLO算法检测平均精度均值(mAP)接近于Faster-RCNN,达到了92.8%;而相较于YOLOv3,所提算法的检测速度基本持平,在检测mAP上提高了3.3个百分点,F1分数提升了3.2个百分点。 展开更多
关键词 YOLOv3算法 硬币 表面缺陷检测 可变形卷积 自适应空间特征融合
在线阅读 下载PDF
基于对照学习的图像缺陷检测算法 被引量:3
15
作者 萧铂钿 张绍兵 成苗 《计算机应用》 CSCD 北大核心 2023年第S02期216-222,共7页
钞纸在实际生产过程中,由于纸类本身存在柔性变化,采用传统的模板匹配使得检测的结果不准确。同时现在使用的深度学习算法对水印进行检测会出现漏检、错检,以及对小缺陷检测不够准确的问题。针对这些问题,提出一种基于对照学习的图像缺... 钞纸在实际生产过程中,由于纸类本身存在柔性变化,采用传统的模板匹配使得检测的结果不准确。同时现在使用的深度学习算法对水印进行检测会出现漏检、错检,以及对小缺陷检测不够准确的问题。针对这些问题,提出一种基于对照学习的图像缺陷分割检测算法。首先,网络输入中心位置相同但大小不等的缺陷图与模板图,其中模板图分辨率稍大于缺陷图。网络采用双分支的编解码器结构,使用ResNet50作为主干网络,分别提取模板图与缺陷图的特征。然后,设计对照注意力模块LACB(Local Attention Contrast Block),将两个分支各个阶段所提取的特征图作为对照注意力模块的输入。将输入进对照模块的特征图划分为数量相同、大小不同的Patch,用注意力机制的方式局部对照缺陷图与模板图之间的差异。由于纸张本身存在柔性变化,水印会在小范围内发生偏移,所以需要在模板图上相对于缺陷图像的位置的一个更大范围内进行对照。因此,输入的缺陷特征图要小于模板特征图,使网络允许特征在一定范围内偏移,模糊缺陷的局部位置信息。将前三层的对照结果输入解码器中,最后一层输入ASPP(Atrous Spatial Pyramid Pooling)中,在语义上综合全局的信息。最后通过解码器将多尺度的特征图跨层融合,减缓下采样带来的信息丢失,同时加强模板图与缺陷图之间不同特征的响应,使分割结果更加精准。实验结果表明,该算法在钞纸数据集上,相较于U-Net,MIoU(Mean Intersection over Union)提高了5.63个百分点,达到了92.36%,F1分数提升了6.23个百分点,达到了92.70%;而相较于DeepLabV3+,MIoU提高了4.06个百分点,F1提升了4.44个百分点。 展开更多
关键词 对照学习 注意力机制 图像分割 钞纸 伪孪生网络
在线阅读 下载PDF
基于投票筛选增强自编码器的纺织品缺陷分割算法 被引量:2
16
作者 李俊祺 成苗 +2 位作者 张绍兵 何莲 石向文 《计算机应用》 CSCD 北大核心 2023年第S02期229-237,共9页
基于深度学习的生成式网络目前已被广泛运用于无监督缺陷检测任务中,它的训练过程仅需学习正常样本,就能将异常样本重建为正常样本,重建图像与异常样本之间的误差便可被用作识别异常的标准。但是在纺织品缺陷检测任务中,由于深度神经网... 基于深度学习的生成式网络目前已被广泛运用于无监督缺陷检测任务中,它的训练过程仅需学习正常样本,就能将异常样本重建为正常样本,重建图像与异常样本之间的误差便可被用作识别异常的标准。但是在纺织品缺陷检测任务中,由于深度神经网络具有较强的泛化性,异常区域一般会被保留在重建图像中,导致异常的漏检。为此,提出了一种基于筛选增强自编码器的轻量化生成模型。首先,通过生成模型重建待测图像;其次,在确保重建图像不会保留缺陷区域的前提下,计算它与待测图像之间的残差图;最后,对残差图进行形态学处理后得到缺陷分割的结果。实验结果表明,所提算法能有效重建纺织品纹理,从而可准确分割出缺陷区域,分割准确率、召回率和F1分数分别可达到92.32%、89.11%和90.69%,并且所提算法还能在不同纹理的纺织品上快速迁移,提升了该类产品的检测效率。 展开更多
关键词 纺织品 缺陷检测 无监督学习 自编码器 图像重建 图像分割
在线阅读 下载PDF
半监督塑封烟盒退化图像修复算法 被引量:1
17
作者 石彬 成苗 +1 位作者 张绍兵 何莲 《计算机应用》 CSCD 北大核心 2023年第S02期238-243,共6页
针对塑封烟盒底纹修复没有成对数据且无监督域转换算法无法处理退化图像的问题,为了去除薄膜并完成底纹信息的修复,提出一种半监督塑封烟盒退化图像修复算法。首先,由薄膜图像生成子网络提取真实塑封烟盒的薄膜信息;然后,利用生成的薄... 针对塑封烟盒底纹修复没有成对数据且无监督域转换算法无法处理退化图像的问题,为了去除薄膜并完成底纹信息的修复,提出一种半监督塑封烟盒退化图像修复算法。首先,由薄膜图像生成子网络提取真实塑封烟盒的薄膜信息;然后,利用生成的薄膜图片和真实的底纹图片以及随机掩码(mask)合成数据集;最后,使用合成数据集学习有薄膜到无薄膜两个域之间的转换。在烟盒数据集上的实验结果表明,视觉定性比较,所提算法更好地修复了受薄膜影响而退化的底纹信息;数据定量比较,所提算法的弗雷歇初始距离(FID)比CycleGAN、基于对比学习的非成对图像翻译网络(CUT)、基于双重对比学习的无监督图像翻译网络DCLGAN分别降低了14.42%、6.85%和3.00%,有利于提高图片质量和方便后续检测,且单张样本平均推理耗时为13.73 ms,能够满足工业生产的实时要求。 展开更多
关键词 跨域图像转化 半监督 图像修复 数据增广 深度学习 塑封烟盒
在线阅读 下载PDF
基于RandLA-Net的3D点云牙颌分割与身份识别
18
作者 钟侠骄 张绍兵 +4 位作者 郭静 王胜朝 成苗 何莲 赵铱民 《计算机应用》 CSCD 北大核心 2023年第S01期269-275,共7页
针对PointNet局部特征聚合不充分、保存模型较大、识别精度有待提升等问题,在三维(3D)点云牙颌身份的识别任务中,采用RandLA-Net的编码结构作为主干网络;在分割任务中采用原始RandLA-Net作为主干网络。针对RandLA-Net特征聚合模块聚合... 针对PointNet局部特征聚合不充分、保存模型较大、识别精度有待提升等问题,在三维(3D)点云牙颌身份的识别任务中,采用RandLA-Net的编码结构作为主干网络;在分割任务中采用原始RandLA-Net作为主干网络。针对RandLA-Net特征聚合模块聚合单一的问题,在识别任务中采用基于偏移注意力(OA)的特征聚合模块,在分割任务中增添了基于点云的Transformer block模块,相较于RandLA-Net的原始网络,新的网络模块能够更好地聚合局部特征。为了达到大规模开集数据集的身份再识别目的,将分类的交叉熵损失函数替换成了三元组损失函数。针对训练牙颌样本数据较少的问题,采用生成虚拟正样本的方式极大地拓展了数据集。实验结果表明:在识别任务中,相较于原始的RandLA-Net主干网络,识别任务的top-1平均精度提升了3.13个百分点;在分割任务中网络平均精度相较于原始RandLA-Net提升了3.06个百分点,平均交并比(MIoU)提升了6.05个百分点。 展开更多
关键词 深度学习 RandLA-Net 点云 自注意力 Transformer block 开集 三元损失
在线阅读 下载PDF
多模态硬币图像单应性矩阵预测
19
作者 邓壮林 张绍兵 +1 位作者 成苗 何莲 《图学学报》 CSCD 北大核心 2022年第3期361-369,共9页
对不同成像条件下拍摄的硬币图像进行配准是硬币表面缺陷算法的前置任务。然而,基于互信息的传统多模态配准方法速度慢、精度低,现有的通过基于深度学习的单应性矩阵预测方法实现的图像配准只适用于单模态的任务。为此,提出一种基于深... 对不同成像条件下拍摄的硬币图像进行配准是硬币表面缺陷算法的前置任务。然而,基于互信息的传统多模态配准方法速度慢、精度低,现有的通过基于深度学习的单应性矩阵预测方法实现的图像配准只适用于单模态的任务。为此,提出一种基于深度学习的适用于多模态硬币图像的单应性矩阵预测方法,进而使用预测的单应性矩阵完成图像配准。首先,使用单应性矩阵预测层预测输入图像对间的单应性矩阵,使用单应性矩阵对待配准图像进行透视变换;然后,使用图像转换层将透视变换后的待配准图像和目标图像映射到同一域,图像转换层可在推理时去除从而减少推理时间;最后,计算同一域下的图像间的损失,并进行训练。实验表明,该方法在测试集上的平均距离误差为3.417像素,相较于基于互信息的传统多模态配准方法5.575像素的平均距离误差降低38.71%。且配准单对图像耗时为17.74 ms,远低于基于互信息的传统多模态配准方法的6368.49 ms。 展开更多
关键词 单应性矩阵 图像配准 硬币 图像转换 多模态
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部