当前基于三维点云的工业异常检测仍处于起步阶段,较先进的方法将点云栅格化成2D图片或采用传统算子提取点云特征,有待进一步研究。对此,提出一种基于3D归一化流的双分支点云异常检测模型。以3D归一化流作为整体框架,结合双分支交互融合...当前基于三维点云的工业异常检测仍处于起步阶段,较先进的方法将点云栅格化成2D图片或采用传统算子提取点云特征,有待进一步研究。对此,提出一种基于3D归一化流的双分支点云异常检测模型。以3D归一化流作为整体框架,结合双分支交互融合模块进行局部特征聚合,以并行结构聚合由Transformer和卷积神经网络(Convs)架构提取的不同焦点的点云特征;通过3D归一化流对特征金字塔在欧氏空间和潜在空间之间的可逆映射进行建模,基于受试者曲线下面积,所提模型从分布学习的角度实现了图像级(I-AUROC)的高效异常检测。在MVTec-3D AD数据集上进行的实验结果表明,所提模型在点云异常检测中取得了比目前先进方法更好的性能,相较于M3DM(Multi-3D-Memory)、AST(Asymmetric Student-Teacher Networks),I-AUROC(Image-level Area Under the Receiver Operating Characteristiccurve)指标分别提升了1.8和5.9个百分点。展开更多
实时、准确的玻璃缺陷检测至关重要;然而,尺度多变的缺陷形态以及特征微弱的小目标和长宽比例极端的细长目标让这个任务极具挑战性。针对上述需求,提出一种基于改进YOLOv8(You Only Look Once version 8)的小目标与细长目标检测模型YOLO...实时、准确的玻璃缺陷检测至关重要;然而,尺度多变的缺陷形态以及特征微弱的小目标和长宽比例极端的细长目标让这个任务极具挑战性。针对上述需求,提出一种基于改进YOLOv8(You Only Look Once version 8)的小目标与细长目标检测模型YOLO-WANI(WPAN+AMFI+NWD&Inner-CIoU)。首先,设计WPAN(Weighted Path Aggregation Network)减小小目标和细长目标信息在网络传播过程中发生的损失,从而平衡不同尺度信息的重要性;其次,引入基于注意力的多尺度特征交互模块(AMFI),以捕捉深层特征中聚焦对象的语义信息;再次,使用归一化沃瑟斯坦距离(NWD)和Inner-CIoU损失替换原始的CIoU(Complete Intersection over Union)损失,从而提高对小目标和细长目标的检测效率;最后,制作玻璃缺陷检测数据集验证模型性能。实验结果表明,相较于YOLOv8n,YOLO-WANI在玻璃缺陷检测数据集上的mAP50:95提高了1.9个百分点、mAP50提高了4.6个百分点,分别达到了42.6%、81.7%;在NEU-DET(the NorthEastern University surface defect database for defect DETection task)钢材缺陷检测数据集上mAP50:95提高了1.5个百分点、mAP50提高了1.9个百分点,分别达到了40.3%、76.1%。所提模型和各个量级的实时缺陷检测模型相比都有着最高的精度,同时只有4.1×106的参数量和9.9 GFLOPs的计算量,且FPS(Frames Per Second)达到138、单图推理时间为(7.16±0.17) ms,满足轻量化和高精度的需求。展开更多
文摘当前基于三维点云的工业异常检测仍处于起步阶段,较先进的方法将点云栅格化成2D图片或采用传统算子提取点云特征,有待进一步研究。对此,提出一种基于3D归一化流的双分支点云异常检测模型。以3D归一化流作为整体框架,结合双分支交互融合模块进行局部特征聚合,以并行结构聚合由Transformer和卷积神经网络(Convs)架构提取的不同焦点的点云特征;通过3D归一化流对特征金字塔在欧氏空间和潜在空间之间的可逆映射进行建模,基于受试者曲线下面积,所提模型从分布学习的角度实现了图像级(I-AUROC)的高效异常检测。在MVTec-3D AD数据集上进行的实验结果表明,所提模型在点云异常检测中取得了比目前先进方法更好的性能,相较于M3DM(Multi-3D-Memory)、AST(Asymmetric Student-Teacher Networks),I-AUROC(Image-level Area Under the Receiver Operating Characteristiccurve)指标分别提升了1.8和5.9个百分点。
文摘实时、准确的玻璃缺陷检测至关重要;然而,尺度多变的缺陷形态以及特征微弱的小目标和长宽比例极端的细长目标让这个任务极具挑战性。针对上述需求,提出一种基于改进YOLOv8(You Only Look Once version 8)的小目标与细长目标检测模型YOLO-WANI(WPAN+AMFI+NWD&Inner-CIoU)。首先,设计WPAN(Weighted Path Aggregation Network)减小小目标和细长目标信息在网络传播过程中发生的损失,从而平衡不同尺度信息的重要性;其次,引入基于注意力的多尺度特征交互模块(AMFI),以捕捉深层特征中聚焦对象的语义信息;再次,使用归一化沃瑟斯坦距离(NWD)和Inner-CIoU损失替换原始的CIoU(Complete Intersection over Union)损失,从而提高对小目标和细长目标的检测效率;最后,制作玻璃缺陷检测数据集验证模型性能。实验结果表明,相较于YOLOv8n,YOLO-WANI在玻璃缺陷检测数据集上的mAP50:95提高了1.9个百分点、mAP50提高了4.6个百分点,分别达到了42.6%、81.7%;在NEU-DET(the NorthEastern University surface defect database for defect DETection task)钢材缺陷检测数据集上mAP50:95提高了1.5个百分点、mAP50提高了1.9个百分点,分别达到了40.3%、76.1%。所提模型和各个量级的实时缺陷检测模型相比都有着最高的精度,同时只有4.1×106的参数量和9.9 GFLOPs的计算量,且FPS(Frames Per Second)达到138、单图推理时间为(7.16±0.17) ms,满足轻量化和高精度的需求。