期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
三维卷积神经网络方法改进及其应用综述
1
作者 李泽慧 张琳 山显英 《计算机工程与应用》 北大核心 2025年第3期48-61,共14页
三维卷积神经网络作为一种深度神经网络,在计算机视觉领域,特别是视频动作识别方面展现了优异的效果。然而三维卷积神经网络仍存在一些问题,针对这些问题,对现有的基于三维卷积的视频动作识别改进方法进行了总结和分析。在轻量化、特征... 三维卷积神经网络作为一种深度神经网络,在计算机视觉领域,特别是视频动作识别方面展现了优异的效果。然而三维卷积神经网络仍存在一些问题,针对这些问题,对现有的基于三维卷积的视频动作识别改进方法进行了总结和分析。在轻量化、特征提取、计算效率、组合模型等方面对三维卷积神经网络的改进进行归纳,并介绍了三维卷积神经网络的实际应用,总结了流行的数据集,并对这些改进方法的实验结果进行了比较和分析。展望了视频动作识别未来的发展方向。 展开更多
关键词 三维卷积神经网络(3DCNN) 行为识别 深度学习
在线阅读 下载PDF
基于3D U-Net++卷积神经网络的断层识别方法及应用 被引量:1
2
作者 李卿武 王兴建 +4 位作者 张永恒 文雪梅 陈阳 王崇名 廖万平 《物探化探计算技术》 CAS 2024年第3期284-291,共8页
断层解释是地震资料解释的基础与关键,准确合理的断层识别对油气开采有着至关重要的作用。随着油田对断层解释精度需求的日益提高,单纯通过基于人工的如相干体、曲率等属性的传统断层解释方法,其精度已无法满足要求。笔者在U-Net卷积神... 断层解释是地震资料解释的基础与关键,准确合理的断层识别对油气开采有着至关重要的作用。随着油田对断层解释精度需求的日益提高,单纯通过基于人工的如相干体、曲率等属性的传统断层解释方法,其精度已无法满足要求。笔者在U-Net卷积神经网络模型的基础上进行改进,得出了一种自动断层识别方法,能够从任意三维地震图像中自动提取断层。文中该模型在足量样本集训练下,对两区块的实际地震数据进行自动断层识别,将识别结果进行分析对比。实验结果表明,该模型能够对任意三维地震数据进行自动断层识别,基于3D U-Net++网络模型的断层识别结果相比于传统U-Net网络识别结果准确性有明显提高,对潜山内部的小断层识别也表现出良好的效果,明显提高了常规、复杂断层识别的工作效率。 展开更多
关键词 断层识别 三维地震数据 卷积神经网络 3D U-Net++
在线阅读 下载PDF
基于3D卷积神经网络的深基坑施工邻近建筑物沉降预测
3
作者 鲁佩林 王凯 《建筑技术》 2024年第S01期95-97,共3页
中长期深基坑邻近建筑物沉降监测具有时间跨度大、周围环境复杂的特点,导致传统预测方法的预测结果准确性较低。针对传统模型考虑基坑邻近建筑物沉降影响因素较少的缺点,本研究引入时间、空间及检测项类型作为三维原始特征,采用了3D卷... 中长期深基坑邻近建筑物沉降监测具有时间跨度大、周围环境复杂的特点,导致传统预测方法的预测结果准确性较低。针对传统模型考虑基坑邻近建筑物沉降影响因素较少的缺点,本研究引入时间、空间及检测项类型作为三维原始特征,采用了3D卷积神经网络构建预测模型,并结合兰州盐场污水处理厂深基坑邻近建筑物沉降监测数据为例进行验证。预测结果表明,3D卷积神经网络相比于传统BP神经网络、ALSTM模型,具有更好的预测结果,能为同类型的中长期深基坑施工提供指导。 展开更多
关键词 沉降预测 三维原始特征 3D卷积神经网络
在线阅读 下载PDF
基于卷积神经网络的单幅图像三维人脸重建 被引量:4
4
作者 王育坚 李深圳 +1 位作者 韩静园 谭卫雄 《传感器与微系统》 CSCD 北大核心 2021年第6期52-56,共5页
利用单幅二维图像进行三维人脸重建是图像处理研究领域的热点问题。受深度卷积神经网络(CNN)和三维形变模型(3DMM)的启发,提出一种采用CNN回归3DMM形状和表情参数的方法,进行三维人脸重建。在CNN模型VGG-16的基础上设计一种VGG-BN的改... 利用单幅二维图像进行三维人脸重建是图像处理研究领域的热点问题。受深度卷积神经网络(CNN)和三维形变模型(3DMM)的启发,提出一种采用CNN回归3DMM形状和表情参数的方法,进行三维人脸重建。在CNN模型VGG-16的基础上设计一种VGG-BN的改进网络模型,通过在每个卷积层后加入批归一化层,优化网络模型性能;并采用迁移学习方法,将预训练模型引入到VGG-BN网络的训练中。将改进的网络模型在300W-LP数据集上训练,在AFLW2000-3D数据集上测试,并和现有方法进行了对比分析。实验结果表明:改进的网络模型在人脸重建的准确性和泛化性方面都有一定的改善,重建人脸的形状和表情效果较好。 展开更多
关键词 三维人脸重建 三维形变模型(3DMM) 卷积神经网络(CNN) 单幅图像
在线阅读 下载PDF
基于3D卷积神经网络的脑肿瘤图像分割 被引量:4
5
作者 宫浩栋 王育坚 韩静园 《光学技术》 CAS CSCD 北大核心 2022年第4期472-477,共6页
三维脑胶质瘤磁共振成像肿瘤形状各异、边缘模糊,目前大多数基于2D卷积神经网络的分割方法不能很好的分割三维图像。为了能够准确分割出三维图像中的肿瘤部分,提出一种融合多尺度特征信息的3D卷积神经网络脑肿瘤图像分割方法。利用并行... 三维脑胶质瘤磁共振成像肿瘤形状各异、边缘模糊,目前大多数基于2D卷积神经网络的分割方法不能很好的分割三维图像。为了能够准确分割出三维图像中的肿瘤部分,提出一种融合多尺度特征信息的3D卷积神经网络脑肿瘤图像分割方法。利用并行的3D空洞卷积提取特征信息,将不同感受野的信息融合。将Dice损失和BCE损失结合,形成一种新的损失函数并配合恒等映射,进一步提高分割精度。在BraTs2020数据集上对模型进行验证,结果表明,该模型分割的全肿瘤区、核心区和增强区的Dice系数分别为89.1%、83.9%和82.6%。在LGG脑部肿瘤图像数据集上对模型进行验证,结果表明,Dice系数达到了93.3%。所提出的分割方法不仅能够精确的分割三维脑胶质瘤图像,而且同样适用于分割二维脑胶质瘤图像。 展开更多
关键词 脑胶质瘤 三维磁共振图像 图像分割 3D卷积神经网络
原文传递
基于三维卷积神经网络的交通事件检测系统 被引量:2
6
作者 梁宇 《西部交通科技》 2023年第5期176-177,199,共3页
文章提出了一种基于三维卷积神经网络(3D CNN)的交通事件检测系统,关键技术包括3D CNN、数据预处理和模型优化。该系统可以实现实时检测、事件分类与识别、数据可视化与报警,通过采用包含多种交通事件的视频数据集进行训练和测试的试验... 文章提出了一种基于三维卷积神经网络(3D CNN)的交通事件检测系统,关键技术包括3D CNN、数据预处理和模型优化。该系统可以实现实时检测、事件分类与识别、数据可视化与报警,通过采用包含多种交通事件的视频数据集进行训练和测试的试验结果表明,该系统在交通事件检测准确率和分类识别效果上表现优异,为交通事件检测领域提供了一种有效方案。 展开更多
关键词 交通事件检测 三维卷积神经网络(3D CNN) 数据预处理 事件分类与识别实时监控
在线阅读 下载PDF
快速3D-CNN结合深度可分离卷积对高光谱图像分类 被引量:2
7
作者 王燕 梁琦 《计算机科学与探索》 CSCD 北大核心 2022年第12期2860-2869,共10页
针对卷积神经网络在高光谱图像特征提取和分类的过程中,存在空谱特征提取不充分以及网络层数太多引起的参数量大、计算复杂的问题,提出快速三维卷积神经网络(3D-CNN)结合深度可分离卷积(DSC)的轻量型卷积模型。该方法首先利用增量主成... 针对卷积神经网络在高光谱图像特征提取和分类的过程中,存在空谱特征提取不充分以及网络层数太多引起的参数量大、计算复杂的问题,提出快速三维卷积神经网络(3D-CNN)结合深度可分离卷积(DSC)的轻量型卷积模型。该方法首先利用增量主成分分析(IPCA)对输入的数据进行降维预处理;其次将输入模型的像素分割成小的重叠的三维小卷积块,在分割的小块上基于中心像素形成地面标签,利用三维核函数进行卷积处理,形成连续的三维特征图,保留空谱特征。用3D-CNN同时提取空谱特征,然后在三维卷积中加入深度可分离卷积对空间特征再次提取,丰富空谱特征的同时减少参数量,从而减少计算时间,分类精度也有所提高。所提模型在Indian Pines、Salinas Scene和University of Pavia公开数据集上验证,并且同其他经典的分类方法进行比较。实验结果表明,该方法不仅能大幅度节省可学习的参数,降低模型复杂度,而且表现出较好的分类性能,其中总体精度(OA)、平均分类精度(AA)和Kappa系数均可达99%以上。 展开更多
关键词 高光谱图像分类 空谱特征提取 三维卷积神经网络(3d-cnn) 深度可分离卷积(DSC) 深度学习
在线阅读 下载PDF
基于注意力-残差双特征流卷积神经网络的深度图帧内编码单元快速划分算法
8
作者 贾克斌 吴岳珩 《北京工业大学学报》 2025年第5期539-551,共13页
针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。... 针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。首先,提出一种具有3个分支的注意力-残差双特征流卷积神经网络(attention-residual bi-feature stream convolutional neural networks,ARBS-CNN)模型,其中基于残差模块(residual module,RM)和特征蒸馏(feature distill,FD)模块的2个分支用于提取全局图像特征,基于动态模块(dynamic module,DM)和卷积-卷积块注意力模块(convolutional-convolutional block attention module,Conv-CBAM)的分支用于提取局部图像特征;然后,将提取到的特征进行整合并输出,得到对深度图CU划分结构的预测;最后,将ARBS-CNN嵌入到3D-HEVC测试平台中,利用预测结果加速深度图帧内编码。与原始算法相比,提出的算法能在维持率失真性能几乎不受影响的条件下,平均减少74.2%的编码时间。实验结果表明,该算法能够在保持率失真性能的条件下,有效降低3D-HEVC的编码复杂度。 展开更多
关键词 三维高效视频编码(three-dimensional high efficiency video coding 3D-HEVC) 深度图 卷积神经网络(convolutional neural networks CNN) 编码单元(coding unit CU)划分 帧内编码 双特征流
在线阅读 下载PDF
基于高光谱图像和3D-CNN的苹果多品质参数无损检测 被引量:14
9
作者 王浩云 李晓凡 +2 位作者 李亦白 孙云晓 徐焕良 《南京农业大学学报》 CAS CSCD 北大核心 2020年第1期178-185,共8页
[目的]为解决水果品质无损检测中成本、效率、精度问题,提出了一种基于高光谱图像和三维卷积神经网络(3D-CNN)的苹果高光谱多品质参数同时检测方法。[方法]使用高光谱成像系统获取400~1000 nm波段的苹果样本的高光谱反射图像并使用S-G... [目的]为解决水果品质无损检测中成本、效率、精度问题,提出了一种基于高光谱图像和三维卷积神经网络(3D-CNN)的苹果高光谱多品质参数同时检测方法。[方法]使用高光谱成像系统获取400~1000 nm波段的苹果样本的高光谱反射图像并使用S-G平滑法对原始图像进行去噪处理,在此基础上,对采集到的高光谱图像通过多感兴趣位置的选取以及间隔波段抽取重组的方法进行样本扩充,再利用三维卷积神经网络建立样本扩充后的苹果高光谱图像与苹果糖度、硬度、含水量的多任务学习模型,通过该模型实现对苹果的糖度、硬度、含水量等品质参数的无损检测。[结果]采集245个苹果的高光谱图像及其对应的品质参数信息,通过样本扩充的方法将原始数据集扩充至9800个样本后进行建模和验证。结果表明:本算法建立的苹果糖度、硬度、水分的分类模型,在糖度类间隔为1°Brix、硬度类间隔为0.5 kg·cm-2、含水量类间隔为10%的情况下,糖度、硬度、水分的预测准确率分别为93.97%、92.29%和93.36%,回归模型糖度、硬度和水分的相关系数最高分别达到0.827、0.775和0.862,比最优的传统算法分别提高15.0%、17.0%和17.2%。[结论]本算法能够较准确实现苹果高光谱多品质参数同时检测,且相对传统方法预测精度有较大提升。 展开更多
关键词 苹果 高光谱 多品质参数 无损检测 三维卷积神经网络(3d-cnn)
在线阅读 下载PDF
3D卷积自编码器高光谱图像分类模型 被引量:6
10
作者 石延新 何进荣 +1 位作者 李照奎 曾志高 《中国图象图形学报》 CSCD 北大核心 2021年第8期2021-2036,共16页
目的高光谱图像分类是遥感领域的基础问题,高光谱图像同时包含丰富的光谱信息和空间信息,传统模型难以充分利用两种信息之间的关联性,而以卷积神经网络为主的有监督深度学习模型需要大量标注数据,但标注数据难度大且成本高。针对现有模... 目的高光谱图像分类是遥感领域的基础问题,高光谱图像同时包含丰富的光谱信息和空间信息,传统模型难以充分利用两种信息之间的关联性,而以卷积神经网络为主的有监督深度学习模型需要大量标注数据,但标注数据难度大且成本高。针对现有模型的不足,本文提出了一种无监督范式下的高光谱图像空谱融合方法,建立了3D卷积自编码器(3D convolutional auto-encoder,3D-CAE)高光谱图像分类模型。方法3D卷积自编码器由编码器、解码器和分类器构成。将高光谱数据预处理后,输入到编码器中进行无监督特征提取,得到一组特征图。编码器的网络结构为3个卷积块构成的3D卷积神经网络,卷积块中加入批归一化技术防止过拟合。解码器为逆向的编码器,将提取到的特征图重构为原始数据,用均方误差函数作为损失函数判断重构误差并使用Adam算法进行参数优化。分类器由3层全连接层组成,用于判别编码器提取到的特征。以3D-CNN(three dimensional convolutional neural network)为自编码器的主干网络可以充分利用高光谱图像的空间信息和光谱信息,做到空谱融合。以端到端的方式对模型进行训练可以省去复杂的特征工程和数据预处理,模型的鲁棒性和稳定性更强。结果在Indian Pines、Salinas、Pavia University和Botswana等4个数据集上与7种传统单特征方法及深度学习方法进行了比较,本文方法均取得最优结果,总体分类精度分别为0.9487、0.9866、0.9862和0.9649。对比实验结果表明了空谱融合和无监督学习对于高光谱遥感图像分类的有效性。结论本文模型充分利用了高光谱图像的光谱特征和空间特征,可以做到无监督特征提取,无需大量标注数据的同时分类精度高,是一种有效的高光谱图像分类方法。 展开更多
关键词 遥感图像分类 空谱特征融合 3d-cnn 自编码器 卷积神经网络(CNN) 深度学习
原文传递
联合LiDAR、高光谱数据及3D-CNN方法的树种分类 被引量:2
11
作者 毛英伍 郭颖 +2 位作者 张王菲 苏勇 关塬 《林业科学》 EI CAS CSCD 北大核心 2023年第3期73-83,共11页
【目的】探究三维卷积神经网络(3D-CNN)在高光谱数据支持的树种分类中的有效网络构建方式,以提高树种分类精度。【方法】以美国加利福尼亚州内华达山脉南部为研究区,LiDAR数据获取的森林冠层高(CHM)进行单木分割并以此为补充建立样本,... 【目的】探究三维卷积神经网络(3D-CNN)在高光谱数据支持的树种分类中的有效网络构建方式,以提高树种分类精度。【方法】以美国加利福尼亚州内华达山脉南部为研究区,LiDAR数据获取的森林冠层高(CHM)进行单木分割并以此为补充建立样本,改进一种结构更简单、分类精度更高且无需对高光谱数据进行预处理的3D-CNN网络结构用于森林树种识别。【结果】相较于常规机器学习分类方法【支持向量机(SVM),随机森林(RF)】、传统二维卷积神经网络模型(2D-CNN)及最新多光谱分辨率三维卷积神经网络(MSR 3D-CNN)模型,本研究提出的3D-CNN模型对树种总体分类精度为99.79%,平均交并比(MIoU)为99.53%。与SVM和RF分类结果相比,本研究构建的3D-CNN模型总体分类精度提高5%左右,且具有对树种边界提取更加准确、椒盐现象更少发生的特点;与2D-CNN相比,总体分类精度提高10%左右,MIoU提高7%左右;与MSR 3D-CNN相比,总体精度相差不大,但在训练和测试过程中,本模型耗时远远小于MSR 3D-CNN模型。【结论】本研究改进的3D-CNN模型结构能够高效对原始高光谱影像进行树种分类并制图,可有效提高树种分类的精度。 展开更多
关键词 高光谱 LIDAR 卷积神经网络 树种分类 3d-cnn
在线阅读 下载PDF
基于MRI和深度学习的桥小脑角区脑膜瘤与听神经瘤分类算法研究 被引量:7
12
作者 娄云重 刘颖 +1 位作者 江华 章浩伟 《波谱学杂志》 CAS 北大核心 2020年第3期300-310,共11页
桥小脑角区脑膜瘤与听神经瘤是两种常见的脑部肿瘤,它们的临床表现和影像学表现极为相似,在临床诊断时极易发生误诊.将影像数据与深度学习方法相结合,建立脑膜瘤与听神经瘤的判别模型,可以为两种脑肿瘤的及时准确诊断提供重要手段.本文... 桥小脑角区脑膜瘤与听神经瘤是两种常见的脑部肿瘤,它们的临床表现和影像学表现极为相似,在临床诊断时极易发生误诊.将影像数据与深度学习方法相结合,建立脑膜瘤与听神经瘤的判别模型,可以为两种脑肿瘤的及时准确诊断提供重要手段.本文采集了307名脑肿瘤患者的T1W-SE序列图像,通过对原始图像进行限制对比度自适应直方图均衡化(Contrast Limited Adaptive Histogram Equalization,CLAHE)等预处理,提升数据集图像质量,再经过建立的三维卷积神经网络(3-Dimensional Convolutional Neural Network,3D CNN)深度学习框架中图像特征的学习,实现对脑膜瘤与听神经瘤的分类.图像增强参数与网络结构参数经过优化后,对脑膜瘤与听神经瘤分类的准确率达到0.9180,曲线下面积(Area Under Curve,AUC)为0.9134,实现了对桥小脑角区脑膜瘤与听神经瘤的有效判别. 展开更多
关键词 脑膜瘤 神经 三维卷积神经网络(3D CNN) 磁共振成像(MRI)
在线阅读 下载PDF
基于三维点云深度学习的路面异物检测 被引量:1
13
作者 王孟 李伟 +1 位作者 高荣 王飒 《计算机系统应用》 2021年第2期160-165,共6页
针对采机场跑道异物FOD(Foreign Object Debris)检测问题,本文设计了一套基于智能车载3D相机采集路面信息并进行异物检测的系统.此系统通过深度图像的深度量化值分布差异初步筛除正常路面,再经过点云异常值过滤与不均匀降样算法对参数... 针对采机场跑道异物FOD(Foreign Object Debris)检测问题,本文设计了一套基于智能车载3D相机采集路面信息并进行异物检测的系统.此系统通过深度图像的深度量化值分布差异初步筛除正常路面,再经过点云异常值过滤与不均匀降样算法对参数进行纠正和数据量缩减,精简后的点云通过对路面数据适应性改进的网络进行异物检测.此网络采用PointCNN网络中的X卷积通过4次卷积提取点云数据进行空间特征,尽可能的保留了异物目标的空间信息,提高检测准确度.通过对采集的数据进行测试实验,本文设计的方法能够准确地识别出异物与非平整路面,准确率接近90%. 展开更多
关键词 FOD 3D相机 深度图像处理 点云非均匀降采样 三维卷积神经网络
在线阅读 下载PDF
基于3DCNN的锅炉再热器管壁减薄预测 被引量:1
14
作者 闫佳瑛 朱希安 《北京信息科技大学学报(自然科学版)》 2021年第1期75-78,共4页
为及时掌握锅炉再热器管壁减薄情况,基于锅炉再热器历史运行数据,结合三维卷积神经网络(3D convolutional neural network,3DCNN),搭建了锅炉再热器厚度损失预测模型。利用某电厂超临界660 MW机组锅炉再热器的运行数据,通过数据预处理... 为及时掌握锅炉再热器管壁减薄情况,基于锅炉再热器历史运行数据,结合三维卷积神经网络(3D convolutional neural network,3DCNN),搭建了锅炉再热器厚度损失预测模型。利用某电厂超临界660 MW机组锅炉再热器的运行数据,通过数据预处理构建三维变量作为模型的输入;通过对比不同结构模型的预测效果,确定3DCNN模型的最优结构;该方法在测试集上的最大绝对误差为12.04%,平均绝对误差为6.77%。结果表明,该方法能够比较准确地预测再热器管壁损失,方便电力企业及时掌握管壁厚度变化情况。 展开更多
关键词 三维卷积神经网络(3DCNN) 锅炉再热器 厚度损失预测
在线阅读 下载PDF
基于LC3D的摔倒行为识别算法
15
作者 查凯文 朱华生 +1 位作者 李伟 李舒宁 《计算机应用与软件》 北大核心 2023年第9期193-198,共6页
针对传统的三维卷积神经网络(C3D)用于摔倒行为识别时对特征的提取不明显,而传统的长短时记忆网络(LSTM)存在梯度消失的问题,提出一种新的基于时序三维卷积网络(LC3D)的摔倒行为识别算法。该算法同步获取视频和骨架两组数据,将视频数据... 针对传统的三维卷积神经网络(C3D)用于摔倒行为识别时对特征的提取不明显,而传统的长短时记忆网络(LSTM)存在梯度消失的问题,提出一种新的基于时序三维卷积网络(LC3D)的摔倒行为识别算法。该算法同步获取视频和骨架两组数据,将视频数据和骨架数据分别输入至改进后的C3D网络和LSTM网络进行训练并提取摔倒行为的C3D模型和LSTM模型;通过Stacking算法将两个模型进行融合得到LC3D模型;利用LC3D模型对摔倒行为进行识别。实验结果表明,使用LC3D网络识别摔倒行为比使用传统三维卷积网络和长短时记忆网络算法的准确率更高。 展开更多
关键词 摔倒行为识别 三维卷积神经网络 长短时记忆网络 LC3D
在线阅读 下载PDF
基于ML-3DCNN的高光谱遥感图像分类算法
16
作者 闫鹏刚 杨佳佳 《信息与电脑》 2023年第17期93-96,共4页
高光谱遥感图像含有丰富的光谱和空间特征信息,在进行地物分类时这些特征的提取尤为重要。提出了一种基于融合拉普拉斯特征的三维卷积神经网络(Meld Laplace 3D Convolution Neural Network,ML-3DCNN)的高光谱遥感图像分类算法,该算法... 高光谱遥感图像含有丰富的光谱和空间特征信息,在进行地物分类时这些特征的提取尤为重要。提出了一种基于融合拉普拉斯特征的三维卷积神经网络(Meld Laplace 3D Convolution Neural Network,ML-3DCNN)的高光谱遥感图像分类算法,该算法采用主成分分析(Principal Components Analysis,PCA)降维结合空间边缘细节特征提取组成的双分支网络结构对遥感图像进行特征提取,有利于提升分类性能。在公开的3组高光谱遥感图像数据集上,与PCA+3DCNN和PCA+3D-2DCNN算法进行对比,结果表明提出的双分支网络结构提升了高光谱遥感影像的分类精度。 展开更多
关键词 高光谱遥感图像 三维卷积神经网络(3DCNN) 分支结构 网络融合
在线阅读 下载PDF
基于三维空洞卷积和图卷积的高光谱影像分类 被引量:1
17
作者 吕欢欢 白爽 张辉 《光电子.激光》 CAS CSCD 北大核心 2024年第9期971-980,共10页
针对高光谱影像分类任务中标记样本数量有限和多样化特征提取不足导致分类效果不理想的问题,本文提出一种基于三维空洞卷积和图卷积的高光谱影像分类方法(three-dimensional dilated convolutional and graph convolutional network,3D-... 针对高光谱影像分类任务中标记样本数量有限和多样化特征提取不足导致分类效果不理想的问题,本文提出一种基于三维空洞卷积和图卷积的高光谱影像分类方法(three-dimensional dilated convolutional and graph convolutional network,3D-DC-GCN)。首先,引入不同尺度的空洞卷积(dilated convolutional,DC)构建三维空洞卷积网络模型提取多尺度的深度空谱特征;其次,通过聚合图节点的邻域特征建立图卷积神经网络(graph convolutional network,GCN)模型,获取蕴含空间结构的上下文特征;最后,为了提高多样化特征的表示能力,将深层空谱特征与空间上下文特征融合并采用Softmax实现分类。本文所提方法能够充分利用高光谱影像的多样化特征并具有较强的特征学习能力,有效提高了影像的分类精度。在Indian Pines和Pavia University高光谱数据集上将提出方法与7种相关分类方法进行实验对比与分析,结果表明本文方法能够得到最优结果,总体分类精达到99.33%和99.41%。 展开更多
关键词 高光谱影像分类 三维卷积神经网络(3d-cnn) 空洞卷积(DC) 卷积神经网络(GCN) 特征融合
原文传递
基于块编码特点的压缩视频质量增强算法
18
作者 于海 杨磊 +4 位作者 高阳 刘枫琪 刘鹏宇 孙萱 张悦 《北京工业大学学报》 CAS CSCD 北大核心 2024年第9期1069-1076,共8页
针对现有压缩视频质量增强算法未能充分利用压缩视频特点的问题,研究了视频编码与压缩视频质量增强任务之间的本质关系,并针对性地设计了一种基于三维卷积神经网络(3D convolutional neural network, 3D-CNN)的非对齐压缩视频质量增强... 针对现有压缩视频质量增强算法未能充分利用压缩视频特点的问题,研究了视频编码与压缩视频质量增强任务之间的本质关系,并针对性地设计了一种基于三维卷积神经网络(3D convolutional neural network, 3D-CNN)的非对齐压缩视频质量增强算法。实验结果表明:相较于高效视频编码(high efficiency video coding, HEVC)标准H.265,所提算法在低延迟(low delay, LD)配置下且量化参数(quantization parameter, QP)为37时,峰值信噪比(peak signal-to-noise ratio, PSNR)提升了0.465 2 dB;相较于数据压缩会议(data compression conference, DCC)中提出的多帧引导的注意力网络(multi-frame guided attention network, MGANet)方法,该算法PSNR的增长量提升了15.1%。 展开更多
关键词 视频编码 高效视频编码(high efficiency video coding HEVC) 压缩视频质量增强 深度学习 卷积神经网络(convolutional neural network CNN) 三维卷积神经网络(3D convolutional neural network 3d-cnn)
在线阅读 下载PDF
煤矿探水卸杆动作识别研究 被引量:6
19
作者 党伟超 姚远 +2 位作者 白尚旺 高改梅 吴喆峰 《工矿自动化》 北大核心 2020年第7期107-112,共6页
针对煤矿井下探水作业监工人员通过观看视频来监控卸杆作业的方式存在效率低下且极易出错的问题,提出利用三维卷积神经网络(3DCNN)模型对探水作业中的卸杆动作进行识别。3DCNN模型使用3D卷积层自动完成动作特征提取,通过3D池化层对运动... 针对煤矿井下探水作业监工人员通过观看视频来监控卸杆作业的方式存在效率低下且极易出错的问题,提出利用三维卷积神经网络(3DCNN)模型对探水作业中的卸杆动作进行识别。3DCNN模型使用3D卷积层自动完成动作特征提取,通过3D池化层对运动特征进行降维,通过Softmax分类处理来识别卸杆动作,并使用批量归一化层提高模型的收敛速度和识别准确率。采用3DCNN模型对卸杆动作进行识别时,首先对数据集进行预处理,从每段视频中均匀抽取几帧图像作为某动作的代表,并降低分辨率;然后采用训练集对3DCNN模型进行训练,并保存训练好的权重文件;最后采用训练好的3DCNN模型对测试集进行测试,得出分类结果。实验结果表明,设置采样帧数为10帧、分辨率为32×32、学习率为0.0001,3DCNN模型对卸杆动作的识别准确率最高可达98.86%。 展开更多
关键词 煤矿防治水 煤矿探水 卸杆动作识别 三维卷积神经网络 3DCNN 批量归一化层
在线阅读 下载PDF
基于目标检测与动作识别算法的电梯危险行为监测 被引量:5
20
作者 毛晓东 《机械设计与制造》 北大核心 2023年第11期144-148,155,共6页
为实时识别电梯厢内的蹦跳、扒电梯门、踹电梯门、打架、摔倒等危险行为,避免电梯安全事故的发生,提出了利用YOLOv3目标检测算法及三维卷积神经网络(3DCNN)进行电梯危险行为监测的方法。首先建立了包括6类电梯行为的目标检测数据集及动... 为实时识别电梯厢内的蹦跳、扒电梯门、踹电梯门、打架、摔倒等危险行为,避免电梯安全事故的发生,提出了利用YOLOv3目标检测算法及三维卷积神经网络(3DCNN)进行电梯危险行为监测的方法。首先建立了包括6类电梯行为的目标检测数据集及动作识别数据集;然后训练了YOLOv3目标检测算法以进行电梯乘客检测,检测准确率可达96.6%,检测速度可达32fps/s;最后设计了三维卷积神经网络模型,并在动作识别数据集上进行训练,最后在测试集上对设计的三维卷积神经网络进行测试,结果表明,设计的三维卷积神经网络模型对电梯危险行为的识别准确率可达到88.3%,识别速度可达306fps/s。 展开更多
关键词 电梯安全事故 危险行为监测 YOLOv3 三维卷积神经网络
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部