期刊文献+
共找到92篇文章
< 1 2 5 >
每页显示 20 50 100
视听融合耦合坐标自注意的单目深度估计
1
作者 马存良 蒲江川 +2 位作者 许春冬 易见兵 嘉明珍 《计算机辅助设计与图形学学报》 北大核心 2025年第2期265-276,共12页
针对单目图片和声音回波信号都含空间信息这一特点,提出一种视听融合的单目深度估计方法.首先,通过池化金字塔模块融合分析回波与材料特征来自适应估计单目图片的离散深度值;然后,采用卷积神经网络和Transformer相结合的方法对单目图片... 针对单目图片和声音回波信号都含空间信息这一特点,提出一种视听融合的单目深度估计方法.首先,通过池化金字塔模块融合分析回波与材料特征来自适应估计单目图片的离散深度值;然后,采用卷积神经网络和Transformer相结合的方法对单目图片进行编码,改进坐标注意力提出坐标自注意力模块对图片特征解码获得离散深度值的概率分布;最后,将像素点的深度值建模为离散深度值的期望来构建最终深度图.实验结果表明,在仿真数据集Replica和Matterport3D数据集上,所提方法的均方根误差分别为0.204和0.875,相对误差分别为0.095和0.161,均取得具有竞争力的结果;在真实数据和含噪声数据中,该方法能够应用于真实场景的深度估计. 展开更多
关键词 单目深度估计 视听融合 池化金字塔模块 自注意力
在线阅读 下载PDF
LpDepth:基于拉普拉斯金字塔的自监督单目深度估计
2
作者 曹明伟 邢景杰 +1 位作者 程宜风 赵海锋 《计算机科学》 北大核心 2025年第3期33-40,共8页
自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影... 自监督单目深度估计受到了国内外研究人员的广泛关注。现有基于深度学习的自监督单目深度估计方法主要采用编码器-解码器结构。然而,这些方法在编码过程中对输入图像进行下采样操作,导致部分图像信息,尤其是图像的边界信息丢失,进而影响深度图的精度。针对上述问题,提出一种基于拉普拉斯金字塔的自监督单目深度估计方法(Self-supervised Monocular Depth Estimation Based on the Laplace Pyramid,LpDepth)。此方法的核心思想是:首先,使用拉普拉斯残差图丰富编码特征,以弥补在下采样过程中丢失的特征信息;其次,在下采样过程中使用最大池化层突显和放大特征信息,使编码器在特征提取过程中更容易地提取到训练模型所需要的特征信息;最后,使用残差模块解决过拟合问题,提高解码器对特征的利用效率。在KITTI和Make3D等数据集上对所提方法进行了测试,同时将其与现有经典方法进行了比较。实验结果证明了所提方法的有效性。 展开更多
关键词 单目深度估计 拉普拉斯金字塔 残差网络 深度
在线阅读 下载PDF
利用多帧序列影像的自监督单目深度估计
3
作者 熊炜 陈奕博 +2 位作者 张丽真 杨茜 邹勤 《计算机应用》 CSCD 北大核心 2024年第12期3907-3914,共8页
多帧自监督单目深度估计通过当前帧和上一帧之间的关系构建代价体积(CV),可以作为单目深度估计网络的额外输入源,更准确地描述场景视频中的时间序列关系和空间结构信息;然而,当场景中存在动态物体或者无纹理区域时,CV会成为不可靠的信... 多帧自监督单目深度估计通过当前帧和上一帧之间的关系构建代价体积(CV),可以作为单目深度估计网络的额外输入源,更准确地描述场景视频中的时间序列关系和空间结构信息;然而,当场景中存在动态物体或者无纹理区域时,CV会成为不可靠的信息来源。当单目深度估计网络过度依赖CV中的不可靠信息源时,会导致深度估计精度下降。为此,设计一种多帧融合模块动态降低不可靠信息源的权重,减小不可靠信息源对网络的影响。为了应对CV中不可靠信息源对网络训练的负面影响,还设计了一种引导深度估计网络训练的网络,防止深度估计网络过度依赖不可靠信息。所提方法在KITTI数据集上取得了出色的性能,与基准方法 Lite-Mono相比,它的绝对相对误差、平方相对误差和均方根误差(RMSE)分别下降了0.015、0.094和0.200;与同类方法相比,所提方法精度更高,且占用的计算资源更少。所提网络结构充分利用了多帧训练的优势,同时避免了多帧训练的缺陷(即CV不确定性对网络的影响),可有效提升模型精度。 展开更多
关键词 自监督单目深度估计 多视图立体 单目视频 代价体积
在线阅读 下载PDF
无监督单目深度估计研究综述 被引量:1
4
作者 蔡嘉诚 董方敏 +1 位作者 孙水发 汤永恒 《计算机科学》 CSCD 北大核心 2024年第2期117-134,共18页
深度估计作为三维重建、自动驾驶和视觉SLAM等领域中的关键环节,一直是计算机视觉领域研究的热点方向,其中无监督学习的单目深度估计技术由于具有方便部署、计算成本低等优点,受到了学术界和工业界的广泛关注。首先梳理了深度估计的基... 深度估计作为三维重建、自动驾驶和视觉SLAM等领域中的关键环节,一直是计算机视觉领域研究的热点方向,其中无监督学习的单目深度估计技术由于具有方便部署、计算成本低等优点,受到了学术界和工业界的广泛关注。首先梳理了深度估计的基本知识及研究现状,简要介绍了基于参数学习、基于非参数学习、基于有监督学习、基于半监督学习和基于无监督学习的深度估计的优势与不足;其次全面总结了基于无监督学习的单目深度估计研究进展,按照结合可解释性掩膜、结合视觉里程计、结合先验辅助信息、结合生成式对抗网络和实时轻量级网络这五大类对无监督学习的单目深度估计进行归纳和总结,对典型的框架模型进行了介绍和分析;然后,介绍了基于无监督学习的单目深度估计在医学、自动驾驶、农业、军事等领域的应用;最后,简单介绍了用于无监督深度估计的常用数据集,提出了基于无监督学习的单目深度估计未来研究方向,并对这个快速发展领域中的各方向研究进行了展望。 展开更多
关键词 计算机视觉 深度学习 无监督学习 单目深度估计
在线阅读 下载PDF
图像与稀疏激光点融合的单目深度估计 被引量:1
5
作者 蔡文靖 刘鑫 +1 位作者 王礼贺 纪宇航 《激光与红外》 CAS CSCD 北大核心 2024年第9期1373-1379,共7页
近年来,随着深度学习的快速发展,涌现出大量单目深度估计算法。但由于缺乏视差等几何约束,限制了算法深度预测精度的进一步提升,无法满足实际应用的需求。因此本文提出了一个二维图像与稀疏激光点融合的深度估计网络,通过实时输入少量... 近年来,随着深度学习的快速发展,涌现出大量单目深度估计算法。但由于缺乏视差等几何约束,限制了算法深度预测精度的进一步提升,无法满足实际应用的需求。因此本文提出了一个二维图像与稀疏激光点融合的深度估计网络,通过实时输入少量激光点的高精度测距结果,提高深度预测精度;其次,为解决自采集数据激光雷达点分布不均匀问题,在有监督网络基础上,加入相对位姿估计网络与深度估计网络联合训练,同时增加光度一致性、深度重投影两个损失函数;最终,利用自采集数据进行实验分析,实验结果表明,当使用160个激光点时,即可将深度预测绝对相对误差由10.1%降至7.6%,当使用1280个激光点时,深度预测绝对相对误差变化趋于平稳,降至4.1%。 展开更多
关键词 单目深度估计 稀疏激光点 残差神经网络
在线阅读 下载PDF
基于多尺度深度图自适应融合的单目深度估计 被引量:1
6
作者 郑游 王磊 杨紫文 《武汉工程大学学报》 CAS 2024年第1期85-90,共6页
深度估计网络通常具有较多的网络层数,图像特征在网络编码和解码过程中会丢失大量信息,因此预测的深度图缺乏对象结构细节且边缘轮廓不清晰。本文提出了一种基于多尺度深度图自适应融合的单目深度估计方法,可有效保留对象的细节和几何... 深度估计网络通常具有较多的网络层数,图像特征在网络编码和解码过程中会丢失大量信息,因此预测的深度图缺乏对象结构细节且边缘轮廓不清晰。本文提出了一种基于多尺度深度图自适应融合的单目深度估计方法,可有效保留对象的细节和几何轮廓。首先,引入压缩与激励残差网络(SE-ResNet),利用注意力机制对不同通道的特征进行编码,从而保留远距离平面深度图的更多细节信息。然后,利用多尺度特征融合网络,融合不同尺度的特征图,得到具有丰富几何特征和语义信息的特征图。最后,利用多尺度自适应深度融合网络为不同尺度特征图生成的深度图添加可学习的权重参数,对不同尺度的深度图进行自适应融合,增加了预测深度图中的目标信息。本文方法在NYU Depth V2数据集上预测的深度图具有更高的准确度和丰富的物体信息,绝对相对误差为0.115,均方根误差为0.525,精确度最高达到99.3%。 展开更多
关键词 单目深度估计 注意力机制 多尺度特征融合网络 多尺度深度自适应融合网络
在线阅读 下载PDF
基于语义辅助和深度时序一致性约束的自监督单目深度估计
7
作者 凌传武 陈华 +1 位作者 徐大勇 张小刚 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第8期1-12,共12页
通过使用相邻帧之间的光度一致性损失代替深度标签作为网络训练的监督信号,基于图像序列训练的自监督单目深度估计方法近年来受到了广泛的关注.光度一致性约束遵循了静态世界假设,而单目图像序列中存在的运动目标违反该假设,进而影响自... 通过使用相邻帧之间的光度一致性损失代替深度标签作为网络训练的监督信号,基于图像序列训练的自监督单目深度估计方法近年来受到了广泛的关注.光度一致性约束遵循了静态世界假设,而单目图像序列中存在的运动目标违反该假设,进而影响自监督训练过程中相机位姿估计精度和光度损失函数的计算精度.通过检测并移除运动目标区域,可在得到与目标运动解耦的相机位姿的同时,消除运动目标区域对光度损失计算精度的影响.为此,本文提出了一种基于语义辅助和深度时序一致性约束的自监督单目深度估计网络.首先,使用离线的实例分割网络检测可能违反静态世界假设的动态类别目标,并移除对应区域输入位姿网络从而得到与物体运动解耦的相机位姿.其次,基于语义一致性和光度一致性约束,检测动态类别目标的运动状态,使得运动区域的光度损失不影响网络参数的迭代更新.最后,在非运动区域施加深度时序一致性约束,显式对齐当前帧的估计深度值与相邻帧的投影深度值,进一步细化深度预测结果.在KITTI、DDAD以及KITTI Odometry数据集上的实验验证了所提方法与以往的自监督单目深度估计方法相比具有更出色的性能表现. 展开更多
关键词 单目深度估计 自监督学习 运动目标 时序一致性
在线阅读 下载PDF
基于Shuffle-ZoeDepth单目深度估计的苗期玉米株高测量方法
8
作者 赵永杰 蒲六如 +2 位作者 宋磊 刘佳辉 宋怀波 《农业机械学报》 EI CAS CSCD 北大核心 2024年第5期235-243,253,共10页
株高是鉴别玉米种质性状及作物活力的重要表型指标,苗期玉米遗传特性表现明显,准确测量苗期玉米植株高度对玉米遗传特性鉴别与田间管理具有重要意义。针对传统植株高度获取方法依赖人工测量,费时费力且存在主观误差的问题,提出了一种融... 株高是鉴别玉米种质性状及作物活力的重要表型指标,苗期玉米遗传特性表现明显,准确测量苗期玉米植株高度对玉米遗传特性鉴别与田间管理具有重要意义。针对传统植株高度获取方法依赖人工测量,费时费力且存在主观误差的问题,提出了一种融合混合注意力信息的改进ZoeDepth单目深度估计模型。改进后的模型将Shuffle Attention模块加入Decoder模块的4个阶段,使Decoder模块在对低分辨率特征图信息提取过程中能更关注特征图中的有效信息,提升了模型关键信息的提取能力,可生成更精确的深度图。为验证本研究方法的有效性,在NYU-V2深度数据集上进行了验证。结果表明,改进的Shuffle-ZoeDepth模型在NYU-V2深度数据集上绝对相对差、均方根误差、对数均方根误差为0.083、0.301 mm、0.036,不同阈值下准确率分别为93.9%、99.1%、99.8%,均优于ZoeDepth模型。同时,利用Shuffle-ZoeDepth单目深度估计模型结合玉米植株高度测量模型实现了苗期玉米植株高度的测量,采集不同距离下苗期玉米图像进行植株高度测量试验。当玉米高度在15~25 cm、25~35 cm、35~45 cm 3个区间时,平均测量绝对误差分别为1.41、2.21、2.08 cm,平均测量百分比误差分别为8.41%、7.54%、4.98%。试验结果表明该方法可仅使用单个RGB相机完成复杂室外环境下苗期玉米植株高度的精确测量。 展开更多
关键词 苗期玉米 株高 单目深度估计 测量方法 混合注意力机制
在线阅读 下载PDF
基于边缘强化的无监督单目深度估计 被引量:1
9
作者 曲熠 陈莹 《系统工程与电子技术》 EI CSCD 北大核心 2024年第1期71-79,共9页
为解决无监督单目深度估计边缘深度估计不准确的问题,提出了一种基于边缘强化的无监督单目深度估计网络模型。该模型由单视图深度网络和姿态网络两部分构成,均采用编解码结构,其中单视图深度网络编码器使用高分辨率网络(high-resolution... 为解决无监督单目深度估计边缘深度估计不准确的问题,提出了一种基于边缘强化的无监督单目深度估计网络模型。该模型由单视图深度网络和姿态网络两部分构成,均采用编解码结构,其中单视图深度网络编码器使用高分辨率网络(high-resolution net,HRNet)作为骨干网络,在整个过程中保持高分辨率表示,有利于提取精确空间特征;单视图深度网络解码器引入条状卷积,细化深度边缘附近的深度变化,同时利用经典的高斯拉普拉斯算子增强边缘细节,最终充分利用深度边缘信息提高深度估计质量。在KITTI数据集中进行的实验结果表明:所提模型具有较好的深度估计性能,能够使深度图中的目标边缘更加清晰,细节更加丰富。 展开更多
关键词 单目深度估计 无监督学习 条状卷积 边缘增强
在线阅读 下载PDF
结合金字塔结构和注意力机制的单目深度估计 被引量:1
10
作者 李滔 胡婷 武丹丹 《图学学报》 CSCD 北大核心 2024年第3期454-463,共10页
单目深度估计是由单幅彩色图像预测出一幅稠密的深度图像。针对目前单目深度估计算法存在边界模糊、上下文信息捕捉能力不足等问题,提出了一种结合金字塔结构和注意力机制的单目深度估计算法。算法采用编码器-解码器的总体框架,其中编... 单目深度估计是由单幅彩色图像预测出一幅稠密的深度图像。针对目前单目深度估计算法存在边界模糊、上下文信息捕捉能力不足等问题,提出了一种结合金字塔结构和注意力机制的单目深度估计算法。算法采用编码器-解码器的总体框架,其中编码器选用PVTv2网络,目的是利用Transformer网络在建模全局信息方面的优势以获取更充分的全局语义信息;解码器由深度估计主分支和2个金字塔子分支组成。深度估计主分支通过空间和通道注意力机制来自适应地关注编码器和解码器特征间重要的特征区域和特征通道;拉普拉斯金字塔子分支和深度残差金字塔子分支旨在从彩色图像和深度估计主分支深度特征中学习到丰富的局部信息并传递到深度估计主分支,进一步解决单目深度估计中细节缺失、结构混乱等问题。实验结果表明,与先进的算法P3Depth相比,在室内公开数据集NYU Depth V2上,该算法的δ_(1.25)阈值精度提升了1.22%,绝对误差和根均方误差分别降低了5.8%和2.8%;而在室外公开数据集KITTI上,该算法的绝对误差、根均方对数误差和根均方误差分别降低了8.5%,3.9%和0.4%。该算法提升了深度估计精度并得到了良好的视觉呈现效果。 展开更多
关键词 深度学习 单目深度估计 金字塔结构 注意力机制 TRANSFORMER
在线阅读 下载PDF
面向全局特征Transformer架构的单目深度估计
11
作者 吴冰源 王永雄 《控制工程》 CSCD 北大核心 2024年第9期1619-1625,共7页
针对卷积神经网络(convolutional neural networks,CNN)全局特征提取不足导致深度估计错误的问题,提出了一种面向全局特征的深度学习网络用于单目深度估计。该网络采用编码器-解码器的端到端架构,其中,编码器为具有多阶段输出的Transfor... 针对卷积神经网络(convolutional neural networks,CNN)全局特征提取不足导致深度估计错误的问题,提出了一种面向全局特征的深度学习网络用于单目深度估计。该网络采用编码器-解码器的端到端架构,其中,编码器为具有多阶段输出的Transformer网络,可提取多尺度的全局特征;解码器由CNN构成。此外,为抑制深度无关的细节信息影响,解码器末端采用了大卷积核注意力(large kernel attention,LKA)模块提升全局特征的提取能力。在室外场景数据集KITTI和室内场景数据集NYU Depth v2上的实验结果表明,面向全局特征的网络有助于生成高精度的、细节特征完整的深度图。与近期提出的同样基于CNN-Transformer的方法 AdaBins相比,所提出网络的参数量减少了42.31%,均方根误差减小了约2%。 展开更多
关键词 单目深度估计 TRANSFORMER 大卷积核注意力 全局特征
在线阅读 下载PDF
基于转置注意力的多尺度深度融合单目深度估计
12
作者 程亚子 雷亮 +1 位作者 陈瀚 赵毅然 《计算机与现代化》 2024年第9期121-126,共6页
单目深度估计是计算机视觉领域中一项基础任务,其目标是通过单张图像预测深度图,并获取每个像素位置的深度信息。本文提出一种新的单目深度估计网络结构,旨在进一步提高网络的预测准确性。转置注意力机制在降低参数量和计算量的同时引... 单目深度估计是计算机视觉领域中一项基础任务,其目标是通过单张图像预测深度图,并获取每个像素位置的深度信息。本文提出一种新的单目深度估计网络结构,旨在进一步提高网络的预测准确性。转置注意力机制在降低参数量和计算量的同时引入了自注意力机制,以关注图像中的特定区域,并结合不同通道之间的信息。这种机制能够有效地关注到图像中的细小区域和边缘信息,并进行学习。本文还提出一种改进的转置注意力机制,以更少的参数量保留语义信息。多尺度深度融合根据不同通道提取不同深度特征的特点,计算每个通道的平均深度,以增强模型的深度感知能力。此外,它能够建模垂直距离的长距离关系,有效地分离物体之间的边缘,有助于减少细粒度信息的损失。最后,本文在NYU Depth V2数据集和KITTI数据集上进行实验,验证了所提出模块的有效性,并取得了出色的性能表现。 展开更多
关键词 深度学习 单目深度估计 转置注意力 多尺度深度融合 通道平均深度
在线阅读 下载PDF
面向非合作目标抓捕的协作式单目深度估计
13
作者 陈胜威 陈雨 周青华 《电子制作》 2024年第24期61-65,共6页
准确的位置信息对于太空机械臂在轨操作至关重要。为了解决传统单目深度估计在辅助双机械臂获取任务环境时出现尺度模糊和左右预测尺度不一致的问题,研究提出了一种融合了多尺度膨胀卷积模块和多尺度膨胀注意力的协作式单目深度估计网络... 准确的位置信息对于太空机械臂在轨操作至关重要。为了解决传统单目深度估计在辅助双机械臂获取任务环境时出现尺度模糊和左右预测尺度不一致的问题,研究提出了一种融合了多尺度膨胀卷积模块和多尺度膨胀注意力的协作式单目深度估计网络(CMoDE-Net)来协助在轨双机械臂抓取非合作目标。实验结果表明,CMoDE-Net可最大限度地减少左右视角之间的整体预测偏差,且当输入视野重叠率超过85%时,可帮助双机械臂获得最高的抓取成功率。 展开更多
关键词 太空机器人 深度学习 单目深度估计 双机械臂 非合作目标抓捕
在线阅读 下载PDF
面向交通场景基于双注意力机制和自适应代价卷的自监督单目深度估计
14
作者 武港 刘威 +3 位作者 胡骏 程帅 杨文兴 孙令岿 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1670-1678,共9页
针对当前交通场景下自监督单目深度估计存在特征表达能力弱、深度图局部细节模糊、深度估计精度低的问题,提出一种基于双注意力机制和自适应代价卷的自监督单目深度估计方法.该方法首先利用双注意力机制的特征提取网络,结合通道注意力... 针对当前交通场景下自监督单目深度估计存在特征表达能力弱、深度图局部细节模糊、深度估计精度低的问题,提出一种基于双注意力机制和自适应代价卷的自监督单目深度估计方法.该方法首先利用双注意力机制的特征提取网络,结合通道注意力和空间注意力,对提取的场景特征进行自适应加权,增强特征表达能力.其次,根据提取的全局特征自适应的构建代价卷,引导网络学习精细的深度特征,提升网络模型对深度图局部细节的学习能力,解决现有方法深度估计精度低的问题.在自动驾驶公开数据集KITTI、Cityscapes上的实验结果表明,本文方法优于目前主流方法. 展开更多
关键词 单目深度估计 自监督 注意力机制 自适应 代价卷
在线阅读 下载PDF
基于尺度线索增强的无监督单目深度估计
15
作者 曲熠 陈莹 《电子学报》 EI CAS CSCD 北大核心 2024年第9期3217-3227,共11页
由于单目深度估计中图像与深度图存在一对多的对应关系,单目深度估计本身就存在着尺度歧义的问题.因此,本文引入基于多视图立体匹配(Multi-View Stereo,MVS)的单目多帧深度估计方法,构造移动深度,挖掘尺度线索,将传统单目深度估计与MVS... 由于单目深度估计中图像与深度图存在一对多的对应关系,单目深度估计本身就存在着尺度歧义的问题.因此,本文引入基于多视图立体匹配(Multi-View Stereo,MVS)的单目多帧深度估计方法,构造移动深度,挖掘尺度线索,将传统单目深度估计与MVS深度估计有机结合,以改善单目深度估计几何建模中固有的模糊性问题.在此基础上,设计两个通道注意力模块,分别提高网络的场景结构感知能力和对局部信息的处理能力,从而更充分地融合不同尺度的特征,产生更精确、更清晰的深度预测.在KITTI数据集的测试结果中,本文方法的平均相对误差和平方相对误差相较基准网络分别最高提升4.7%和8.0%,所有误差和准确率指标均超越其他主流的无监督单目深度估计方法. 展开更多
关键词 单目深度估计 无监督学习 深度学习 多尺度 通道注意力
在线阅读 下载PDF
基于稳定光度损失的无监督单目深度估计
16
作者 曲熠 陈莹 《电子测量与仪器学报》 CSCD 北大核心 2024年第11期158-167,共10页
在基于视频的无监督单目深度估计模型训练中,光度损失一直发挥着重要作用,但其在弱纹理区域和边缘区域等特殊区域普遍存在较大误差,导致训练网络的监督信号存在较强的不稳定性。针对这一问题,提出一种更具鲁棒性的无监督单目深度估计方... 在基于视频的无监督单目深度估计模型训练中,光度损失一直发挥着重要作用,但其在弱纹理区域和边缘区域等特殊区域普遍存在较大误差,导致训练网络的监督信号存在较强的不稳定性。针对这一问题,提出一种更具鲁棒性的无监督单目深度估计方法。本文方法首先结合双分支编码器和通道注意力模块来提升单帧深度网络对深度特征的提取能力,然后利用单帧深度网络结果引导进行多帧深度估计,以提高深度估计的准确性。在此基础上设计一种新型光度损失函数,通过计算图像梯度上的光度损失消除局部亮度变化引起的不合理监督,并利用连续像素之间的差异特性来定义模糊像素,最后基于二进制掩模排除由于目标帧和重构目标帧上边缘模糊像素产生的错误监督。本文方法在KITTI数据集的测试结果中,平均相对误差、平方相对误差、均方根误差等多项指标均有提升,平均相对误差和平方相对误差分别降低至0.075和0.548。实验结果证明,与其他先进方法相比,本文方法进一步提高了现有模型的性能。 展开更多
关键词 单目深度估计 无监督学习 深度学习 光度损失 鲁棒性
在线阅读 下载PDF
多尺度特征增强的多帧自监督单目深度估计
17
作者 寇旗旗 王伟臣 +3 位作者 韩成功 吕晨 程德强 姬玉成 《光学精密工程》 CSCD 北大核心 2024年第24期3603-3615,共13页
针对目前的深度估计网络对室外场景下图像的空间特征提取不够充分的问题,导致输出深度图存在物体边缘失真、模糊和区域伪影等缺陷,本文提出了一种多尺度特征增强的多帧自监督单目深度估计模型。首先,该模型编码器引入大核注意力的激活模... 针对目前的深度估计网络对室外场景下图像的空间特征提取不够充分的问题,导致输出深度图存在物体边缘失真、模糊和区域伪影等缺陷,本文提出了一种多尺度特征增强的多帧自监督单目深度估计模型。首先,该模型编码器引入大核注意力的激活模块,提高编码器对输入图像全局空间特征的提取能力,保留空间上下文信息;同时,提出了一种结构增强模块,使其能够在通道维度上判别重要特征,增强网络对图像结构特征的感知能力;最后,解码器中使用动态上采样方法代替近邻插值的上采样方法,恢复细节信息,优化了深度图的伪影现象。实验结果表明,本文提出的深度估计网络在KITTI和CityScapes室外数据集的测试结果优于目前的主流算法,尤其在KITTI数据集上的预测正确率达到90.3%。可视化结果也表明,本文网络模型生成的深度图边缘更加清晰准确,有效地提高了深度估计网络的预测精度。 展开更多
关键词 单目深度估计 自监督 多帧 大核注意力 特征增强
在线阅读 下载PDF
面向软体机械臂抓取的单目深度估计方法
18
作者 张竞豪 邓礼楠 沈逸 《控制工程》 CSCD 北大核心 2024年第2期352-358,共7页
软体机械臂在非结构化环境中执行物体抓取任务时,具有柔顺性和安全性的优势。但由于传统的立体视觉系统难以安装在软体机械臂上,软体机械臂获取目标物体的三维位置仍存在挑战。首先,建立了描述软体机械臂运动状态和目标物体位置的协作... 软体机械臂在非结构化环境中执行物体抓取任务时,具有柔顺性和安全性的优势。但由于传统的立体视觉系统难以安装在软体机械臂上,软体机械臂获取目标物体的三维位置仍存在挑战。首先,建立了描述软体机械臂运动状态和目标物体位置的协作坐标系模型。随后,提出了一种改进运动恢复结构的单目深度估计方法:①针对深度估计的实时性要求,提出采用主成分分析-尺度不变特征变换(principal component analysis-scale invariant feature transform,PCA-SIFT)方法对特征描述符降维;②将机械臂末端的移动距离作为约束恢复深度估计的真实尺度。最后,通过实验验证了所提出的协作坐标系和深度估计方法的有效性。实验结果表明,所提深度估计方法在多种光照和遮挡环境中,特征匹配时间缩短了16.02%,平均误差控制在5 mm以内。 展开更多
关键词 软体机器人 单目深度估计 机器人抓取
在线阅读 下载PDF
基于局部区域强化的单目深度估计算法
19
作者 王乐刚 陈程立诏 《青岛大学学报(自然科学版)》 CAS 2024年第1期39-44,51,共7页
针对深度估计场景中复杂纹理和复杂几何结构造成的物体边界扭曲、局部细节信息丢失等问题,提出基于局部区域强化的单目深度估计方法。首先,利用基于卷积神经网络的深度估计模型,得到低分辨率的图像;然后,引入显著目标检测模型,得到高分... 针对深度估计场景中复杂纹理和复杂几何结构造成的物体边界扭曲、局部细节信息丢失等问题,提出基于局部区域强化的单目深度估计方法。首先,利用基于卷积神经网络的深度估计模型,得到低分辨率的图像;然后,引入显著目标检测模型,得到高分辨率的显著图像,监督生成深度图;最后将显著图与深度图融合,以此提高整个图像的深度估计精度。公共数据集上的实验结果表明,该方法可以显著提高单目深度估计的精度。 展开更多
关键词 单目深度估计 局部区域强化 卷积神经网络 深度学习
在线阅读 下载PDF
基于单目深度估计变电站场景的语义分割模型
20
作者 张娜 王大伟 《电力系统装备》 2024年第5期179-181,共3页
针对现有语义分割方法缺乏三维深度几何信息的有效学习,导致复杂变电站场景下对物体语义分割精度低的问题,文章提出了基于单目深度估计变电站场景的语义分割模型。该模型由DeepLab v3+辅图像语义分割模型与AdaBinsModule单目深度估计模... 针对现有语义分割方法缺乏三维深度几何信息的有效学习,导致复杂变电站场景下对物体语义分割精度低的问题,文章提出了基于单目深度估计变电站场景的语义分割模型。该模型由DeepLab v3+辅图像语义分割模型与AdaBinsModule单目深度估计模型两部分组成。首先,AdaBinsModule根据可见光图像生成对应深度图,从而提取到图像中目标物体在三维空间中的深度信息。其次,采用矩阵相乘的方式将深度图中深度信息作为权重与可见光图像融合,并根据既定深度阈值弱化图像中远距离无效背景像素,以减少其在后续图像分割阶段对目标物体分割精度的影响。最后,将融合后的图像输入DeepLab v3+辅图像语义分割模型中进行语义分割。试验表明,相比基准模型,文章所提方法能更好地提取分割目标的深度轮廓特征,语义分割精度提升明显。 展开更多
关键词 单目深度估计 语义分割 图像融合 深度 变电站
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部