期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
融合内在拓扑与多尺度时间特征的骨架动作识别
1
作者 王琪 何宁 《计算机工程与应用》 北大核心 2025年第4期150-157,共8页
图卷积网络在基于骨架的人体动作识别任务中发挥着关键作用。为了解决现有的图卷积网络忽略内在关系,时间卷积功能受限,以及未能充分探索关节与骨骼之间潜在功能相关性等问题,提出一种融合内在拓扑与多尺度时间特征的骨架动作识别方法... 图卷积网络在基于骨架的人体动作识别任务中发挥着关键作用。为了解决现有的图卷积网络忽略内在关系,时间卷积功能受限,以及未能充分探索关节与骨骼之间潜在功能相关性等问题,提出一种融合内在拓扑与多尺度时间特征的骨架动作识别方法。为推断上下文内在拓扑关系,模型利用多头自注意力机制和共享拓扑构建内在拓扑空间图卷积模块;基于复杂的动作序列分析构建多尺度时间卷积模块,旨在扩展时间卷积结构并捕捉多尺度时间特征;模型搭建关节和骨骼信息交互桥梁,实现两者信息的有效传输和融合,以便更深入地探索它们之间的功能相关性。对所提出的方法进行验证,在NTU-RGB+D 60数据集上取得了CS基准91.5%和CV基准96.9%的识别准确率,在NTU-RGB+D 120数据集上分别取得了C-Sub基准89.0%和C-Set基准90.8%的准确率。实验结果表明所提出方法能够更加有效地提取骨架时空特征,进而提升识别精度。 展开更多
关键词 骨架动作识别 图卷积 内在拓扑 多尺度 信息融合
在线阅读 下载PDF
基于轻量级图卷积的人体骨架动作识别方法 被引量:8
2
作者 孙琪翔 何宁 +1 位作者 张聪聪 刘圣杰 《计算机工程》 CAS CSCD 北大核心 2022年第5期306-313,共8页
视频中的人体动作识别在计算机视觉领域得到广泛关注,基于人体骨架的动作识别方法可以明确地表现人体动作,因此已逐渐成为该领域的重要研究方向之一。针对多数主流人体动作识别方法网络参数量大、计算复杂度高等问题,设计一种融合多流... 视频中的人体动作识别在计算机视觉领域得到广泛关注,基于人体骨架的动作识别方法可以明确地表现人体动作,因此已逐渐成为该领域的重要研究方向之一。针对多数主流人体动作识别方法网络参数量大、计算复杂度高等问题,设计一种融合多流数据的轻量级图卷积网络,并将其应用于人体骨架动作识别任务。在数据预处理阶段,利用多流数据融合方法对4种特征数据流进行融合,通过一次训练就可得到最优结果,从而降低网络参数量。设计基于图卷积网络的非局部网络模块,以捕获图像的全局信息从而提高动作识别准确率。在此基础上,设计空间Ghost图卷积模块和时间Ghost图卷积模块,从网络结构上进一步降低网络参数量。在动作识别数据集NTU60 RGB+D和NTU120 RGB+D上进行实验,结果表明,与近年主流动作识别方法ST-GCN、2s AS-GCN、2s AGCN等相比,基于该轻量级图卷积网络的人体骨架动作识别方法在保持较低网络参数量的情况下能够取得较高的识别准确率。 展开更多
关键词 人体骨架动作识别 数据融合 图卷积 非局部网络模块 Ghost网络
在线阅读 下载PDF
基于图卷积神经网络的人体骨架动作识别研究进展 被引量:1
3
作者 杨巨成 张泉钰 +3 位作者 王波 王嫄 陈亚瑞 赵婷婷 《天津科技大学学报》 CAS 2023年第6期1-11,共11页
基于人体骨架的动作识别是实现计算机视觉智能的重要分支。本文对基于图卷积神经网络的人体骨架动作识别技术进行研究并分析,对基于频谱图卷积和空域图卷积的研究现状进行综述,并从邻接矩阵和输入特征两个角度详述了图卷积模型在人体骨... 基于人体骨架的动作识别是实现计算机视觉智能的重要分支。本文对基于图卷积神经网络的人体骨架动作识别技术进行研究并分析,对基于频谱图卷积和空域图卷积的研究现状进行综述,并从邻接矩阵和输入特征两个角度详述了图卷积模型在人体骨架动作识别领域的研究进展。此外,对现有的基于图卷积神经网络的人体骨架动作识别算法进行了分析比较,最后展望了图卷积神经网络在人体骨架动作识别领域的未来发展方向。 展开更多
关键词 图理论 图神经网络 图卷积神经网络 基于骨架动作识别 时空域融合
在线阅读 下载PDF
基于图结构Transformer网络的骨架行为识别研究
4
作者 刘子璇 俞建峰 +2 位作者 钱陈豪 化春键 蒋毅 《机械与电子》 2025年第3期3-8,15,共7页
针对目前人体骨架行为识别方法多用图卷积作为框架,缺少动作时序信息建模与时空特征融合能力的问题,提出一种基于Transformer算法的Actionformer模型。该模型采用分组注意力结构以加强局部特征的提取能力,并添加了空间信息嵌入与时序信... 针对目前人体骨架行为识别方法多用图卷积作为框架,缺少动作时序信息建模与时空特征融合能力的问题,提出一种基于Transformer算法的Actionformer模型。该模型采用分组注意力结构以加强局部特征的提取能力,并添加了空间信息嵌入与时序信息嵌入模块,以增强原始Transformer模型对空间和时间特征的提取。实验结果显示,Actionformer模型在NTU RGB+D数据集上的动作识别准确率较高,优于ST GCN和ST TR等基于图卷积和Transformer的传统模型。 展开更多
关键词 骨架动作识别 图结构Transformer 分层次注意力 骨架图结构嵌入
在线阅读 下载PDF
学习成对样本运动显著性的细粒度人体骨架动作识别 被引量:1
5
作者 李红艳 涂志刚 +1 位作者 谢伟 张嘉旭 《中国科学:信息科学》 CSCD 北大核心 2023年第12期2440-2457,共18页
基于骨架数据的细粒度人体动作识别是一项重要的研究课题,但未被充分解决.由于骨架数据缺乏视觉表观信息,相似类别的人体动作很难被现有的深度网络模型识别.在这项工作中,我们提出了一个新型的运动显著性探测器(motion salience prober,... 基于骨架数据的细粒度人体动作识别是一项重要的研究课题,但未被充分解决.由于骨架数据缺乏视觉表观信息,相似类别的人体动作很难被现有的深度网络模型识别.在这项工作中,我们提出了一个新型的运动显著性探测器(motion salience prober,MSP),并引入了配对学习(motion salience prober-incorporated pairwise-learning,MSP-PL)框架,以实现细粒度的骨架动作识别.我们的MSP-PL框架在构造成对的相似骨架运动样本基础上(查询样本与探测样本),利用运动显著性学习机制,促进编码器学习精细化的运动特征.其核心模块MSP可以在我们设计的探测样本和损失函数的帮助下,增强查询样本的显著性运动特征,并消除冗余的噪声.本文设计了3种探测样本构造策略来生成查询–探测样本对,辅助模型识别查询样本的动作,并测试了它们对模型性能的影响.在NTU-RGB+D120数据集与Kinetics-Skeleton数据集上的大量实验表明,我们的MSP-PL框架是通用的,大多数骨架特征编码器可以无缝嵌入其中,并显著提高其准确性.5个主流的编码器对精细化动作的平均分类准确率提高了2.4%以上.此外,我们的MSP-PL框架在与最新的编码器相结合时,在骨架动作识别方面达到了最先进的性能. 展开更多
关键词 骨架动作识别 细粒度动作识别 视觉注意力 运动显著性学习 对比学习
原文传递
时空双仿射微分不变量及骨架动作识别 被引量:3
6
作者 李琪 墨瀚林 +2 位作者 赵婧涵 郝宏翔 李华 《中国图象图形学报》 CSCD 北大核心 2021年第12期2879-2891,共13页
目的人体骨架的动态变化对于动作识别具有重要意义。从关节轨迹的角度出发,部分对动作类别判定具有价值的关节轨迹传达了最重要的信息。在同一动作的每次尝试中,相应关节的轨迹一般具有相似的基本形状,但其具体形式会受到一定的畸变影... 目的人体骨架的动态变化对于动作识别具有重要意义。从关节轨迹的角度出发,部分对动作类别判定具有价值的关节轨迹传达了最重要的信息。在同一动作的每次尝试中,相应关节的轨迹一般具有相似的基本形状,但其具体形式会受到一定的畸变影响。基于对畸变因素的分析,将人体运动中关节轨迹的常见变换建模为时空双仿射变换。方法首先用一个统一的表达式以内外变换的形式将时空双仿射变换进行描述。基于变换前后轨迹曲线的微分关系推导设计了双仿射微分不变量,用于描述关节轨迹的局部属性。基于微分不变量和关节坐标在数据结构上的同构特点,提出了一种通道增强方法,使用微分不变量将输入数据沿通道维度扩展后,输入神经网络进行训练与评估,用于提高神经网络的泛化能力。结果实验在两个大型动作识别数据集NTU(Nanyang Technological University)RGB+D(NTU 60)和NTU RGB+D 120(NTU 120)上与若干最新方法及两种基线方法进行比较,在两种实验设置(跨参与者识别与跨视角识别)中均取得了明显的改进结果。相比于使用原始数据的时空图神经卷积网络(spatio-temporal graph convolutional networks,ST-GCN),在NTU 60数据集中,跨参与者与跨视角的识别准确率分别提高了1.9%和3.0%;在NTU 120数据集中,跨参与者与跨环境的识别准确率分别提高了5.6%和4.5%。同时对比于数据增强,基于不变特征的通道增强方法在两种实验设置下都能有明显改善,更为有效地提升了网络的泛化能力。结论本文提出的不变特征与通道增强,直观有效地综合了传统特征和深度学习的优点,有效提高了骨架动作识别的准确性,改善了神经网络的泛化能力。 展开更多
关键词 运动分析 骨架动作识别 时空双仿射变换 微分不变量 通道增强 泛化能力
原文传递
基于几何特征与LSTM网络结合的动作识别算法 被引量:3
7
作者 邬倩 吴飞 骆立志 《传感器与微系统》 CSCD 2020年第10期111-114,共4页
为进一步提高基于人体骨架动作识别的识别率,打破以往大部分基于深度学习的方法的输入都为人体骨架关节坐标的局限性,提出了一种将骨架几何特征与长短期记忆(LSTM)网络结合的动作识别算法。选择基于关节与选定直线之间距离的骨架几何特... 为进一步提高基于人体骨架动作识别的识别率,打破以往大部分基于深度学习的方法的输入都为人体骨架关节坐标的局限性,提出了一种将骨架几何特征与长短期记忆(LSTM)网络结合的动作识别算法。选择基于关节与选定直线之间距离的骨架几何特征代替骨架关节坐标作为网络的输入,并引入了基于LSTM的网络结构,即时序关注LSTM网络。利用时序关注LSTM网络具有重点关注最具识别性的帧的能力,在SBU Interaction数据集和UT Kinect数据集上分别取得了99.25%和98.79%的识别率。实验结果证明:该方法对基于人体骨架动作识别的有效性。 展开更多
关键词 骨架动作识别 几何特征 长短期记忆(LSTM)网络
在线阅读 下载PDF
一种用于动作识别的双分支网络
8
作者 秦晓飞 蔡锐 +3 位作者 陈萌 张文奇 何常香 张学典 《光学仪器》 2022年第4期16-25,共10页
动作识别是计算机视觉领域的一项重要任务,主要有基于RGB视频和人体骨架两种数据模态的领域,主流方法分别是3D卷积神经网络和图卷积神经网络。针对视频和人体骨架两种数据模态的不同特点,设计了双分支网络分别对两种数据模态进行建模。... 动作识别是计算机视觉领域的一项重要任务,主要有基于RGB视频和人体骨架两种数据模态的领域,主流方法分别是3D卷积神经网络和图卷积神经网络。针对视频和人体骨架两种数据模态的不同特点,设计了双分支网络分别对两种数据模态进行建模。对于人体骨架数据,基于自注意力机制设计了图卷积神经网络,该算法能在基于骨架的动作识别任务中达到先进的性能。对于视频数据,采用3D卷积网络进行特征提取。同时,利用深监督方法对两种数据模态的中间特征进行监督,提高两种数据特征的耦合度,进一步提高网络效率。这种算法的网络结构简单,在NTU-RGBD60(CS)数据集上仅用3.37×10^(7)的参数量可达到95.6%的精度。 展开更多
关键词 基于人体骨架动作识别 图卷积神经网络 自注意力机制 3D卷积神经网络
在线阅读 下载PDF
面向骨架图卷积动作识别的跨维交互注意力
9
作者 韩守东 龚雨舟 +1 位作者 谢云飞 李洪全 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第11期93-100,共8页
针对骨架动作识别任务中传统图卷积网络未能充分挖掘骨架特征在不同维度之间交互语义的问题,提出一种跨维交互注意力(CDIA).CDIA包含了三种子注意力:空间-通道分组注意力(S-CGA)关联了骨架不同子图的内部节点之间和子图之间局部与全局... 针对骨架动作识别任务中传统图卷积网络未能充分挖掘骨架特征在不同维度之间交互语义的问题,提出一种跨维交互注意力(CDIA).CDIA包含了三种子注意力:空间-通道分组注意力(S-CGA)关联了骨架不同子图的内部节点之间和子图之间局部与全局的交互特征;时序-空间位移注意力(T-SSA)建立了帧间一阶位姿特征的上下文依赖;时序-通道差分注意力(T-CDA)增强了帧间二阶动态特征的表达.实验结果表明:在NTU 60的X-Sub和XView基准及NTU 120的X-Sub和X-Set基准上,CDIA相对基线网络的识别精度分别提升3.2%,1.1%和0.9%,1.8%,在FineGYM数据集上提升3.3%,计算量与参数量仅产生微小增加,可集成于不同图卷积网络,具备轻量化、即插即用的特性和优秀的识别性能. 展开更多
关键词 骨架动作识别 图卷积网络 跨维交互注意力 局部与全局 位姿特征关联 帧间差分
原文传递
基于MobileNetV3与ST-SRU的危险驾驶姿态识别 被引量:2
10
作者 赵俊男 佘青山 +2 位作者 穆高原 吴秋轩 席旭刚 《控制与决策》 EI CSCD 北大核心 2022年第5期1320-1328,共9页
针对危险驾驶行为引起的交通安全事故频发的现状,提出一种基于MobileNetV3和ST-SRU的危险驾驶姿态识别系统.首先,修改MobileNetV3的网络结构使其适用于人体姿态估计任务,输出关节点的热力图和偏移量图,用来估计J个关节点的二维坐标位置... 针对危险驾驶行为引起的交通安全事故频发的现状,提出一种基于MobileNetV3和ST-SRU的危险驾驶姿态识别系统.首先,修改MobileNetV3的网络结构使其适用于人体姿态估计任务,输出关节点的热力图和偏移量图,用来估计J个关节点的二维坐标位置;其次,定义ST-SRU骨架动作识别算法,利用动作的骨架序列数据对动作进行分类.实验结果表明:MobileNetV3姿态估计算法在自建的AI Challenger上肢姿态数据集上测得PCP值(percentage correct parts)达到95.6%,测试1000次用时仅为5.03 s;利用自建的危险驾驶行为数据集将训练好的姿态估计和动作识别模型移植到嵌入式平台,实现了实时的危险驾驶姿态识别系统. 展开更多
关键词 MobileNetV3 人体姿态估计 骨架动作识别 ST-SRU 危险驾驶姿态识别
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部