期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
多媒体数据的知识关联与理解专题前言
1
作者 蒋树强 刘青山 +1 位作者 孙立峰 李波 《软件学报》 EI CSCD 北大核心 2019年第4期865-866,共2页
近年来,不同来源的多媒体数据产生量剧增,成为用户信息获取、信息交换与信息消费的主要对象,多媒体数据具有广泛的应用需求和重大的应用价值.相对于其他数据类型,图像、视频等多媒体数据具有关系繁杂、冗余性强、信息隐藏深、全面理解... 近年来,不同来源的多媒体数据产生量剧增,成为用户信息获取、信息交换与信息消费的主要对象,多媒体数据具有广泛的应用需求和重大的应用价值.相对于其他数据类型,图像、视频等多媒体数据具有关系繁杂、冗余性强、信息隐藏深、全面理解困难等特点,因此,全面和准确地分析和理解多媒体内容是一个非常重要和具有挑战性的问题.最近,基于知识关联与理解的多媒体计算正逐渐得到研究者的关注,呈现出新的发展动态,这项研究可以使得多媒体内容的分析与理解更加深入,建立从多媒体内容感知到全面认知理解的桥梁. 展开更多
关键词 多媒体数据 知识 多媒体内容 多媒体计算 信息获取 信息消费 信息交换 数据类型
在线阅读 下载PDF
动态需求响应概念扩展及研究重点 被引量:13
2
作者 姚建国 张凯锋 +3 位作者 丁哲通 李亚平 杨胜春 夏旻 《电力系统自动化》 EI CSCD 北大核心 2019年第14期207-215,共9页
在短时间尺度上,掌握需求侧资源的动态响应特性以及与电网动态变化过程的配合关系对于发挥资源的灵活调节作用、促进电网安全稳定运行具有重要作用.文中在对需求响应相关概念及研究成果进行梳理的基础上,认识到动态需求响应能够改善电... 在短时间尺度上,掌握需求侧资源的动态响应特性以及与电网动态变化过程的配合关系对于发挥资源的灵活调节作用、促进电网安全稳定运行具有重要作用.文中在对需求响应相关概念及研究成果进行梳理的基础上,认识到动态需求响应能够改善电网的动态过程品质,拓展了动态需求响应的新内涵,扩大了动态需求响应的作用范围.在阐明新内涵后,从大范围、多类型资源的研究视角出发,分析了动态需求响应面临的挑战,提出了面向大规模多样化资源的动态需求响应研究重点,包括动态需求响应资源辨识、资源的动态特性分析、适应动态需求响应的市场机制设计、动态需求响应控制理论及控制策略等4个方面,并对各项研究重点进行了概括和展望. 展开更多
关键词 动态需求响应 动态过程 资源辨识 市场机制 控制理论
在线阅读 下载PDF
改进的卷积神经网络行人检测方法 被引量:14
3
作者 徐超 闫胜业 《计算机应用》 CSCD 北大核心 2017年第6期1708-1715,共8页
为了在行人检测任务中使卷积神经网络(CNN)选择出更优模型并获得定位更准确的检测框,提出一种改进的基于卷积神经网络的行人检测方法。改进主要涉及两个方面:如何决定CNN样本迭代学习次数和如何进行重合窗口的合并。首先,关于CNN样本迭... 为了在行人检测任务中使卷积神经网络(CNN)选择出更优模型并获得定位更准确的检测框,提出一种改进的基于卷积神经网络的行人检测方法。改进主要涉及两个方面:如何决定CNN样本迭代学习次数和如何进行重合窗口的合并。首先,关于CNN样本迭代次序问题,在顺序迭代训练多个CNN分类模型的基础上,提出一种基于校验集正确率及其在迭代系列分类器中展现出的稳定性进行更优模型选择的策略,以使最终选择的分类器推广能力更优。其次,提出了一种不同于非极大值抑制(NMS)的多个精确定位回归框合并机制。精确定位回归框的获取以CNN检测过程输出的粗定位框作为输入。然后,对每个粗定位框应用CNN精确定位过程并获得对应的精确定位回归框。最后,对多个精确定位回归框进行合并,合并过程考虑了每个精确定位回归框的正确概率。更精确地说,最终的合并窗口是基于多个相关的精确定位回归框的概率加权求和方式获得。针对提出的两个改进,在国际上广泛使用的行人检测公共测试数据集ETH上进行了一系列实验。实验结果表明,所提的两个改进方法均能有效地提高系统的检测性能,在相同的测试条件下,融合两个改进的方法相比Fast R-CNN算法检测性能提升了5.06个百分点。 展开更多
关键词 深度学习 卷积神经网络 图像分类 行人检测
在线阅读 下载PDF
多媒体内容的多维度相似性计算与搜索专题前言
4
作者 蒋树强 刘青山 +1 位作者 孙立峰 李波 《软件学报》 EI CSCD 北大核心 2020年第7期1931-1932,共2页
图像、视音频等多媒体数据包含的信息量非常丰富.近年来,随着研究的不断深入,根据不同应用需求,多媒体搜索可以从不同维度展开,包括从底层特征到高层语义的表示维度、从实例到类别的物体维度、从单个概念到多个概念直至语言的描述维度... 图像、视音频等多媒体数据包含的信息量非常丰富.近年来,随着研究的不断深入,根据不同应用需求,多媒体搜索可以从不同维度展开,包括从底层特征到高层语义的表示维度、从实例到类别的物体维度、从单个概念到多个概念直至语言的描述维度、从全局内容到局部区域的尺度维度等,并且这些维度之间也相互关联与交叉.多维度的多媒体相似性计算与搜索研究可以深入挖掘多媒体内容的相似性,建立更加全面的多媒体内容搜索方案. 展开更多
关键词 相似性计算 多媒体内容 底层特征 多维度 搜索方案 视音频 不同维度
在线阅读 下载PDF
基于条件生成对抗网络的乳腺上皮和间质区域自动分割
5
作者 张泽林 徐军 《计算机应用》 CSCD 北大核心 2020年第10期2910-2916,共7页
乳腺病理组织图像中上皮和间质区域的自动分割对乳腺癌的诊断和治疗具有非常重要的临床意义。但是由于乳腺组织病理图像中上皮和间质区域具有高度复杂性,因此一般的分割模型很难只根据提供的分割标记来有效地训练,并对两种区域进行快速... 乳腺病理组织图像中上皮和间质区域的自动分割对乳腺癌的诊断和治疗具有非常重要的临床意义。但是由于乳腺组织病理图像中上皮和间质区域具有高度复杂性,因此一般的分割模型很难只根据提供的分割标记来有效地训练,并对两种区域进行快速、准确的分割。为此,提出一种基于条件对抗网络(cGAN)的上皮和间质分割条件对抗网络(EPScGAN)模型。在EPScGAN中,判别器的判别机制为生成器的训练提供了一个可训练的损失函数,来更加准确地衡量出生成器网络的分割结果输出和真实标记之间的误差,从而更好地指导生成器的训练。从荷兰癌症研究所(NKI)和温哥华综合医院(VGH)两个机构提供的专家标记的乳腺病理图像数据集中随机裁剪出1286张尺寸为512×512的图像作为实验数据集,然后将该数据集按照7∶3的比例划分为训练集和测试集对EPScGAN模型进行训练和测试。结果表明,EPScGAN模型在测试集的平均交并比(mIoU)为78.12%,和其他6种流行的深度学习分割模型相比较,提出的EPScGAN具有更好的分割性能。 展开更多
关键词 深度学习 条件生成对抗网络 乳腺病理组织图像 上皮和间质区域 图像分割
在线阅读 下载PDF
基于极深卷积神经网络的人脸超分辨率重建算法 被引量:20
6
作者 孙毅堂 宋慧慧 +1 位作者 张开华 严飞 《计算机应用》 CSCD 北大核心 2018年第4期1141-1145,共5页
针对多种放大倍数的人脸超分辨率重建问题,提出一种基于极深卷积神经网络的人脸超分辨率重建方法,并通过实验发现增加网络深度能够有效提升人脸重建的精度。首先,设计一个包含20个卷积层的网络从低分辨率图片和高分辨率图片之间学习一... 针对多种放大倍数的人脸超分辨率重建问题,提出一种基于极深卷积神经网络的人脸超分辨率重建方法,并通过实验发现增加网络深度能够有效提升人脸重建的精度。首先,设计一个包含20个卷积层的网络从低分辨率图片和高分辨率图片之间学习一种端到端的映射关系,并通过在网络结构中将多个小的滤波器进行多次串联以扩大提取纹理信息的范围。其次,引入了残差学习的方法来解决随着深度的提升细节信息丢失的问题。另外,将不同放大因子的低分辨率人脸图片融合到一个训练集中训练,使得该卷积网络能够解决不同放大因子的人脸超分辨率重建问题。在CASPEAL测试集上的结果显示,该极深卷积神经网络的方法比基于双三次插值的人脸重建方法在峰值信噪比(PSNR)和结构相似度上有2.7 d B和2%的提升,和SRCNN的方法比较也有较大的提升,在精度和视觉改善方面都有较大提升。这显示了更深的网络结构能够在重建中取得更好的结果。 展开更多
关键词 超分辨率重建 卷积神经网络 机器学习 深度学习 残差学习
在线阅读 下载PDF
基于距离加权重叠度估计与椭圆拟合优化的精确目标跟踪算法 被引量:5
7
作者 王宁 宋慧慧 张开华 《计算机应用》 CSCD 北大核心 2021年第4期1100-1105,共6页
为解决判别式相关滤波(DCF)跟踪算法在跟踪目标旋转或非刚性形变时的模型漂移、尺度粗糙、跟踪失败问题,提出一种基于距离加权重叠度估计与椭圆拟合优化的精确目标跟踪算法(DWOP-EFO)。首先,同时采用矩形框之间的重叠度和中心距离作为... 为解决判别式相关滤波(DCF)跟踪算法在跟踪目标旋转或非刚性形变时的模型漂移、尺度粗糙、跟踪失败问题,提出一种基于距离加权重叠度估计与椭圆拟合优化的精确目标跟踪算法(DWOP-EFO)。首先,同时采用矩形框之间的重叠度和中心距离作为动态锚框质量评价的依据,能够缩小预测结果与目标区域之间的空间距离,缓解模型漂移问题;其次,为了进一步提高跟踪精度,采用轻量化的目标分割网络将目标从背景中分割出来,再利用椭圆拟合算法对分割轮廓进行优化并输出稳定的旋转矩形框,实现对目标尺度的精确估计;最后,通过尺度置信度优化策略对置信度高的尺度结果实现门控输出。所提算法能缓解模型漂移问题,同时有利于增强跟踪器的鲁棒性和提升跟踪精度。在两个最为流行的评测数据集VOT2018和OTB100上进行了实验,结果表明:在VOT2018数据集上,所提算法的期望平均重叠率(EAO)指标比基于重叠度最大化准确跟踪算法(ATOM)提高2.2个百分点,相较于基于可学习的判别模型跟踪器(DiMP)提高1.9个百分点;同时,所提算法在OTB100评测数据集上的成功率指标比ATOM高出1.3个百分点,特别是在非刚性形变属性上效果显著。所提算法在评测数据集上的平均运行速率均超过25 frame/s实现了实时跟踪。 展开更多
关键词 判别式相关滤波 视觉跟踪 目标分割 距离加权 椭圆拟合
在线阅读 下载PDF
基于预测稀疏编码的快速单幅图像超分辨率重建 被引量:2
8
作者 沈辉 袁晓彤 刘青山 《计算机应用》 CSCD 北大核心 2015年第6期1749-1752,共4页
针对经典的基于稀疏编码的图像超分辨率算法在重建过程中运算量大、计算效率低的缺点,提出一种基于预测稀疏编码的单幅图像超分辨率重建算法。训练阶段,该算法在传统的稀疏编码误差函数基础上叠加编码预测误差项构造目标函数,并采用交... 针对经典的基于稀疏编码的图像超分辨率算法在重建过程中运算量大、计算效率低的缺点,提出一种基于预测稀疏编码的单幅图像超分辨率重建算法。训练阶段,该算法在传统的稀疏编码误差函数基础上叠加编码预测误差项构造目标函数,并采用交替优化过程最小化该目标函数;测试阶段,仅需将输入的低分辨图像块和预先训练得到的低分辨率字典相乘就能预测出重建系数,从而避免了求解稀疏回归问题。实验结果表明,与经典的基于稀疏编码的单幅图像超分辨率算法相比,该算法能够在显著减少重建阶段运算时间的同时几乎完全保留超分辨率视觉效果。 展开更多
关键词 图像超分辨率 预测稀疏编码 字典学习 交替优化
在线阅读 下载PDF
联合姿态先验的人体精确解析双分支网络模型 被引量:1
9
作者 高明达 孙玉宝 +1 位作者 刘青山 邵晓雯 《软件学报》 EI CSCD 北大核心 2020年第7期1959-1968,共10页
人体解析旨在将人体图像分割成多个具有细粒度语义的部件区域,进行形成对人体图像的语义理解.然而,由于人体姿态的复杂性,现有的人体解析算法容易对人体四肢部件形成误判,且对于小目标区域的分割不够精确.针对上述问题,联合人体姿态估... 人体解析旨在将人体图像分割成多个具有细粒度语义的部件区域,进行形成对人体图像的语义理解.然而,由于人体姿态的复杂性,现有的人体解析算法容易对人体四肢部件形成误判,且对于小目标区域的分割不够精确.针对上述问题,联合人体姿态估计信息,提出了一种人体精确解析的双分支网络模型.该模型首先使用基干网络表征人体图像,将人体姿态估计模型预测到的姿态先验作为基干网络的注意力信息,进而形成人体结构先验驱动的多尺度特征表达,并将提取的特征分别输入至全卷积网络解析分支与检测解析分支.全卷积网络解析分支获得全局分割结果,检测解析分支更关注小尺度目标的检测与分割,融合两个分支的预测信息可以获得更为精确的分割结果.实验结果验证了该算法的有效性,在当前主流的人体解析数据集LIP和ATR上,所提方法的m Io U评测指标分别为52.19%和68.29%,有效提升了解析精度,在人体四肢部件以及小目标部件区域获得了更为准确的分割结果. 展开更多
关键词 人体解析 语义分割 人体姿态估计 部件检测 卷积神经网络
在线阅读 下载PDF
基于双重注意力孪生网络的实时视觉跟踪 被引量:11
10
作者 杨康 宋慧慧 张开华 《计算机应用》 CSCD 北大核心 2019年第6期1652-1656,共5页
为了解决全卷积孪生网络(SiamFC)跟踪算法在跟踪目标经历剧烈的外观变化时容易发生模型漂移从而导致跟踪失败的问题,提出了一种双重注意力机制孪生网络(DASiam)去调整网络模型并且不需要在线更新。首先,主干网络使用修改后表达能力更强... 为了解决全卷积孪生网络(SiamFC)跟踪算法在跟踪目标经历剧烈的外观变化时容易发生模型漂移从而导致跟踪失败的问题,提出了一种双重注意力机制孪生网络(DASiam)去调整网络模型并且不需要在线更新。首先,主干网络使用修改后表达能力更强的并适用于目标跟踪任务的VGG网络;然后,在网络的中间层加入一个新的双重注意力机制去动态地提取特征,这种机制由通道注意机制和空间注意机制组成,分别对特征图的通道维度和空间维度进行变换得到双重注意特征图;最后,通过融合两个注意机制的特征图进一步提升模型的表征能力。在三个具有挑战性的跟踪基准库即OTB2013、OTB100和2017年视觉目标跟踪库(VOT2017)实时挑战上进行实验,实验结果表明,以40 frame/s的速度运行时,所提算法在OTB2013和OTB100上的成功率指标比基准SiamFC分别高出3.5个百分点和3个百分点,并且在VOT2017实时挑战上面超过了2017年的冠军SiamFC,验证了所提出算法的有效性。 展开更多
关键词 卷积神经网络 视觉跟踪 注意力机制 孪生网络
在线阅读 下载PDF
基于关键点的服装检索 被引量:7
11
作者 陈嫒嫒 李来 +1 位作者 刘光灿 刘青山 《计算机应用》 CSCD 北大核心 2017年第11期3249-3255,共7页
目前,同款或近似款式服装检索主要分为基于文本和基于内容两类。基于文本算法往往需要海量标注样本,且存在人工主观性带来的标注缺失和标注差异等问题;基于内容算法一般对服装图像的颜色、形状、纹理提取特征,进行相似性度量,但难以应... 目前,同款或近似款式服装检索主要分为基于文本和基于内容两类。基于文本算法往往需要海量标注样本,且存在人工主观性带来的标注缺失和标注差异等问题;基于内容算法一般对服装图像的颜色、形状、纹理提取特征,进行相似性度量,但难以应对背景颜色干扰,以及视角、姿态引起的服装形变等问题。针对上述问题,提出一种基于关键点的服装检索方法。利用级联深度卷积神经网络为基础,定位服装关键点,融合关键点区域低层视觉信息以及整幅图像的高层语义信息。对比传统检索方法,所提算法能有效处理视角、姿态引起的服装形变和复杂背景的干扰;同时不需大量样本标定,且对背景、形变鲁棒。在Fashion Landmark数据集和BDAT-Clothes数据集上与常用算法进行对比实验。实验结果表明所提算法能有效提升检索的查准率和查全率。 展开更多
关键词 关键点 深度卷积神经网络 级联 服装检索
在线阅读 下载PDF
通道稳定性加权补充学习的实时视觉跟踪算法 被引量:5
12
作者 樊佳庆 宋慧慧 张开华 《计算机应用》 CSCD 北大核心 2018年第6期1751-1754,共4页
为解决补充学习(Staple)跟踪算法在平面内旋转、部分遮挡时存在的跟踪失败问题,提出了一种通过通道稳定性加权的补充学习(CSStaple)跟踪算法。首先,使用标准相关滤波分类器检测出每层通道的响应值;然后,计算获得每层通道的稳定性权重,... 为解决补充学习(Staple)跟踪算法在平面内旋转、部分遮挡时存在的跟踪失败问题,提出了一种通过通道稳定性加权的补充学习(CSStaple)跟踪算法。首先,使用标准相关滤波分类器检测出每层通道的响应值;然后,计算获得每层通道的稳定性权重,并乘到每层权重上,获得相关滤波响应;最后,通过融合颜色补充学习器的响应,得到最终的响应结果,响应中的最大值的位置即为跟踪结果。将所提算法与层和空间可靠性判别相关滤波(CSR-DCF)跟踪、对冲深度跟踪(HDT)、核化相关滤波(KCF)跟踪和Staple等跟踪算法进行了对比实验。实验结果表明,所提算法在成功率上表现最优,在OTB50和OTB100上比Staple分别高出2.5个百分点和0.9个百分点,验证了所提算法对目标在平面内旋转和部分遮挡时的有效性。 展开更多
关键词 相关滤波 视觉跟踪 颜色直方图 补充学习 通道稳定性加权
在线阅读 下载PDF
基于双重金字塔网络的视频目标分割方法 被引量:4
13
作者 姜斯浩 宋慧慧 +1 位作者 张开华 汤润发 《计算机应用》 CSCD 北大核心 2019年第8期2242-2246,共5页
针对复杂视频场景中难以分割特定目标的问题,提出一种基于双重金字塔网络(DPN)的视频目标分割方法。首先,通过调制网络的单向传递让分割模型适应特定目标的外观。具体而言,从给定目标的视觉和空间信息中学习一种调制器,并通过调制器调... 针对复杂视频场景中难以分割特定目标的问题,提出一种基于双重金字塔网络(DPN)的视频目标分割方法。首先,通过调制网络的单向传递让分割模型适应特定目标的外观。具体而言,从给定目标的视觉和空间信息中学习一种调制器,并通过调制器调节分割网络的中间层以适应特定目标的外观变化。然后,通过基于不同区域的上下文聚合的方法,在分割网络的最后一层中聚合全局上下文信息。最后,通过横向连接的自左而右结构,在所有尺度中构建高阶语义特征图。所提出的视频目标分割方法是一个可以端到端训练的分割网络。大量实验结果表明,所提方法在DAVIS2016数据集上的性能与较先进的使用在线微调的方法相比,可达到相竞争的结果,且在DAVIS2017数据集上性能较优。 展开更多
关键词 视频目标分割 特征金字塔 卷积神经网络 深度学习 多尺度融合
在线阅读 下载PDF
融合时空多特征表示的无监督视频分割算法 被引量:4
14
作者 李雪君 张开华 宋慧慧 《计算机应用》 CSCD 北大核心 2017年第11期3134-3138,3151,共6页
针对视频分割的难点在于分割目标的无规则运动、快速变换的背景、目标外观的任意变化与形变等,提出了一种基于时空多特征表示的无监督视频分割算法,通过融合像素级、超像素级以及显著性三类特征设计由细粒度到粗粒度的稳健特征表示。首... 针对视频分割的难点在于分割目标的无规则运动、快速变换的背景、目标外观的任意变化与形变等,提出了一种基于时空多特征表示的无监督视频分割算法,通过融合像素级、超像素级以及显著性三类特征设计由细粒度到粗粒度的稳健特征表示。首先,采用超像素分割对视频序列进行处理以提高运算效率,并设计图割算法进行快速求解;其次,利用光流法对相邻帧信息进行匹配,并通过K-D树算法实现最近邻搜索以引入各超像素的非局部时空颜色特征,从而增强分割的鲁棒性;然后,对采用超像素计算得到的分割结果,设计混合高斯模型进行完善;最后,引入图像的显著性特征,协同超像素分割与混合高斯模型的分割结果,设计投票获得更加准确的视频分割结果。实验结果表明,所提算法是一种稳健且有效的分割算法,其结果优于当前大部分无监督视频分割算法及部分半监督视频分割算法。 展开更多
关键词 超像素分割 K-D树 混合高斯模型 图割算法 光流法
在线阅读 下载PDF
混合阶通道注意力网络的单图像超分辨率重建 被引量:3
15
作者 姚鲁 宋慧慧 张开华 《计算机应用》 CSCD 北大核心 2020年第10期3048-3053,共6页
目前用于图像超分辨率重建的通道注意力机制存在注意力预测破坏每个通道和其权重的直接对应关系以及仅仅只考虑一阶或二阶通道注意力而没有综合考虑优势互补的问题,因此提出一种混合阶通道注意力网络的单图像超分辨率重建算法。首先,该... 目前用于图像超分辨率重建的通道注意力机制存在注意力预测破坏每个通道和其权重的直接对应关系以及仅仅只考虑一阶或二阶通道注意力而没有综合考虑优势互补的问题,因此提出一种混合阶通道注意力网络的单图像超分辨率重建算法。首先,该网络框架利用局部跨通道相互作用策略将之前一、二阶通道注意力模型采用的升降维改为核为k的一维卷积。这样不仅使得通道注意力预测更直接准确,而且得到的模型相比之前的通道注意力模型更简单;同时,采用改进一、二阶通道注意力模型以综合利用不同阶通道注意力的优势,提高网络判别能力。在基准数据集上的实验结果表明,和现有的超分辨率算法相比,所提算法重建图像的纹理细节和高频信息能得到更好的恢复,且在Set5和BSD100数据集上感知指数(PI)分别平均提高0.3和0.1。这表明此网络能更准确地预测通道注意力并综合利用了不同阶通道注意力,一定程度上提升了性能。 展开更多
关键词 通道注意力机制 生成对抗网络 图像超分辨率重建 卷积神经网络 深度学习
在线阅读 下载PDF
基于多层特征增强的实时视觉跟踪 被引量:1
16
作者 费大胜 宋慧慧 张开华 《计算机应用》 CSCD 北大核心 2020年第11期3300-3305,共6页
为了解决全卷积孪生视觉跟踪网络(SiamFC)出现相似语义信息干扰物使得跟踪目标发生漂移,导致跟踪失败的问题,设计出一种基于多层特征增强的实时视觉跟踪网络(MFESiam),分别去增强高层和浅层的特征表示能力,从而提升算法的鲁棒性。首先,... 为了解决全卷积孪生视觉跟踪网络(SiamFC)出现相似语义信息干扰物使得跟踪目标发生漂移,导致跟踪失败的问题,设计出一种基于多层特征增强的实时视觉跟踪网络(MFESiam),分别去增强高层和浅层的特征表示能力,从而提升算法的鲁棒性。首先,对于浅层特征,利用一个轻量并且有效的特征融合策略,通过一种数据增强技术模拟一些在复杂场景中的变化,例如遮挡、相似物干扰、快速运动等来增强浅层特征的纹理特性;其次,对于高层特征,提出一个像素感知的全局上下文注意力机制模块(PCAM)来提高目标的长时定位能力;最后,在三个具有挑战性的跟踪基准库OTB2015、GOT-10K和2018年视觉目标跟踪库(VOT2018)上进行大量实验。实验结果表明,所提算法在OTB2015和GOT-10K上的成功率指标比基准SiamFC分别高出6.3个百分点和4.1个百分点,并且以每秒45帧的速度运行达到实时跟踪。在VOT2018实时挑战上,所提算法的平均期望重叠率指标超过2018年的冠军,即高性能的候选区域孪生视觉跟踪器(SiamRPN),验证了所提算法的有效性。 展开更多
关键词 视觉跟踪 数据增强 注意力机制 全局上下文 长时定位
在线阅读 下载PDF
深浅层表示融合的半监督视频目标分割
17
作者 吕潇 宋慧慧 樊佳庆 《计算机应用》 CSCD 北大核心 2022年第12期3884-3890,共7页
为了解决半监督视频目标分割任务中,分割精度与分割速度难以兼顾以及无法对视频中与前景相似的背景目标做出有效区分的问题,提出一种基于深浅层特征融合的半监督视频目标分割算法。首先,利用预先生成的粗糙掩膜对图像特征进行处理,以获... 为了解决半监督视频目标分割任务中,分割精度与分割速度难以兼顾以及无法对视频中与前景相似的背景目标做出有效区分的问题,提出一种基于深浅层特征融合的半监督视频目标分割算法。首先,利用预先生成的粗糙掩膜对图像特征进行处理,以获取更鲁棒的特征;然后,通过注意力模型提取深层语义信息;最后,将深层语义信息与浅层位置信息进行融合,从而得到更加精确的分割结果。在多个流行的数据集上进行了实验,实验结果表明:在分割运行速度基本不变的情况下,所提算法在DAVIS 2016数据集上的雅卡尔(J)指标相较于学习快速鲁棒目标模型的视频目标分割(FRTM)算法提高了1.8个百分点,综合评价指标为J和F得分的均值J&F相较于FRTM提高了2.3个百分点;同时,在DAVIS 2017数据集上,所提算法的J指标比FRTM提升了1.2个百分点,综合评价指标J&F比FRTM提升了1.1个百分点。以上结果充分说明所提算法能够在保持较快分割速度的情况下实现更高的分割精度,并且能够有效区别相似的前景与背景目标,具有较强的鲁棒性。可见所提算法在平衡速度与精度以及有效区分前景背景方面的优越性能。 展开更多
关键词 视频目标分割 注意力 融合 深层语义信息 浅层位置信息
在线阅读 下载PDF
调控领域人工智能应用的高复用性验证平台
18
作者 高志远 庄卫金 +4 位作者 李峰 于芳 张鸿 王艳 夏旻 《中国电力》 2025年第3期142-150,共9页
近年来,电网调控领域智能化发展趋势明显,但由于人工智能(artificial intelligence,AI)技术本身的黑盒性质,正确性和可靠性验证问题日渐重要,能够支持各种不同人工智能模型验证的复用性支持平台尤为重要。通过对验证需求和问题的分析,... 近年来,电网调控领域智能化发展趋势明显,但由于人工智能(artificial intelligence,AI)技术本身的黑盒性质,正确性和可靠性验证问题日渐重要,能够支持各种不同人工智能模型验证的复用性支持平台尤为重要。通过对验证需求和问题的分析,提出一种包含基础设施、平台服务和应用服务的3层验证平台架构,分析了该架构下AI模型验证的运行模式,开展了案例和样本复用、容器化和镜像、多框架和算法集成等关键技术研究,并进行了开发和实施。该平台实现了算力和数据资源的统一管理和复用、兼容支持多种不同AI框架和算法库、验证场景的动态生成等,为后续调控领域人工智能技术推广应用奠定了基础。 展开更多
关键词 电网调控 人工智能 机器学习 新型电力系统 信息通信技术 能量管理系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部