题名 基于对抗学习与形状修正的遥感图像建筑提取
1
作者
王若兰
李辉
机构
四川大学视觉合成图形图像技术国家级重点实验室
出处
《半导体光电》
北大核心
2024年第6期1031-1038,共8页
基金
国家自然科学基金项目(U20A20161)。
文摘
高分辨率遥感图像建筑物提取对城市实景三维重建具有重要意义。针对传统卷积方法分割复杂背景遥感图像中的建筑物时出现的地物互相遮挡和边界模糊导致分割精度不高问题,提出一种改进HRNet的遥感图像建筑物提取网络模型(SCGAN)。基于HRNet结构引入形状修正单元提升模型对建筑物边缘和形状的感知能力,结合对抗学习策略强化建筑物边界和几何形状等细节特征。实验结果表明,基于对抗学习和形状修正单元的SCGAN有效提升了分割精度,在WHU和Massachusetts数据集上的IoU分别为90.94%和70.89%,与流行的语义分割模型相比表现最佳。
关键词
神经网络
语义分割
遥感图像
建筑物提取
对抗学习
Keywords
neural network
semantic segmentation
remote sensing images
building extraction
adversarial learning
分类号
P237
[天文地球—摄影测量与遥感]
题名 异构无人机群扫描覆盖路径规划
2
作者
蓝浩
陶伟
李辉
机构
四川大学 计算机学院(软件学院)
四川大学视觉合成图形图像技术国家级重点实验室
中国舰船研究设计中心
出处
《计算机仿真》
2025年第2期405-411,共7页
基金
国家自然科学基金重点项目(U20A20161)。
文摘
扫描覆盖问题一直是无线传感网络的热点问题,目前大多数研究主要集中于同构无人机扫描覆盖问题,目标为无人机数量最小的情况下对区域节点达到全覆盖。近年来,扫描覆盖问题衍生出新的方向,即MTMC(min-time max-coverage)问题,即使用有限无人机对区域节点进行扫描覆盖,使得覆盖率尽可能大的同时任务时间尽可能小。在考虑了无人机异构性的基础上,分析了MTMC问题的数学模型,提出了CWBGAA(CW Based on Genetic Annealing Algorithm optimization)算法解决MTMC问题。上述算法分为两阶段解决问题,第一阶段基于启发式插入算法生成每架无人机对应的飞行路径,第二阶段基于遗传退火算法对生成后路径进行路径优化,使得无人机的飞行时间降低。仿真结果表明,CWBGAA算法相较于其它算法拥有更好的性能,提升覆盖率的同时降低了任务执行时间。
关键词
异构无人机群
扫描覆盖
最小时间最大覆盖率
路径规划
遗传退火算法
Keywords
Heterogeneous UAVs
Sweep coverage
MTMC
Route plan
Genetic annealing algorithm
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
题名 多传感器NCSR红外图像超分辨率算法
3
作者
苏冰山
赵学武
陈雨
安世勇
机构
郑州航空工业管理学院智能工程学院
四川大学 电子信息学院
四川大学视觉合成图形图像技术国家级重点实验室
出处
《中原工学院学报》
CAS
2020年第5期52-58,共7页
基金
河南省科技攻关项目(202102210164)。
文摘
提出一种新的多传感器红外图像超分辨率算法。算法将一种非局部集中稀疏表示模型与红外图像的高频估计图像相结合:首先根据相位一致算法提取可见光图像和红外图像的边缘;然后将提取的图像边缘按照相关和非相关边缘分类,分类后依据可见光图像与红外图像的二次仿射变换关系模型,得出相关边缘红外图像块的高频估计;最后将高频估计与非局部集中稀疏表示模型的字典训练过程结合起来,得到新的正则化模型,由此模型重建高分辨率红外图像。实验结果证明本文算法在主观视觉效果和客观评价指标方面均优于传统算法。
关键词
红外图像超分辨
非局部集中稀疏表示(NCSR)
高频估计
多传感器
正则化
Keywords
infrared image super-resolution
Nonlocally Centralized Sparse Representation(NCSR)
high frequency
multi-sensor
regularization
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于改进狼群算法的无人机协同任务规划
4
作者
彭泫滈
张娟
李辉
胡术
机构
四川大学 计算机学院软件学院
景德镇陶瓷大学 信息工程学院
四川大学视觉合成图形图像技术国家级重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第10期69-79,共11页
基金
国家自然科学基金重点项目(U20A20161)
"十三五"全军共用信息系统装备预研项目(31505550302)。
文摘
多无人机在现代化作战中的运用日渐增多,无人机任务规划在无人机智能作战中至关重要。针对子系统能力约束下的无人机任务分配问题,提出一种Levy Flight(LF)优化下基于拍卖机制的混沌反向学习狼群优化算法CRL-AMIWPA。首先,定义无人机能力矩阵和任务场景,对无人机异构性、任务执行能力、执行任务能力最低需求建立同一矩阵描述,根据距离油耗和最迟任务完成时间的加权和建立目标函数,建立子系统约束下的任务分配模型;然后,设计狼群个体编码,每个编码方案包含一种任务分配策略,针对未达到任务需求最低能力的解,采用基于合同网的拍卖策略予以修正。另外,在狼群初始化阶段,采用Tent混沌算子和反向学习策略,将狼群个体均匀地分布在解空间中,以提高初始种群的多样性,最后,利用LF策略优化寻优过程,提高跳出局部最优解的能力。仿真实验结果表明,所提算法能有效解决在子系统约束场景下无人机任务分配问题,相比其他群智能算法和狼群算法,具有更优的寻优性和收敛速度。
关键词
狼群算法
任务分配
混沌优化
变步长优化
群智能算法
Keywords
Wolf Pack Algorithm(WPA)
task allocation
chaotic optimization
variable step size optimization
swarm intelligence algorithm
分类号
V279
[航空宇航科学与技术—飞行器设计]
题名 基于推迟重采样的时空路径复用蓄水池算法
5
作者
刘双嘉
马宁
李方钏
张严辞
机构
四川大学 计算机学院
四川大学视觉合成图形图像技术国家级重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2024年第12期3843-3850,共8页
基金
国家重大专项资助项目(GJXM92579)
四川省重点研发资助项目(2023YFG0122)。
文摘
现有的基于蓄水池的时空重要性重采样(ReSTIR)算法在渲染具有光泽(glossy)材质的场景表面时,难以兼顾渲染质量和性能。为此提出了一种基于推迟重采样的时空路径复用蓄水池算法。其基本思想是仅复用起点为漫反射(diffuse)材质的路径和子路径,利用diffuse采样分布的弱方向性,减少采样分布差异。具体而言,该算法将样本获取和重采样计算,从着色点推迟到路径上第一个diffuse材质的路径顶点。此外,提出了一种路径选择方法,通过选择推迟距离更小的路径,来增强重采样结果对渲染结果的影响。实验结果表明,与其他ReSTIR算法相比,该算法能够以较低的性能开销,取得较高质量的glossy表面渲染结果,在实时渲染中具有更高的实用价值。
关键词
实时渲染
路径追踪
路径复用
光泽材质
Keywords
real-time rendering
path tracing
ReSTIR
glossy material
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于显式运动建模的视频伪装目标检测
6
作者
肖涛
章超
傅可人
机构
四川大学 计算机学院
四川 警察学院
智能警务四川 省重点 实验室
四川大学视觉合成图形图像技术国家级重点实验室
出处
《上海理工大学学报》
CAS
CSCD
北大核心
2024年第2期120-128,共9页
基金
国家自然科学基金资助项目(62176169)
智能警务四川省重点实验室资助项目(ZNJW2022KFMS001)。
文摘
目前的视频伪装目标检测方法通常采用隐式运动建模或直接输入存在噪声的离线光流图来获取运动线索,这会影响模型性能。为了解决这一问题,提出一种新的基于显式运动建模的视频伪装目标检测框架,称为SMHNet。首先,该框架将显式运动建模与伪装目标检测联合在同一个框架中进行学习。然后利用特征双向更新模块实现两个分支的双向交互更新,相互补充、优化和纠错,输出光流估计结果和目标检测图。此外,为了解决缺少光流真值图这一问题,采用自监督策略对显式运动建模分支进行监督。在两个数据集上的对比实验结果表明,SMHNet有效地提高了视频场景中伪装目标检测的性能。
关键词
视频伪装目标检测
显式运动建模
光流
自监督
Keywords
Video camouflaged object detection
explicit motion handling
optical flow
selfsupervision
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 差异感知的室内场景动态光照在线估计方法
7
作者
刘玉婉
郭智溢
邢冠宇
刘艳丽
机构
四川大学 计算机学院
四川大学视觉合成图形图像技术国家级重点实验室
出处
《计算机应用》
CSCD
北大核心
2024年第S2期184-191,共8页
基金
国家自然科学基金资助项目(62172290)
四川省重点研发计划项目(2023YFS0454)。
文摘
为了提高增强现实场景中虚实融合的真实感,提出一种差异感知的室内场景动态光照在线估计方法。与现有方法直接计算光照参数或生成光照贴图不同,该方法通过估计不同光照条件下场景的光照差异图像实现对于室内场景中光照的动态更新,从而更准确地获取场景动态光照并保留场景中的细节信息。所提方法的卷积神经网络(CNN)包括2个子网络,分别是低动态范围(LDR)图像特征提取网络和光照估计网络。整体网络结构以一张场景内所有主要光源开启时采集的高动态范围(HDR)全景光照贴图作为初始光照贴图,并把该光照贴图与光照变化后的有限视界的LDR图像共同作为输入。首先,基于AlexNet搭建CNN提取LDR图像特征,并在光照估计网络共享编码器中连接这些特征与HDR光照贴图特征;其次,利用U-Net结构,通过引入注意力机制,实现对光照差异图像和光源掩膜的估计,进而实现对场景动态光照的更新。在全景光照贴图的数值评估中,所提方法的均方误差(MSE)指标相较于Gardner方法、Garon方法、EMLight、Guo方法以及耦合的双StyleGAN全景合成网络StyleLight分别降低约79%、65%、38%、17%、87%,其他性能也有所提升。以上从定性和定量方面均证明了所提方法的有效性。
关键词
室内场景
动态光照
深度学习
合成数据集
高动态范围
Keywords
indoor scene
dynamic illumination
deep learning
synthetic dataset
High Dynamic Range(HDR)
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于优化人工势场法的无人机航迹规划
被引量:18
8
作者
王庆禄
吴冯国
郑成辰
李辉
机构
四川大学 计算机学院(软件学院)
四川大学视觉合成图形图像技术国家级重点实验室
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2023年第5期1461-1468,共8页
基金
国家自然科学基金重点项目(U20A20161)资助课题。
文摘
针对传统人工势场(traditional artificial potential field,TAPF)法在无人机航迹规划中存在的局部极小值、斥力过大、无效避障等问题,提出一种优化人工势场法。首先将障碍物斥力进行分解,避免了局部极小值情况;其次重构合力计算方式,避免无人机在障碍密集区域所受斥力过大;最后引入二次碰撞预测方法,减少无人机无效避障的同时保证航迹平滑。在考虑无人机物理约束条件下进行航迹规划实验。仿真结果表明,该方法相较于TAPF法,不仅缩短了规划航线长度,且在航迹平滑性上有明显提升。
关键词
人工势场法
航迹规划
物理约束
碰撞预测
航迹平滑
Keywords
artificial potential field method
path planning
physical constraint
collision predict
smooth trajectory
分类号
V249
[航空宇航科学与技术—飞行器设计]
题名 基于深度随机博弈的近距空战机动决策
被引量:23
9
作者
马文
李辉
王壮
黄志勇
吴昭欣
陈希亮
机构
四川大学 计算机学院
四川大学视觉合成图形图像技术国家级重点实验室
陆军工程大学 指挥控制工程学院
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2021年第2期443-451,共9页
基金
全军装备预研项目(31505550302)资助课题。
文摘
针对空战中作战信息复杂、难以快速准确地感知态势做出决策的问题,提出一种博弈论与深度强化学习相结合的算法。首先,依据一对一典型空战流程,以随机博弈为标准,构建近距空战中红蓝双方对抗条件下的双机多状态博弈模型。其次,利用深度Q网络(deep Q network,DQN)处理战机的连续无限状态空间。然后,使用Minimax算法构建线性规划来求解每个特定状态下阶段博弈的最优值函数,并训练网络逼近值函数。最后,训练完成后根据网络输出求得最优机动策略。空战仿真实验表明,该算法具有较好的适应性和智能性,能够有效地针对空战对手的行动策略实时选择有利的机动动作并占据优势地位。
关键词
博弈论
深度强化学习
随机博弈
空战决策
Keywords
game theory
deep reinforcement learning
stochastic game
air combat strategy
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 潜艇隐蔽效能建模与快速计算
被引量:2
10
作者
刘文
胡术
李辉
机构
四川大学 计算机学院(软件学院)
四川大学视觉合成图形图像技术国家级重点实验室
出处
《舰船科学技术》
北大核心
2023年第6期39-46,共8页
基金
国家自然科学基金资助项目(62101363)。
文摘
针对现有潜艇隐蔽效能模型评估方法单一、计算效率低等问题,构建了基于海洋环境数据与潜艇工况的潜艇隐蔽效能模型,用于潜艇隐蔽性的评估,同时提出一种基于层次细节算法的快速计算方法,用于潜艇隐蔽效能快速计算。首先,通过海洋温盐场计算海洋声速场,利用射线Bellhop模型计算声传播损失值;其次,分析潜艇工况与运动规律和被动声呐投放深度对探测能力的影响,结合概率论和被动声呐方程构建潜艇隐蔽效能模型;然后,利用误差反向传播算法建立BellhopBP模型,采用层次细节算法思想,实现隐蔽效能快速准确的计算。最后,在不同大小和位置的海域进行隐蔽效能仿真实验。实验结果表明,该潜艇隐蔽效能模型和快速计算方法可以快速准确地计算潜艇隐蔽效能,计算效率约提高至现有方法的12~25倍。该研究为潜艇隐蔽航行的航迹规划研究提供参考。
关键词
潜艇隐蔽效能
快速计算
层次细节
建模与仿真
Keywords
submarine concealment effectiveness
fast computation
level of detail
modeling and simulation
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
E843
[军事—战术学]
U676.1
[交通运输工程—船舶及航道工程]
题名 强化学习中的策略重用:研究进展
被引量:5
11
作者
何立
沈亮
李辉
王壮
唐文泉
机构
四川大学 计算机(软件)学院
四川大学视觉合成图形图像技术国家级重点实验室
江西洪都航空工业集团有限责任公司
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2022年第3期884-899,共16页
基金
"十三五"全军共用信息系统装备预研项目(31505550302)资助课题。
文摘
策略重用(policy reuse, PR)作为一种迁移学习(transfer learning, TL)方法,通过利用任务之间的内在联系,将过去学习到的经验、知识用于加速学习当前的目标任务,不仅能够在很大程度上解决传统强化学习(reinforcement learning, RL)收敛速度慢、资源消耗大等问题,而且避免了在相似问题上难以复用的问题。本文综述了RL中的PR方法,将现有方法细分为策略重构、奖励设计、问题转换、相似性度量等方面来分别介绍和分析各自的特点,及其在多智能体场景和深度RL(deep RL, DRL)中的扩展。并且,介绍了源和目标任务之间的映射方法。最后,基于当前PR的应用,叙述了该课题在未来发展方向上的一些猜想和假设。
关键词
强化学习
迁移学习
策略重用
任务映射
Keywords
reinforcement learning(RL)
transfer learning(TL)
policy reuse(PR)
task mapping
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 面向大尺度战场的地貌晕渲增强方法
被引量:2
12
作者
孙胜哲
李辉
机构
四川大学 计算机学院(软件学院)
四川大学视觉合成图形图像技术国家级重点实验室
出处
《计算机系统应用》
2023年第5期11-19,共9页
基金
国家自然科学基金重点项目(U20A20161)。
文摘
地貌晕渲是大尺度战场仿真中的重要一环,针对现有的地貌晕渲技术在细节处纹理特征不明显的问题,提出了一种结合高程曲率和环境光遮蔽的大尺度战场地貌晕渲增强方法.第1步,通过分析数字高程数据的曲率属性生成地形曲率图,曲率图与卫星影像叠加可以突出显示地貌特征线.第2步,提出一种基于深度可分离卷积的环境光遮蔽计算方法,能够增强战场地形在沟壑处的视觉表现.最后将曲率图、环境光遮蔽与卫星影像三者融合生成实时地貌晕渲效果.实验表明,本文方法可以在较低级别的全球卫星影像上呈现更好的视觉效果,使得观察者在把握三维地形整体走势的同时,能进一步分析地貌细节处的纹理特征.
关键词
战场仿真
地貌晕渲
平面曲率
环境光遮蔽
深度可分离卷积
Keywords
battlefield simulation
relief shading
plan curvature
ambient occlusion
depthwise separable convolution
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
E91
[军事]
题名 一种改进的航迹聚类方法
被引量:2
13
作者
张勇
张建伟
韩云祥
机构
四川大学 空天科学与工程学院
四川大学 计算机学院
四川大学视觉合成图形图像技术国家级重点实验室
出处
《现代计算机》
2020年第18期11-18,共8页
基金
四川省科技计划(成果转化项目):基于地空通话语音识别的空管指挥安全监控系统(No.2019ZHCG0089)。
文摘
针对现有处理轨迹数据的聚类算法大多数存在时间复杂度高,聚类效果达不到处理预期的情况,提出一种基于快速DTW距离度量的并行剪枝层次聚类算法。在计算不同轨迹之间的相似度过程中采用快速DTW算法取代计算效果较差的欧氏距离度量算法;合并簇与更新距离矩阵由单步运算改为批次运算,加快收敛速度;对于远离聚类中心的离群轨迹及时剪枝,减少不必要的合并簇与更新距离矩阵操作。通过处理大规模航迹数据,可视化聚类过程,相较于目前常用的层次聚类算法时间复杂度降低20%,基于真实飞行数据验证该算法的有效性。
关键词
轨迹聚类
快速DTW
相似性度量
层次聚类
Keywords
Tracks Clustering
FastDTW
Similarity Measure
Hierarchical Clustering
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
V355
[航空宇航科学与技术—人机与环境工程]
题名 联合组间对抗数据混合与变换器学习的协同显著性检测
14
作者
吴泱
宋慧慧
张开华
陈虎
刘青山
机构
南京信息工程大学 自动化学院
南京信息工程大学 计算机与软件学院数字取证教育部工程研究中心
四川大学视觉合成图形图像技术国家级重点实验室
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2023年第9期1838-1854,共17页
基金
科技创新2030-“新一代人工智能”重大项目(No.2018AAA0100400)
国家自然科学基金项目(No.61876088,61872189,62276141,U20B2065,61532009)
+1 种基金
江苏省333工程人才项目(No.BRA2020291)
视觉合成图形图像技术国家级重点实验室开放研究项目(No.2021SCUVS001)资助。
文摘
协同显著性检测旨在发现并分割出一组图像中相同语义类别的前景显著目标.当前基于深度学习的协同显著性检测方法主要存在两方面局限:(1)训练数据中仅含有单一显著目标,无法为模型训练提供对抗样本,导致其泛化性受限,难以有效应对未知类别目标、干扰显著目标、嘈杂背景等挑战;(2)现有方法通常利用卷积神经网络提取特征,其感受野受限,无法建模长程依赖关系,限制了所学特征的表征力.为此,本文提出了一种新颖的基于组间对抗数据混合的协同显著性检测变换器,旨在通过纯视觉变换器构建序列到序列的协同显著性检测网络,并使用组间混合后的数据进行对抗训练,以提升模型的泛化性.所设计的网络结构包含数据混合子网络和协同显著性检测变换器两部分.具体而言,在数据混合子网络中,本文设计了目标细化模块,输入类激活图,引导网络以无监督的方式从一组图像中分割出边缘平滑的显著目标作为对抗对象,并通过设计调距模块将对抗对象以最小化重叠的方式混合至另一组图像之中,生成混合训练数据;在协同显著性检测变换器中,本文从序列建模的角度,设计了任务注入器,将组信息图符与显著性信息图符注入序列特征之中,并利用自注意力机制充分捕获特征之间的全局上下文信息.最后,将获得的组特征和显著性特征通过自注意力机制进行充分混合交互,以进一步增强特征的表征力,生成精确的协同显著性检测结果.本文在包含Cosal2015、Co CA和Co SOD3k等三个基准数据集上做了充分的实验评估,与多个领先方法的对比结果充分证明了本方法的优越性能.
关键词
数据混合
变换器
协同显著性检测
大数据
Keywords
mixup
transformer
co-salient object detection
big-data
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于多维度匹配的知识库问答实体链接
15
作者
张森
张攀
机构
四川大学 计算机学院
四川大学视觉合成图形图像技术国家级重点实验室
出处
《现代计算机》
2021年第12期8-13,18,共7页
基金
四川省科技计划项目(重点研发项目)(No.2020YFG0327、2020YFG0306)。
文摘
目前知识库问答的实体链接主要存在如下困难:问句实体名拼写不规范;知识库中存在大量缺乏区分特征的相似实体;问句缺乏上下文。为了解决上述问题,提出一种多维度匹配的实体链接方法,分别对文本、统计与实体属性维度逐步进行匹配实体候选集。其中,文本维度设置多级阈值,从知识库筛选出合理大小的实体候选集;统计维度根据实体热度得分,对实体候选集进行重排序;实体属性维度利用基于Transformer的关系预测模型对问句中实体关系进行预测,根据实体关系匹配出最终链接的实体。该方法在SimpleQuestions数据集上的准确度达到85.46%,较现有模型提升3.8%。
关键词
知识库问答
实体对齐
多维度匹配
TRANSFORMER
SimpleQuestions
Keywords
Knowledge Base Question Answering
Entity Linking
Multi-Dimensional Matching
Transformer
SimpleQuestions
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于绝对相位靶的摄像机标定仿真与实验研究
被引量:4
16
作者
安世勇
朱江平
杨红雨
周佩
肖雯帆
朱昌会
机构
四川大学视觉合成图形图像技术国家级重点实验室
四川大学 计算机学院
出处
《激光与光电子学进展》
CSCD
北大核心
2022年第4期262-273,共12页
基金
国家自然科学基金(61901287)
四川省重点研发专项(2021YFG0195,2020YFG0112,2020YFG0306)
四川省重大科技专项(2019ZDZX0039,2018GZDZX0029)。
文摘
摄像机标定是结构光三维传感技术中联系测量系统内外参数与三维坐标之间的重要环节。基于灰度信息提取特征点的摄像机标定方法易受图像噪声、对比度等因素的影响。提出一种基于绝对相位靶(APT)的摄像机标定方法,采用时间相位展开算法计算绝对相位,提取相位值为4π整数倍的特征点,采用局部窗口最小二乘拟合算法计算特征点的精确亚像素坐标,进而建立特征点的图像坐标与世界坐标的对应关系。通过仿真实验,分析不同高斯噪声和模糊条件下摄像机参数的绝对误差变化,发现相对于传统的棋盘格和圆点标定法,所提APT标定法对图像噪声和模糊具有更好的鲁棒性,且具有更高的标定精度。真实的对比实验显示,APT标定方法的标定精度优于棋盘格和圆点标定法,尤其在“离焦”(标靶处于相机有效工作距离之外)情况下可将重投影误差降低58.68%,证明了APT标定方法的有效性和可行性。
关键词
测量
摄像机标定
相移条纹
绝对相位
特征点提取
亚像素拟合
Keywords
measurement
camera calibration
phase-shifting fringe
absolute phase
feature point detection
subpixel fitting
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 红外-可见光跨模态的行人检测综述
被引量:4
17
作者
别倩
王晓
徐新
赵启军
王正
陈军
胡瑞敏
机构
武汉科技大学 计算机科学与技术 学院
武汉科技大学 智能信息处理与实时工业系统湖北省重点 实验室
四川大学视觉合成图形图像技术国家级重点实验室
武汉大学 多媒体网络通信工程湖北省重点 实验室
出处
《中国图象图形学报》
CSCD
北大核心
2023年第5期1287-1307,共21页
基金
国家自然科学基金项目(U1803262,62071338)
省级大学生创新创业训练计划项目(S202210488063)
+1 种基金
湖北省资助项目(D20211106,2022CFB018)
四川大学视觉合成图形图像技术国家级重点实验室开放课题项目(2021SCUVS003)。
文摘
可见光图像在光照充足的条件下可以提供一系列辅助检测行人的信息,如颜色和纹理等信息,但在低照度场景下表现并不理想。红外图像虽然不能提供颜色和纹理信息,但红外图像根据热辐射差异成像而不依赖于光照条件这一特性,使其可以在低照度场景下有效区分行人区域与背景区域并提供清晰的行人轮廓信息。由于红外和可见光两种模态之间直观的互补性,同时使用红外和可见光图像的行人检测任务被认为是一个很有前景的研究方向,受到了广泛关注,大幅促进了在安防(如安全监控和自动驾驶)和疫情防控等领域应用的发展。本文对红外—可见光跨模态的行人检测工作进行全面梳理,并对未来方向进行深入思考。首先,该课题具有独特性质。可见光图像对应三通道的颜色信息而红外图像对应单通道的温差信息,如何在两种模态存在本质差异的前提下,充分利用二者的互补性是红外—可见光跨模态行人检测领域的核心挑战和主要任务。其次,近几年红外—可见光跨模态行人检测研究针对的问题可分为两类,即模态差异大和实际应用难。针对模态差异大的问题,可分为图像未对准和融合不充分两类问题。针对实际应用难的问题,又分为标注成本、实时检测和硬件成本3类问题。本文依次对跨模态行人检测的主要研究方向展开细致且全面的描述并进行相应的总结。然后,详细地介绍与跨模态行人检测相关的数据集和评价指标,并以不同的评价指标对相关方法在不同层面上进行比较。最后,对跨模态行人检测领域存在的且尚未解决的问题进行讨论,并提出对未来相关工作方向的一些思考。
关键词
跨模态行人检测
可见光图像
红外图像
深度学习
行人检测
Keywords
cross-modal pedestrian detection
visible image
infrared image
deep learning
pedestrian detection
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 注意力机制的曲面沉浸式投影系统补偿
被引量:2
18
作者
雷清桦
杨婷
程鹏
机构
四川大学视觉合成图形图像技术国家级重点实验室
四川大学 计算机学院
四川大学 空天科学与工程学院
出处
《中国图象图形学报》
CSCD
北大核心
2022年第4期1238-1250,共13页
基金
国家自然科学基金项目(U183310179)
四川省科技厅重点研发项目(2021YFG0300)。
文摘
目的沉浸式投影系统已广泛运用于虚拟现实系统之中,然而沉浸式投影系统中的互反射现象严重影响着虚拟现实系统的落地使用。沉浸式投影系统的互反射是指由于投影机光线和屏幕反射光线相互叠加造成的亮度冗余现象,严重影响了投影系统的成像质量和人眼的视觉感受。为此,本文提出一种新的基于互反射通道(interreflection channel,IRC)先验和注意力机制的神经网络。方法IRC先验基于这样一个事实,即大多数受到互反射影响的投影图像都包含一些亮度较高的区域。高亮度区域往往受互反射影响更为严重,而低亮度区域受互反射影响程度较低。根据这一规律,采用IRC先验作为注意力图的监督样本,获取补偿图像的亮度区域信息。同时,为了对投影图像不同区域按影响程度进行差异化补偿,提出一种新的由两个相同子网络构成的补偿网络结构Pair-Net。结果实验对比了4种现有方法,Pair-Net在ROI(region of interesting)指标分析上取得了明显优势,在人眼感受上有显著的效果提升。结论本文提出的基于注意力机制的网络模型能够针对不同区域进行差异化补偿,很大程度上消除了互反射影响,提升了沉浸式投影系统的成像质量。
关键词
沉浸式投影系统
互反射补偿
深度学习
注意力机制
虚拟现实
Keywords
immersive projection system
inter-reflection compensation
deep learning
attention mechanism
virtual reality
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]