人群数量估计是人群管理系统的关键,对于预防踩踏事故和引导人群至关重要,已成为一个日益重要的任务和具有挑战性的研究方向。本文提出一种数据相关的拆分注意力机制的编码器-解码器结构的人群计数方法,称为DNe StCount。为应对视频监...人群数量估计是人群管理系统的关键,对于预防踩踏事故和引导人群至关重要,已成为一个日益重要的任务和具有挑战性的研究方向。本文提出一种数据相关的拆分注意力机制的编码器-解码器结构的人群计数方法,称为DNe StCount。为应对视频监控的尺度变化和透视失真的挑战,将更密集的空洞采样比率应用到密集空洞空间金字塔池化模块DASPP设计中。为提升密度图估计的准确性,将可学习的、数据相关的上采样方法 DUpsampling应用到特征聚合模块DFA设计中。为弥补欧几里德损失可能存在对离群值敏感、训练不稳定等缺点,采用Smooth L1损失设计损失函数。在具有挑战性的数据集上进行的实验和分析表明,本文提出的人群计数方法 DNe St Count与其他主流方法相比更具有竞争力。展开更多
由于大气雾和气溶胶的存在,图像能见度显著下降且色彩失真,给高级图像识别带来极大困难.现有的图像去雾算法常存在过度增强、细节丢失和去雾不充分等问题.针对过度增强和去雾不充分的问题,本文提出了一种基于频率和注意力机制的图像去...由于大气雾和气溶胶的存在,图像能见度显著下降且色彩失真,给高级图像识别带来极大困难.现有的图像去雾算法常存在过度增强、细节丢失和去雾不充分等问题.针对过度增强和去雾不充分的问题,本文提出了一种基于频率和注意力机制的图像去雾算法(frequency and attention mechanism of the image dehazing network,FANet).该算法采用编码器-解码器结构,通过构建双分支频率提取模块获取全局和局部的高低频信息.构建频率融合模块调整高低频信息的权重占比,并在下采样过程中引入附加通道-像素模块和通道-像素注意力模块,以优化去雾效果.实验结果显示,FANet在SOTS-indoor数据集上的PSNR和SSIM分别为40.07 dB和0.9958,在SOTS-outdoor数据集上分别为39.77 dB和0.9958.同时,该算法也在HSTS和Haze4k测试集上取得了不错的结果,与其他去雾算法相比有效缓解了颜色失真和去雾不彻底等问题.展开更多
为解决光在水下传播过程中由吸收与散射效应导致的水下图像模糊、对比度低和颜色失真问题,提出一种基于Inception-Residual和生成对抗网络的水下图像增强算法。首先,将退化水下图像缩放至256×256×3大小,以获得用于训练模型的...为解决光在水下传播过程中由吸收与散射效应导致的水下图像模糊、对比度低和颜色失真问题,提出一种基于Inception-Residual和生成对抗网络的水下图像增强算法。首先,将退化水下图像缩放至256×256×3大小,以获得用于训练模型的数据集。接着,将Inception模块、残差思想、编码解码结构和生成对抗网络相结合,构建IRGAN(Generative Adversarial Network with Inception-Residual)模型来增强水下图像。然后,利用全局相似性、内容感知和色彩感知构造多项损失函数,约束生成网络和判别网络的对抗训练。最后,通过训练好的模型对退化水下图像进行处理以获得清晰的水下图像。实验结果表明与现有增强方法相比,所提算法增强的水下图像在PSNR、UIQM和IE指标上的平均值分别比第二名提升13.6%、4.1%和0.9%。在主观感知和客观评估中,增强后的水下图像在清晰度、对比度增强和颜色校正方面均得到改善。展开更多
文摘人群数量估计是人群管理系统的关键,对于预防踩踏事故和引导人群至关重要,已成为一个日益重要的任务和具有挑战性的研究方向。本文提出一种数据相关的拆分注意力机制的编码器-解码器结构的人群计数方法,称为DNe StCount。为应对视频监控的尺度变化和透视失真的挑战,将更密集的空洞采样比率应用到密集空洞空间金字塔池化模块DASPP设计中。为提升密度图估计的准确性,将可学习的、数据相关的上采样方法 DUpsampling应用到特征聚合模块DFA设计中。为弥补欧几里德损失可能存在对离群值敏感、训练不稳定等缺点,采用Smooth L1损失设计损失函数。在具有挑战性的数据集上进行的实验和分析表明,本文提出的人群计数方法 DNe St Count与其他主流方法相比更具有竞争力。
文摘由于大气雾和气溶胶的存在,图像能见度显著下降且色彩失真,给高级图像识别带来极大困难.现有的图像去雾算法常存在过度增强、细节丢失和去雾不充分等问题.针对过度增强和去雾不充分的问题,本文提出了一种基于频率和注意力机制的图像去雾算法(frequency and attention mechanism of the image dehazing network,FANet).该算法采用编码器-解码器结构,通过构建双分支频率提取模块获取全局和局部的高低频信息.构建频率融合模块调整高低频信息的权重占比,并在下采样过程中引入附加通道-像素模块和通道-像素注意力模块,以优化去雾效果.实验结果显示,FANet在SOTS-indoor数据集上的PSNR和SSIM分别为40.07 dB和0.9958,在SOTS-outdoor数据集上分别为39.77 dB和0.9958.同时,该算法也在HSTS和Haze4k测试集上取得了不错的结果,与其他去雾算法相比有效缓解了颜色失真和去雾不彻底等问题.
文摘为解决光在水下传播过程中由吸收与散射效应导致的水下图像模糊、对比度低和颜色失真问题,提出一种基于Inception-Residual和生成对抗网络的水下图像增强算法。首先,将退化水下图像缩放至256×256×3大小,以获得用于训练模型的数据集。接着,将Inception模块、残差思想、编码解码结构和生成对抗网络相结合,构建IRGAN(Generative Adversarial Network with Inception-Residual)模型来增强水下图像。然后,利用全局相似性、内容感知和色彩感知构造多项损失函数,约束生成网络和判别网络的对抗训练。最后,通过训练好的模型对退化水下图像进行处理以获得清晰的水下图像。实验结果表明与现有增强方法相比,所提算法增强的水下图像在PSNR、UIQM和IE指标上的平均值分别比第二名提升13.6%、4.1%和0.9%。在主观感知和客观评估中,增强后的水下图像在清晰度、对比度增强和颜色校正方面均得到改善。