期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于解纠缠表示学习的人脸反欺骗算法 被引量:1
1
作者 周毅岩 石亮 +1 位作者 张遨 岳晓宇 《计算机应用研究》 CSCD 北大核心 2024年第8期2502-2507,共6页
针对现有人脸反欺骗模型面对不同应用场景识别精度低、泛化性能不佳的问题,引入解纠缠表示学习,提出一种基于解纠缠表示学习的人脸反欺骗方法。该方法采用U-Net架构和ResNet-18作为编/解码器。首阶段训练中,通过输入真实样本使得编码器... 针对现有人脸反欺骗模型面对不同应用场景识别精度低、泛化性能不佳的问题,引入解纠缠表示学习,提出一种基于解纠缠表示学习的人脸反欺骗方法。该方法采用U-Net架构和ResNet-18作为编/解码器。首阶段训练中,通过输入真实样本使得编码器仅学习到真实样本相关信息。第二阶段,构建对抗性学习网络,输入不具标签的样本,将预训练的编码器输出和新编码器输出进行特征融合,由解码器重建图像,在鉴别器中与原始图像进行对抗训练,以实现特征的解耦。模型与一些经典人脸反欺骗方法相比,有着更好的检测性能,在OULU-NPU数据集的数个实验中,最低的检测错误率仅为0.8%,表现优于STDN等经典检测方法。该人脸反欺骗方法通过分阶段训练的方式,使得模型在对抗性训练中获得了相比端到端模型更具判别性的特征表示,在欺骗特征图输出阶段采用多分类策略,减小了不同的图像噪声对分类结果的影响,在公开数据集上的实验验证了算法的有效性。 展开更多
关键词 人脸反欺骗 解纠缠表示学习 多分类 域泛化
在线阅读 下载PDF
解纠缠表示学习在跨年龄人脸识别中的应用 被引量:2
2
作者 陈莉明 田茂 颜佳 《计算机应用研究》 CSCD 北大核心 2021年第11期3500-3505,共6页
跨年龄人脸识别因其在现实生活中的广泛应用而成为人脸识别领域的热门话题。针对跨年龄人脸识别精度较低的问题,引入解纠缠表示学习,提出了一个基于生成对抗网络的解纠缠表示学习(IPDRL)网络来实现人脸图像的识别。该网络由编码器、生... 跨年龄人脸识别因其在现实生活中的广泛应用而成为人脸识别领域的热门话题。针对跨年龄人脸识别精度较低的问题,引入解纠缠表示学习,提出了一个基于生成对抗网络的解纠缠表示学习(IPDRL)网络来实现人脸图像的识别。该网络由编码器、生成器和鉴别器构成。编码器在对特征中的年龄变化进行解纠缠的同时,对人脸图像的身份信息进行编码,提取只利于身份鉴别的特征,实现身份特征和年龄特征的解纠缠;生成器根据输入的年龄特征生成对应的身份保持的年龄图像;鉴别器通过对抗学习和多任务学习实现年龄和身份的类分布预测。通过将解纠缠表示学习、对抗学习和多任务学习相结合的方法,很好地保留了人脸图像的身份信息,并使跨年龄人脸图像识别的精度得到了提高。 展开更多
关键词 人脸识别 解纠缠表示学习 多任务学习 生成对抗网络
在线阅读 下载PDF
基于跨媒体解纠缠表示学习的风格化图像描述生成 被引量:1
3
作者 蔺泽浩 李国趸 +3 位作者 曾祥极 邓悦 张寅 庄越挺 《计算机学报》 EI CAS CSCD 北大核心 2022年第12期2510-2527,共18页
风格化图像描述生成的文本不仅被要求在语义上与给定的图像一致,而且还要与给定的语言风格保持一致.随着神经网络在计算机视觉和自然语言生成领域的技术发展,有关这个主题的最新研究取得了显著进步.但是,神经网络模型作为一种黑盒系统,... 风格化图像描述生成的文本不仅被要求在语义上与给定的图像一致,而且还要与给定的语言风格保持一致.随着神经网络在计算机视觉和自然语言生成领域的技术发展,有关这个主题的最新研究取得了显著进步.但是,神经网络模型作为一种黑盒系统,人类仍然很难理解其隐层空间中参数所代表的风格、事实及它们之间的关系.为了提高对隐层空间中包含的事实内容和语言风格属性的理解以及增强对两者的控制能力,提高神经网络的可控性和可解释性,本文提出了一种使用解纠缠技术的新型风格化图像描述生成模型Disentangled Stylized Image Caption(DSIC).该模型分别从图像和描述文本中非对齐地学习解纠缠表示,具体使用了两个解纠缠表示学习模块——D-Images和D-Captions来分别学习图像和图像描述中解纠缠的事实信息和风格信息.在推理阶段,DSIC模型利用图像描述生成解码器以及一种特别设计的基于胶囊网络的信息聚合方法来充分利用先前学习的跨媒体信息表示,并通过直接控制隐层向量来生成目标风格的图像描述.本文在SentiCap数据集和FlickrStyle10K数据集上进行了相关实验.解纠缠表示学习的实验结果证明了模型解纠缠的有效性,而风格化图像描述生成实验结果则证明了聚合的跨媒体解纠缠表示可以带来更好的风格化图像描述生成性能,相对于对比的风格化图像描述生成模型,本文方法在多个指标上的性能提升了17%至86%. 展开更多
关键词 跨媒体 机器学习 解纠缠表示学习 风格化图像描述生成 自然语言生成
在线阅读 下载PDF
基于属性解纠缠表示的交互式服装图像检索
4
作者 黄晓菊 陈金广 《计算机与数字工程》 2025年第3期829-834,共6页
交互式服装检索可以将查询图像中的特定属性替换为目标属性,以更新检索结果。然而属性学习嵌入空间存在语义纠缠,改变特定属性会导致其他属性发生改变,限制了检索结果的可控性和有效性。为了解决该问题,论文提出了一种属性保持解纠缠表... 交互式服装检索可以将查询图像中的特定属性替换为目标属性,以更新检索结果。然而属性学习嵌入空间存在语义纠缠,改变特定属性会导致其他属性发生改变,限制了检索结果的可控性和有效性。为了解决该问题,论文提出了一种属性保持解纠缠表示学习(APDRL)网络来实现服装的交互式检索。首先,该网络为服装图像每种属性类型学习特定的子空间,以获得属性分离表示;其次,利用联合损失函数优化网络模型;最后,根据内存块中的每个属性原型嵌入,操纵向量将查询图像中特定属性修改为目标属性。在DeepFashion数据集上测试,实验结果表明:APDRL方法在保留服装固定属性的同时还可以修改目标属性,具有较强的可控性和实用性,优于其他主流的检索算法。 展开更多
关键词 交互式服装检索 解纠缠表示学习 DeepFashion 目标属性 损失函数
在线阅读 下载PDF
基于改进高斯混合变分自编码器的半监督情感音乐生成 被引量:1
5
作者 胥备 刘桐 《计算机科学》 CSCD 北大核心 2024年第8期281-296,共16页
音乐可以通过序列化的声音信息传递声音内容和情感。情感是音乐所表达的语义中的重要组成部分,因此,音乐生成技术不仅要考虑音乐的结构信息,还应融入情感元素。现有的情感音乐生成技术大多采用基于情感标注的完全监督方法,但音乐领域缺... 音乐可以通过序列化的声音信息传递声音内容和情感。情感是音乐所表达的语义中的重要组成部分,因此,音乐生成技术不仅要考虑音乐的结构信息,还应融入情感元素。现有的情感音乐生成技术大多采用基于情感标注的完全监督方法,但音乐领域缺乏大量标准的情感标注数据集,且情感标签不足以表达音乐的情感特征。针对上述问题,提出了基于改进的高斯混合变分自编码器(Gaussian Mixture Variational Autoencoders,GMVAE)的半监督情感音乐生成方法(Semg-GMVAE),将音乐的节奏特征和调式特征与情感建立联系,同时向GMVAE中引入一种特征解纠缠机制来分别学习这两种特征的潜在变量表示,并对其进行半监督聚类推断。最后通过操纵音乐的特征表示,实现了针对快乐、紧张、悲伤、平静情感的音乐生成与情感转换。同时,针对GMVAE难以区分不同情感类别数据的问题,实验指出其关键原因是GMVAE证据下界中的方差正则项与互信息抑制项使得各类别的高斯分量分散性不足,从而影响学习表示的性能和生成的数据样本的情感质量。因此,Semg-GMVAE对这两项因子分别进行了惩罚和增强,并使用Transformer-XL作为编码器和解码器以提升在长序列音乐上的建模能力。基于真实数据集的实验结果表明,相比现有方法,Semg-GMVAE能够将不同情感的音乐在潜在空间中更好地分离,增强了音乐与情感的关联程度,并且能够有效对不同音乐特征进行解纠缠分离,最后通过改变特征表示更好地实现情感音乐生成或情感切换。 展开更多
关键词 情感音乐生成 半监督生成模型 解纠缠表示学习 高斯混合变分自编码器 Transformer-XL
在线阅读 下载PDF
基于多对抗性鉴别网络的人脸活体检测 被引量:1
6
作者 任拓 闫玮 +6 位作者 况立群 谢剑斌 谌钟毓 高峰 郭锐 束伟 谢昌颐 《计算机工程与科学》 CSCD 北大核心 2023年第9期1611-1620,共10页
人脸活体检测是人脸识别系统安全性保证的关键,其中,解纠缠学习方法可以有效解决人脸活体检测中泛化数据集的问题,但是现有的解纠缠学习方法往往将整幅人脸图像作为输入,解析出伪造痕迹元素,会忽略伪造痕迹的局部细节问题。针对这一问题... 人脸活体检测是人脸识别系统安全性保证的关键,其中,解纠缠学习方法可以有效解决人脸活体检测中泛化数据集的问题,但是现有的解纠缠学习方法往往将整幅人脸图像作为输入,解析出伪造痕迹元素,会忽略伪造痕迹的局部细节问题。针对这一问题,改进现有的伪造痕迹解纠缠网络,提出多对抗性鉴别网络模型,在鉴别器中设计主鉴别器和区域鉴别器,引入人脸遮罩模块,生成人脸皮肤、五官遮罩蒙版,整合人脸局部信息,使生成器拟合的图像更接近数据集中人脸图像的分布,同时解离出加强版的伪造痕迹。提出的多对抗性鉴别网络有效地增强了伪造人脸图像的伪造痕迹信息并提高了人脸活体检测的准确率。具体来说,该网络模型在OULU-NPU数据集的2个实验中的检测错误率仅为0.8%和1.4%,相比STDN错误率显著降低,同时在Idiap Replay-Attack数据集上也达到了较好的检测效果。为了验证该网络模型的可迁移性,在NUAA数据集和Idiap Replay-Attack数据集上进行跨域实验,达到了不错的效果。 展开更多
关键词 人脸识别 活体检测 生成对抗网络 解纠缠表示学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部