期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于属性解纠缠表示的交互式服装图像检索
1
作者
黄晓菊
陈金广
《计算机与数字工程》
2025年第3期829-834,共6页
交互式服装检索可以将查询图像中的特定属性替换为目标属性,以更新检索结果。然而属性学习嵌入空间存在语义纠缠,改变特定属性会导致其他属性发生改变,限制了检索结果的可控性和有效性。为了解决该问题,论文提出了一种属性保持解纠缠表...
交互式服装检索可以将查询图像中的特定属性替换为目标属性,以更新检索结果。然而属性学习嵌入空间存在语义纠缠,改变特定属性会导致其他属性发生改变,限制了检索结果的可控性和有效性。为了解决该问题,论文提出了一种属性保持解纠缠表示学习(APDRL)网络来实现服装的交互式检索。首先,该网络为服装图像每种属性类型学习特定的子空间,以获得属性分离表示;其次,利用联合损失函数优化网络模型;最后,根据内存块中的每个属性原型嵌入,操纵向量将查询图像中特定属性修改为目标属性。在DeepFashion数据集上测试,实验结果表明:APDRL方法在保留服装固定属性的同时还可以修改目标属性,具有较强的可控性和实用性,优于其他主流的检索算法。
展开更多
关键词
交互式服装检索
解纠缠表示
学习
DeepFashion
目标属性
损失函数
在线阅读
下载PDF
职称材料
基于解纠缠表示学习的人脸反欺骗算法
被引量:
1
2
作者
周毅岩
石亮
+1 位作者
张遨
岳晓宇
《计算机应用研究》
CSCD
北大核心
2024年第8期2502-2507,共6页
针对现有人脸反欺骗模型面对不同应用场景识别精度低、泛化性能不佳的问题,引入解纠缠表示学习,提出一种基于解纠缠表示学习的人脸反欺骗方法。该方法采用U-Net架构和ResNet-18作为编/解码器。首阶段训练中,通过输入真实样本使得编码器...
针对现有人脸反欺骗模型面对不同应用场景识别精度低、泛化性能不佳的问题,引入解纠缠表示学习,提出一种基于解纠缠表示学习的人脸反欺骗方法。该方法采用U-Net架构和ResNet-18作为编/解码器。首阶段训练中,通过输入真实样本使得编码器仅学习到真实样本相关信息。第二阶段,构建对抗性学习网络,输入不具标签的样本,将预训练的编码器输出和新编码器输出进行特征融合,由解码器重建图像,在鉴别器中与原始图像进行对抗训练,以实现特征的解耦。模型与一些经典人脸反欺骗方法相比,有着更好的检测性能,在OULU-NPU数据集的数个实验中,最低的检测错误率仅为0.8%,表现优于STDN等经典检测方法。该人脸反欺骗方法通过分阶段训练的方式,使得模型在对抗性训练中获得了相比端到端模型更具判别性的特征表示,在欺骗特征图输出阶段采用多分类策略,减小了不同的图像噪声对分类结果的影响,在公开数据集上的实验验证了算法的有效性。
展开更多
关键词
人脸反欺骗
解纠缠表示
学习
多分类
域泛化
在线阅读
下载PDF
职称材料
解纠缠表示学习在跨年龄人脸识别中的应用
被引量:
2
3
作者
陈莉明
田茂
颜佳
《计算机应用研究》
CSCD
北大核心
2021年第11期3500-3505,共6页
跨年龄人脸识别因其在现实生活中的广泛应用而成为人脸识别领域的热门话题。针对跨年龄人脸识别精度较低的问题,引入解纠缠表示学习,提出了一个基于生成对抗网络的解纠缠表示学习(IPDRL)网络来实现人脸图像的识别。该网络由编码器、生...
跨年龄人脸识别因其在现实生活中的广泛应用而成为人脸识别领域的热门话题。针对跨年龄人脸识别精度较低的问题,引入解纠缠表示学习,提出了一个基于生成对抗网络的解纠缠表示学习(IPDRL)网络来实现人脸图像的识别。该网络由编码器、生成器和鉴别器构成。编码器在对特征中的年龄变化进行解纠缠的同时,对人脸图像的身份信息进行编码,提取只利于身份鉴别的特征,实现身份特征和年龄特征的解纠缠;生成器根据输入的年龄特征生成对应的身份保持的年龄图像;鉴别器通过对抗学习和多任务学习实现年龄和身份的类分布预测。通过将解纠缠表示学习、对抗学习和多任务学习相结合的方法,很好地保留了人脸图像的身份信息,并使跨年龄人脸图像识别的精度得到了提高。
展开更多
关键词
人脸识别
解纠缠表示
学习
多任务学习
生成对抗网络
在线阅读
下载PDF
职称材料
基于跨媒体解纠缠表示学习的风格化图像描述生成
被引量:
1
4
作者
蔺泽浩
李国趸
+3 位作者
曾祥极
邓悦
张寅
庄越挺
《计算机学报》
EI
CAS
CSCD
北大核心
2022年第12期2510-2527,共18页
风格化图像描述生成的文本不仅被要求在语义上与给定的图像一致,而且还要与给定的语言风格保持一致.随着神经网络在计算机视觉和自然语言生成领域的技术发展,有关这个主题的最新研究取得了显著进步.但是,神经网络模型作为一种黑盒系统,...
风格化图像描述生成的文本不仅被要求在语义上与给定的图像一致,而且还要与给定的语言风格保持一致.随着神经网络在计算机视觉和自然语言生成领域的技术发展,有关这个主题的最新研究取得了显著进步.但是,神经网络模型作为一种黑盒系统,人类仍然很难理解其隐层空间中参数所代表的风格、事实及它们之间的关系.为了提高对隐层空间中包含的事实内容和语言风格属性的理解以及增强对两者的控制能力,提高神经网络的可控性和可解释性,本文提出了一种使用解纠缠技术的新型风格化图像描述生成模型Disentangled Stylized Image Caption(DSIC).该模型分别从图像和描述文本中非对齐地学习解纠缠表示,具体使用了两个解纠缠表示学习模块——D-Images和D-Captions来分别学习图像和图像描述中解纠缠的事实信息和风格信息.在推理阶段,DSIC模型利用图像描述生成解码器以及一种特别设计的基于胶囊网络的信息聚合方法来充分利用先前学习的跨媒体信息表示,并通过直接控制隐层向量来生成目标风格的图像描述.本文在SentiCap数据集和FlickrStyle10K数据集上进行了相关实验.解纠缠表示学习的实验结果证明了模型解纠缠的有效性,而风格化图像描述生成实验结果则证明了聚合的跨媒体解纠缠表示可以带来更好的风格化图像描述生成性能,相对于对比的风格化图像描述生成模型,本文方法在多个指标上的性能提升了17%至86%.
展开更多
关键词
跨媒体
机器学习
解纠缠表示
学习
风格化图像描述生成
自然语言生成
在线阅读
下载PDF
职称材料
基于改进高斯混合变分自编码器的半监督情感音乐生成
被引量:
1
5
作者
胥备
刘桐
《计算机科学》
CSCD
北大核心
2024年第8期281-296,共16页
音乐可以通过序列化的声音信息传递声音内容和情感。情感是音乐所表达的语义中的重要组成部分,因此,音乐生成技术不仅要考虑音乐的结构信息,还应融入情感元素。现有的情感音乐生成技术大多采用基于情感标注的完全监督方法,但音乐领域缺...
音乐可以通过序列化的声音信息传递声音内容和情感。情感是音乐所表达的语义中的重要组成部分,因此,音乐生成技术不仅要考虑音乐的结构信息,还应融入情感元素。现有的情感音乐生成技术大多采用基于情感标注的完全监督方法,但音乐领域缺乏大量标准的情感标注数据集,且情感标签不足以表达音乐的情感特征。针对上述问题,提出了基于改进的高斯混合变分自编码器(Gaussian Mixture Variational Autoencoders,GMVAE)的半监督情感音乐生成方法(Semg-GMVAE),将音乐的节奏特征和调式特征与情感建立联系,同时向GMVAE中引入一种特征解纠缠机制来分别学习这两种特征的潜在变量表示,并对其进行半监督聚类推断。最后通过操纵音乐的特征表示,实现了针对快乐、紧张、悲伤、平静情感的音乐生成与情感转换。同时,针对GMVAE难以区分不同情感类别数据的问题,实验指出其关键原因是GMVAE证据下界中的方差正则项与互信息抑制项使得各类别的高斯分量分散性不足,从而影响学习表示的性能和生成的数据样本的情感质量。因此,Semg-GMVAE对这两项因子分别进行了惩罚和增强,并使用Transformer-XL作为编码器和解码器以提升在长序列音乐上的建模能力。基于真实数据集的实验结果表明,相比现有方法,Semg-GMVAE能够将不同情感的音乐在潜在空间中更好地分离,增强了音乐与情感的关联程度,并且能够有效对不同音乐特征进行解纠缠分离,最后通过改变特征表示更好地实现情感音乐生成或情感切换。
展开更多
关键词
情感音乐生成
半监督生成模型
解纠缠表示
学习
高斯混合变分自编码器
Transformer-XL
在线阅读
下载PDF
职称材料
基于因子级特征与属性偏好联合学习的会话推荐
6
作者
林浩
陈平华
《广东工业大学学报》
CAS
2024年第6期91-100,共10页
针对序列短、数据稀疏、难以泛化导致的会话推荐准确率不高问题,提出了因子级特征与属性偏好联合学习的会话推荐模型。模型首先通过构建全局级会话项目依赖感知图,学习用户全局级会话项目嵌入;然后,应用解纠缠表示学习方法将会话中的项...
针对序列短、数据稀疏、难以泛化导致的会话推荐准确率不高问题,提出了因子级特征与属性偏好联合学习的会话推荐模型。模型首先通过构建全局级会话项目依赖感知图,学习用户全局级会话项目嵌入;然后,应用解纠缠表示学习方法将会话中的项目分解为多个相对独立的因子级特征,学习用户因子级兴趣偏好;接着利用情境化自注意图神经网络捕获用户针对会话项目属性的偏好;最后,将因子级兴趣偏好与项目属性偏好联合学习,得到用户最终兴趣偏好表示,并最终完成会话推荐。在Diginetica、Cosmetics两个公开数据集上的多个实验表明,本文模型优于对比的基线模型,验证了本文模型的良好推荐性能和设计合理性。
展开更多
关键词
会话推荐
因子级特征
解纠缠表示
全局项目依赖
图神经网络
在线阅读
下载PDF
职称材料
DR-GAN:一种无监督学习的探地雷达杂波抑制方法
被引量:
2
7
作者
雷文太
毛凌青
+4 位作者
庞泽邦
任强
王成浩
隋浩
辛常乐
《电子与信息学报》
EI
CSCD
北大核心
2023年第10期3776-3785,共10页
探地雷达(GPR)是一种基于电磁波的地下无损探测技术,广泛应用于市政工程、交通、军事等领域。在数据采集过程中,由于发射天线和接收天线之间的耦合、起伏地面的散射以及地下随机媒质的复杂性等原因,采集得到的GPR B-scan回波中通常存在...
探地雷达(GPR)是一种基于电磁波的地下无损探测技术,广泛应用于市政工程、交通、军事等领域。在数据采集过程中,由于发射天线和接收天线之间的耦合、起伏地面的散射以及地下随机媒质的复杂性等原因,采集得到的GPR B-scan回波中通常存在杂波,杂波严重影响了地下目标的检测和特征提取。该文提出一种用于GPR B-scan图像杂波抑制的解纠缠表示生成对抗网络(DR-GAN),设计了目标特征编码器和杂波特征编码器用来提取GPR B-scan图像中的目标特征和杂波特征,设计了杂波抑制生成器用来获取杂波抑制后的GPR B-scan图像。与现有的基于监督学习的GPR杂波抑制方法相比,该方法在网络训练时不需要成对的匹配数据,可以更好地应用于实测GPR图像的杂波抑制。在仿真和实测GPR数据上的实验结果表明,DR-GAN这一无监督学习网络具有更好的杂波抑制性能。对石英砂中埋设的钢筋进行数据采集,运用DR-GAN对含杂波的实测数据进行处理,处理结果的改善系数(IF)指标较现有的鲁棒非负矩阵分解(RNMF)方法提高了17.85 dB。
展开更多
关键词
探地雷达
杂波抑制
无监督学习
解纠缠表示
生成对抗网络
在线阅读
下载PDF
职称材料
基于多对抗性鉴别网络的人脸活体检测
被引量:
1
8
作者
任拓
闫玮
+6 位作者
况立群
谢剑斌
谌钟毓
高峰
郭锐
束伟
谢昌颐
《计算机工程与科学》
CSCD
北大核心
2023年第9期1611-1620,共10页
人脸活体检测是人脸识别系统安全性保证的关键,其中,解纠缠学习方法可以有效解决人脸活体检测中泛化数据集的问题,但是现有的解纠缠学习方法往往将整幅人脸图像作为输入,解析出伪造痕迹元素,会忽略伪造痕迹的局部细节问题。针对这一问题...
人脸活体检测是人脸识别系统安全性保证的关键,其中,解纠缠学习方法可以有效解决人脸活体检测中泛化数据集的问题,但是现有的解纠缠学习方法往往将整幅人脸图像作为输入,解析出伪造痕迹元素,会忽略伪造痕迹的局部细节问题。针对这一问题,改进现有的伪造痕迹解纠缠网络,提出多对抗性鉴别网络模型,在鉴别器中设计主鉴别器和区域鉴别器,引入人脸遮罩模块,生成人脸皮肤、五官遮罩蒙版,整合人脸局部信息,使生成器拟合的图像更接近数据集中人脸图像的分布,同时解离出加强版的伪造痕迹。提出的多对抗性鉴别网络有效地增强了伪造人脸图像的伪造痕迹信息并提高了人脸活体检测的准确率。具体来说,该网络模型在OULU-NPU数据集的2个实验中的检测错误率仅为0.8%和1.4%,相比STDN错误率显著降低,同时在Idiap Replay-Attack数据集上也达到了较好的检测效果。为了验证该网络模型的可迁移性,在NUAA数据集和Idiap Replay-Attack数据集上进行跨域实验,达到了不错的效果。
展开更多
关键词
人脸识别
活体检测
生成对抗网络
解纠缠表示
学习
在线阅读
下载PDF
职称材料
视觉—语义双重解纠缠的广义零样本学习
9
作者
韩阿友
杨关
+1 位作者
刘小明
刘阳
《中国图象图形学报》
CSCD
北大核心
2023年第9期2913-2926,共14页
目的传统的零样本学习(zero-shot learning,ZSL)旨在依据可见类别的数据和相关辅助信息对未见类别的数据进行预测分类,而广义零样本学习(generalized zero-shot learning,GZSL)中分类的类别既可能属于可见类也可能属于不可见类,这更符...
目的传统的零样本学习(zero-shot learning,ZSL)旨在依据可见类别的数据和相关辅助信息对未见类别的数据进行预测分类,而广义零样本学习(generalized zero-shot learning,GZSL)中分类的类别既可能属于可见类也可能属于不可见类,这更符合现实的应用场景。基于生成模型的广义零样本学习的原始特征和生成特征不一定编码共享属性所指的语义相关信息,这样会导致模型倾向于可见类,并且分类时忽略了语义信息中与特征相关的有用信息。为了分解出相关的视觉特征和语义信息,提出了视觉—语义双重解纠缠框架。方法首先,使用条件变分自编码器为不可见类生成视觉特征,再通过一个特征解纠缠模块将其分解为语义一致性和语义无关特征。然后,设计了一个语义解纠缠模块将语义信息分解为特征相关和特征无关的语义。其中,利用总相关惩罚来保证分解出来的两个分量之间的独立性,特征解纠缠模块通过关系网络来衡量分解的语义一致性,语义解纠缠模块通过跨模态交叉重构来保证分解的特征相关性。最后,使用两个解纠缠模块分离出来的语义一致性特征和特征相关语义信息联合学习一个广义零样本学习分类器。结果实验在4个广义零样本学习公开数据集AWA2(animals with attributes2)、CUB(caltech-ucsd birds-200-2011)、SUN(SUN attribute)和FLO(Oxford flowers)上取得了比Baseline更好的结果,调和平均值在AwA2、CUB、SUN和FLO上分别提升了1.6%、3.2%、6.2%和1.5%。结论在广义零样本学习分类中,本文提出的视觉—语义双重解纠缠方法经实验证明比基准方法取得了更好的性能,并且优于大多现有的相关方法。
展开更多
关键词
零样本学习(ZSL)
广义零样本学习(GZSL)
解纠缠表示
变分自编码器(VAE)
跨模态重构
总相关性(TC)
原文传递
题名
基于属性解纠缠表示的交互式服装图像检索
1
作者
黄晓菊
陈金广
机构
西安工程大学计算机科学学院
出处
《计算机与数字工程》
2025年第3期829-834,共6页
基金
陕西省重点研发计划项目(编号:2020GY-122)
陕西省教育厅科研计划项目(编号:21JP049)资助。
文摘
交互式服装检索可以将查询图像中的特定属性替换为目标属性,以更新检索结果。然而属性学习嵌入空间存在语义纠缠,改变特定属性会导致其他属性发生改变,限制了检索结果的可控性和有效性。为了解决该问题,论文提出了一种属性保持解纠缠表示学习(APDRL)网络来实现服装的交互式检索。首先,该网络为服装图像每种属性类型学习特定的子空间,以获得属性分离表示;其次,利用联合损失函数优化网络模型;最后,根据内存块中的每个属性原型嵌入,操纵向量将查询图像中特定属性修改为目标属性。在DeepFashion数据集上测试,实验结果表明:APDRL方法在保留服装固定属性的同时还可以修改目标属性,具有较强的可控性和实用性,优于其他主流的检索算法。
关键词
交互式服装检索
解纠缠表示
学习
DeepFashion
目标属性
损失函数
Keywords
interactive clothing retrieval
disentanglement representation learning
DeepFashion
target attribute
loss funtion
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于解纠缠表示学习的人脸反欺骗算法
被引量:
1
2
作者
周毅岩
石亮
张遨
岳晓宇
机构
江苏科技大学计算机学院
出处
《计算机应用研究》
CSCD
北大核心
2024年第8期2502-2507,共6页
基金
2022年江苏省高校“智慧教育与教学数字化转型研究”专项课题。
文摘
针对现有人脸反欺骗模型面对不同应用场景识别精度低、泛化性能不佳的问题,引入解纠缠表示学习,提出一种基于解纠缠表示学习的人脸反欺骗方法。该方法采用U-Net架构和ResNet-18作为编/解码器。首阶段训练中,通过输入真实样本使得编码器仅学习到真实样本相关信息。第二阶段,构建对抗性学习网络,输入不具标签的样本,将预训练的编码器输出和新编码器输出进行特征融合,由解码器重建图像,在鉴别器中与原始图像进行对抗训练,以实现特征的解耦。模型与一些经典人脸反欺骗方法相比,有着更好的检测性能,在OULU-NPU数据集的数个实验中,最低的检测错误率仅为0.8%,表现优于STDN等经典检测方法。该人脸反欺骗方法通过分阶段训练的方式,使得模型在对抗性训练中获得了相比端到端模型更具判别性的特征表示,在欺骗特征图输出阶段采用多分类策略,减小了不同的图像噪声对分类结果的影响,在公开数据集上的实验验证了算法的有效性。
关键词
人脸反欺骗
解纠缠表示
学习
多分类
域泛化
Keywords
face anti-spoofing
disentangled representation learning
multiclass classification
domain generalization
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
解纠缠表示学习在跨年龄人脸识别中的应用
被引量:
2
3
作者
陈莉明
田茂
颜佳
机构
乐山师范学院电子与材料工程学院
武汉大学电子与信息学院
出处
《计算机应用研究》
CSCD
北大核心
2021年第11期3500-3505,共6页
基金
国家自然科学基金资助项目(61701351)
乐山市重点科技计划项目(20GZD024)
乐山师范学院高层次人才科研启动项目(RC202038)。
文摘
跨年龄人脸识别因其在现实生活中的广泛应用而成为人脸识别领域的热门话题。针对跨年龄人脸识别精度较低的问题,引入解纠缠表示学习,提出了一个基于生成对抗网络的解纠缠表示学习(IPDRL)网络来实现人脸图像的识别。该网络由编码器、生成器和鉴别器构成。编码器在对特征中的年龄变化进行解纠缠的同时,对人脸图像的身份信息进行编码,提取只利于身份鉴别的特征,实现身份特征和年龄特征的解纠缠;生成器根据输入的年龄特征生成对应的身份保持的年龄图像;鉴别器通过对抗学习和多任务学习实现年龄和身份的类分布预测。通过将解纠缠表示学习、对抗学习和多任务学习相结合的方法,很好地保留了人脸图像的身份信息,并使跨年龄人脸图像识别的精度得到了提高。
关键词
人脸识别
解纠缠表示
学习
多任务学习
生成对抗网络
Keywords
face recognition
disentangled representation learning
multi-task learning
generative adversarial network
分类号
TP394.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于跨媒体解纠缠表示学习的风格化图像描述生成
被引量:
1
4
作者
蔺泽浩
李国趸
曾祥极
邓悦
张寅
庄越挺
机构
浙江大学计算机科学与技术学院
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2022年第12期2510-2527,共18页
基金
国家自然科学基金(62072399,61402403,U19B2042)
中国工程科技知识中心
+2 种基金
数字图书馆教育部工程研究中心
中国工程科技数据和知识技术研究中心
中央高校基本科研业务费和百度人工智能课题基金资助.
文摘
风格化图像描述生成的文本不仅被要求在语义上与给定的图像一致,而且还要与给定的语言风格保持一致.随着神经网络在计算机视觉和自然语言生成领域的技术发展,有关这个主题的最新研究取得了显著进步.但是,神经网络模型作为一种黑盒系统,人类仍然很难理解其隐层空间中参数所代表的风格、事实及它们之间的关系.为了提高对隐层空间中包含的事实内容和语言风格属性的理解以及增强对两者的控制能力,提高神经网络的可控性和可解释性,本文提出了一种使用解纠缠技术的新型风格化图像描述生成模型Disentangled Stylized Image Caption(DSIC).该模型分别从图像和描述文本中非对齐地学习解纠缠表示,具体使用了两个解纠缠表示学习模块——D-Images和D-Captions来分别学习图像和图像描述中解纠缠的事实信息和风格信息.在推理阶段,DSIC模型利用图像描述生成解码器以及一种特别设计的基于胶囊网络的信息聚合方法来充分利用先前学习的跨媒体信息表示,并通过直接控制隐层向量来生成目标风格的图像描述.本文在SentiCap数据集和FlickrStyle10K数据集上进行了相关实验.解纠缠表示学习的实验结果证明了模型解纠缠的有效性,而风格化图像描述生成实验结果则证明了聚合的跨媒体解纠缠表示可以带来更好的风格化图像描述生成性能,相对于对比的风格化图像描述生成模型,本文方法在多个指标上的性能提升了17%至86%.
关键词
跨媒体
机器学习
解纠缠表示
学习
风格化图像描述生成
自然语言生成
Keywords
cross-media
machine learning
disentangled representation learning
stylized image caption
natural language generation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于改进高斯混合变分自编码器的半监督情感音乐生成
被引量:
1
5
作者
胥备
刘桐
机构
南京邮电大学计算机学院
江苏大数据安全与智能处理重点实验室
出处
《计算机科学》
CSCD
北大核心
2024年第8期281-296,共16页
基金
江苏省高校自然科学基金面上项目(21KJB520017)。
文摘
音乐可以通过序列化的声音信息传递声音内容和情感。情感是音乐所表达的语义中的重要组成部分,因此,音乐生成技术不仅要考虑音乐的结构信息,还应融入情感元素。现有的情感音乐生成技术大多采用基于情感标注的完全监督方法,但音乐领域缺乏大量标准的情感标注数据集,且情感标签不足以表达音乐的情感特征。针对上述问题,提出了基于改进的高斯混合变分自编码器(Gaussian Mixture Variational Autoencoders,GMVAE)的半监督情感音乐生成方法(Semg-GMVAE),将音乐的节奏特征和调式特征与情感建立联系,同时向GMVAE中引入一种特征解纠缠机制来分别学习这两种特征的潜在变量表示,并对其进行半监督聚类推断。最后通过操纵音乐的特征表示,实现了针对快乐、紧张、悲伤、平静情感的音乐生成与情感转换。同时,针对GMVAE难以区分不同情感类别数据的问题,实验指出其关键原因是GMVAE证据下界中的方差正则项与互信息抑制项使得各类别的高斯分量分散性不足,从而影响学习表示的性能和生成的数据样本的情感质量。因此,Semg-GMVAE对这两项因子分别进行了惩罚和增强,并使用Transformer-XL作为编码器和解码器以提升在长序列音乐上的建模能力。基于真实数据集的实验结果表明,相比现有方法,Semg-GMVAE能够将不同情感的音乐在潜在空间中更好地分离,增强了音乐与情感的关联程度,并且能够有效对不同音乐特征进行解纠缠分离,最后通过改变特征表示更好地实现情感音乐生成或情感切换。
关键词
情感音乐生成
半监督生成模型
解纠缠表示
学习
高斯混合变分自编码器
Transformer-XL
Keywords
Emotional music generation
Semi-supervised generative models
Disentangled representation learning
Gaussian mixture variational autoencoders
Transformer-XL
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于因子级特征与属性偏好联合学习的会话推荐
6
作者
林浩
陈平华
机构
广东工业大学计算机学院
出处
《广东工业大学学报》
CAS
2024年第6期91-100,共10页
基金
广东省重点领域研发计划项目(2021B0101200002)
广东省自然科学基金资助项目(2021A1515012233)。
文摘
针对序列短、数据稀疏、难以泛化导致的会话推荐准确率不高问题,提出了因子级特征与属性偏好联合学习的会话推荐模型。模型首先通过构建全局级会话项目依赖感知图,学习用户全局级会话项目嵌入;然后,应用解纠缠表示学习方法将会话中的项目分解为多个相对独立的因子级特征,学习用户因子级兴趣偏好;接着利用情境化自注意图神经网络捕获用户针对会话项目属性的偏好;最后,将因子级兴趣偏好与项目属性偏好联合学习,得到用户最终兴趣偏好表示,并最终完成会话推荐。在Diginetica、Cosmetics两个公开数据集上的多个实验表明,本文模型优于对比的基线模型,验证了本文模型的良好推荐性能和设计合理性。
关键词
会话推荐
因子级特征
解纠缠表示
全局项目依赖
图神经网络
Keywords
session-based recommendation
factor-level feature
disentangled representation learning
global-level item dependency
graph neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
DR-GAN:一种无监督学习的探地雷达杂波抑制方法
被引量:
2
7
作者
雷文太
毛凌青
庞泽邦
任强
王成浩
隋浩
辛常乐
机构
中南大学计算机学院
中国电波传播研究所
出处
《电子与信息学报》
EI
CSCD
北大核心
2023年第10期3776-3785,共10页
基金
中国电波传播研究所稳定支持科研经费(A131903W13)。
文摘
探地雷达(GPR)是一种基于电磁波的地下无损探测技术,广泛应用于市政工程、交通、军事等领域。在数据采集过程中,由于发射天线和接收天线之间的耦合、起伏地面的散射以及地下随机媒质的复杂性等原因,采集得到的GPR B-scan回波中通常存在杂波,杂波严重影响了地下目标的检测和特征提取。该文提出一种用于GPR B-scan图像杂波抑制的解纠缠表示生成对抗网络(DR-GAN),设计了目标特征编码器和杂波特征编码器用来提取GPR B-scan图像中的目标特征和杂波特征,设计了杂波抑制生成器用来获取杂波抑制后的GPR B-scan图像。与现有的基于监督学习的GPR杂波抑制方法相比,该方法在网络训练时不需要成对的匹配数据,可以更好地应用于实测GPR图像的杂波抑制。在仿真和实测GPR数据上的实验结果表明,DR-GAN这一无监督学习网络具有更好的杂波抑制性能。对石英砂中埋设的钢筋进行数据采集,运用DR-GAN对含杂波的实测数据进行处理,处理结果的改善系数(IF)指标较现有的鲁棒非负矩阵分解(RNMF)方法提高了17.85 dB。
关键词
探地雷达
杂波抑制
无监督学习
解纠缠表示
生成对抗网络
Keywords
Ground Penetrating Radar(GPR)
Clutter suppression
Unsupervised learning
Disentangled Representations(DR)
Generative Adversarial Networks(GAN)
分类号
TN957.52 [电子电信—信号与信息处理]
在线阅读
下载PDF
职称材料
题名
基于多对抗性鉴别网络的人脸活体检测
被引量:
1
8
作者
任拓
闫玮
况立群
谢剑斌
谌钟毓
高峰
郭锐
束伟
谢昌颐
机构
中北大学大数据学院
国防科技大学电子科学学院
辽宁科技大学电子与信息工程学院
墨尔本大学医学、牙科和健康科学学院
出处
《计算机工程与科学》
CSCD
北大核心
2023年第9期1611-1620,共10页
基金
国家自然科学基金(62106238)
山西省回国留学人员科研资助项目(2020-113)
山西省科技成果转化引导专项(202104021301055)。
文摘
人脸活体检测是人脸识别系统安全性保证的关键,其中,解纠缠学习方法可以有效解决人脸活体检测中泛化数据集的问题,但是现有的解纠缠学习方法往往将整幅人脸图像作为输入,解析出伪造痕迹元素,会忽略伪造痕迹的局部细节问题。针对这一问题,改进现有的伪造痕迹解纠缠网络,提出多对抗性鉴别网络模型,在鉴别器中设计主鉴别器和区域鉴别器,引入人脸遮罩模块,生成人脸皮肤、五官遮罩蒙版,整合人脸局部信息,使生成器拟合的图像更接近数据集中人脸图像的分布,同时解离出加强版的伪造痕迹。提出的多对抗性鉴别网络有效地增强了伪造人脸图像的伪造痕迹信息并提高了人脸活体检测的准确率。具体来说,该网络模型在OULU-NPU数据集的2个实验中的检测错误率仅为0.8%和1.4%,相比STDN错误率显著降低,同时在Idiap Replay-Attack数据集上也达到了较好的检测效果。为了验证该网络模型的可迁移性,在NUAA数据集和Idiap Replay-Attack数据集上进行跨域实验,达到了不错的效果。
关键词
人脸识别
活体检测
生成对抗网络
解纠缠表示
学习
Keywords
face recognition
liveness detection
generative adversarial network
disentangled representation learning
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
视觉—语义双重解纠缠的广义零样本学习
9
作者
韩阿友
杨关
刘小明
刘阳
机构
中原工学院计算机学院
河南省网络舆情监测与智能分析重点实验室
西安电子科技大学通信工程学院
出处
《中国图象图形学报》
CSCD
北大核心
2023年第9期2913-2926,共14页
基金
国家自然科学基金项目(61906141)
东北师范大学应用统计教育部重点实验室项目(135131007)
河南省高等学校重点科研项目(23A520022)。
文摘
目的传统的零样本学习(zero-shot learning,ZSL)旨在依据可见类别的数据和相关辅助信息对未见类别的数据进行预测分类,而广义零样本学习(generalized zero-shot learning,GZSL)中分类的类别既可能属于可见类也可能属于不可见类,这更符合现实的应用场景。基于生成模型的广义零样本学习的原始特征和生成特征不一定编码共享属性所指的语义相关信息,这样会导致模型倾向于可见类,并且分类时忽略了语义信息中与特征相关的有用信息。为了分解出相关的视觉特征和语义信息,提出了视觉—语义双重解纠缠框架。方法首先,使用条件变分自编码器为不可见类生成视觉特征,再通过一个特征解纠缠模块将其分解为语义一致性和语义无关特征。然后,设计了一个语义解纠缠模块将语义信息分解为特征相关和特征无关的语义。其中,利用总相关惩罚来保证分解出来的两个分量之间的独立性,特征解纠缠模块通过关系网络来衡量分解的语义一致性,语义解纠缠模块通过跨模态交叉重构来保证分解的特征相关性。最后,使用两个解纠缠模块分离出来的语义一致性特征和特征相关语义信息联合学习一个广义零样本学习分类器。结果实验在4个广义零样本学习公开数据集AWA2(animals with attributes2)、CUB(caltech-ucsd birds-200-2011)、SUN(SUN attribute)和FLO(Oxford flowers)上取得了比Baseline更好的结果,调和平均值在AwA2、CUB、SUN和FLO上分别提升了1.6%、3.2%、6.2%和1.5%。结论在广义零样本学习分类中,本文提出的视觉—语义双重解纠缠方法经实验证明比基准方法取得了更好的性能,并且优于大多现有的相关方法。
关键词
零样本学习(ZSL)
广义零样本学习(GZSL)
解纠缠表示
变分自编码器(VAE)
跨模态重构
总相关性(TC)
Keywords
zero-shot learning(ZSL)
generalized zero-shot learning(GZSL)
disentanglement representation
variational auto-encoders(VAE)
cross-modal reconstruction
total correlation(TC)
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于属性解纠缠表示的交互式服装图像检索
黄晓菊
陈金广
《计算机与数字工程》
2025
0
在线阅读
下载PDF
职称材料
2
基于解纠缠表示学习的人脸反欺骗算法
周毅岩
石亮
张遨
岳晓宇
《计算机应用研究》
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
3
解纠缠表示学习在跨年龄人脸识别中的应用
陈莉明
田茂
颜佳
《计算机应用研究》
CSCD
北大核心
2021
2
在线阅读
下载PDF
职称材料
4
基于跨媒体解纠缠表示学习的风格化图像描述生成
蔺泽浩
李国趸
曾祥极
邓悦
张寅
庄越挺
《计算机学报》
EI
CAS
CSCD
北大核心
2022
1
在线阅读
下载PDF
职称材料
5
基于改进高斯混合变分自编码器的半监督情感音乐生成
胥备
刘桐
《计算机科学》
CSCD
北大核心
2024
1
在线阅读
下载PDF
职称材料
6
基于因子级特征与属性偏好联合学习的会话推荐
林浩
陈平华
《广东工业大学学报》
CAS
2024
0
在线阅读
下载PDF
职称材料
7
DR-GAN:一种无监督学习的探地雷达杂波抑制方法
雷文太
毛凌青
庞泽邦
任强
王成浩
隋浩
辛常乐
《电子与信息学报》
EI
CSCD
北大核心
2023
2
在线阅读
下载PDF
职称材料
8
基于多对抗性鉴别网络的人脸活体检测
任拓
闫玮
况立群
谢剑斌
谌钟毓
高峰
郭锐
束伟
谢昌颐
《计算机工程与科学》
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
9
视觉—语义双重解纠缠的广义零样本学习
韩阿友
杨关
刘小明
刘阳
《中国图象图形学报》
CSCD
北大核心
2023
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部