-
题名基于特征融合的文本到图像的生成
被引量:6
- 1
-
-
作者
徐泽
帅仁俊
刘开凯
马力
吴梦麟
-
机构
南京工业大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2021年第6期125-130,共6页
-
基金
国家自然科学基金(61701222)。
-
文摘
近年来,基于生成对抗网络(Generative Adversarial Network, GAN)从文本描述中合成图像这一具有挑战性的任务已经取得了令人鼓舞的结果。这些方法虽然可以生成具有一般形状和颜色的图像,但通常也会生成具有不自然的局部细节且扭曲的全局图像。这是因为卷积神经网络在捕获用于像素级别图像合成的高级语义信息时效率低下,以及处于粗略状态的生成器-鉴别器由于缺少详细信息生成了有缺陷的结果,而这个结果会作为输入促使最终结果的生成。因此,提出了一种基于特征融合的生成对抗网络。该网络通过嵌入残差块特征金字塔结构来引入多尺度特征融合,并通过自适应融合这些特征直接生成最后的精细图像,仅使用一个鉴别器就可以生成256 px×256 px的逼真图像。将所提方法在花类数据集Oxford-102和加利福尼亚理工学院鸟类数据库CUB上进行验证,使用Inception Score和FID评估生成图像的质量,结果表明,生成图像的质量明显优于以往若干经典的方法。
-
关键词
特征融合
鉴别器
残差块特征金字塔
生成对抗网络
-
Keywords
Feature fusion
Discriminator
Residual block feature pyramid
Generative adversarial network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于卷积神经网络的线结构光高精度三维测量方法
- 2
-
-
作者
叶涛
何威燃
刘国鹏
欧阳煜
王斌
-
机构
中国矿业大学(北京)机械与电气工程学院
-
出处
《仪器仪表学报》
2025年第2期183-195,共13页
-
基金
国家自然科学基金项目(52374166)
北京市自然基金项目(L221018)
中央高校基本科研业务费专项资金资助项目(2024ZKPYZJD04)资助。
-
文摘
线结构光视觉三维测量技术因其高精度和非接触的三维重建优势而被广泛应用。然而,现有的线结构光三维测量方法在标定过程中往往面临较高的耦合性问题,且在复杂环境下,背景噪声和光照变化会严重干扰条纹的提取,导致结构光条纹中心定位精度下降,进而影响整体三维测量的精度和鲁棒性。针对上述问题,提出了一种基于卷积神经网络的鲁棒三维测量方法。首先,设计了一种创新性的残差U型块特征金字塔网络(RSU-FPN),旨在实现背景噪声的干扰抑制和结构光条纹区域中心的高精度鲁棒提取。其次,构建了一种新型的线结构光视觉传感器,并提出了一种分离式测量模型,成功将摄像机标定与光平面标定解耦,极大地提高了系统的灵活性与扩展性。通过这种解耦的标定方式,避免了传统标定方法中存在的耦合问题,使得整个测量系统更加高效且易于调整。实验结果表明,所提出的基于卷积神经网络的鲁棒三维测量方法,在复杂背景下能够实现结构光条纹中心的高精度提取,利用提取出的光条纹中心进行标定,其均方根误差分别为x方向0.005 mm、y方向0.009 mm以及z方向0.097 mm。并且,该方法在不同表面类型(如漫反射表面和光滑反射表面)上均能实现高精度的三维重建,验证了其在实际应用中的优越性和强大的鲁棒性。
-
关键词
线结构光
三维测量
卷积神经网络
残差U型块特征金字塔网络
背景噪声抑制
-
Keywords
line structured light
3D measurement
convolutional neural network
residual U-block feature pyramid network
background noise suppression
-
分类号
TH741
[机械工程]
-