期刊文献+
共找到2,696篇文章
< 1 2 135 >
每页显示 20 50 100
基于短期充电数据和增强鲸鱼优化算法的锂离子电池容量预测
1
作者 陈峥 彭月 +3 位作者 胡竞元 申江卫 肖仁鑫 夏雪磊 《储能科学与技术》 北大核心 2025年第1期319-330,共12页
为解决采用数据驱动的方法对锂离子电池容量进行预测时,难以获取完整充电数据、数据采样精度低和特征因子提取质量不佳等问题,本工作提出了一种基于短期充电数据和增强鲸鱼优化算法的锂离子电池容量预测方法。首先,为提升数据精度,利用... 为解决采用数据驱动的方法对锂离子电池容量进行预测时,难以获取完整充电数据、数据采样精度低和特征因子提取质量不佳等问题,本工作提出了一种基于短期充电数据和增强鲸鱼优化算法的锂离子电池容量预测方法。首先,为提升数据精度,利用三次样条插值对充电数据进行补充。其次,通过挖掘充电电压曲线与容量衰退之间的规律,确定特征因子为某充电时间区间的电压增量,并利用增强鲸鱼算法,从短期充电数据中实现了老化特征的有效提取。随后,构建了高斯过程回归容量预测模型,在确定训练数据量后,对比了不同算法的预测结果,验证了所构建模型的有效性。最后,将该方法在不同电池上进行测试,验证了预测精度和泛化能力。结果表明:对于实验室数据集,将前15%老化特征作为训练集时,可将该类电池最大误差控制在2.49%以内,且97%的预测误差控制在1.5%内;对于公开数据集,仅12组训练数据就能将该类电池最大误差控制在1%以内,实现了利用低精度和短期充电数据对电池容量的准确预测。 展开更多
关键词 锂离子电池 短期充电数据 容量预测 增强鲸鱼优化算法 高斯过程回归
在线阅读 下载PDF
基于大模型检索增强生成的气象数据库问答模型实现
2
作者 江双五 张嘉玮 +1 位作者 华连生 杨菁林 《计算机工程与应用》 北大核心 2025年第5期113-121,共9页
随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索... 随着信息检索和知识获取需求的增加,智能问答系统在多个垂直领域得到广泛应用。然而,在气象领域仍缺乏专门的智能问答系统研究,严重限制了气象信息的高效利用和气象系统的服务效率。针对这一需求,提出了一种面向气象数据库的大模型检索智能问答技术实现方案。该方案设计了一种基于关系型数据库(SQL)与文档型数据(NoSQL)的多通道查询路由(multi-channel retrieval router,McRR)方法,为了适配数据库进行大模型查询以及增强大模型对查询表的理解,分别提出指令查询转换方法与数据库表摘要方法DNSUM,提升大模型对数据库的语义理解能力,通过结合问题理解、重排序器和响应生成等关键模块,构建了一个端到端的智能问答模型,可实现多数据源的相关知识检索及答案生成。实验结果显示,该模型可以有效理解用户问题并生成准确的答案,具有良好的检索和响应能力。不仅为气象领域提供了一种智能问答的解决方案,也为气象智能问答技术提供了新的应用实施参考。 展开更多
关键词 数据库查询 数据库问答 大语言模型 检索增强生成 气象问答
在线阅读 下载PDF
融合数据增强的互花米草入侵关联要素实体识别方法
3
作者 李忠伟 张文丰 +1 位作者 李永 李明轩 《计算机工程与设计》 北大核心 2025年第2期603-609,共7页
为解决互花米草入侵领域的训练数据匮乏,存在实体特征提取不准确的问题,提出一种融合数据增强的互花米草入侵关联要素识别深度学习模型。将训练数据采用同类实体随机交叉互换的方法进行数据增强,利用BERT预训练获得互花米草入侵关联要... 为解决互花米草入侵领域的训练数据匮乏,存在实体特征提取不准确的问题,提出一种融合数据增强的互花米草入侵关联要素识别深度学习模型。将训练数据采用同类实体随机交叉互换的方法进行数据增强,利用BERT预训练获得互花米草入侵关联要素的上下文信息;使用BiLSTM进一步提取特征,利用CRF得到实体的标签约束。通过对比不同模型在自建数据集上的精确率、召回率和F1分数,验证了该模型在互花米草入侵领域实体识别的有效性。 展开更多
关键词 命名实体识别 互花米草入侵 深度学习 数据增强 预训练模型 双向长短期记忆网络 条件随机场
在线阅读 下载PDF
基于改进ACGAN算法的带钢小样本数据增强方法
4
作者 师红宇 王嘉鑫 李怡 《计算机集成制造系统》 北大核心 2025年第1期211-218,共8页
为了解决带钢小样本数据集在深度学习中出现的模式崩溃、图像模糊和错判等问题,提出一种改进的ACGAN数据增强方法。首先,模型中引入带梯度惩罚项的Wasserstein距离作为损失函数,解决了模式崩溃和训练不稳定问题;其次,生成器网络中改进... 为了解决带钢小样本数据集在深度学习中出现的模式崩溃、图像模糊和错判等问题,提出一种改进的ACGAN数据增强方法。首先,模型中引入带梯度惩罚项的Wasserstein距离作为损失函数,解决了模式崩溃和训练不稳定问题;其次,生成器网络中改进标签反卷积网络,使标签信息更好地贯穿整个生成网络,并在其末端设计了去噪结构,提高了生成图像质量;接着,判别器网络中引入级联融合思想,增强了网络判别能力;最后,将改进前后的模型在NEU带钢表面缺陷数据集和MNIST数据集上进行对比实验,结果表明:所提模型生成各类样本图像的清晰度、准确性明显提高,并且客观指标FID的平均值在NEU带钢表面缺陷数据集上下降了15.8%,在MNIST数据集下降了73%,为带钢小样本数据集的扩充提供了一种新方法。 展开更多
关键词 图像生成 生成对抗网络 数据增强 小样本
在线阅读 下载PDF
一种多尺度特征融合运动想象脑电信号分类算法——基于时频域数据增强
5
作者 郑敏敏 钱政康 赵桐 《莆田学院学报》 2025年第2期52-60,70,共10页
针对传统的脑电信号识别算法样本量较小、识别分类准确率较低的问题,提出了一种基于时频域数据增强的多尺度特征融合运动想象脑电信号分类算法。对原始信号进行独立主成分分析滤除眼电噪声,并进行时域和频域的数据增强,将原始数据、时... 针对传统的脑电信号识别算法样本量较小、识别分类准确率较低的问题,提出了一种基于时频域数据增强的多尺度特征融合运动想象脑电信号分类算法。对原始信号进行独立主成分分析滤除眼电噪声,并进行时域和频域的数据增强,将原始数据、时域增强数据、频域增强数据三组数据分别进行多尺度多频带的共空间模式、功率谱密度以及小波包能量特征提取,合并特征并通过特征选择得到最佳特征组,训练支持向量机,由投票得出最终分类结果。在公开数据集BCI CompetitionⅣ-2a和OpenBMI上进行验证,结果表明提出的方法分类效果良好,分类准确率高于其他对比方法。 展开更多
关键词 运动想象 数据增强 共空间模式 支持向量机
在线阅读 下载PDF
基于多尺度注意力和数据增强的细胞核分割 被引量:1
6
作者 张兴鹏 何东 +1 位作者 杨模 叶杭滨 《计算机工程》 北大核心 2025年第2期387-396,共10页
U-Net因结构简单且高效被广泛应用于医学分割领域。然而,U-Net的跳跃连接不能很好地弥补编码器和解码器之间的语义差距。而医学分割数据的标注要求严格,使得数据集数量和规模都较小。针对上述问题,设计多尺度注意力融合(MSAF)模块,旨在... U-Net因结构简单且高效被广泛应用于医学分割领域。然而,U-Net的跳跃连接不能很好地弥补编码器和解码器之间的语义差距。而医学分割数据的标注要求严格,使得数据集数量和规模都较小。针对上述问题,设计多尺度注意力融合(MSAF)模块,旨在利用注意力机制可调整网络学习方向的特点和多尺度特征融合来有效缓解语义偏差。MSAF模块在前2个阶段使用通道注意力来捕获全局特征;在后2个阶段使用空间注意力来捕获局部特征;最后将多个阶段提取的特征进行融合以增强特征信息。此外,提出基于傅里叶变换的数据增强(FTDA)方法解决医学分割数据集稀少的问题。FTDA通过扰动输入图像在频域中的幅度信息实现其相位信息的数据增强。在MoNuSeg、CryoNuSeg和2018 Data Science Bowl数据集上的实验结果表明,提出方法的mIoU和Dice指标比其他先进方法表现出更好的性能。此外,提出的FTDA方法对小规模数据集也具有较好的增益效果。 展开更多
关键词 注意力机制 U-Net模型 傅里叶变换 细胞核分割 数据增强
在线阅读 下载PDF
基于改进GAN的闸门结构数据增强研究
7
作者 黄建章 张钰奇 +1 位作者 铁瑛 徐平 《水电能源科学》 北大核心 2025年第1期103-107,共5页
为保证大坝闸门的正常运行,需在闸门上布置大量传感器进行健康监测。然而在实际运行中,由于闸门所处的工作环境恶劣,经常造成传感器所采集数据发生缺失,导致采集的数据样本不充足,不具有代表性。对此,基于传统的生成对抗网络(GAN)算法,... 为保证大坝闸门的正常运行,需在闸门上布置大量传感器进行健康监测。然而在实际运行中,由于闸门所处的工作环境恶劣,经常造成传感器所采集数据发生缺失,导致采集的数据样本不充足,不具有代表性。对此,基于传统的生成对抗网络(GAN)算法,提出了Attention-GAN算法对原始数据进行扩充。试验结果表明,Attention-GAN算法生成样本与原始样本之间的相似性比传统的GAN算法得到了明显提高,其中平均余弦相似度在闸门数据集上相较于GAN提高了9.87%。可见该算法能够有效地实现小样本露顶式闸门加速度数据增强。 展开更多
关键词 Attention-GAN 数据增强 结构数据 VMD去噪
在线阅读 下载PDF
基于数据增强的异质图注意力网络
8
作者 杨应修 陈红梅 +1 位作者 周丽华 肖清 《计算机科学》 北大核心 2025年第3期180-187,共8页
异质图是由不同类型节点及边构成的图,可建模现实世界中各种类型对象及其关系。异质图嵌入旨在捕捉图中丰富的属性、结构和语义等信息,学习节点嵌入向量,用于节点分类、链接预测等任务,进而实现用户识别、商品推荐等应用。在异质图嵌入... 异质图是由不同类型节点及边构成的图,可建模现实世界中各种类型对象及其关系。异质图嵌入旨在捕捉图中丰富的属性、结构和语义等信息,学习节点嵌入向量,用于节点分类、链接预测等任务,进而实现用户识别、商品推荐等应用。在异质图嵌入方法中,元路径通常被用来获取节点间的高阶结构和语义信息,然而现有方法忽略了元路径实例中不同类型节点或异质图中不同类型邻居节点的差异,导致信息丢失,进而影响节点嵌入质量。针对上述问题,提出基于数据增强的异质图注意力网络(Heterogeneous graph Attention Network based on Data Augmentation,HANDA),以更好地学习节点嵌入向量。首先,提出基于元路径邻居的边增强。该方法基于元路径获取节点的元路径邻居,用节点及其元路径邻居形成的语义边增强异质图。这些增强边不仅蕴含了节点间的高阶结构和语义,还缓解了异质图的稀疏性。其次,提出融入节点类型注意力的节点嵌入。该方法采用多头注意力从多个角度学习不同直接边邻居及增强边邻居的重要性并在注意力中融入节点的类型信息,进而通过消息传递、直接边邻居及增强边邻居同时获取节点的属性、高阶结构和语义信息,提升了节点嵌入质量。在真实数据集上的实验验证了HANDA模型在节点分类、链接预测任务上的效果优于基准模型。 展开更多
关键词 异质图 嵌入 元路径 数据增强 图神经网络
在线阅读 下载PDF
融合数据质量增强和时空信息编码网络的船舶海上轨迹预测方法
9
作者 石悦 罗贺 +1 位作者 蒋儒浩 王国强 《模式识别与人工智能》 北大核心 2025年第1期51-67,共17页
高精度的海上船舶轨迹预测是降低船舶碰撞风险、提升船舶搜救效率的重要基础.海上航行环境的多变性使船舶轨迹数据在时间和空间上具有高度复杂性,现有方法对船舶轨迹数据的质量及运动信息关注度不足,难以充分捕捉轨迹中的时空特征和关... 高精度的海上船舶轨迹预测是降低船舶碰撞风险、提升船舶搜救效率的重要基础.海上航行环境的多变性使船舶轨迹数据在时间和空间上具有高度复杂性,现有方法对船舶轨迹数据的质量及运动信息关注度不足,难以充分捕捉轨迹中的时空特征和关联信息.因此,文中提出融合数据质量增强和时空信息编码网络的船舶海上轨迹预测方法(Ship Maritime Trajectory Prediction Method Integrating Data Quality Enhancement and Spatio-Temporal Information Encoding Network,DQE-STIEN).首先,基于船舶轨迹数据的特征,设计结合哈希映射分类及局部离群哈希值异常检测的数据质量增强算法,对问题数据进行质量增强.然后,针对多属性的船舶轨迹数据,设计具有双编码通道的时空信息编码网络,充分提取并整合船舶轨迹数据中的位置信息与运动特征.最后,基于时空信息编码提取数据中的时空关联信息,并经解码生成完整的轨迹预测结果.在5个不同区域的AIS数据集上的实验表明DQE-STIEN性能较优.同时,DQE-STIEN具有一定的泛化性,也能有效分析能源、销售、环境和金融等领域的时序数据. 展开更多
关键词 轨迹预测 时空信息编码 数据质量增强 双编码通道 混合预测模型
在线阅读 下载PDF
基于多通道数据双层增强的样本不平衡故障诊断方法
10
作者 郭一鸣 童一飞 +3 位作者 何非 谢中取 宋世达 黄静 《兵工学报》 北大核心 2025年第2期287-300,共14页
在复杂制造过程中常需要采集并分析多通道数据以实现状态监测和故障诊断,针对现有方法难以处理多通道数据复杂时空相关结构和样本不平衡的问题,提出了一种基于多通道数据双层增强的样本不平衡故障诊断方法。所提模型具有2阶段数据增强... 在复杂制造过程中常需要采集并分析多通道数据以实现状态监测和故障诊断,针对现有方法难以处理多通道数据复杂时空相关结构和样本不平衡的问题,提出了一种基于多通道数据双层增强的样本不平衡故障诊断方法。所提模型具有2阶段数据增强和全局优化的特点,通过先学习故障特征再转化为多通道数据的方式实现数据增强,引入分布差异评估机制有效地描述不同通道之间的数据相关性,基于多目标的全局优化策略来提高生成数据的质量。通过实际案例验证所提方法的有效性,实验结果表明:双层增强方法能有效扩充多通道数据的样本量,全局优化策略可以提高生成数据在故障诊断中的性能。与现有模型相比,所提方法在多种样本不平衡场景下均具有较高的故障诊断准确率。 展开更多
关键词 多通道数据 样本不平衡故障诊断 双层数据增强 全局优化
在线阅读 下载PDF
基于数据增强和损失平衡的机电领域命名实体识别
11
作者 林娜 岳希 唐聃 《计算机工程与应用》 北大核心 2025年第7期222-232,共11页
机电领域命名实体识别是机电创新设计信息检索最基础的过程。目前命名实体识别任务的数据在机电领域较少,且大部分存在不平衡问题。通过构建机电领域命名实体识别数据集,根据数据集文本结构特点设计多维数据增强方法,并提出基于改进los... 机电领域命名实体识别是机电创新设计信息检索最基础的过程。目前命名实体识别任务的数据在机电领域较少,且大部分存在不平衡问题。通过构建机电领域命名实体识别数据集,根据数据集文本结构特点设计多维数据增强方法,并提出基于改进loss的命名实体识别模型BERT-BiGRU-CRF(BL)。对互联网机电领域文本语料进行爬取并进行标注构成机电领域命名实体识别数据集;根据不同方式对数据集的影响从同类实体替换、同义词替换、语料裁减和语料拼接四个方面进行多维数据增强后按一定比例进行数据扩充增加数据丰富度;针对数据集数据不平衡问题设计使用Weigh loss平衡focal loss与CRF loss权重的模型,该模型采用BERT进行词向量编码,利用BiGRU完成文本向量的特征提取,使用CRF进行标签约束与解码。经实验证明,多维数据增强方法对模型效果有显著提升,并且经过改进的模型在原始和增强后数据集上表现均为最优,F1值分别为78.23%和83.3%。 展开更多
关键词 机电领域 命名实体识别 数据增强 focal loss Weigh loss
在线阅读 下载PDF
基于大语言模型和数据增强的通感隐喻分析
12
作者 盛坤 王中卿 《计算机应用》 北大核心 2025年第3期794-800,共7页
中文通感隐喻分析任务是隐喻领域的一个特定细分任务。由于通感语料中感觉词的分布不均匀,中文通感隐喻数据集存在数据稀疏的问题。为解决这一问题,利用真实训练数据中的稀疏感觉词数据作为提示,并使用大语言模型生成额外的合成样本进... 中文通感隐喻分析任务是隐喻领域的一个特定细分任务。由于通感语料中感觉词的分布不均匀,中文通感隐喻数据集存在数据稀疏的问题。为解决这一问题,利用真实训练数据中的稀疏感觉词数据作为提示,并使用大语言模型生成额外的合成样本进行数据增强。为避免合成数据的引入造成的额外噪声影响模型性能,构建基于大语言模型的数据增强框架,并采用评分机制和标签误差优化机制减小合成数据和真实数据之间的分布差异。实验结果表明,所提框架可以生成高质量的合成数据来扩充数据集,在感觉词抽取和感觉领域分类任务上的总体F1值达到68.5%,比仅使用真实训练数据的基线模型T5(Text-To-Text Transfer Transformer)提升了2.7个百分点。 展开更多
关键词 大语言模型 数据增强 通感隐喻 数据稀疏 数据合成
在线阅读 下载PDF
基于数据增强和特征融合的花粉图像分类
13
作者 刘昌海 张恒 +3 位作者 陆小锋 冯予乐 吕森林 刘书朋 《工业控制计算机》 2025年第1期97-99,共3页
传统花粉分析识别方法依赖于人工经验标注花粉图像,这一过程耗时且耗费人力。近年来,深度学习技术取代传统方法,广泛应用于花粉分析识别研究领域。然而,目前深度学习方法在识别时间、内存占用和准确性等算法模型效能方面仍有待优化。为... 传统花粉分析识别方法依赖于人工经验标注花粉图像,这一过程耗时且耗费人力。近年来,深度学习技术取代传统方法,广泛应用于花粉分析识别研究领域。然而,目前深度学习方法在识别时间、内存占用和准确性等算法模型效能方面仍有待优化。为进一步提高算法模型的效能,采用了数据增强技术,通过旋转、缩放和平移等手段扩展花粉数据集并采用局部二值模式(LBP)网络实现特征融合,提升花粉识别的准确度。实验结果显示,该方法在花粉识别上取得了95.1%的准确率和96.4%的精确率,表明数据增强和特征融合技术在提高花粉识别准确性和效率方面的有效性,为花粉分析识别相关研究领域提供技术和方法参考。 展开更多
关键词 花粉分类 深度学习 数据增强 特征融合
在线阅读 下载PDF
基于数据增强和机器学习的铁尾矿混凝土抗压强度预测
14
作者 荣兆川 胥孝川 +1 位作者 李志军 戴佳豪 《新型建筑材料》 2025年第3期95-101,141,共8页
研究了铁尾矿(IOTs)对混凝土28 d抗压强度的影响,并采用4种机器学习模型进行分析。通过选择6个关键变量,对145组数据进行描述性统计,采用变分自编码器(VAE)对数据进行增强,并比较了梯度提升、自适应增强、随机森林和高斯过程4种模型的... 研究了铁尾矿(IOTs)对混凝土28 d抗压强度的影响,并采用4种机器学习模型进行分析。通过选择6个关键变量,对145组数据进行描述性统计,采用变分自编码器(VAE)对数据进行增强,并比较了梯度提升、自适应增强、随机森林和高斯过程4种模型的性能。结果表明,梯度提升模型在各项评估指标上均表现最佳,特别是在决定系数、均方误差等关键指标上。基于梯度提升模型预测混凝土的28 d抗压强度,与实际数据吻合度高,泛化能力强,该模型为学者们提供了一种高效、经济、可靠的预测方法。 展开更多
关键词 铁尾矿 抗压强度 机器学习 数据增强 梯度提升
在线阅读 下载PDF
面向深度学习的图像数据增强综述
15
作者 杨锁荣 杨洪朝 +1 位作者 申富饶 赵健 《软件学报》 北大核心 2025年第3期1390-1412,共23页
深度学习已经在许多计算机视觉任务中取得了显著的成果.然而,深度神经网络通常需要大量的训练数据以避免过拟合,但实际应用中标记数据可能非常有限.因此,数据增强已成为提高训练数据充分性和多样性的有效方法,也是深度学习模型成功应用... 深度学习已经在许多计算机视觉任务中取得了显著的成果.然而,深度神经网络通常需要大量的训练数据以避免过拟合,但实际应用中标记数据可能非常有限.因此,数据增强已成为提高训练数据充分性和多样性的有效方法,也是深度学习模型成功应用于图像数据的必要环节.系统地回顾不同的图像数据增强方法,并提出一个新的分类方法,为研究图像数据增强提供了新的视角.从不同的类别出发介绍各类数据增强方法的优势和局限性,并阐述各类方法的解决思路和应用价值.此外,还介绍语义分割、图像分类和目标检测这3种典型计算机视觉任务中常用的公共数据集和性能评价指标,并在这3个任务上对数据增强方法进行实验对比分析.最后,讨论当前数据增强所面临的挑战和未来的发展趋势. 展开更多
关键词 深度学习 图像数据增强 图像识别 泛化性能 计算机视觉
在线阅读 下载PDF
用于植物病虫害图像识别的数据增强方法
16
作者 肖宇 吴杰 马驰 《计算机技术与发展》 2025年第3期210-214,共5页
在深度学习的植物病虫害图像识别领域,区域数据增强是提高模型泛化能力的关键策略。该技术通过有选择性地移除图像的特定区域,促使模型更加专注于提取那些区分度较低的特征,进而增强了模型对新数据的适应性和识别能力。所提出的Saliency... 在深度学习的植物病虫害图像识别领域,区域数据增强是提高模型泛化能力的关键策略。该技术通过有选择性地移除图像的特定区域,促使模型更加专注于提取那些区分度较低的特征,进而增强了模型对新数据的适应性和识别能力。所提出的SaliencyBatchMix数据增强方法利用类激活映射(CAM)计算语义百分比图(SPM)后,按Batch的维度选择具有代表性的图像区域,并将图像区域作为指示性补丁与目标图像混合,以引导模型学习更恰当的特征表示。该方法可减少训练中裁剪区域的无意义像素,并且减少了标签噪声。在GhostNet架构下的实验中,SaliencyBatchMix分别在IP102和Embrapa数据集上实现了72.05%和96.86%的准确率。对比于使用CutMix方法分别提升了0.62百分点和1百分点。通过对结果的对比和消融实验分析,验证了SaliencyBatchMix在提高模型泛化能力和准确率的有效性。 展开更多
关键词 数据增强 类激活映射 深度学习 植物病虫害识别 GhostNet
在线阅读 下载PDF
基于命题逻辑与数据增强的逻辑推理答题方法
17
作者 张杰 张虎 王宇杰 《计算机工程与设计》 北大核心 2025年第1期190-197,共8页
为解决现有面向机器阅读理解的逻辑推理方法对文本中存在的深层逻辑关系利用不足与现有的逻辑推理数据集规模较小的问题,提出一种基于命题逻辑与数据增强的逻辑推理答题方法。将命题逻辑引入到逻辑推理任务,构建符合文本逻辑推理的新规... 为解决现有面向机器阅读理解的逻辑推理方法对文本中存在的深层逻辑关系利用不足与现有的逻辑推理数据集规模较小的问题,提出一种基于命题逻辑与数据增强的逻辑推理答题方法。将命题逻辑引入到逻辑推理任务,构建符合文本逻辑推理的新规则,将其应用到文本逻辑图的扩充过程中,增加文本中可利用的深层逻辑关系;结合文本中存在的逻辑关系,提出并列关系替换、推理词和推理词组替换的数据增强策略。实验结果表明,该方法比以往的方法取得了更好的效果。 展开更多
关键词 阅读理解 逻辑推理 逻辑关系 命题逻辑 文本逻辑图 数据增强 神经推理 符号推理
在线阅读 下载PDF
基于图像翻译的红外弱小目标数据增强算法
18
作者 廖彦彬 季钰翔 +2 位作者 傅志凌 杨海 王喆 《激光与红外》 北大核心 2025年第2期304-312,共9页
为了缓解在红外弱小目标检测问题中图像数据稀缺的问题,提出了一种基于图像翻译的红外弱小目标图像数据增强算法。该方法是一个两阶段的图像生成算法,首先引入额外的可见光图像,通过U-GAT-IT模型学习可见光和红外图像之间的映射,将可见... 为了缓解在红外弱小目标检测问题中图像数据稀缺的问题,提出了一种基于图像翻译的红外弱小目标图像数据增强算法。该方法是一个两阶段的图像生成算法,首先引入额外的可见光图像,通过U-GAT-IT模型学习可见光和红外图像之间的映射,将可见光图像转化为红外背景图像。为了解决图像翻译过程中的过拟合问题,提出了通道正则化方法,使红外和可见光图像的通道信息量保持一致。接着,设计了一个基于视觉Transformer结构的自编码器,学习红外小目标的分布特征,以遮挡重构的方式在得到的红外背景图像上合成弱小目标。本方法在SIATD数据集上进行训练和测试,实验结果表明提出的数据增强方法在三个模型上使检测指标得到了一定提升,其中在YOLOv3模型上AP指标提高了1.37%,证明了提出的数据增强算法的有效性,能够提高目标检测模型在红外弱小目标检测任务中的表现。 展开更多
关键词 图像翻译 数据增强 目标检测 红外弱小目标检测 生成对抗网络 自编码器 转换器网络
在线阅读 下载PDF
基于电话内容文本的数据增强模型研究
19
作者 曾孟佳 阳子聪 黄旭 《电脑知识与技术》 2025年第3期9-11,共3页
群众来电是政府部门倾听民声的重要手段,也是普通民众向政府反映社会生活问题的重要途径。为满足群众向政府拨打电话反映问题后,根据电话内容匹配相应政府处理部门的应用需求,达到快速、自动化短文本分类目的,该文将文本分类模型与数据... 群众来电是政府部门倾听民声的重要手段,也是普通民众向政府反映社会生活问题的重要途径。为满足群众向政府拨打电话反映问题后,根据电话内容匹配相应政府处理部门的应用需求,达到快速、自动化短文本分类目的,该文将文本分类模型与数据增强模型相结合,以提高分类精准度和效率,使用EDA技术、SimBERT和RoFormer-Sim数据增强模型进行对比实验。结果显示,文本分类模型ERNIE和RoFormer-Sim数据增强模型在文本分类任务上表现最佳,F1值为93.41%。相较原样本在BERT-base模型下的效果提高了1.86%。此外,RoFormer增强样本对于不同的文本分类算法,F1值提升均超过了1%。 展开更多
关键词 来电文本 数据增强 文本分类 ERNIE
在线阅读 下载PDF
基于知识融合的藏语安多方言数据增强方法
20
作者 钱木吉 仁增多杰 拉毛吉 《电脑知识与技术》 2025年第7期50-55,共6页
针对藏语安多方言数据稀缺的问题,文章提出一种基于知识融合的数据增强方法。该方法首先分析安多方言词汇特征,将其分为8种实体特征和5种非实体特征,并构建了藏语辞藻、敬语和反义词词典。然后,利用Tibetan-Llama2模型进行风格迁移,将... 针对藏语安多方言数据稀缺的问题,文章提出一种基于知识融合的数据增强方法。该方法首先分析安多方言词汇特征,将其分为8种实体特征和5种非实体特征,并构建了藏语辞藻、敬语和反义词词典。然后,利用Tibetan-Llama2模型进行风格迁移,将藏语书面语转换为安多方言。最后,结合安多方言语法特征,对生成的方言文本进行多特征融合扩充。实验结果表明,该方法将源语料扩充了6.67倍,生成的数据兼具多样性和可读性,为藏语安多方言数据增强提供了一种有效的解决方案。 展开更多
关键词 藏语 安多方言 数据增强 知识融合 风格迁移 低资源语言
在线阅读 下载PDF
上一页 1 2 135 下一页 到第
使用帮助 返回顶部