期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于预测控制的混沌系统参数微调控制方法 被引量:7
1
作者 李冬梅 王正欧 《信息与控制》 CSCD 北大核心 2003年第5期426-430,共5页
本文将预测控制理论引入混沌系统的控制研究中 ,提出一种基于预测控制的混沌系统参数微调控制方法 ,通过对控制参数进行微调 ,将模型未知时的混沌运动稳定到系统的不稳定不动点处 .与现有同类方法相比 ,本控制系统具有快得多的响应速度 ... 本文将预测控制理论引入混沌系统的控制研究中 ,提出一种基于预测控制的混沌系统参数微调控制方法 ,通过对控制参数进行微调 ,将模型未知时的混沌运动稳定到系统的不稳定不动点处 .与现有同类方法相比 ,本控制系统具有快得多的响应速度 ,需要较短的时间就能实现混沌系统的控制 .本方法能够控制超混沌系统 ,算法简便 ,控制算法的收敛性和控制系统的稳定性能够保证 ,理论分析和仿真实验都表明了本方法的有效性 . 展开更多
关键词 混沌系统 预测控制 参数微调控制方法 数学模型
在线阅读 下载PDF
基于多层BP神经网络和无参数微调的人群计数方法 被引量:2
2
作者 徐洋 陈燚 +1 位作者 黄磊 谢晓尧 《计算机科学》 CSCD 北大核心 2018年第10期235-239,共5页
针对大部分现有的人群计数方法被应用到新的场景时性能下降的问题,在多层BP神经网络框架下,提出一种具有无参数微调的人群计数方法。首先,从训练图像中裁切图像块,将获得的相似尺度的行人作为人群BP神经网络模型的输入;然后,BP神经网络... 针对大部分现有的人群计数方法被应用到新的场景时性能下降的问题,在多层BP神经网络框架下,提出一种具有无参数微调的人群计数方法。首先,从训练图像中裁切图像块,将获得的相似尺度的行人作为人群BP神经网络模型的输入;然后,BP神经网络模型通过学习预测密度图,得到了一个具有代表性的人群块;最后,为了处理新场景,对训练好的BP神经网络模型进行目标场景微调,可追求有相同属性的样本,包括候选块检索和局部块检索。实验数据集包括PETS2009数据集、UCSD数据集和UCF_CC_50数据集。这些场景的实验结果验证了提出方法的有效性。相比于全局回归计数法和密度估计计数法,提出的方法在平均绝对误差和均方误差方面均有较大优势,消除了场景间区别和前景分割的影响。 展开更多
关键词 人群计数 BP神经网络 参数微调 密度图 平均绝对误差
在线阅读 下载PDF
激光刻蚀实现介质谐振器参数微调的研究
3
作者 陈赐海 《压电与声光》 CSCD 北大核心 2012年第5期720-723,共4页
研究提出激光刻蚀加工技术的新方法,实现微波陶瓷介质谐振器的参数微调。首先运用电磁理论推导求解本征值问题的有限元法,利用该方法验证了机械调节谐振器参数存在的缺点,重点研究激光刻蚀微调操作中存在的几种影响因素,获得激光微调参... 研究提出激光刻蚀加工技术的新方法,实现微波陶瓷介质谐振器的参数微调。首先运用电磁理论推导求解本征值问题的有限元法,利用该方法验证了机械调节谐振器参数存在的缺点,重点研究激光刻蚀微调操作中存在的几种影响因素,获得激光微调参数与谐振频率改变量的关系式。最后用自制相对频率误差小于0.2%的微波介质谐振器验证了激光刻蚀法微调的优势。 展开更多
关键词 介质谐振器 有限元法 激光刻蚀 谐振频率 参数微调
在线阅读 下载PDF
基于高效参数微调的生成式大模型领域适配技术 被引量:8
4
作者 丁鑫 邹荣金 潘志庚 《人工智能》 2023年第4期1-9,共9页
在深度学习中,“预训练+微调”范式是经典的模型领域适配技术,可有效将预训练模型的丰富知识迁移至新的任务中。然而,随着深度神经网络的规模不断增大,生成式大模型的参数规模往往动辄数十亿甚至数千亿。因此,本文指出在新任务中“全量... 在深度学习中,“预训练+微调”范式是经典的模型领域适配技术,可有效将预训练模型的丰富知识迁移至新的任务中。然而,随着深度神经网络的规模不断增大,生成式大模型的参数规模往往动辄数十亿甚至数千亿。因此,本文指出在新任务中“全量微调”生成式大模型以实现领域适配不再具有可行性。接着,针对以上问题,本文介绍了一种“轻量化”的大模型领域适配技术——高效参数微调,并对三类主流算法进行综述,分析了算法的主要思想和优缺点。最后,本文借助两个成功案例展示了高效参数微调技术在生成式语言/视觉大模型上的应用效果,证明了高效参数调参技术仅需训练少量额外参数即可近似达到“全量微调”的领域适配效果。 展开更多
关键词 高效参数微调 生成式大模型 领域适配 有限算力
在线阅读 下载PDF
前缀标签嵌入的参数高效微调与预测分数引导Mixup的文本分类方法
5
作者 庞宇宏 线岩团 +1 位作者 相艳 黄于欣 《微电子学与计算机》 2025年第2期31-38,共8页
文本分类旨在根据文本的特征,将其划分到一个或多个类别中。目前,在面对文本对抗攻击时,传统的深度学习模型和微调预训练语言模型往往面临着过拟合问题。由于训练数据的特定性,使得模型在处理与训练数据分布不同的对抗性样本时,无法充... 文本分类旨在根据文本的特征,将其划分到一个或多个类别中。目前,在面对文本对抗攻击时,传统的深度学习模型和微调预训练语言模型往往面临着过拟合问题。由于训练数据的特定性,使得模型在处理与训练数据分布不同的对抗性样本时,无法充分泛化,进而降低了模型在对抗性攻击场景中的鲁棒性。一些参数高效的微调方法采用轻量级的模型结构,由于相对较低的表达能力使得模型无法有效捕捉对抗性攻击的复杂特征,导致其鲁棒性差。此外,在模型分类过程中,无论是用于分类的特征向量还是起到引导作用的前缀向量,对分类结果的影响机制尚未得到清晰的认识导致模型的可解释性差。本文提出一个新的方法,将前缀标签嵌入与预训练语言模型融合,在分类层面引入标签与文本相似度的打分机制,通过预测分数引导下的Mixup,有效地挖掘与分类密切相关的特征,缓解过拟合问题,提升模型的鲁棒性。同时结合多头机制,使模型获得更加丰富的特征表达,提升模型可解释性。实验表明,该框架在保持参数高效微调前提下提高了针对4种不同类型的文本攻击的鲁棒性,同时保持了干净文本的可比准确性。 展开更多
关键词 文本分类 鲁棒性 预训练语言模型 前缀标签嵌入 Mixup数据增强 参数高效微调
在线阅读 下载PDF
大模型微调的多领域机器翻译方法综述
6
作者 陈子建 王斯日古楞 斯琴图 《计算机科学与探索》 北大核心 2025年第4期916-928,共13页
随着机器翻译技术的快速发展,基于预训练大模型的机器翻译方法已在自然语言处理领域占据重要地位。然而,由于不同领域之间语言特征、词汇风格和表达方式的显著差异,单一预训练模型在多领域翻译任务中难以实现高效且稳定的性能。为此,聚... 随着机器翻译技术的快速发展,基于预训练大模型的机器翻译方法已在自然语言处理领域占据重要地位。然而,由于不同领域之间语言特征、词汇风格和表达方式的显著差异,单一预训练模型在多领域翻译任务中难以实现高效且稳定的性能。为此,聚焦于多领域机器翻译任务中大模型微调技术的关键问题,系统性地综述了微调技术的核心原理、主要方法及应用效果,重点分析了全参数微调、参数高效微调和提示微调三类策略的性能表现与适用场景。深入探讨了不同微调方法的优势与局限性,重点分析了在资源受限条件下如何通过高效微调策略平衡领域泛化能力与任务特异性,展示了参数高效微调与提示微调在资源利用效率和领域适应性方面的显著优势。通过对比分析与实验验证,进一步评估了不同微调策略在领域迁移和资源利用方面的实际效果,并通过案例分析验证了其有效性。未来的研究方向应重点关注资源的高效利用、模型的领域自适应能力,以及翻译质量和鲁棒性的提升,从而推动多领域机器翻译系统在性能与适应性方面的持续发展。 展开更多
关键词 大模型微调 多领域机器翻译 参数微调 参数高效微调 提示微调
在线阅读 下载PDF
基于奇异值分解的适应微调
7
作者 林志鹏 郭峥嵘 +1 位作者 张伟志 郭躬德 《计算机系统应用》 2025年第1期276-284,共9页
大语言模型的兴起对自然语言处理领域产生了深远影响.随着计算资源的增长和模型规模的扩大,大语言模型在自然语言处理中的应用潜力日益显现.然而,广泛使用的低秩适应微调方法在面对模型规模增大时,遇到了微调效率和存储成本等方面的挑战... 大语言模型的兴起对自然语言处理领域产生了深远影响.随着计算资源的增长和模型规模的扩大,大语言模型在自然语言处理中的应用潜力日益显现.然而,广泛使用的低秩适应微调方法在面对模型规模增大时,遇到了微调效率和存储成本等方面的挑战.为了解决这一问题,本文提出了一种基于奇异值分解的适应微调方法.该方法只需将奇异值分解得到的对角矩阵和缩放向量作为可训练参数,从而在降低训练成本的同时,实现了在多个自然语言处理任务上的性能提升.实验结果显示,基于奇异值分解的适应微调方法在GLUE和E2E基准测试中的性能超越了同等数量级的方法.通过与常用的参数高效微调方法进行比较,发现基于奇异值分解的适应微调方法在减少可训练参数数量和提高微调效率方面具有显著优势,并在可训练参数微调效率实验中实现了最高的性能增益.在未来的研究中,将专注于进一步优化基于奇异值分解的适应微调方法,在更广泛的任务和更大规模的模型中实现更高效的微调. 展开更多
关键词 参数高效微调 生成式大模型 深度学习 领域适配 有限算力
在线阅读 下载PDF
融合多种参数高效微调技术的深度伪造检测方法
8
作者 张溢文 蔡满春 +2 位作者 陈咏豪 朱懿 姚利峰 《计算机科学与探索》 CSCD 北大核心 2024年第12期3335-3347,共13页
近年来,随着深度伪造技术趋于成熟,换脸软件、合成视频已经随处可见。尽管深度伪造技术为人们带来了娱乐,但同时也为不法分子提供了滥用的机会。因此,深度伪造检测技术的重要性也日益凸显。现有的深度伪造检测方法普遍存在跨压缩率鲁棒... 近年来,随着深度伪造技术趋于成熟,换脸软件、合成视频已经随处可见。尽管深度伪造技术为人们带来了娱乐,但同时也为不法分子提供了滥用的机会。因此,深度伪造检测技术的重要性也日益凸显。现有的深度伪造检测方法普遍存在跨压缩率鲁棒性差、跨数据集泛化性差以及模型训练开销大等问题。为解决上述问题,提出一种融合多种参数高效微调技术的深度伪造检测方法,使用以掩码图像建模(MIM)自监督方法预训练的视觉自注意力模型作为主干,使用克罗内克积改进的低秩自适应方法对预训练模型的自注意力模块参数进行微调,同时采用并行结构加入卷积适配器对图像局部纹理信息进行学习,以增强预训练模型在深度伪造检测任务中的适应能力,采用并行结构引入经典适配器对预训练模型的前馈网络微调以充分利用预训练阶段学习到的知识,使用多层感知机代替原预训练模型分类头实现深度伪造检测。在六个数据集上的实验结果表明,该模型在可训练参数仅有2×10^(7)的情况下,在六个主流数据集上实现了平均约0.996的帧水平AUC。在跨压缩率实验中,帧水平AUC的平均下降为0.135。在跨数据集泛化性实验中,帧水平AUC达到了平均0.765。 展开更多
关键词 深度伪造 视觉自注意力模型 自监督预训练模型 低秩自适应 参数高效微调
在线阅读 下载PDF
基于参数高效微调的跨模态枸杞虫害识别模型D-PAG
9
作者 邢嘉璐 刘建平 +2 位作者 周国民 刘立波 王健 《农业大数据学报》 2024年第4期509-521,共13页
随着多模态基础模型(大模型)的发展,如何高效地将其迁移到特定领域或任务中成为目前的热点、难点问题。该研究以多模态大模型CLIP为基础模型,使用参数高效微调方法Prompt、Adapter将CLIP迁移到枸杞虫害识别任务中,提出了用于枸杞虫害识... 随着多模态基础模型(大模型)的发展,如何高效地将其迁移到特定领域或任务中成为目前的热点、难点问题。该研究以多模态大模型CLIP为基础模型,使用参数高效微调方法Prompt、Adapter将CLIP迁移到枸杞虫害识别任务中,提出了用于枸杞虫害识别的跨模态参数高效微调模型D-PAG。D-PAG模型首先在CLIP编码器的输入层或隐层中嵌入了可学习的Prompt与Adapter,用于训练,学习虫害特征;然后利用门控单元将Prompt、Adapter集成到CLIP编码器网络中,平衡两者对特征提取的影响大小,在Adapter中设计了GCS-Adapter注意力用以加强跨模态语义信息融合。为了验证方法的有效性,在枸杞虫害数据集和细粒度数据集IP102上进行了实验。验证实验结果表明,在枸杞数据集上仅用20%样本数量训练便可达到98.8%的准确率,使用40%样本数量训练准确率达到了99.5%;在IP102上验证,准确率达到75.6%,与ViT持平。该方案可在少样本条件下,通过引入极少额外参数,将多模态大模型基础知识高效迁移到特定虫害识别领域,为高效使用大模型解决农业图像处理问题提供了新的技术方案。 展开更多
关键词 枸杞 虫害识别 参数高效微调 大模型 CLIP
在线阅读 下载PDF
视觉大模型参数高效微调技术应用与展望 被引量:2
10
作者 程乐超 《人工智能》 2024年第1期54-65,共12页
视觉大模型(Large Vision Model,LVM)通过在各种大型图像数据集上进行预训练,在图像识别、图像分割等多种下游视觉任务上展现了强大的零样本泛化性能。随着算力的不断提升,大模型的参数规模也在迅速增长,最近的参数规模甚至达到千亿级... 视觉大模型(Large Vision Model,LVM)通过在各种大型图像数据集上进行预训练,在图像识别、图像分割等多种下游视觉任务上展现了强大的零样本泛化性能。随着算力的不断提升,大模型的参数规模也在迅速增长,最近的参数规模甚至达到千亿级。随着参数规模的增加,模型性能持续改进,表明模型获取了更多的知识。然而,从头开始训练这样一个庞大的模型,对硬件资源和训练数据提出了巨大需求,几乎没有个人或公司能够负担如此高昂的成本。参数高效微调(Parameter-Efficient Fine-Tuning,PEFT)通过在已有的大型模型基础上,仅微调较小数量的参数,适配特定的下游任务,而无需对所有参数进行调整。PEFT方法极大地降低了计算成本,并且可以达到甚至超越全参数微调的性能,为解决大型视觉模型适配特定任务时所面临的挑战提供了一种可行而高效的策略。 展开更多
关键词 视觉大模型 参数化高效微调 垂直场景适配
在线阅读 下载PDF
微调Stable Diffusion的侧扫声呐图像数据集扩充方法
11
作者 高鑫 张龙刚 +3 位作者 彭望 郝瑞亭 马双双 郑杰 《舰船科学技术》 北大核心 2025年第4期137-142,共6页
针对水下声学图像获取难度大、优质数据少的问题,提出一种参数高效微调Stable Diffusion的侧扫声呐图像数据集扩充方法。旨在提升数据集质量与多样性,进而改善基于深度学习的舰船侧扫声呐目标检测系统的性能。首先冻结预训练模型全连接... 针对水下声学图像获取难度大、优质数据少的问题,提出一种参数高效微调Stable Diffusion的侧扫声呐图像数据集扩充方法。旨在提升数据集质量与多样性,进而改善基于深度学习的舰船侧扫声呐目标检测系统的性能。首先冻结预训练模型全连接层的权重,随后注入可训练的秩分解矩阵(Rank Decomposition Matrices),最后嵌入提示词生成图像样本。实验结果表明,相比于目前主流基于CycleGAN的方法,提出的方法生成了更高质量、多样化、稳定的侧扫声呐图像。此外,数据集扩充后,多种主流的目标检测算法性能均有所增强,YOLOv8n的mAP@0.5提升了22.9%,证明了该方法的有效性。 展开更多
关键词 侧扫声呐 深度学习 参数高效微调 稳态扩散
在线阅读 下载PDF
基于差分隐私的大语言模型指令微调技术
12
作者 蒋金陵 徐胜超 +2 位作者 杨波 毛明扬 蒋大锐 《计算机与数字工程》 2025年第2期493-498,共6页
由于大语言模型需要接触大量的数据信息,在设计大语言模型指令微调技术时,通常会出现隐私数据泄露的情况,导致技术的微调性能较差。提出基于差分隐私的大语言模型指令微调技术。在差分隐私的作用下,计算指令数据集的敏感度,再计算引入... 由于大语言模型需要接触大量的数据信息,在设计大语言模型指令微调技术时,通常会出现隐私数据泄露的情况,导致技术的微调性能较差。提出基于差分隐私的大语言模型指令微调技术。在差分隐私的作用下,计算指令数据集的敏感度,再计算引入的随机噪声规模,并对指令数据集添加随机噪声。从中读取大量的模型参数,并设定模型的损失函数,通过梯度值对模型参数进行更新,计算模型指令微调参数。通过计算模型评估值,判断其初次微调后模型的性能,再引入低秩矩阵,对大语言模型进行二次微调,实现对模型的性能优化。实验结果表明,设计的微调技术在实际应用中困惑度均值为0.35,微调性能较好。 展开更多
关键词 差分隐私 大语言模型 指令微调 微调策略 微调参数 数据隐私 随机噪声
在线阅读 下载PDF
基于差分隐私的联邦大模型微调技术 被引量:1
13
作者 曾辉 熊诗雨 +1 位作者 狄永正 史红周 《信息安全研究》 CSCD 北大核心 2024年第7期616-623,共8页
随着私有数据可用性的降低,基于联邦学习的大模型参数微调成为备受关注的研究领域.尽管联邦学习本身具有一定程度的隐私保护能力,但其中的梯度泄露攻击和针对大模型的嵌入反转攻击等隐私安全问题仍然威胁着参与者的敏感信息.在当前对隐... 随着私有数据可用性的降低,基于联邦学习的大模型参数微调成为备受关注的研究领域.尽管联邦学习本身具有一定程度的隐私保护能力,但其中的梯度泄露攻击和针对大模型的嵌入反转攻击等隐私安全问题仍然威胁着参与者的敏感信息.在当前对隐私保护意识不断增强的背景下,这些潜在的隐私风险显著阻碍了基于联邦学习的大模型参数微调在实际应用中的推广.因此,提出一种联邦大模型嵌入差分隐私控制算法,通过全局和本地双重隐私控制机制,在高效参数微调过程中为大模型的嵌入模型添加可控的随机噪声,以增强基于联邦学习的大模型参数微调的隐私保护能力.此外,通过对不同联邦设置的实验比较,展示了该算法在大模型参数微调中的隐私保护效果,并通过中心化和联邦化的性能比较实验验证了该算法的可行性. 展开更多
关键词 联邦学习 大模型 高效参数微调 差分隐私 数据隐私泄露
在线阅读 下载PDF
低秩自适应微调的一阶段红外目标跟踪
14
作者 代宇航 刘乔 +2 位作者 袁笛 范娜娜 刘云鹏 《红外与激光工程》 EI CSCD 北大核心 2024年第8期89-103,共15页
由于缺乏大规模的红外跟踪训练数据集,现有的红外跟踪方法大都利用在大规模可见光数据上预训练的模型,然后在小规模的红外数据上进行完全微调。然而,当预训练模型的参数规模迅速增大时,完全微调需要的内存和时间成本也急剧增长,这限制... 由于缺乏大规模的红外跟踪训练数据集,现有的红外跟踪方法大都利用在大规模可见光数据上预训练的模型,然后在小规模的红外数据上进行完全微调。然而,当预训练模型的参数规模迅速增大时,完全微调需要的内存和时间成本也急剧增长,这限制了低资源用户在大型模型上进行研究和应用。为解决该问题,提出一种参数、内存和时间高效自适应的红外目标跟踪算法。首先,通过Transformer的自注意力机制对模板和搜索区域图像进行联合特征提取和关系建模,获取与目标关联度更强的特征表示;其次,利用低秩自适应矩阵的侧网络将可训练参数从主干网络中进行解耦,以减少需要训练更新的参数规模;最后,设计一种轻量级空间特征增强模块,增强特征对目标和背景的判别能力。提出方法的训练参数,内存和时间分别仅占完全微调方法的0.04%、39.6%和66.2%,性能却超越了完全微调。在3个标准红外跟踪数据集LSOTB-TIR120,LSOTB-TIR100和PTB-TIR上的实验对比结果和消融实验证明了提出的方法是有效的。提出的方法在LSOTB-TIR120数据集上成功率为73.7%,精度为86.0%,归一化精度为78.5%;LSOTB-TIR100数据集上成功率为71.6%,精度为83.9%,归一化精度为76.1%;在PTB-TIR数据集上成功率为69.0%,精度为84.9%,均取得了当前最先进的跟踪性能。 展开更多
关键词 红外目标跟踪 参数高效微调 低秩自适应矩阵 特征解耦 TRANSFORMER
在线阅读 下载PDF
迁移学习在机械设备故障诊断领域的进展研究
15
作者 陈驻民 韦继程 《机械管理开发》 2024年第3期96-99,共4页
迁移学习是一种新兴的机器学习方法,通过运用已学习的知识对不同但相关领域问题进行求解,能够较为有效的解决模型泛化能力弱、样本数据不足等问题。针对迁移学习在机械设备故障诊断领域的应用方法进行了综述,总结了三类关于迁移学习的... 迁移学习是一种新兴的机器学习方法,通过运用已学习的知识对不同但相关领域问题进行求解,能够较为有效的解决模型泛化能力弱、样本数据不足等问题。针对迁移学习在机械设备故障诊断领域的应用方法进行了综述,总结了三类关于迁移学习的诊断预测方法,并对迁移学习在故障诊断领域的未来研究方向进行了探讨。 展开更多
关键词 迁移学习 故障诊断 参数微调 特征对齐 生成对抗网络
在线阅读 下载PDF
基于剪枝的大模型联邦参数高效微调技术
16
作者 曾辉 熊诗雨 +1 位作者 狄永正 史红周 《计算机应用》 2025年第3期715-724,共10页
随着数据隐私重要性的不断提升,用于下游任务的预训练基础模型(PFM)的微调变得愈发困难,这推动了基于PFM的联邦学习研究。然而,PFM给联邦学习系统带来了显著的挑战,特别是在本地计算和通信方面。因此,针对联邦学习的本地计算和聚合通信... 随着数据隐私重要性的不断提升,用于下游任务的预训练基础模型(PFM)的微调变得愈发困难,这推动了基于PFM的联邦学习研究。然而,PFM给联邦学习系统带来了显著的挑战,特别是在本地计算和通信方面。因此,针对联邦学习的本地计算和聚合通信这两个主要阶段,分别提出对应的解决方案,即本地高效微调模式和环形本地聚合模式。本地高效微调模式采用基于参数高效微调(PEFT)的模型剪枝算法以减轻本地计算和通信开销;环形本地聚合模式采用分布式的本地聚合方法取代中心化的聚合方法以提升聚合阶段的通信效率。实验结果表明,所提大模型联邦参数高效微调框架在最终性能和效率方面均表现良好。 展开更多
关键词 联邦学习 大模型 微调 参数高效微调 模型剪枝
在线阅读 下载PDF
基于参数高效微调的藏文大模型研究
17
作者 杨毛加 柔特 +2 位作者 才智杰 官却才让 贡去卓么 《中文信息学报》 2024年第12期106-115,共10页
大模型是指拥有庞大参数量的深度学习模型,具备强大的表征学习和生成能力,对自然语言处理等领域产生了深远影响。随着技术的不断进步,大模型在性能和应用范围上不断取得突破,成为人工智能领域的研究热点。然而,大模型的发展也面临着一... 大模型是指拥有庞大参数量的深度学习模型,具备强大的表征学习和生成能力,对自然语言处理等领域产生了深远影响。随着技术的不断进步,大模型在性能和应用范围上不断取得突破,成为人工智能领域的研究热点。然而,大模型的发展也面临着一些挑战,如模型训练成本高、参数冗余以及跨语言应用存在局限性等。特别地,在藏文这一具有独特语言特性的研究领域,大模型的研究尚处于起步阶段,缺乏相应的模型和资源支持。针对上述问题,该文通过基于LoRA的参数高效微调方法,提出了基于Llama2模型架构构建的Tibetan-Llama2和Tibetan-Alpaca模型,经过较大规模数据的增量预训练和指令微调,上述两种模型具备了对藏文的长文本理解和生成能力,展现了其多任务学习能力,并且在多个领域都有广泛的应用前景。 展开更多
关键词 自然语言处理 藏文大模型 参数高效微调 增量预训练 指令微调
在线阅读 下载PDF
基于CLIP的视频时刻检索预训练模型
18
作者 缪翌 张卫锋 徐领 《计算机应用研究》 CSCD 北大核心 2024年第12期3866-3872,共7页
视频时刻检索作为下游任务,依赖预训练模型提取特征的能力。近年的研究表明,以CLIP为代表的图像-语言预训练模型在大规模数据集下能学习到有效且通用的语义知识,从而在图像分类等任务上表现出强大的迁移能力和零样本能力。然而其迁移到... 视频时刻检索作为下游任务,依赖预训练模型提取特征的能力。近年的研究表明,以CLIP为代表的图像-语言预训练模型在大规模数据集下能学习到有效且通用的语义知识,从而在图像分类等任务上表现出强大的迁移能力和零样本能力。然而其迁移到视频时刻检索任务仍效果不佳。为解决上述难题,提出了视频时刻检索网络VMRNet,该网络以CLIP预训练模型为骨干,并设计了用于增强CLIP模型时序建模能力和跨模态交互能力的视频时序增强模块VTEMo。该模块采用旁路层级结构,引入查询文本引导的视觉提示,引导视觉编码器学习当前查询任务关注的视觉信息和时序信息。在QVHighlights、Charades-STA等常用数据集上进行了验证实验,VMRNet的R1@0.5指标在两个数据集上分别提高0.83和1.27,模型总体性能优于其他代表性的模型。实验结果充分表明,提出的VTEMo可在查询文本引导下有效学习视频视觉特征和时序特征,VMRNet结合VTEMo可在视频时刻检索任务上获得更为优秀的表现。 展开更多
关键词 多模态 视频时刻检索 图像-语言预训练模型 参数微调
在线阅读 下载PDF
基于迁移学习双阶段训练的情感语音克隆技术
19
作者 李囡 郭浩 相洁 《计算机工程与设计》 北大核心 2024年第5期1533-1540,共8页
为解决传统基于SV2TTS架构的语音克隆系统合成语音缺乏丰富表达能力的问题,提出一种基于迁移学习双阶段训练说话人编码器的情感语音克隆方法。在说话人识别技术基础上,利用迁移学习,对说话人编码器进行音色克隆训练;在情感克隆训练阶段... 为解决传统基于SV2TTS架构的语音克隆系统合成语音缺乏丰富表达能力的问题,提出一种基于迁移学习双阶段训练说话人编码器的情感语音克隆方法。在说话人识别技术基础上,利用迁移学习,对说话人编码器进行音色克隆训练;在情感克隆训练阶段,采用情感语音数据集对其参数进行微调,提取具有情感信息的说话人特征。将此特征作为合成器的输入对梅尔谱的生成过程进行调节,通过声码器将此梅尔谱转换为具有目标说话人信息的情感语音。主客观分析结果表明,该方法所生成的克隆语音的情感相似度更高,音色相似度也有一定改善。 展开更多
关键词 迁移学习 情感语音克隆 情感语音合成 双阶段训练 说话人识别 说话人编码 参数微调
在线阅读 下载PDF
基于滤波器相似性剪枝的声学场景分类
20
作者 李香梅 马建芬 +1 位作者 降爱莲 张朝霞 《计算机工程与设计》 北大核心 2024年第7期1997-2003,共7页
为解决场景分类系统模型复杂度高且现有场景分类剪枝算法容易丢失重要特征信息的问题,提出一种基于滤波器相似性剪枝的声学场景分类方法。以滤波器自身相似性为基础,采用余弦距离和欧氏距离度量距离融合的方法生成相似矩阵判断滤波器重... 为解决场景分类系统模型复杂度高且现有场景分类剪枝算法容易丢失重要特征信息的问题,提出一种基于滤波器相似性剪枝的声学场景分类方法。以滤波器自身相似性为基础,采用余弦距离和欧氏距离度量距离融合的方法生成相似矩阵判断滤波器重要性并消除冗余滤波器。为提高分类器的泛化性,在网络输出端用决策森林后处理并构建网络。实验结果表明,所提方法能够有效在降低模型复杂度的基础上提升分类精度和系统泛化性,尤其是当消除参数较多时,所提方法特别有利。 展开更多
关键词 声学场景分类 卷积神经网络 滤波器相似性 相似矩阵 滤波器剪枝 参数微调 决策森林
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部