期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
基于信息检索的知识库问答综述
1
作者 田萱 吴志超 《计算机研究与发展》 北大核心 2025年第2期314-335,共22页
知识库问答旨在从知识库中检索相关信息用于模型推理,最终返回准确的答案.近年来随着深度学习和大语言模型的发展,基于信息检索的知识库问答研究成为焦点,涌现出许多新颖方法.从模型方法、数据集等不同方面对基于信息检索的知识库问答... 知识库问答旨在从知识库中检索相关信息用于模型推理,最终返回准确的答案.近年来随着深度学习和大语言模型的发展,基于信息检索的知识库问答研究成为焦点,涌现出许多新颖方法.从模型方法、数据集等不同方面对基于信息检索的知识库问答研究进行梳理总结.首先对知识库问答的研究意义和相关定义进行介绍.然后按照模型执行过程从问句解析、信息检索、模型推理、答案生成这4个阶段阐述每个阶段面临的关键问题以及典型解决方法,对每个阶段所使用到的共性网络模块进行总结.其次针对基于信息检索的知识库问答方法的不可解释性进行分析梳理.此外,对不同特点的相关数据集和不同阶段的基线模型进行了分类介绍与总结.最后对基于信息检索的知识库问答每个执行阶段以及该领域整体发展方向进行了总结和展望. 展开更多
关键词 知识库问答 信息检索 深度学习 大语言模型 阶段性问题
在线阅读 下载PDF
基于深度学习的抽取式摘要研究综述
2
作者 田萱 李嘉梁 孟晓欢 《计算机科学与探索》 CSCD 北大核心 2024年第11期2823-2847,共25页
自动文本摘要(ATS)是自然语言处理的热门研究方向,主要实现方法分为抽取式和生成式两类。抽取式摘要直接采用源文档中的文字内容,相比生成式摘要具有更高的语法正确性和事实正确性,在政策解读、官方文件总结、法律和医药等要求较为严谨... 自动文本摘要(ATS)是自然语言处理的热门研究方向,主要实现方法分为抽取式和生成式两类。抽取式摘要直接采用源文档中的文字内容,相比生成式摘要具有更高的语法正确性和事实正确性,在政策解读、官方文件总结、法律和医药等要求较为严谨的领域具有广泛应用前景。目前基于深度学习的抽取式摘要研究受到广泛关注。主要梳理了近几年基于深度学习的抽取式摘要技术研究进展;针对抽取式摘要的两个关键步骤——文本单元编码和摘要抽取,分别分析了相关研究工作。根据模型框架的不同,将文本单元编码方法分为层级序列编码、基于图神经网络的编码、融合式编码和基于预训练的编码四类进行介绍;根据摘要抽取阶段抽取粒度的不同,将摘要抽取方法分为文本单元级抽取和摘要级抽取两类进行分析。介绍了抽取式摘要任务常用的公共数据集和性能评估指标。预测并分析总结了该领域未来可能的研究方向及相应的发展趋势。 展开更多
关键词 自然语言处理 神经网络 深度学习 抽取 模型框架 预训练 编码方法 融合式
在线阅读 下载PDF
基于ERNIE-RCNN梅花研究信息文本分类方法 被引量:2
3
作者 付红萍 陈恺之 陈志泊 《东北农业大学学报》 CAS CSCD 北大核心 2022年第5期20-31,共12页
采用文本分类方法对梅花中文语料按研究方向(基因、育种、非生物胁迫等)进行分类,是构建梅花知识图谱的重要预处理过程,也是对基于以上研究方向的梅花研究信息进行相关语义检索、智能问答等的重要基础。为探究文本分类方法应用于梅花研... 采用文本分类方法对梅花中文语料按研究方向(基因、育种、非生物胁迫等)进行分类,是构建梅花知识图谱的重要预处理过程,也是对基于以上研究方向的梅花研究信息进行相关语义检索、智能问答等的重要基础。为探究文本分类方法应用于梅花研究信息的可行性,提出基于改进ERNIE-RCNN的梅花研究信息文本分类方法。针对缺乏梅花研究信息数据集导致常用文本分类方法分类效果不佳的问题,构建包含6个研究方向的中文梅花研究信息文本数据集;针对传统分类模型的编码机制难以体现文本逻辑性、语义还原不精确的问题,引入预训练模型ERNIE对文本进行编码,在编码过程中增强对文本特征提取与语义表示的能力;为更好保留文本词序及特征,提高分类正确性,在ERNIE模型编码基础上融合TextRCNN模型进行分类,改进TextRCNN模型卷积层丢弃率,增强分类模型泛化性,提高分类能力。通过对改进ERNIE-RCNN模型与仅改进ERNIE的ERNIE-RCNN模型、原始ERNIE-RCNN模型、ERNIE模型、BERT模型以及TextRCNN模型进行对比,试验结果表明,改进ERNIE-RCNN模型在不同评价指标上均高于其他模型,精准率、召回率和F1值分别不小于91.53%、90.27%、92.35%,正确率为95.35%。基于改进ERNIE-RCNN的梅花研究信息文本分类方法可满足实际需要。 展开更多
关键词 梅花 研究信息 文本分类 ERNIE TextRCNN 深度学习
在线阅读 下载PDF
基于PCIe级联网口的农业监测视频高速传输系统研究 被引量:3
4
作者 段瑞枫 陈艳 +2 位作者 洪凯 张就 张海燕 《农业机械学报》 EI CAS CSCD 北大核心 2024年第3期203-212,共10页
农业监测智慧化需要实时、高效、可靠的视频数据处理和传输方案,为了解决传统基于CPU和GPU架构的系统速率低、实时性差的问题,设计了基于Zynq架构的PCIe级联网口的高速传输系统。针对PCIe接口开发,在硬件层面,优化配置XDMA IP核参数,完... 农业监测智慧化需要实时、高效、可靠的视频数据处理和传输方案,为了解决传统基于CPU和GPU架构的系统速率低、实时性差的问题,设计了基于Zynq架构的PCIe级联网口的高速传输系统。针对PCIe接口开发,在硬件层面,优化配置XDMA IP核参数,完成接口的数据收发引擎设计,并基于MIG 7 IP核优化配置了DDR缓存区。在软件层面,基于PCIe驱动,调度VLC软件完成视频数据读取,实现板卡和上位机之间数据的快速收发和流畅播放。针对网口协议栈的实现,利用ARM可编程特性,调度LWIP轻量级协议栈,完成TCP协议的开发,实现了网口的数据快速收发,避免了上位机CPU直接处理网络协议的时延和运算开销。此外调度AXI协议完成PCIe接口和网口的高速连通。在Zynq MZ7030FA平台上传输视频文件对系统进行速率和可靠性实测。结果表明:网口传输速率达800 Mb/s,基本实现了千兆以太网;PCIe接口的最高传输速率达816 MB/s,逼近硬件PCIe 2.0 x2的最高速率,且整个系统在应用层上实现了可靠传输。本文的研究为农业监测视频传输应用提供了高效可靠的解决方案,且系统具有较好的扩展性和推广性。 展开更多
关键词 农业监测 高速传输 片上系统 现场可编程门阵列 PCIe高速接口 千兆以太网
在线阅读 下载PDF
基于流行的推荐研究综述 被引量:1
5
作者 雷钦岚 田萱 《计算机科学与探索》 CSCD 北大核心 2024年第5期1109-1134,共26页
目前,基于流行的推荐系统成为研究热点。流行度使得推荐效果得到显著提升,而流行偏差带来的马太效应也引发了研究者的广泛关注,同时一些研究者考虑将二者结合作为混合式流行来实现推荐。采用流行这一概念,对流行度、流行偏差和混合式流... 目前,基于流行的推荐系统成为研究热点。流行度使得推荐效果得到显著提升,而流行偏差带来的马太效应也引发了研究者的广泛关注,同时一些研究者考虑将二者结合作为混合式流行来实现推荐。采用流行这一概念,对流行度、流行偏差和混合式流行进行统一表示。首先介绍流行在推荐领域的应用背景,然后根据不同视角,分别对流行度增强推荐方法、去流行偏差推荐方法和混合式流行推荐方法进行综述。在每类方法中,根据建模的具体子任务或具体策略进行进一步划分,对代表性方法进行分析介绍,评价其优点和局限性等,并详细总结每类方法的方法机制和适用场景,从多方面对不同方法间的联系与区别进行讨论。还介绍了该领域中常用数据集、评价指标和基线算法,并对其中代表性方法进行性能对比分析。最后针对基于流行的推荐研究发展趋势提出一些看法,从多角度对该技术未来的发展难点与热点进行总结与展望。 展开更多
关键词 流行度 流行偏差 混合式流行 基于流行的推荐
在线阅读 下载PDF
提示学习研究综述
6
作者 崔金满 李冬梅 +3 位作者 田萱 孟湘皓 杨宇 崔晓晖 《计算机工程与应用》 CSCD 北大核心 2024年第23期1-27,共27页
经过微调的预训练语言模型在各领域任务中均取得了显著的性能。但是,预训练和微调之间在训练数据和目标函数方面存在着巨大差距,阻碍了预训练语言模型对下游任务的有效适应。提示学习的提出缩小了预训练和微调之间的差距,并可以很好地... 经过微调的预训练语言模型在各领域任务中均取得了显著的性能。但是,预训练和微调之间在训练数据和目标函数方面存在着巨大差距,阻碍了预训练语言模型对下游任务的有效适应。提示学习的提出缩小了预训练和微调之间的差距,并可以很好地应用到小样本甚至零样本场景中。提示学习的核心思想是将提示模板插入到原始输入中,将下游任务数据转化为自然语言的形式输入到预训练模型中,输出预测结果,然后通过语言表达器将输出映射到相应的标签。系统地梳理了当前提示学习的相关工作,根据提示学习的实现步骤,从提示模板和语言表达器构建两个阶段介绍该类方法的研究进展。将基于提示模板的方法细分为人工构建、自动构建、引入外部知识构建提示和思维提示方法4种;将基于语言表达器的方法细分为人工构建的表达器、基于搜索的表达器、软表达器和引入外部知识构建表达器的方法4种。总结了提示学习在自然语言处理、计算机视觉和多模态领域的主要应用,并对提示学习相关实验进行了分析。最后,概述了提示学习的现状和挑战,展望了提示学习的未来发展方向。 展开更多
关键词 提示学习 预训练模型 预训练和微调 小样本学习 零样本学习
在线阅读 下载PDF
基于Landsat 8数据的人工林地上生物量估测模型研究
7
作者 闫宇 邓焯 +1 位作者 李斌 赵天忠 《西北林学院学报》 CSCD 北大核心 2024年第5期53-60,77,共9页
为提高森林资源管理的效率和精度,探讨特征变量选择与新型机器学习算法结合建立桉树人工林地上生物量估测模型的精度。以广西高峰林场为研究区,以Landsat 8遥感数据结合实测样地数据,使用Pearson相关性分析法结合随机森林的特征变量选... 为提高森林资源管理的效率和精度,探讨特征变量选择与新型机器学习算法结合建立桉树人工林地上生物量估测模型的精度。以广西高峰林场为研究区,以Landsat 8遥感数据结合实测样地数据,使用Pearson相关性分析法结合随机森林的特征变量选择方法,分别构建基于多元线性回归(MLR)、K最邻近(KNN)、随机森林(RF)和极端梯度提升(XGBoost)算法的森林地上生物量估测模型,使用模型评价指标对比不同模型的精度。结果表明,XGBoost模型拟合精度最高,验证结果R^(2)为0.75、RMSE为30.15 t/hm^(2)、MAE为20.27 t/hm^(2);RF、KNN和MLR模型次之,R^(2)分别为0.69、0.54和0.52。利用Pearson相关性分析法结合随机森林相较于仅使用随机森林筛选变量的方法,R^(2)提高了27.12%、RMSE降低了11.44 t/hm^(2)、MAE降低了8.70 t/hm^(2)。采用机器学习方法的模型比多元线性回归模型更有优势,其中新型机器学习算法XGBoost在生物量估测方面有巨大潜力。Pearson相关性分析结合随机森林的特征选择方法能够减少冗余变量对模型估测精度的影响,有效提高模型预测性能。 展开更多
关键词 森林地上生物量 变量筛选 机器学习 XGBoost Landsat 8
在线阅读 下载PDF
基于深度学习的新闻推荐算法研究综述 被引量:24
8
作者 田萱 丁琪 +1 位作者 廖子慧 孙国栋 《计算机科学与探索》 CSCD 北大核心 2021年第6期971-998,共28页
新闻推荐(NR)可以有效缓解新闻信息过载,是当今人们获取新闻资讯的重要方式,而深度学习(DL)成为近年来促进新闻推荐发展的主流技术,使新闻推荐的效果得到显著提升,受到研究者们的广泛关注。主要对基于深度学习的新闻推荐方法研究现状进... 新闻推荐(NR)可以有效缓解新闻信息过载,是当今人们获取新闻资讯的重要方式,而深度学习(DL)成为近年来促进新闻推荐发展的主流技术,使新闻推荐的效果得到显著提升,受到研究者们的广泛关注。主要对基于深度学习的新闻推荐方法研究现状进行分类梳理和分析归纳。根据对新闻推荐的核心对象——用户和新闻的建模思路不同,将基于深度学习的新闻推荐方法分为“两段式”方法、“融合式”方法和“协同式”方法三类。在每类方法中,根据建模过程中的具体子任务或基于的数据组织结构进行更进一步细分,对代表性模型进行分析介绍,评价其优点和局限性等,并详细总结每类方法的特点和优缺点。另外还介绍了新闻推荐中常用数据集、基线算法和性能评价指标,最后分析展望了该领域未来可能的研究方向及发展趋势。 展开更多
关键词 新闻推荐(NR) 深度学习(DL) 用户兴趣建模 新闻建模
在线阅读 下载PDF
实体关系抽取方法研究综述 被引量:98
9
作者 李冬梅 张扬 +1 位作者 李东远 林丹琼 《计算机研究与发展》 EI CSCD 北大核心 2020年第7期1424-1448,共25页
在自然语言处理领域,信息抽取一直以来受到人们的关注。信息抽取主要包括3项子任务:实体抽取、关系抽取和事件抽取,而关系抽取是信息抽取领域的核心任务和重要环节.实体关系抽取的主要目标是从自然语言文本中识别并判定实体对之间存在... 在自然语言处理领域,信息抽取一直以来受到人们的关注。信息抽取主要包括3项子任务:实体抽取、关系抽取和事件抽取,而关系抽取是信息抽取领域的核心任务和重要环节.实体关系抽取的主要目标是从自然语言文本中识别并判定实体对之间存在的特定关系,这为智能检索、语义分析等提供了基础支持,有助于提高搜索效率,促进知识库的自动构建.综合阐述了实体关系抽取的发展历史,介绍了常用的中文和英文关系抽取工具和评价体系.主要从4个方面展开介绍了实体关系抽取方法,包括:早期的传统关系抽取方法、基于传统机器学习、基于深度学习和基于开放领域的关系抽取方法,总结了在不同历史阶段的主流研究方法以及相应的代表性成果,并对各种实体关系抽取技术进行对比分析.最后,对实体关系抽取的未来重点研究内容和发展趋势进行了总结和展望. 展开更多
关键词 自然语言处理 实体关系抽取 机器学习 深度学习 开放领域
在线阅读 下载PDF
推荐任务中知识图谱嵌入应用研究综述 被引量:10
10
作者 田萱 陈杭雪 《计算机科学与探索》 CSCD 北大核心 2022年第8期1681-1705,共25页
推荐系统旨在为用户推荐个性化内容以提升用户体验,但目前仍面临着诸如可解释性差、冷启动问题和序列化推荐建模等挑战。近年来,蕴含大量结构化知识和语义信息的知识图谱(KG)被广泛应用于各种推荐任务中以期缓解上述问题。对不同推荐任... 推荐系统旨在为用户推荐个性化内容以提升用户体验,但目前仍面临着诸如可解释性差、冷启动问题和序列化推荐建模等挑战。近年来,蕴含大量结构化知识和语义信息的知识图谱(KG)被广泛应用于各种推荐任务中以期缓解上述问题。对不同推荐任务中知识图谱嵌入(KGE)的创新应用进行系统性综述。首先梳理出采用知识图谱嵌入的三类常见推荐任务以及知识图谱嵌入应用的四种目的;然后根据技术不同归纳总结出四类知识图谱嵌入方法,包括传统嵌入方法、嵌入传播方法、异质图嵌入方法和基于图神经网络的方法;进一步详细阐述了每类方法在不同推荐任务中的使用特点及应用策略,评价其优点和局限性等,并从多个方面对方法间的联系与区别进行定性和定量分析;最后,针对面向不同推荐任务中知识图谱嵌入应用的发展趋势提出一些看法,从多个角度展望了该领域未来值得关注的几个发展方向。 展开更多
关键词 知识图谱嵌入(KGE) 推荐任务 可解释推荐 冷启动 序列化推荐 知识图谱嵌入应用
在线阅读 下载PDF
机器学习在社交媒体用户自杀意念检测中的应用综述
11
作者 蒙秀扬 王世屹 +1 位作者 李渡渡 王春玲 《计算机科学与探索》 北大核心 2025年第3期559-581,共23页
近年来,社交媒体平台成为人类发布情感甚至是自杀意念、企图和行为的崭新阵地,并且成为自杀意念检测的重要数据平台和关键评估依据。随着人工智能技术的兴起,关于机器学习在社交媒体用户自杀意念检测中的应用研究成为热点。但在国内,该... 近年来,社交媒体平台成为人类发布情感甚至是自杀意念、企图和行为的崭新阵地,并且成为自杀意念检测的重要数据平台和关键评估依据。随着人工智能技术的兴起,关于机器学习在社交媒体用户自杀意念检测中的应用研究成为热点。但在国内,该领域相关研究较为匮乏,尚未形成完整体系。为系统梳理其研究现状及发展脉络,对机器学习技术赋能自杀意念检测的研究进行了全面总结。概述了自杀意念检测的定义、流程、常见方法及评价指标,总结了目前自杀意念检测任务中常用的数据集和现有特征工程及其技术。分别从传统的机器学习和深度学习的角度对自杀意念检测进行了系统总结,对比分析了每种方法的关键技术、核心思想及优缺点。归纳了当前该领域中亟待解决的问题及创新解决方法,特别介绍了ChatGPT等大语言模型、多模态模型在该领域的应用。讨论了机器学习在社交媒体自杀意念检测应用研究中的局限性,并提出了未来的研究方向,以期进一步推动形成数据驱动、人机协同、跨学科融合、跨文化畛域的数智化自杀意念检测新范式。 展开更多
关键词 自杀意念检测 社交媒体 机器学习 深度学习 特征提取
在线阅读 下载PDF
基于Landsat 8遥感影像的地上生物量模型反演研究 被引量:17
12
作者 周蓉 赵天忠 吴发云 《西北林学院学报》 CSCD 北大核心 2022年第2期186-192,共7页
以吉林省延边朝鲜族自治州汪清县的主要针叶纯林树种为研究对象,结合Landsat 8 OLI数据和地面调查数据,通过提取半径为15 m圆形样地林分尺度下的遥感特征变量实现对地上生物量的估算。首先提取128块样地内的34个遥感特征,其次采用随机... 以吉林省延边朝鲜族自治州汪清县的主要针叶纯林树种为研究对象,结合Landsat 8 OLI数据和地面调查数据,通过提取半径为15 m圆形样地林分尺度下的遥感特征变量实现对地上生物量的估算。首先提取128块样地内的34个遥感特征,其次采用随机森林特征重要性分析遥感特征的贡献率,再利用BP神经网络算法的2种训练算法、SVM支持向量机的3种核函数构建地上生物量模型,最后利用32个测试样本评价模型的估算精度。结果表明,BP神经网络的L-M训练算法和贝叶斯正则化训练算法的R^(2)分别为0.6029、0.6721,RMSE分别为5.0969、4.2637,MAE分别为4.1669、3.2118;SVM支持向量机的线性核函数、RBF核函数、多项式核函数的R^(2)分别为0.5858、0.5619、0.4877,RMSE分别为5.8594、5.6009、5.7637,MAE分别为4.24、3.89、4.176。以贝叶斯正则化训练算法构建地上生物量模型的估测精度最佳;BP神经网络算法比SVM向量机更适用于本研究;同一种机器学习算法不同的训练函数存在差异性。 展开更多
关键词 地上生物量 BP神经网络 SVM支持向量机 遥感影像
在线阅读 下载PDF
定制采伐机数据处理系统设计与实现 被引量:3
13
作者 张航 郭冰峰 +3 位作者 李雯静 李昀 陕晨曦 陈文静 《科学技术创新》 2021年第8期105-109,共5页
基于科研人员对于采伐机数据的研究需要,设计并实现了定制采伐机数据处理系统。通过分析采伐机数据结构特征,实现了pri、hpr、csv三种格式的数据文件的上传功能;针对采伐机数据存在缺失、数据记录过程中造成的不一致、错误等,结合数据... 基于科研人员对于采伐机数据的研究需要,设计并实现了定制采伐机数据处理系统。通过分析采伐机数据结构特征,实现了pri、hpr、csv三种格式的数据文件的上传功能;针对采伐机数据存在缺失、数据记录过程中造成的不一致、错误等,结合数据清洗规则,实现了采伐机数据的清洗;针对科研人员的研究需要,实现了自动计算采伐木胸径和树高、模拟切割、生成干形数据、数据可视化等功能。根据系统分析与用户需求,定制采伐机数据处理系统采用B/S系统架构,选择Django作为服务端框架,Layui为前端页面,MYSQL与Redis作为数据库,采用pandas处理数据。针对大量数据清洗过程的耗时问题,选用多线程与矩阵运算的方式,提高系统运算效率。选用Celery进行任务管理,以任务队列管理方式处理异步任务,避免阻塞问题。 展开更多
关键词 定制采伐机数据 数据处理 数据可视化
在线阅读 下载PDF
直骨架斜接偏移曲线构造等高线的地形算法研究
14
作者 龚勋 杨刚 郭亦非 《地理与地理信息科学》 CSCD 北大核心 2020年第5期1-7,共7页
现有地形生成方法多针对的是自然、随机地形,对具有明确设计需求的地形,尤其是对人工地形自动化生成缺乏深入探讨。针对生产建设中“人工堆垫地形”的高效生成问题,该文提出一种自动化地形生成方法:首先,在分析该类地形形态特征的基础上... 现有地形生成方法多针对的是自然、随机地形,对具有明确设计需求的地形,尤其是对人工地形自动化生成缺乏深入探讨。针对生产建设中“人工堆垫地形”的高效生成问题,该文提出一种自动化地形生成方法:首先,在分析该类地形形态特征的基础上,使用直骨架算法对地形底部平面轮廓图进行区域划分以获得不同的坡面区域,然后采用高效的多边形直骨架斜接偏移算法,构造和编辑阶梯状坡面或曲面坡面,由此可以根据给定参数自动、高效地构造出等高线地形模型。该方法有效扩展了传统直骨架方法的造型能力,对于排土场、梯田和林业景观等地形及边坡的计算机辅助造型设计具有一定的应用价值。 展开更多
关键词 地形建模方法 直骨架 偏移曲线 计算几何 等高线地形图
在线阅读 下载PDF
研究团队研究资源共享平台的研建
15
作者 杨圆飞 田萱 《中国教育信息化》 2020年第11期92-96,共5页
论文、代码及数据集是计算机科学领域的重要研究资源。但论文种类繁多,论文及其相关资源(如代码和数据集)散落在个人电脑上难以查找和共享,导致资源管理效率低、成本高,并容易导致资源泄露或丢失。在当前信息时代,提高研究资源信息化水... 论文、代码及数据集是计算机科学领域的重要研究资源。但论文种类繁多,论文及其相关资源(如代码和数据集)散落在个人电脑上难以查找和共享,导致资源管理效率低、成本高,并容易导致资源泄露或丢失。在当前信息时代,提高研究资源信息化水平具有重要现实意义。文章为北京林业大学信息学院文本挖掘与智能信息处理研究团队设计开发了一套研究资源共享平台,该系统旨在对团队的论文、代码及数据集资源进行统一管理,厘清资源之间的相互关系。该系统具有资源检索、资源上传和下载、数据统计功能,能够帮助团队提升研究效率,节约团队成本。 展开更多
关键词 资源共享 信息管理系统 Spring MVC(Spring Model-Viewer-Controller)框架
在线阅读 下载PDF
基于深度学习的查询建议综述
16
作者 田萱 徐泽洲 王子涵 《计算机研究与发展》 EI CSCD 北大核心 2024年第12期3168-3187,共20页
查询建议是当今搜索引擎必不可少的一个组成部分,它可以在用户输入完整查询前提供查询候选项,帮助用户更准确、更快速地表达信息需求.深度学习技术有助于提升查询建议的准确度,成为近年来推动查询建议发展的主流技术.主要对基于深度学... 查询建议是当今搜索引擎必不可少的一个组成部分,它可以在用户输入完整查询前提供查询候选项,帮助用户更准确、更快速地表达信息需求.深度学习技术有助于提升查询建议的准确度,成为近年来推动查询建议发展的主流技术.主要对基于深度学习的查询建议研究现状进行归纳整理与分析对比,根据深度学习应用阶段不同,把其分为生成式查询建议与排名式查询建议2类,分析其中每种模型的建模思路和处理特征.此外还介绍了查询建议领域常用的数据集、基线方法与评价指标,并对比其中不同模型的技术特点与实验结果.最后总结了基于深度学习的查询建议研究目前面临的挑战与未来发展趋势. 展开更多
关键词 查询建议 深度学习 查询自动补全 编码器-解码器 神经语言模型
在线阅读 下载PDF
可编辑的根系建模与生长模拟方法
17
作者 杨猛 肖成 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第1期73-80,共8页
针对植物根系种类繁多,形态呈现出高度多样性问题,提出一种可编辑的建模方法来模拟根系生长.首先拓展了传统的L系统,以一种具有语义特征的规则描述根系结构与拓扑关系;然后加入根茎半径与单根长度的连续方程,生成符合自然规律的生长;再... 针对植物根系种类繁多,形态呈现出高度多样性问题,提出一种可编辑的建模方法来模拟根系生长.首先拓展了传统的L系统,以一种具有语义特征的规则描述根系结构与拓扑关系;然后加入根茎半径与单根长度的连续方程,生成符合自然规律的生长;再通过指导向量控制根系的全局形态;最后提供多种编辑根茎局部形状的手段,如根茎骨架、曲面造型、不规则表面等,生成具有自然观感的根茎模型.对自然界中的6种植物进行仿真实验,包括直根系、须根系、储藏根系和板根4种不同类型,结果表明,根系的模拟结果与真实图片的平均相似度达到79.16%,所提方法具有构建多种类型根系的建模能力,可以通过设置形状指导曲线或者调节部分参数,构建出具有特殊形态的真实感根系模型. 展开更多
关键词 根系建模 生长模拟 可编辑模型 指导生长
在线阅读 下载PDF
基于深度学习的自然场景文本检测与识别综述 被引量:44
18
作者 王建新 王子亚 田萱 《软件学报》 EI CSCD 北大核心 2020年第5期1465-1496,共32页
自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别... 自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别的相关研究背景及主要技术研究路线;然后,根据自然场景文本信息处理的不同阶段,进一步介绍文本检测模型、文本识别模型和端到端的文本识别模型,并阐述和分析每类模型方法的基本思路和优缺点;另外,列举了常见公共标准数据集以及性能评估指标和方法,并对不同模型相关实验结果进行了对比分析;最后总结基于深度学习的自然场景文本检测与识别技术面临的挑战和发展趋势. 展开更多
关键词 深度学习 自然场景 文本检测 文本识别 端到端
在线阅读 下载PDF
基于语义分割的食品标签文本检测 被引量:11
19
作者 田萱 王子亚 王建新 《农业机械学报》 EI CAS CSCD 北大核心 2020年第8期336-343,共8页
食品包装上的标签文本含有生产日期、营养成分、生产厂家等食品相关信息,这些不仅为消费者购买食品提供了重要依据,也有助于食品监督抽检机构发现潜在的食品安全问题。食品标签文本检测是食品标签自动识别的前提,有助于降低人工录入成... 食品包装上的标签文本含有生产日期、营养成分、生产厂家等食品相关信息,这些不仅为消费者购买食品提供了重要依据,也有助于食品监督抽检机构发现潜在的食品安全问题。食品标签文本检测是食品标签自动识别的前提,有助于降低人工录入成本、提高数据处理效率。基于食品包装图像构建数据集,提出了一种基于语义分割的距离场模型,以检测食品标签。该模型包含像素分类和距离场回归两类任务,其中像素分类任务分割处理图像中的文本区域,距离场回归任务预测文本区域内的像素点到该区域边界的归一化距离。为提升模型的检测性能,在回归预测模块中通过增加注意力模块优化模型结构,并针对距离场回归任务损失值过小、影响模型训练优化问题对其损失函数进行了改进。消融实验结果表明,增加注意力模块和损失函数的改进使得模型的准确率分别提高了4.39、3.80个百分点,有效提高了检测准确率。食品包装图像数据集的对比实验表明,采用本文模型检测食品标签文本具有较好的性能,其召回率、准确率分别达到87.61%、76.50%。 展开更多
关键词 食品标签 语义分割 文本检测 文本识别
在线阅读 下载PDF
多标签分类综述 被引量:6
20
作者 李冬梅 杨宇 +3 位作者 孟湘皓 张小平 宋潮 赵玉凤 《计算机科学与探索》 CSCD 北大核心 2023年第11期2529-2542,共14页
多标签分类是指在一个样本中可能会有多个标签同时存在的分类问题,目前已被广泛应用于文本分类、图像分类、音乐及视频分类等领域。与传统的单标签分类问题不同,由于标签之间可能存在相关性或者依赖关系,多标签分类问题变得更加复杂。... 多标签分类是指在一个样本中可能会有多个标签同时存在的分类问题,目前已被广泛应用于文本分类、图像分类、音乐及视频分类等领域。与传统的单标签分类问题不同,由于标签之间可能存在相关性或者依赖关系,多标签分类问题变得更加复杂。近年来,深度学习技术发展迅猛,结合深度学习的多标签分类方法逐渐成为研究热点。因此,从传统的和基于深度学习的角度对多标签分类方法进行了总结,分析了每一种方法的关键思想、代表性模型和优缺点。在传统的多标签分类方法中,分别介绍了问题转换方法和算法自适应方法。在基于深度学习的多标签分类方法中,特别是对最新的基于Transformer的多标签分类方法进行了综述,该方法目前已成为解决多标签分类问题的主流方法之一。此外,介绍了来自不同领域的多标签分类数据集,并简要分析了多标签分类的15个评价指标。最后,从多模态数据多标签分类、基于提示学习的多标签分类和不平衡数据多标签分类三方面对未来工作进行了展望,以期进一步推动多标签分类的发展和应用。 展开更多
关键词 多标签分类 问题转换 算法自适应 深度学习
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部