期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种论文作者重名消歧方法
1
作者 仇国华 赵华 《软件导刊》 2020年第3期111-115,共5页
作者重名消歧是一个重要又复杂的研究课题,在科技文献检索工作中,作者重名问题势必会降低文献检索的效率和准确性,影响工作进度。提出一种改进粒子群算法优化的BP(Back Propagation)神经网络算法,以解决作者重名消歧问题。首先引入Beta... 作者重名消歧是一个重要又复杂的研究课题,在科技文献检索工作中,作者重名问题势必会降低文献检索的效率和准确性,影响工作进度。提出一种改进粒子群算法优化的BP(Back Propagation)神经网络算法,以解决作者重名消歧问题。首先引入Beta分布的动态惯性权重,提高算法全局搜索能力;其次利用改进粒子群算法优化的权值和阈值,作为BP神经网络的初始权值和阈值进行模型训练,以加快模型训练速度;最后通过特征评价函数过滤式选取排序较优的M维特征子集作为输入层特征向量训练模型,得到最终预测结果,从而精确区分重名的作者。实验研究表明,该模型对重名作者身份的预测准确率可达89.01%,证明了该算法的有效性。 展开更多
关键词 重名消歧 PSO算法 BP神经网络 动态惯性权重 特征评价函数
在线阅读 下载PDF
一种基于异质信息网络的学术文献作者重名消歧方法 被引量:7
2
作者 邓启平 陈卫静 +1 位作者 嵇灵 张宇娥 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第4期60-68,共9页
【目的】充分利用学术文献中的实体关系数据解决作者重名消歧问题。【方法】从文献信息中抽取多种类型节点及其关系构建异质信息网络,采用网络表示学习方法获取作者节点的表示向量并利用聚类分析得到初步划分,最后基于强规则匹配融合多... 【目的】充分利用学术文献中的实体关系数据解决作者重名消歧问题。【方法】从文献信息中抽取多种类型节点及其关系构建异质信息网络,采用网络表示学习方法获取作者节点的表示向量并利用聚类分析得到初步划分,最后基于强规则匹配融合多个聚类簇得到消歧结果。【结果】在构建的Web of Science数据集下进行测试,本文方法的K-Metric平均值达0.842,较对比方法提升了63.18%,即使不考虑强规则匹配依然提升了34.69%。【局限】该方法需要利用引文信息,应用场景具有一定的局限性。【结论】基于异质信息网络,利用更丰富的实体关系对作者节点进行表示学习,能有效改善作者重名消歧的效果。 展开更多
关键词 重名消歧 关系数据 异质信息网络 网络表示学习
原文传递
基于网络表示学习的作者重名消歧研究 被引量:11
3
作者 余传明 钟韵辞 +1 位作者 林奥琛 安璐 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第2期48-59,共12页
【目的】消除文献系统中的作者重名歧义,以解决其导致的文献错误聚合问题。【方法】通过结构化文献数据建立作者网络、文献网络以及作者-文献网络,融合不同网络表示学习方法获得文献节点表示,并采用无监督学习方法,将文献节点表示作为特... 【目的】消除文献系统中的作者重名歧义,以解决其导致的文献错误聚合问题。【方法】通过结构化文献数据建立作者网络、文献网络以及作者-文献网络,融合不同网络表示学习方法获得文献节点表示,并采用无监督学习方法,将文献节点表示作为特征,使用层次凝聚聚类按照真实作者对文献进行正确划分。【结果】在ArnetMiner、CiteSeerX和DBLP三组数据集上进行实证研究,本文方法在网络稀疏的情况下仍然具有较好的效果,Macro-F1值在次优模型基础上最高提升6%。【局限】仅研究英文情境下的作者重名消歧。【结论】基于网络表示学习的方法能够有效解决作者重名消歧问题,实验结果对于改进科研合作推荐、引文推荐以及知识网络相关研究具有重要意义。 展开更多
关键词 网络表示学习 异构网络 作者重名消歧 无监督学习
原文传递
基于支持向量机分类和语义信息的中文跨文本指代消解 被引量:5
4
作者 赵知纬 顾静航 +2 位作者 胡亚楠 钱龙华 周国栋 《计算机应用》 CSCD 北大核心 2013年第4期984-987,共4页
跨文本(实体)指代消解(CDCR)的任务就是把所有分布在不同文本但指向相同实体的词组合在一起形成一个指代链。传统的跨文本指代消解主要采用聚类方法来解决信息检索中遇到的重名消歧问题。将聚类问题转换为分类问题,并采用支持向量机(SVM... 跨文本(实体)指代消解(CDCR)的任务就是把所有分布在不同文本但指向相同实体的词组合在一起形成一个指代链。传统的跨文本指代消解主要采用聚类方法来解决信息检索中遇到的重名消歧问题。将聚类问题转换为分类问题,并采用支持向量机(SVM)分类器来解决信息抽取中的重名消歧和多名聚合问题。该方法可有效融合实体名称的构词特征、读音特征以及文本内部和文本外部的多种语义特征。在中文跨文本指代语料库上的实验表明,同聚类方法相比,该方法在提高精度的同时,也提高了召回率。 展开更多
关键词 跨文本指代 信息抽取 支持向量机分类器 语义信息 重名消歧 多名聚合
在线阅读 下载PDF
面向学术文献的作者名消歧方法研究综述 被引量:11
5
作者 沈喆 王毅 +1 位作者 姚毅凡 成颖 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第8期15-27,共13页
【目的】分析并评述面向学术文献的作者名消歧的相关工作,为该领域的后续研究提供借鉴。【文献范围】在Web of Science、谷歌学术、中国知网和万方数据库中检索2016年1月1日至2020年3月28日的相关研究,共选择51篇文献进行综述。【方法... 【目的】分析并评述面向学术文献的作者名消歧的相关工作,为该领域的后续研究提供借鉴。【文献范围】在Web of Science、谷歌学术、中国知网和万方数据库中检索2016年1月1日至2020年3月28日的相关研究,共选择51篇文献进行综述。【方法】以作者名消歧的流程为主线系统梳理各项研究成果,分类总结特征提取、特征表示以及模型训练与预测等主题的研究,并针对研究中的共性问题进行多维度的讨论。【结果】在特征表示方面,相较于2016年之前的研究,基于图、概率和混合模型的方法优化了复杂特征的相似度计算。在模型训练与预测方面,基于机器学习的算法仍需要提高效率与泛化能力,使其能够满足大型数据库和增量消歧的需求。多数研究尚未解决数据中存在的诸如训练数据不均、特征数据缺失、一人多名等问题。【局限】由于各项研究的实证数据差异较大,未能对不同方法进行量化比较。【结论】提出从多源数据融合、用户干预以及预训练模型的引入等视角开展后续研究的思路。 展开更多
关键词 作者名 姓名 重名消歧 文献数据库
原文传递
SCI论文作者自动识别方法研究 被引量:3
6
作者 侯海东 洪腾龙 徐建良 《软件导刊》 2018年第8期57-60,共4页
针对科研管理部门进行SCI论文统计时依赖人工判断识别作者、工作繁重且容易出错等问题,通过深入分析SCI论文文献特征,设计一种利用论文作者姓名和署名单位进行作者自动识别的方法。基于中国海洋大学2012-2016年发表的SCI论文数据进行实... 针对科研管理部门进行SCI论文统计时依赖人工判断识别作者、工作繁重且容易出错等问题,通过深入分析SCI论文文献特征,设计一种利用论文作者姓名和署名单位进行作者自动识别的方法。基于中国海洋大学2012-2016年发表的SCI论文数据进行实验和结果分析,针对作者识别过程中出现的作者重名问题,利用字符串模糊匹配和作者间合著关系对识别方法进行改进,再通过实验对比改进前后的作者识别结果,评估改进方法。实验结果表明,改进方法取得了比较理想的效果,达到了更高的识别精度。 展开更多
关键词 作者识别 重名消歧 合著关系 模糊匹配
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部