期刊文献+

基于分布式大数据技术的科学计量模块化分析平台构建研究 被引量:3

Developing Modularity Scientometrics System with Distributed Technology
原文传递
导出
摘要 【目的】设计开发模块化计量指标分析平台,满足计量分析人员多维条件定制、实时高效计算的计量分析需求。【应用背景】面对海量科学文献数据,传统关系数据库进行大数据量计量计算时效率较低,计算时间长,分布式大数据技术为实时性科学计量分析平台提供了技术基础。【方法】设计计量指标管理模型及基于工作流的指标构建流程,将分析任务分解为多个可独立计算单元;基于分布式大数据ES索引、Redis集合计算、预计算指标等技术,将计算统计任务转化为倒排索引查询及集合运算等操作。【结果】为用户提供标准化的指标选择构建流程、可动态扩展的弹性任务配置及准实时的指标计算支持。【结论】以分布式大数据技术为基础,对计算任务抽象分装,实现了高效、通用的模块化分析平台,同时本研究也可为相关分析决策系统提供参考。 [Objective]This paper designs and develops a modularity scientometrics system,aiming to meet the needs and real time processing tasks facing researchers.[Context]The relational database system cannot manage the vast amount of literature resources,while the distributed technology provides highly efficient computating ability for the scientometrics data.[Methods]We designed a genenal indicator model and a standard task workflow.Then,we built the proposed system based on ES,Redis and modularity indicator designs.[Results]Our platform provides standard workflow for users to conduct scientometrics tasks and receive resluts in almost real time.[Conclusions]The distributed technology and modularity design could help us build a highly efficient and universal scientometrics as well as decision making systems.
作者 师洪波 郭红梅 岳婷 钱力 黄定余 常志军 Shi Hongbo;Guo Hongmei;Yue Ting;Qian Li;Huang Dingyu;Chang Zhijun(National Science Library,Chinese Academy of Sciences,Beijing 100190,China;Department of Library,Information and Archives Management,School of Economics and Management,University of Chinese Academy of Sciences,Beijing 100190,China)
出处 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第2期231-238,共8页 Data Analysis and Knowledge Discovery
基金 中国科学院基金项目“基于科学计量数据的模块化资源服务平台建设”(项目编号:院1750)的研究成果之一.
关键词 分布式技术 模块化分析 科学计量 Distributed Technology Modularity Analysis Scientometrics
  • 相关文献

参考文献3

二级参考文献21

共引文献804

同被引文献36

引证文献3

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部