期刊文献+
共找到769篇文章
< 1 2 39 >
每页显示 20 50 100
数据规模对合著关系预测的影响研究 被引量:3
1
作者 张金柱 韩涛 《情报杂志》 CSSCI 北大核心 2016年第9期80-85,共6页
[目的/意义]为了发现适合合著关系预测的最佳数据集规模,并公平比较合著关系预测的指标,需要比较和分析不同数据规模下合著关系预测的整体准确率和最优指标的变化情况。[方法/过程]选取12个共同邻居及其改进指标作为代表性的合著关系预... [目的/意义]为了发现适合合著关系预测的最佳数据集规模,并公平比较合著关系预测的指标,需要比较和分析不同数据规模下合著关系预测的整体准确率和最优指标的变化情况。[方法/过程]选取12个共同邻居及其改进指标作为代表性的合著关系预测指标,在不同规模的合著网络数据集上运用链路预测的理论和方法计算不同指标的预测准确率,并发现不同数据规模下的最优指标,从而揭示数据规模对合著关系预测的影响以及造成这些影响的原因。[结果/结论]在图书情报领域,通过作者出现频次大小形成不同规模的合著网络数据集,实验结果表明,数据规模越大,合著关系预测的整体准确率越高,并在合著网络全数据集上实现了准确率的巨大提升,说明没有经过任何过滤的完整合著网络是合著关系预测的最佳数据集;同时,不同数据集中合著关系预测的最优指标发生了变化,验证了指标具有数据规模偏好,说明公平科学比较合著关系预测指标需要在多个不同规模的数据集下进行。造成该结果的原因在于随着数据规模变大,合著网络数据集越接近真实情况,改进指标的优势得到了充分发挥。该方法可以扩展应用到其他领域并对结论进行验证。 展开更多
关键词 数据规模 合著关系预测 图书情报 准确率 最优指标
在线阅读 下载PDF
城市轨道交通综合监控系统数据规模和系统性能分析 被引量:4
2
作者 王婷婷 《无线互联科技》 2015年第1期165-167,共3页
以苏州轨道交通4号线为例,探讨了城市轨道交通综合监控系统数据规模和系统性能分析方法。
关键词 轨道交通 综合监控 数据规模 系统性能
在线阅读 下载PDF
数据规模化利用的法律规制 被引量:10
3
作者 袁曾 《地方立法研究》 CSSCI 2023年第5期71-84,共14页
以ChatGPT等为代表的生成式人工智能,已经实现以自然语言交互并输出非特定的内容,其依赖的底层技术架构对数据利用的方式、范围及其效益产生了深刻影响。数据特别是规模化利用的数据,呈现出了从资源化逐步向资产化、资本化转型的特征。... 以ChatGPT等为代表的生成式人工智能,已经实现以自然语言交互并输出非特定的内容,其依赖的底层技术架构对数据利用的方式、范围及其效益产生了深刻影响。数据特别是规模化利用的数据,呈现出了从资源化逐步向资产化、资本化转型的特征。对数据有效规模化利用的规制,将直接决定数据效益的转化成效与数字经济的发展路径。现有数据治理框架,无法高效匹配新科技时代数据利用的技术基础要求与权益再分配的价值需求。当前,我国学界有关数据利用规则体系的研究以数据权属为主要方向,但无法有效解决数据大规模使用与交易效率的实践要求,无法有效促进我国海量数据优势的基础效益转化。为有效解决现实问题与发展要求,需在规模化、标准化、类型化的数据利用模式下,充分激活数据要素市场,重构多层次的数据利用规则与权益分配机制,实现以规则优势引领发展优势,以高质量发展不断推进中国式现代化。 展开更多
关键词 生成式人工智能 数据规模化利用 ChatGPT 数据二十条 算法治理
在线阅读 下载PDF
东方国信:大数据规模优势渐显 被引量:1
4
《股市动态分析》 2016年第47期49-49,共1页
东方国信(300166):三季报营收利润大幅增加,大概率全年完成计划。公司三季度实现营业收入6.7亿元,归属于上市公司股东净利润1.2亿元,两项均同比增长42.27%。四季度是软件类和信息服务类企业业绩确认的传统旺季,目前账面预售账款已有730... 东方国信(300166):三季报营收利润大幅增加,大概率全年完成计划。公司三季度实现营业收入6.7亿元,归属于上市公司股东净利润1.2亿元,两项均同比增长42.27%。四季度是软件类和信息服务类企业业绩确认的传统旺季,目前账面预售账款已有7305万。全年业绩确认有望维持现有的较快速度。大数据1.0已经成为主流技术进入各行业。 展开更多
关键词 数据规模 净利润 税后利润 季报 估值 医疗大数据 公司股东 营业收入
在线阅读 下载PDF
数据规模、数据范围与平台企业绩效——基于数字平台并购视角 被引量:3
5
作者 刘玉斌 张贵娟 徐洪海 《数量经济技术经济研究》 CSSCI CSCD 北大核心 2024年第3期131-152,共22页
数据是数字平台的核心资产,并购是平台企业获取数据的重要途径。同业并购与跨界并购获得的数据类型及其在平台内或平台间的交互作用程度存在差异,它们如何影响企业绩效是数字平台并购策略选择需要关注的关键问题。本文以广告主导平台为... 数据是数字平台的核心资产,并购是平台企业获取数据的重要途径。同业并购与跨界并购获得的数据类型及其在平台内或平台间的交互作用程度存在差异,它们如何影响企业绩效是数字平台并购策略选择需要关注的关键问题。本文以广告主导平台为研究对象,通过构建两阶段Hotelling博弈模型比较分析同业并购与跨界并购对数字平台市场绩效的影响,使用2009~2021年上市的广告主导数字平台相关数据进行实证检验,并对百度公司的并购行为进行案例分析。研究发现:“数据规模经济”主导的同业并购和“数据范围经济”主导的跨界并购均有利于提升平台企业绩效;由于同类数据更易融合并形成“数据规模网络效应”,同业并购对平台企业绩效的提升作用更为明显。本文从数据要素视角深入揭示了不同类型并购影响数字平台市场绩效的内在经济逻辑,可为数字平台如何基于数据规模、数据范围和数据网络效应选择并购策略提供参考依据。 展开更多
关键词 数字平台 同业并购 跨界并购 数据规模经济 数据范围经济
原文传递
云计算环境下计算机大规模数据存储技术
6
作者 张旭 《互联网周刊》 2025年第3期54-56,共3页
随着信息技术的迅猛发展,云计算已成为支持大规模数据存储和处理的重要基础设施。本文介绍了云计算环境中的数据存储架构,重点讨论了多租户存储架构与可扩展性设计在大规模数据存储中的应用与挑战,并深入分析了数据压缩与去重、缓存与... 随着信息技术的迅猛发展,云计算已成为支持大规模数据存储和处理的重要基础设施。本文介绍了云计算环境中的数据存储架构,重点讨论了多租户存储架构与可扩展性设计在大规模数据存储中的应用与挑战,并深入分析了数据压缩与去重、缓存与预取策略、数据分层存储等优化技术。通过对这些技术的探讨,本文展示了如何在云计算环境下实现高效、可靠的大规模数据存储,以期为相关领域的研究与实践提供参考。 展开更多
关键词 云计算环境 计算机 规模数据 数据存储技术
在线阅读 下载PDF
图计算框架的大规模社交网络数据处理
7
作者 党莉莉 于强 张晔 《计算机应用文摘》 2025年第3期157-159,共3页
随着社交网络规模的指数级增长,传统数据处理方法面临挑战。基于图计算框架在处理大规模社交网络数据中的应用情况,文章分析了Pregel,GraphX和PowerGraph等主流框架的优缺点。研究表明,基于BSP模型的分布式图计算框架能显著提升处理效率... 随着社交网络规模的指数级增长,传统数据处理方法面临挑战。基于图计算框架在处理大规模社交网络数据中的应用情况,文章分析了Pregel,GraphX和PowerGraph等主流框架的优缺点。研究表明,基于BSP模型的分布式图计算框架能显著提升处理效率,而针对社交网络特点的改进图分区算法能够有效降低跨分区通信开销。 展开更多
关键词 图计算框架 社交网络分析 规模数据处理 分布式计算 图分区
在线阅读 下载PDF
通信网络大规模数据流隐蔽攻击轻量级检测算法
8
作者 祁巧云 《微处理机》 2025年第1期33-37,共5页
针对通信网络中低频率、随机化等隐蔽攻击难以检测且现有方法效率低下的问题,设计了一种大规模数据流隐蔽攻击检测算法。该算法通过挖掘能量消耗特征和计算参数差异系数,避免循环迭代过程,构建轻量级检测模型,并优化数据包转发监听机制... 针对通信网络中低频率、随机化等隐蔽攻击难以检测且现有方法效率低下的问题,设计了一种大规模数据流隐蔽攻击检测算法。该算法通过挖掘能量消耗特征和计算参数差异系数,避免循环迭代过程,构建轻量级检测模型,并优化数据包转发监听机制。实验结果表明,该算法可在1秒内完成隐蔽攻击检测,3秒内恢复通信信号,可扩展性超过93%。研究成果为提高通信网络安全性提供了新的技术方案,具有良好的应用价值。 展开更多
关键词 通信网络 规模数据 隐蔽攻击 信任值 轻量级 优化数据
在线阅读 下载PDF
超大规模数据处理中并行计算技术的应用研究 被引量:3
9
作者 杨多海 《科技创新与应用》 2024年第17期181-184,共4页
随着人工智能和大数据时代的到来,超大规模数据处理成了一个重要的研究领域。该文主要探讨并行计算技术在超大规模数据处理中的应用,首先详细阐述并行计算和超大规模数据处理的基本理论与概念,特别是并行计算的编程模型与工具,最后通过... 随着人工智能和大数据时代的到来,超大规模数据处理成了一个重要的研究领域。该文主要探讨并行计算技术在超大规模数据处理中的应用,首先详细阐述并行计算和超大规模数据处理的基本理论与概念,特别是并行计算的编程模型与工具,最后通过分析并行计算在搜索引擎、气象预报和金融分析等中的实际案例,阐述并行计算技术在超大规模数据处理中的实际应用。 展开更多
关键词 并行计算技术 超大规模数据处理 编程模型与工具 实际案例 具体应用
在线阅读 下载PDF
MapReduce模型在大规模数据并行挖掘中的应用
10
作者 唐婧 杜微 周翼 《智能物联技术》 2024年第2期38-42,共5页
MapReduce并行编程模型通过定义良好的接口和运行支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度。系统阐述MapReduce的基本工作原理及其工作流程,以TeraSort算法为例,针对其存在的问题,提出动态数据分区... MapReduce并行编程模型通过定义良好的接口和运行支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度。系统阐述MapReduce的基本工作原理及其工作流程,以TeraSort算法为例,针对其存在的问题,提出动态数据分区和数据压缩等优化建议。研究成果表明,优化后的TeraSort算法能够显著缩短数据处理时间,优化系统的吞吐量,并改善资源分配的均衡性。 展开更多
关键词 MAPREDUCE 规模数据 并行挖掘 TeraSort
在线阅读 下载PDF
基于三阶张量的大规模数据谱聚类集成算法 被引量:1
11
作者 仵匀政 杜韬 +2 位作者 周劲 陈迪 王心耕 《大数据》 2024年第3期133-148,共16页
为了降低大规模数据谱聚类计算负担,进一步提高聚类的准确性和鲁棒性,提出了一种基于三阶张量的大规模数据谱聚类集成算法。首先,提出一种混合代表最近邻近似方法构造数据间的稀疏亲和子矩阵;然后将稀疏亲和子矩阵表示为二部图,通过图... 为了降低大规模数据谱聚类计算负担,进一步提高聚类的准确性和鲁棒性,提出了一种基于三阶张量的大规模数据谱聚类集成算法。首先,提出一种混合代表最近邻近似方法构造数据间的稀疏亲和子矩阵;然后将稀疏亲和子矩阵表示为二部图,通过图分割的方法得到初步聚类结果;最后,提出三阶张量集成方法,将多个聚类结果进行融合,得到最终的聚类结果。在大规模的真实数据集和合成数据集上验证,相较经典的谱聚类算法、聚类集成算法以及近年来对其改进的算法,该算法表现出更优异的性能。 展开更多
关键词 数据聚类 规模数据 谱聚类 三阶张量 聚类集成
在线阅读 下载PDF
大规模图数据处理系统的分布式算法设计与性能优化 被引量:4
12
作者 雷希媛 李晓龙 《信息记录材料》 2024年第3期133-135,共3页
随着图数据规模的不断增大,大规模图数据处理系统成为当前研究的热点之一。本文围绕分布式算法设计与性能优化展开研究,旨在解决图数据处理中的挑战与问题。通过深入探讨图数据的特点、分布式系统的应用以及分布式算法设计的原理,结合... 随着图数据规模的不断增大,大规模图数据处理系统成为当前研究的热点之一。本文围绕分布式算法设计与性能优化展开研究,旨在解决图数据处理中的挑战与问题。通过深入探讨图数据的特点、分布式系统的应用以及分布式算法设计的原理,结合性能优化策略,旨在提高大规模图数据处理系统的效率与可扩展性。 展开更多
关键词 规模数据 分布式算法 性能优化 数据处理系统 可扩展性
在线阅读 下载PDF
云计算环境下大规模数据存储技术分析 被引量:1
13
作者 李纪鑫 《信息记录材料》 2024年第1期188-190,共3页
在大规模数据存储中,云计算技术的应用受到广泛重视。分析了云计算环境下大规模数据存储技术的应用价值,并提出了蒙特卡洛(Monte Carlo, MC)算法、并行高级加密标准(advanced encryption standard, AES)算法、双链存储模型、关系数据库... 在大规模数据存储中,云计算技术的应用受到广泛重视。分析了云计算环境下大规模数据存储技术的应用价值,并提出了蒙特卡洛(Monte Carlo, MC)算法、并行高级加密标准(advanced encryption standard, AES)算法、双链存储模型、关系数据库技术的数据存储和查询方法。经过研究结果显示,采用云计算大规模数据存储技术,提升数据存储的弹性扩展性能,具有高可用性和容错性、安全和隐私保护性、数据分析和挖掘等价值,能够明显改善数据存储和处理的效果。 展开更多
关键词 云计算环境 规模数据 存储技术
在线阅读 下载PDF
基于云计算的大规模数据处理算法优化分析 被引量:1
14
作者 沈毅 《集成电路应用》 2024年第6期116-117,共2页
阐述提升数据算法运行速度的策略,介绍基于云计算技术的大规模数据处理算法,包括数据处理算法分类、大规模数据处理算法特点。针对云计算环境下数据处理挑战,提出算法优化方案。
关键词 云计算 规模数据处理 算法优化 数据处理效率
在线阅读 下载PDF
面向大规模图像检索的哈希学习综述
15
作者 张雪凝 刘兴波 +3 位作者 宋井宽 聂秀山 王少华 尹义龙 《软件学报》 北大核心 2025年第1期79-106,共28页
随着互联网空间中图像数据的爆发式增长和图像应用领域的拓宽,大规模图像检索的需求与日俱增.哈希学习为大规模图像检索提供显著的存储与检索效率,并成为近年来一个研究热点.现有哈希学习综述存在着时效性弱与技术路线不清晰的问题,即... 随着互联网空间中图像数据的爆发式增长和图像应用领域的拓宽,大规模图像检索的需求与日俱增.哈希学习为大规模图像检索提供显著的存储与检索效率,并成为近年来一个研究热点.现有哈希学习综述存在着时效性弱与技术路线不清晰的问题,即多总结5–10年前的研究成果,且较少总结哈希学习算法各组成部分间的关联关系.鉴于此,通过总结近20年公开发表的哈希学习文献,对面向大规模图像检索的哈希学习进行系统的综述性研究.首先,介绍哈希学习的技术路线和哈希学习算法的主要组成部分,包括损失函数、优化策略及样本外扩展映射.其次,将面向图像检索的哈希学习算法分为无监督哈希方法和监督哈希方法两类,并分别梳理每类方法的研究现状和演化过程.然后,介绍哈希学习算法评估通用的图像数据集与评估指标,并通过对比实验分析部分经典算法的性能.最后,结合哈希学习的局限性与新挑战对其发展前景进行阶段性总结与展望. 展开更多
关键词 图像检索 规模数据 近似最近邻检索 哈希学习 相似性保持
在线阅读 下载PDF
基于云计算的大规模数据分析与处理
16
作者 刘国华 《微型计算机》 2024年第4期43-45,共3页
伴随着互联网及大数据技术的飞速发展,云计算已逐渐成为当今社会广泛关注的热点,云计算为海量数据的存储、处理及分析提供了全新的解决方案。本文着重探讨了基于云计算的大规模数据分析与处理技术,深入剖析了云计算在数据处理领域的优... 伴随着互联网及大数据技术的飞速发展,云计算已逐渐成为当今社会广泛关注的热点,云计算为海量数据的存储、处理及分析提供了全新的解决方案。本文着重探讨了基于云计算的大规模数据分析与处理技术,深入剖析了云计算在数据处理领域的优势与应用背景,并对面临的挑战与解决方案进行了详尽阐述。本文意在为大数据时代的发展提供有益的借鉴与启示,以助力云计算与大数据领域的创新与发展。 展开更多
关键词 云计算 规模数据 数据分析 数据处理
在线阅读 下载PDF
面向大规模海量数据的数据挖掘隐私保护方法研究
17
作者 胡莺 《数码设计(电子版)》 2024年第2期0444-0446,共3页
大规模海量数据的应用越来越广泛,从商业分析到公共安全,数据挖掘涉及从海量数据中提取有价值的信息,包含医疗记录、消费习惯及地理位置等个人的敏感信息,被用来分析与挖掘时,用户的隐私面临着泄露的风险。数据加密与访问控制等传统的... 大规模海量数据的应用越来越广泛,从商业分析到公共安全,数据挖掘涉及从海量数据中提取有价值的信息,包含医疗记录、消费习惯及地理位置等个人的敏感信息,被用来分析与挖掘时,用户的隐私面临着泄露的风险。数据加密与访问控制等传统的数据保护措施,虽能在一定程度上保护数据,但在面对大规模数据挖掘时显得力不从心。探索更为先进的数据隐私保护方法,在保证数据挖掘有效性的同时,做到了隐私保护的最优化,这些技术创新及规范,共同推动了隐私保护技术的不断发展。 展开更多
关键词 规模海量数据 数据挖掘 隐私保护 方法
原文传递
基于量子计算的输变电系统大规模数据处理与智能决策研究
18
作者 朱锴杰 闵景业 施磊 《电气技术与经济》 2024年第9期328-330,共3页
随着电力系统发展,输变电系统的数据处理与决策日益复杂,传统方法难以满足需求。因此,本研究引入量子计算,利用其强大的并行计算能力和高效优化算法,应对大规模数据处理挑战。针对输变电特点,提出基于量子计算的智能决策方法。该方法能... 随着电力系统发展,输变电系统的数据处理与决策日益复杂,传统方法难以满足需求。因此,本研究引入量子计算,利用其强大的并行计算能力和高效优化算法,应对大规模数据处理挑战。针对输变电特点,提出基于量子计算的智能决策方法。该方法能高效处理海量数据,准确识别系统故,并提供优化决策方案。此外,文章还探讨了量子计算在电力系统负荷预测、电网规划等领域的应潜力。实验结果表明,量子计算在处理输变电大规模数据时优势明显,能提高数据处理的准确性和效率,为电力系统的稳定运行和智能化管理提供支持,为输变电大规模数据处理与智能决策提供新的解决方案,奠定了量子计算在电力系统中的应用基础。 展开更多
关键词 量子计算 输变电系统 规模数据处理 智能决策 并行计算
在线阅读 下载PDF
数据挖掘算法在大规模数据集上的高性能计算实现与效果评估
19
作者 曾小莉 陈凤 《数字技术与应用》 2024年第9期192-194,共3页
本文以“数据挖掘算法在大规模数据集上的高性能计算实现与效果评估”为主题,针对当今大规模数据集背景下,数据挖掘算法在计算性能方面面临的挑战,提出了一种高效的计算实现方法,并对其在实际应用中的效果进行了评估。文章从算法层面入... 本文以“数据挖掘算法在大规模数据集上的高性能计算实现与效果评估”为主题,针对当今大规模数据集背景下,数据挖掘算法在计算性能方面面临的挑战,提出了一种高效的计算实现方法,并对其在实际应用中的效果进行了评估。文章从算法层面入手,通过优化算法结构和设计,提升了算法在大规模数据集上的计算效率,同时基于高性能计算平台,对优化后的算法进行了实际部署,确保了其在大规模数据集上能够快速、稳定地运行。通过对多个真实场景的数据集进行实验验证,充分评估了所提方法在不同应用场景下的性能表现,验证了其在大规模数据集上具有显著的计算效果。 展开更多
关键词 规模数据 高性能计算 数据挖掘算法 真实场景 计算性能 效果评估 计算效果 优化算法
在线阅读 下载PDF
软件测试中大规模数据爬取和测试方法研究
20
作者 毛怡明 《电脑编程技巧与维护》 2024年第3期94-96,103,共4页
大规模数据测试已成为现代软件开发领域不可或缺的一部分。研究强调了数据爬取技术的关键作用,以获取大规模数据用于测试。首先,选择合适的数据源,然后开发或配置数据爬取工具,以有效地收集数据,最后,进行数据清洗和预处理,包括:去噪、... 大规模数据测试已成为现代软件开发领域不可或缺的一部分。研究强调了数据爬取技术的关键作用,以获取大规模数据用于测试。首先,选择合适的数据源,然后开发或配置数据爬取工具,以有效地收集数据,最后,进行数据清洗和预处理,包括:去噪、数据格式化和标准化,以确保测试数据的质量和一致性。测试数据生成是测试的关键组成部分,可通过随机选择样本或数据驱动方法生成测试用例。在性能测试方面,负载测试和性能分析辅助评估软件在大规模数据集下的性能。安全性测试涵盖恶意数据攻击模拟和漏洞扫描,以确保应用程序的安全性。综合而言,大规模数据测试策略必须综合考虑性能、正确性和安全性,以确保软件在应对大规模数据时的稳定性和可靠性。 展开更多
关键词 规模数据测试 数据爬取 测试数据生成 性能测试
在线阅读 下载PDF
上一页 1 2 39 下一页 到第
使用帮助 返回顶部