期刊文献+
共找到780篇文章
< 1 2 39 >
每页显示 20 50 100
An improved transfer learning strategy for short-term cross-building energy prediction usingdata incremental 被引量:4
1
作者 Guannan Li Yubei Wu +5 位作者 Chengchu Yan Xi Fang Tao Li Jiajia Gao Chengliang Xu Zixi Wang 《Building Simulation》 SCIE EI CSCD 2024年第1期165-183,共19页
The available modelling data shortage issue makes it difficult to guarantee the performance of data-driven building energy prediction(BEP)models for both the newly built buildings and existing information-poor buildin... The available modelling data shortage issue makes it difficult to guarantee the performance of data-driven building energy prediction(BEP)models for both the newly built buildings and existing information-poor buildings.Both knowledge transfer learning(KTL)and data incremental learning(DIL)can address the data shortage issue of such buildings.For new building scenarios with continuous data accumulation,the performance of BEP models has not been fully investigated considering the data accumulation dynamics.DIL,which can learn dynamic features from accumulated data adapting to the developing trend of new building time-series data and extend BEP model's knowledge,has been rarely studied.Previous studies have shown that the performance of KTL models trained with fixed data can be further improved in scenarios with dynamically changing data.Hence,this study proposes an improved transfer learning cross-BEP strategy continuously updated using the coarse data incremental(CDI)manner.The hybrid KTL-DIL strategy(LSTM-DANN-CDI)uses domain adversarial neural network(DANN)for KLT and long short-term memory(LSTM)as the Baseline BEP model.Performance evaluation is conducted to systematically qualify the effectiveness and applicability of KTL and improved KTL-DIL.Real-world data from six-type 36 buildings of six types are adopted to evaluate the performance of KTL and KTL-DIL in data-driven BEP tasks considering factors like the model increment time interval,the available target and source building data volumes.Compared with LSTM,results indicate that KTL(LSTM-DANN)and the proposed KTL-DIL(LSTM-DANN-CDI)can significantly improve the BEP performance for new buildings with limited data.Compared with the pure KTL strategy LSTM-DANN,the improved KTL-DIL strategy LSTM-DANN-CDI has better prediction performance with an average performance improvement ratio of 60%. 展开更多
关键词 building energy prediction(BEP) cross-building data incremental learning(DIL) domain adversarial neural network(DANN) knowledge transfer learning(KTL)
原文传递
Use of Incremental Analysis Updates in 4D-Var Data Assimilation 被引量:4
2
作者 Banglin ZHANG Vijay TALLAPRAGADA +2 位作者 Fuzhong WENG Jason SIPPEL Zaizhong MA 《Advances in Atmospheric Sciences》 SCIE CAS CSCD 2015年第12期1575-1582,共8页
The four-dimensional variational (4D-Var) data assimilation systems used in most operational and research centers use initial condition increments as control variables and adjust initial increments to find optimal a... The four-dimensional variational (4D-Var) data assimilation systems used in most operational and research centers use initial condition increments as control variables and adjust initial increments to find optimal analysis solutions. This approach may sometimes create discontinuities in analysis fields and produce undesirable spin ups and spin downs. This study explores using incremental analysis updates (IAU) in 4D-Var to reduce the analysis discontinuities. IAU-based 4D-Var has almost the same mathematical formula as conventional 4D-Var if the initial condition increments are replaced with time-integrated increments as control variables. The IAU technique was implemented in the NASA/GSFC 4D-Var prototype and compared against a control run without IAU. The results showed that the initial precipitation spikes were removed and that other discontinuities were also reduced, especially for the analysis of surface temperature. 展开更多
关键词 data assimilation incremental analysis updates 4D-Vat convergence
在线阅读 下载PDF
Incremental Learning Based on Data Translation and Knowledge Distillation
3
作者 Tan Cheng Jielong Wang 《International Journal of Intelligence Science》 2023年第2期33-47,共15页
Recently, deep convolutional neural networks (DCNNs) have achieved remarkable results in image classification tasks. Despite convolutional networks’ great successes, their training process relies on a large amount of... Recently, deep convolutional neural networks (DCNNs) have achieved remarkable results in image classification tasks. Despite convolutional networks’ great successes, their training process relies on a large amount of data prepared in advance, which is often challenging in real-world applications, such as streaming data and concept drift. For this reason, incremental learning (continual learning) has attracted increasing attention from scholars. However, incremental learning is associated with the challenge of catastrophic forgetting: the performance on previous tasks drastically degrades after learning a new task. In this paper, we propose a new strategy to alleviate catastrophic forgetting when neural networks are trained in continual domains. Specifically, two components are applied: data translation based on transfer learning and knowledge distillation. The former translates a portion of new data to reconstruct the partial data distribution of the old domain. The latter uses an old model as a teacher to guide a new model. The experimental results on three datasets have shown that our work can effectively alleviate catastrophic forgetting by a combination of the two methods aforementioned. 展开更多
关键词 incremental Domain Learning data Translation Knowledge Distillation Cat-astrophic Forgetting
在线阅读 下载PDF
肿瘤临床科学研究新范式
4
作者 樊嘉 高强 董良庆 《中国科学基金》 北大核心 2025年第1期14-23,共10页
伴随着生命科学技术的飞速发展,临床肿瘤学的科研范式的转变引领着前所未有的创新突破,数据驱动型科研方法已经成为推动肿瘤研究的核心力量,从传统的还原论思维到如今的多维度组学数据分析和高通量靶点筛选验证,正迎来类似历史性转折。... 伴随着生命科学技术的飞速发展,临床肿瘤学的科研范式的转变引领着前所未有的创新突破,数据驱动型科研方法已经成为推动肿瘤研究的核心力量,从传统的还原论思维到如今的多维度组学数据分析和高通量靶点筛选验证,正迎来类似历史性转折。尤其是在肝癌诊治领域,基础研究与临床实践的深度融合,推动了肝癌突破性创新与渐进性演化协同促进的“双轨驱动”新科学范式的发展,并在早期筛查、新治疗靶点挖掘以及个体化诊治方面都取得显著进展。新的临床科研范式正以前所未有的速度重塑肿瘤学的前沿,助力突破了传统科研范式的局限,为肿瘤诊疗开辟了创新路径。 展开更多
关键词 科学研究范式 数据驱动 突破性研究 渐进性研究 精准医学
在线阅读 下载PDF
Augmenter:基于数据源图的事件级别入侵检测
5
作者 孙鸿斌 王苏 +3 位作者 王之梁 蒋哲宇 杨家海 张辉 《计算机科学》 北大核心 2025年第2期344-352,共9页
近年来,高级可持续威胁(APT)攻击频发。数据源图包含丰富的上下文信息,反映了进程的执行过程,具有检测APT攻击的潜力,因此基于数据源图的入侵检测系统(PIDS)备受关注。PIDS通过捕获系统日志生成数据源图来识别恶意行为。PIDS主要面临3... 近年来,高级可持续威胁(APT)攻击频发。数据源图包含丰富的上下文信息,反映了进程的执行过程,具有检测APT攻击的潜力,因此基于数据源图的入侵检测系统(PIDS)备受关注。PIDS通过捕获系统日志生成数据源图来识别恶意行为。PIDS主要面临3个挑战:高效性、通用性和实时性,特别是高效性。目前的PIDS在检测到异常行为时,一个异常节点或一张异常图就会产生成千上万条告警,其中会包含大量的误报,给安全人员带来不便。为此,提出了基于数据源图的入侵检测系统Augmenter,同时解决上述3个挑战。Augmenter利用节点的信息字段对进程进行社区划分,有效学习不同进程的行为。此外,Augmenter提出时间窗口策略实现子图划分,并采用了图互信息最大化的无监督特征提取方法提取节点的增量特征,通过增量特征提取来放大异常行为,同时实现异常行为与正常行为的划分。最后,Augmenter依据进程的类型训练多个聚类模型来实现事件级别的检测,通过检测到事件级别的异常能够更精准地定位攻击行为。在DARPA数据集上对Augmenter进行评估,通过衡量检测阶段的运行效率,验证了Augmenter的实时性。在检测能力方面,与最新工作Kairos和ThreaTrace相比,所提方法的精确率和召回率分别为0.83和0.97,Kairos为0.17和0.80,ThreaTrace为0.29和0.76,Augmenter具有更高的精确率和检测性能。 展开更多
关键词 高级可持续威胁 数据源图 入侵检测 增量特征 异常行为
在线阅读 下载PDF
Eclat算法下电力大数据并行关联规则增量挖掘方法
6
作者 孙瑜 任高明 《电力信息与通信技术》 2025年第1期83-88,共6页
电力大数据具有时变性的特点,如果挖掘方法无法实时处理新增数据,及时发现数据之间更新的关联规则,可能导致挖掘结果的滞后和不准确,降低挖掘的准确度。对此,文章提出Eclat算法下电力大数据并行关联规则增量挖掘方法。采用相似项合并策... 电力大数据具有时变性的特点,如果挖掘方法无法实时处理新增数据,及时发现数据之间更新的关联规则,可能导致挖掘结果的滞后和不准确,降低挖掘的准确度。对此,文章提出Eclat算法下电力大数据并行关联规则增量挖掘方法。采用相似项合并策略消除由数据冗余和噪声引起的误导性信息,提高电力大数据的质量;通过最小哈希原理优化Eclat算法,建立Min Hash矩阵估计原始数据集候选项目集,对其实施剪枝,减少数据比较和存储的复杂性,提高挖掘的效率。利用增量更新原则获取更新后候选项目集,并结合Hash Eclat算法快速更新已有的关联规则,实现大数据并行关联规则的增量挖掘,提升关联规则挖掘的准确度。实验结果表明,利用该方法开展关联规则挖掘时,I/O占用量始终在200 kB以下,CPU占用量低于20%,漏检数量和误报数量最低为0,网络通信量最低可达到268 MB,ROC曲线下方面积较大,与当前挖掘方法相比,具有较高的挖掘准确度和较好的挖掘性能。 展开更多
关键词 Eclat算法 电力大数据 并行规则 增量挖掘 数据项合并
在线阅读 下载PDF
面向特征演化数据流的增量学习方法研究
7
作者 陈燕菲 刘三民 《重庆工商大学学报(自然科学版)》 2025年第1期94-104,共11页
目的特征演化数据流的特征空间随时间推移而动态变化,传统增量学习方法囿于固定特征空间的假设,无法直接应用于特征演化数据流的学习场景,因此针对挖掘特征演化数据流时面对的分类模型与当前数据特征不匹配而失效、模型预测性能受噪声... 目的特征演化数据流的特征空间随时间推移而动态变化,传统增量学习方法囿于固定特征空间的假设,无法直接应用于特征演化数据流的学习场景,因此针对挖掘特征演化数据流时面对的分类模型与当前数据特征不匹配而失效、模型预测性能受噪声干扰等问题,提出了一种面向特征演化数据流的增量学习方法。方法首先,通过引入模糊隶度函数并结合增量孪生支持向量机模型,鲁棒地训练与更新分类器;当出现新特征时,重新训练新分类器,同时结合局部线性加权回归算法拟合新旧特征之间的映射关系,从而在旧特征消失时,利用所学到的映射关系,将已训练好的旧分类器投影至新特征空间继续更新;最后,结合两种不同的集成策略以合并新旧两分类器实现共同预测。结果通过大量仿真实验,所提方法分类准确率相较于对比方法提升了0.3%~21.7%;在含不同信噪比数据集上,分类模型性能整体优于对比模型,并随着人工增加噪声比例,模型分类效果受负面影响较小。结论所提方法得以构建性能高效稳定的分类模型,在提升模型预测精度的同时能减少噪声对分类性能的干扰,增强了模型对特征演化数据流自适应学习能力。 展开更多
关键词 数据流挖掘 特征演化 增量学习 动态数据流 集成学习
在线阅读 下载PDF
基于线性回归的多维数据半监督维数约减方法探究
8
作者 林敏 龚让声 《遵义师范学院学报》 2025年第1期88-91,96,共5页
多维数据约减时,并未考虑数据本身的结构,无法较好地保留原始数据结构,影响数据维数约减效果,为此,研究基于线性回归的多维数据半监督维数约减方法。利用正交增量子空间类标传播算法,将有类标多维数据样本标记无类标多维数据样本通过线... 多维数据约减时,并未考虑数据本身的结构,无法较好地保留原始数据结构,影响数据维数约减效果,为此,研究基于线性回归的多维数据半监督维数约减方法。利用正交增量子空间类标传播算法,将有类标多维数据样本标记无类标多维数据样本通过线性回归,建立样本稀疏表示正则项;结合稀疏表示正则项,设计半监督维数约减目标函数,获取最大广义特征值相应的特征向量,构建多维数据的投影矩阵,将多维数据投影成低维数据,完成半监督维数约简。实验结果表明,在不同多维数据维数时,该方法约减维数的最低轮廓系数在0.839左右,轮廓系数较高,不同网络攻击时,安全性较高。 展开更多
关键词 增量子空间 多维数据 半监督 维数约减 线性回归 目标函数
在线阅读 下载PDF
基于智能通信协议的增量配电网数据采集管理方法研究
9
作者 陈金前 《通信电源技术》 2025年第3期43-45,共3页
为提高配电网设备数据采集效率,设计了一种结合自适应传输机制、动态路由优化及高效数据解压缩的智能通信协议,并优化了数据采集流程,包括数据流动模型和存储管理策略。实验结果表明,所提方法在多个指标上显著优于传统Modbus协议,验证... 为提高配电网设备数据采集效率,设计了一种结合自适应传输机制、动态路由优化及高效数据解压缩的智能通信协议,并优化了数据采集流程,包括数据流动模型和存储管理策略。实验结果表明,所提方法在多个指标上显著优于传统Modbus协议,验证了其在增量配电网数据采集中的应用优势。 展开更多
关键词 智能通信协议 增量配电网 数据采集管理
在线阅读 下载PDF
基于联邦增量学习的财务信息数据共享方法
10
作者 李琛琛 《计算机应用文摘》 2025年第3期178-181,185,共5页
在共享过程中,任何用户都可以访问财务信息数据,导致其安全性较低,因此设计了一种基于联邦增量学习的财务信息数据共享方法。融合联邦学习与增量学习优势来定义联邦增量学习的五元组模型,以找到最优共享动作。在确保共享最优动作的前提... 在共享过程中,任何用户都可以访问财务信息数据,导致其安全性较低,因此设计了一种基于联邦增量学习的财务信息数据共享方法。融合联邦学习与增量学习优势来定义联邦增量学习的五元组模型,以找到最优共享动作。在确保共享最优动作的前提下,构建候选数据集的索引库,并通过联邦增量学习生成主密钥和公钥,构建财务信息数据发送方与接收方的共享模型。模型中,用户访问请求需经身份验证和行为信任度评估,只有合法且信任度高的用户才能继续处理请求。模型寻找并评估服务区块节点的安全性,选择最佳节点与用户交互,实现财务数据共享。实验结果表明,设计方法误码率低至0.000024,隐私保护强度高达0.98,而其他方法的误码率较高且隐私保护能力较弱,证明设计方法的安全性更高。 展开更多
关键词 联邦增量学习 财务信息 数据共享 共享动作 密钥
在线阅读 下载PDF
面向区块链网络的数据隐私保护可搜索加密方法研究
11
作者 李坚 杨峰 +3 位作者 吴佳 李平舟 陈乐然 付金凤 《微型电脑应用》 2025年第2期115-118,共4页
为了解决传统区块链数据对称加密上传的弊端,基于Fabric平台,提出一种区块链网络数据动态结构加密的隐私保护可搜索加密方案。将可搜索加密框架分为数据拥有者、数据提供者和数据用户,通过对上传的区块链上传数据进行自适应加密和动态... 为了解决传统区块链数据对称加密上传的弊端,基于Fabric平台,提出一种区块链网络数据动态结构加密的隐私保护可搜索加密方案。将可搜索加密框架分为数据拥有者、数据提供者和数据用户,通过对上传的区块链上传数据进行自适应加密和动态可重建加密,以此实现一种动态的双重安全可搜索加密,提高区块链网络数据的安全和检索效率。结果表明,所提方法关键词查询时间约为1.5 ms,动态更新时间约为100 ms;相较于常用可搜索加密方法,其复杂性更低、安全性较高。由此得出本加密方法促进了区块链在敏感数据领域的应用扩展,同时也为区块链数据共享提供了新的方向。 展开更多
关键词 区块链网络 数据隐私保护 可搜索加密方法 不可预测标签 增量版本控制
在线阅读 下载PDF
New incremental clustering framework based on induction as inverted deduction
12
作者 Lv Zonglei Wang Jiandong Xu Tao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2009年第5期1132-1143,共12页
A new incremental clustering framework is presented, the basis of which is the induction as inverted deduction. Induction is inherently risky because it is not truth-preserving. If the clustering is considered as an i... A new incremental clustering framework is presented, the basis of which is the induction as inverted deduction. Induction is inherently risky because it is not truth-preserving. If the clustering is considered as an induction process, the key to build a valid clustering is to minimize the risk of clustering. From the viewpoint of modal logic, the clustering can be described as Kripke frames and Kripke models which are reflexive and symmetric. Based on the theory of modal logic, its properties can be described by system B in syntax. Thus, the risk of clustering can be calculated by the deduction relation of system B and proximity induction theorem described. Since the new proposed framework imposes no additional restrictive conditions of clustering algorithm, it is therefore a universal framework. An incremental clustering algorithm can be easily constructed by this framework from any given nonincremental clustering algorithm. The experiments show that the lower the a priori risk is, the more effective this framework is. It can be demonstrated that this framework is generally valid. 展开更多
关键词 data mining CLUSTERING incremental clustering induction learning modal logic.
在线阅读 下载PDF
Fast Discovering Frequent Patterns for Incremental XML Queries
13
作者 PENGDun-lu QIUYang 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第5期638-646,共9页
It is nontrivial to maintain such discovered frequent query patterns in real XML-DBMS because the transaction database of queries may allow frequent updates and such updates may not only invalidate some existing frequ... It is nontrivial to maintain such discovered frequent query patterns in real XML-DBMS because the transaction database of queries may allow frequent updates and such updates may not only invalidate some existing frequent query patterns but also generate some new frequent query patterns. In this paper, two incremental updating algorithms, FUX-QMiner and FUXQMiner, are proposed for efficient maintenance of discovered frequent query patterns and generation the new frequent query patterns when new XMI, queries are added into the database. Experimental results from our implementation show that the proposed algorithms have good performance. Key words XML - frequent query pattern - incremental algorithm - data mining CLC number TP 311 Foudation item: Supported by the Youthful Foundation for Scientific Research of University of Shanghai for Science and TechnologyBiography: PENG Dun-lu (1974-), male, Associate professor, Ph.D, research direction: data mining, Web service and its application, peerto-peer computing. 展开更多
关键词 XML frequent query pattern incremental algorithm data mining
在线阅读 下载PDF
不平衡数据下基于SVM增量学习的指挥信息系统状态监控方法
14
作者 焦志强 易侃 +1 位作者 张杰勇 姚佩阳 《系统工程与电子技术》 EI CSCD 北大核心 2024年第3期992-1003,共12页
针对指挥信息系统历史状态样本有限的特点,基于支持向量机(support vector machines,SVM)设计了一种面向不平衡数据的SVM增量学习方法。针对系统正常/异常状态样本不平衡的情况,首先利用支持向量生成一部分新样本,然后通过分带的思想逐... 针对指挥信息系统历史状态样本有限的特点,基于支持向量机(support vector machines,SVM)设计了一种面向不平衡数据的SVM增量学习方法。针对系统正常/异常状态样本不平衡的情况,首先利用支持向量生成一部分新样本,然后通过分带的思想逐带产生分布更加均匀的新样本以调节原样本集的不平衡比。针对系统监控实时性要求高且在运行过程中会有新样本不断加入的特点,采用增量学习的方式对分类模型进行持续更新,在放松KKT(Karush-Kuhn-Tucker)更新触发条件的基础上,通过定义样本重要度并引入保留率和遗忘率的方式减少了增量学习过程中所需训练的样本数量。为了验证算法的有效性和优越性,实验部分在真实系统中获得的数据集以及UCI数据集中3类6组不平衡数据集中与现有的算法进行了对比。结果表明,所提算法能够有效实现对不平衡数据的增量学习,从而满足指挥信息系统状态监控的需求。 展开更多
关键词 指挥信息系统 系统监控 支持向量机 不平衡数据 增量学习
在线阅读 下载PDF
Fault Detection Based on Incremental Locally Linear Embedding for Satellite TX-I 被引量:1
15
作者 程月华 胡国飞 +2 位作者 陆宁云 姜斌 邢琰 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2015年第6期600-609,共10页
A fault detection method based on incremental locally linear embedding(LLE)is presented to improve fault detecting accuracy for satellites with telemetry data.Since conventional LLE algorithm cannot handle incremental... A fault detection method based on incremental locally linear embedding(LLE)is presented to improve fault detecting accuracy for satellites with telemetry data.Since conventional LLE algorithm cannot handle incremental learning,an incremental LLE method is proposed to acquire low-dimensional feature embedded in high-dimensional space.Then,telemetry data of Satellite TX-I are analyzed.Therefore,fault detection are performed by analyzing feature information extracted from the telemetry data with the statistical indexes T2 and squared prediction error(SPE)and SPE.Simulation results verify the fault detection scheme. 展开更多
关键词 incremental locally linear embedding(LLE) telemetry data fault detection dimensionality reduction statistical indexes
在线阅读 下载PDF
面向垂直行业定制的多模态网络编程技术
16
作者 胡宇翔 崔子熙 +2 位作者 田乐 崔鹏帅 季新生 《信息通信技术》 2024年第4期51-56,共6页
多模态网络(Polymorphic Network,PINet)支持多种用户服务在统一的物理环境中共存,实现用户定制的多样化网络协议和能力等。文章以增量式、全维度、一体化和高安全的网络编程为目标,提出一种多模态网络的编程系统方案和运行逻辑,探讨关... 多模态网络(Polymorphic Network,PINet)支持多种用户服务在统一的物理环境中共存,实现用户定制的多样化网络协议和能力等。文章以增量式、全维度、一体化和高安全的网络编程为目标,提出一种多模态网络的编程系统方案和运行逻辑,探讨关键技术包括网络模态生成、安全功能验证和流水线柔性编译等,为各种网络模态的灵活、快速部署提供一种可行的方案。 展开更多
关键词 编程模型 多模态网络 可编程数据平面 增量式编程 网络模态
在线阅读 下载PDF
一种基于改进相对邻域区分度的属性约简算法
17
作者 冯卫兵 孙甜甜 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期1049-1056,共8页
弱标记不完备混合型数据是一种常见的数据类型,因此对弱标记不完备混合决策系统进行属性约简,是当前研究的一个热点.首先,通过改进相对邻域区分度的属性重要度定义,构造基于改进相对邻域区分度的增量式更新机制;然后,设计了弱标记不完... 弱标记不完备混合型数据是一种常见的数据类型,因此对弱标记不完备混合决策系统进行属性约简,是当前研究的一个热点.首先,通过改进相对邻域区分度的属性重要度定义,构造基于改进相对邻域区分度的增量式更新机制;然后,设计了弱标记不完备混合决策系统中增加属性集的增量式属性约简算法;最后,选取UCI数据库上的8个数据集,将改进的算法与其他同类型的属性约简算法进行对比,实验结果表明,改进的算法具有较高的约简效率和分类性能,从而验证了新算法的可行性. 展开更多
关键词 属性约简 弱标记数据 相对邻域区分度 增量学习
在线阅读 下载PDF
基于DBSCAN算法的海量网络数据增量并行化聚类方法
18
作者 郑艳松 陶礼贵 《现代计算机》 2024年第24期97-102,共6页
传统的聚类算法在面对动态递增的数据时,需要重新运行整个聚类过程,耗时且效率低。为有效应对这一挑战,提出基于DBSCAN算法的海量网络数据增量并行化聚类方法。采用Chernoff bounds准则分区网络数据,确保均衡且具代表性。应用DBSCAN算... 传统的聚类算法在面对动态递增的数据时,需要重新运行整个聚类过程,耗时且效率低。为有效应对这一挑战,提出基于DBSCAN算法的海量网络数据增量并行化聚类方法。采用Chernoff bounds准则分区网络数据,确保均衡且具代表性。应用DBSCAN算法聚类,精准识别高密度区域,同时处理噪声数据,实现网络数据的初始化聚类。针对动态数据,设定增量合并原则,高效合并新数据与原始聚类,保持聚类结果实时更新。实验结果表明,所提出的方法具有较高的置信水平(不低于97%),并且在聚类时间复杂度上表现出色,成功实现了对海量网络数据的增量并行化精准快速聚类。 展开更多
关键词 DBSCAN算法 网络数据 数据增量 并行化聚类 Chernoff bounds准则 增量合并规则
在线阅读 下载PDF
基于增量加权的不平衡漂移数据流分类算法 被引量:1
19
作者 蔡博 张海清 +3 位作者 李代伟 向筱铭 于曦 邓钧予 《计算机应用研究》 CSCD 北大核心 2024年第3期854-860,共7页
概念漂移是数据流学习领域中的一个难点问题,同时数据流中存在的类不平衡问题也会严重影响算法的分类性能。针对概念漂移和类不平衡的联合问题,在基于数据块集成的方法上引入在线更新机制,结合重采样和遗忘机制提出了一种增量加权集成... 概念漂移是数据流学习领域中的一个难点问题,同时数据流中存在的类不平衡问题也会严重影响算法的分类性能。针对概念漂移和类不平衡的联合问题,在基于数据块集成的方法上引入在线更新机制,结合重采样和遗忘机制提出了一种增量加权集成的不平衡数据流分类方法(incremental weighted ensemble for imbalance learning,IWEIL)。该方法以集成框架为基础,利用基于可变大小窗口的遗忘机制确定基分类器对窗口内最近若干实例的分类性能,并计算基分类器的权重,随着新实例的逐个到达,在线更新IWEIL中每个基分器及其权重。同时,使用改进的自适应最近邻SMOTE方法生成符合新概念的新少数类实例以解决数据流中类不平衡问题。在人工数据集和真实数据集上进行实验,结果表明,相比于DWMIL算法,IWEIL在HyperPlane数据集上的G-mean和recall指标分别提升了5.77%和6.28%,在Electricity数据集上两个指标分别提升了3.25%和6.47%。最后,IWEIL在安卓应用检测问题上表现良好。 展开更多
关键词 数据流 不平衡数据 概念漂移 增量加权 集成学习
在线阅读 下载PDF
省级自然资源监测数据库建设研究 被引量:1
20
作者 张大骞 郭昌达 +1 位作者 陶旸 刘善磊 《地理空间信息》 2024年第2期109-112,共4页
针对自然资源监测数据成果集成管理与动态更新需求,开展了省级自然资源监测数据库建设研究。在数据分层、数据模型、逻辑设计、物理实现等设计基础上,详细阐述了数据库建库与更新的技术流程。通过空间数据多时态管理技术、多源矢量数据... 针对自然资源监测数据成果集成管理与动态更新需求,开展了省级自然资源监测数据库建设研究。在数据分层、数据模型、逻辑设计、物理实现等设计基础上,详细阐述了数据库建库与更新的技术流程。通过空间数据多时态管理技术、多源矢量数据关联融合、基于身份标识码的全生命周期管理、按需更新的增量更新模式等关键技术应用实施,解决数据标准化整合与数据库动态更新问题,从而为自然资源监测数据库纳入自然资源三维立体时空数据库体系提供支持。 展开更多
关键词 自然资源监测 数据建库 数据整合 增量更新 关联融合 时空数据
在线阅读 下载PDF
上一页 1 2 39 下一页 到第
使用帮助 返回顶部