期刊文献+
共找到376篇文章
< 1 2 19 >
每页显示 20 50 100
Distance function selection in several clustering algorithms
1
作者 LUYu 《Journal of Chongqing University》 CAS 2004年第1期47-50,共4页
Most clustering algorithms need to describe the similarity of objects by a predefined distance function. Three distance functions which are widely used in two traditional clustering algorithms k-means and hierarchical... Most clustering algorithms need to describe the similarity of objects by a predefined distance function. Three distance functions which are widely used in two traditional clustering algorithms k-means and hierarchical clustering were investigated. Both theoretical analysis and detailed experimental results were given. It is shown that a distance function greatly affects clustering results and can be used to detect the outlier of a cluster by the comparison of such different results and give the shape information of clusters. In practice situation, it is suggested to use different distance function separately, compare the clustering results and pick out the 搒wing points? And such points may leak out more information for data analysts. 展开更多
关键词 distance function clustering algorithms K-MEANS DENDROGRAM data mining
在线阅读 下载PDF
基于Max-min distance聚类算法的园地空间聚类--以永泰县嵩口镇为例
2
作者 冯宇琳 《测绘与空间地理信息》 2024年第7期146-149,共4页
空间聚类是空间数据挖掘的重要手段之一。本文研究了一种基于质心点距离的Max-min distance空间聚类算法:通过加载园地图斑数据,计算其园地图斑质心,判断聚类中心之间的距离,并将符合条件的园地图斑进行聚类,最终将聚类结果可视化表达... 空间聚类是空间数据挖掘的重要手段之一。本文研究了一种基于质心点距离的Max-min distance空间聚类算法:通过加载园地图斑数据,计算其园地图斑质心,判断聚类中心之间的距离,并将符合条件的园地图斑进行聚类,最终将聚类结果可视化表达。本文的算法是利用Visual Studio 2017实验平台和ArcGIS Engine组件式开发环境,采用C#语言进行编写。实验结果表明:1)Max-mindistance聚类通过启发式的选择簇中心,克服了K-means选择簇中心过于邻近的缺点,能够适应嵩口镇等山区丘陵地区空间分布呈破碎的园地数据集分布,有效地实现园地的合理聚类;2)根据连片面积将园地空间聚类结果分为大中小三类,未来嵩口镇可以重点发展园地连片规模较大的村庄,形成规模化的青梅种植园。 展开更多
关键词 max-mindistance聚类算法 园地 GIS 嵩口镇
在线阅读 下载PDF
A Leukocyte image fast scanning based on max–min distance clustering 被引量:1
3
作者 Yapin Wang Yiping Cao 《Journal of Innovative Optical Health Sciences》 SCIE EI CAS 2016年第6期50-57,共8页
A leukocyte image fast scanning method based on max min distance clustering is proposed.Because of the lower proportion and uneven distribution of leukocytes in human peripheral blood,there will not be any leukocyte i... A leukocyte image fast scanning method based on max min distance clustering is proposed.Because of the lower proportion and uneven distribution of leukocytes in human peripheral blood,there will not be any leukocyte in lager quantity of the captured images if we directly scan the blood smear along an ordinary zigzag scanning routine with high power(100^(x))objective.Due to the larger field of view of low power(10^(x))objective,the captured low power blood smear images can be used to locate leukocytes.All of the located positions make up a specific routine,if we scan the blood smear along this routine with high power objective,there will be definitely leukocytes in almost all of the captured images.Considering the number of captured images is still large and some leukocytes may be redundantly captured twice or more,a leukocyte clustering method based on max-min distance clustering is developed to reduce the total number of captured images as well as the number of redundantly captured leukocytes.This method can improve the scanning eficiency obviously.The experimental results show that the proposed method can shorten scanning time from 8.0-14.0min to 2.54.0 min while extracting 110 nonredundant individual high power leukocyte images. 展开更多
关键词 Leukocyte image fast scanning scanning routine max-min distance clustering window clustering microscopic imaging image segmentation
在线阅读 下载PDF
Ant colony ATTA clustering algorithm of rock mass structural plane in groups 被引量:9
4
作者 李夕兵 王泽伟 +1 位作者 彭康 刘志祥 《Journal of Central South University》 SCIE EI CAS 2014年第2期709-714,共6页
Based on structural surface normal vector spherical distance and the pole stereographic projection Euclidean distance,two distance functions were established.The cluster analysis of structure surface was conducted by ... Based on structural surface normal vector spherical distance and the pole stereographic projection Euclidean distance,two distance functions were established.The cluster analysis of structure surface was conducted by the use of ATTA clustering methods based on ant colony piles,and Silhouette index was introduced to evaluate the clustering effect.The clustering analysis of the measured data of Sanshandao Gold Mine shows that ant colony ATTA-based clustering method does better than K-mean clustering analysis.Meanwhile,clustering results of ATTA method based on pole Euclidean distance and ATTA method based on normal vector spherical distance have a great consistence.The clustering results are most close to the pole isopycnic graph.It can efficiently realize grouping of structural plane and determination of the dominant structural surface direction.It is made up for the defects of subjectivity and inaccuracy in icon measurement approach and has great engineering value. 展开更多
关键词 rock mass discontinuity cluster analysis ant colony ATTA algorithm distance function Silhouette index
在线阅读 下载PDF
Design of Evolutionary Algorithm Based Energy Efficient Clustering Approach for Vehicular Adhoc Networks
5
作者 VDinesh SSrinivasan +1 位作者 Gyanendra Prasad Joshi Woong Cho 《Computer Systems Science & Engineering》 SCIE EI 2023年第7期687-699,共13页
In a vehicular ad hoc network(VANET),a massive quantity of data needs to be transmitted on a large scale in shorter time durations.At the same time,vehicles exhibit high velocity,leading to more vehicle disconnections... In a vehicular ad hoc network(VANET),a massive quantity of data needs to be transmitted on a large scale in shorter time durations.At the same time,vehicles exhibit high velocity,leading to more vehicle disconnections.Both of these characteristics result in unreliable data communication in VANET.A vehicle clustering algorithm clusters the vehicles in groups employed in VANET to enhance network scalability and connection reliability.Clustering is considered one of the possible solutions for attaining effectual interaction in VANETs.But one such difficulty was reducing the cluster number under increasing transmitting nodes.This article introduces an Evolutionary Hide Objects Game Optimization based Distance Aware Clustering(EHOGO-DAC)Scheme for VANET.The major intention of the EHOGO-DAC technique is to portion the VANET into distinct sets of clusters by grouping vehicles.In addition,the DHOGO-EAC technique is mainly based on the HOGO algorithm,which is stimulated by old games,and the searching agent tries to identify hidden objects in a given space.The DHOGO-EAC technique derives a fitness function for the clustering process,including the total number of clusters and Euclidean distance.The experimental assessment of the DHOGO-EAC technique was carried out under distinct aspects.The comparison outcome stated the enhanced outcomes of the DHOGO-EAC technique compared to recent approaches. 展开更多
关键词 Vehicular networks clustering evolutionary algorithm fitness function distance metric
在线阅读 下载PDF
基于距离度量的癌症预测分类算法研究
6
作者 殷丽凤 刘浩琦 《大连交通大学学报》 2025年第2期106-112,共7页
为了提高分类算法的效率及准确性,提出一种基于距离度量的二分类算法模型并应用于癌症识别领域。首先,利用k-means聚类找到数据集的聚类中心,计算每个样本点到聚类中心的曼哈顿距离、余弦相似度和马氏距离。其次,采用距离度量替换原有... 为了提高分类算法的效率及准确性,提出一种基于距离度量的二分类算法模型并应用于癌症识别领域。首先,利用k-means聚类找到数据集的聚类中心,计算每个样本点到聚类中心的曼哈顿距离、余弦相似度和马氏距离。其次,采用距离度量替换原有属性放人GBM和XGBoost分类器进行学习的方式来压缩数据属性,以减少分类器的训练压力、提高训练效率,并用训练好的模型对测试集进行预测。最后,设计3组不同训练方式进行对比试验,用分类评估标准评估模型性能,并控制参数从多个角度验证TCDM的合理性。试验结果表明,TCDM相较于其他分类模型在癌症识别领域中有更高的性能和准确率。 展开更多
关键词 分类算法 余弦相似度 马氏距离 曼哈顿距离 K-MEANS聚类
在线阅读 下载PDF
智能电网多智能体信息自动化融合模型构建
7
作者 崔跃君 张浩海 +2 位作者 王昊 王磊 顾新桥 《自动化技术与应用》 2025年第1期110-114,共5页
智能电网多智能体信息具有多源异构性,有效利用信息的准确性较低,融合效率不佳。针对上述问题,构建一种智能电网多智能体信息自动化融合模型。利用数据仓库技术集成智能电网多智能体信息,并实施完整性处理和异常值处理。为降低信息量、... 智能电网多智能体信息具有多源异构性,有效利用信息的准确性较低,融合效率不佳。针对上述问题,构建一种智能电网多智能体信息自动化融合模型。利用数据仓库技术集成智能电网多智能体信息,并实施完整性处理和异常值处理。为降低信息量、信息维度,提取信息距离熵特征,计算匹配系数。然后以匹配系数为输入值,通过K均值聚类算法将同类别的智能电网多智能体信息划分到一起,实现信息自动化融合。实验结果表明:应用所构建的自动化模型,同类融合的信息间一致性达到最大值,均在0.8以上;时间开销均达到最小值,由此说明所构建的模型融合准确性更高,融合效率较好。 展开更多
关键词 智能电网 多智能体 信息集成 距离熵 K均值聚类算法 自动化融合
在线阅读 下载PDF
A New Line Symmetry Distance and Its Application to Data Clustering 被引量:1
8
作者 Sriparna Saha Sanghamitra Bandyopadhyay 《Journal of Computer Science & Technology》 SCIE EI CSCD 2009年第3期544-556,共13页
In this paper, at first a new line-symmetry-based distance is proposed. The properties of the proposed distance are then elaborately described. Kd-tree-based nearest neighbor search is used to reduce the complexity of... In this paper, at first a new line-symmetry-based distance is proposed. The properties of the proposed distance are then elaborately described. Kd-tree-based nearest neighbor search is used to reduce the complexity of computing the proposed line-symmetry-based distance. Thereafter an evolutionary clustering technique is developed that uses the new linesymmetry-based distance measure for assigning points to different clusters. Adaptive mutation and crossover probabilities are used to accelerate the proposed clustering technique. The proposed GA with line-symmetry-distance-based (GALSD) clustering technique is able to detect any type of clusters, irrespective of their geometrical shape and overlapping nature, as long as they possess the characteristics of line symmetry. GALSD is compared with the existing well-known K-means clustering algorithm and a newly developed genetic point-symmetry-distance-based clustering technique (GAPS) for three artificial and two real-life data sets. The efficacy of the proposed line-symmetry-based distance is then shown in recognizing human face from a given image. 展开更多
关键词 unsupervised classification clustering symmetry property line-symmetry-based distance KD-TREE genetic algorithm face recognition
原文传递
基于累积和事件段识别与改进谱聚类的锂离子电池储能系统内短路故障检测方法 被引量:1
9
作者 肖先勇 陈智凡 +2 位作者 汪颖 何涛 张逢蓉 《电网技术》 EI CSCD 北大核心 2024年第2期658-667,共10页
锂离子电池系统的内短路故障可能导致严重安全事故,其检测受到在线检测实时性以及故障特征获得性制约,是当下锂离子电池储能系统安全运行亟待解决的问题。该文提出一种基于累积和(cumulative sum,CUSUM)事件段检测与改进谱聚类的锂离子... 锂离子电池系统的内短路故障可能导致严重安全事故,其检测受到在线检测实时性以及故障特征获得性制约,是当下锂离子电池储能系统安全运行亟待解决的问题。该文提出一种基于累积和(cumulative sum,CUSUM)事件段检测与改进谱聚类的锂离子电池储能系统内短路故障检测方法。首先,考虑内短路故障时的电压/温度变化特性,基于累积和事件突变点识别方法,识别疑似内短路故障事件段。其次,构建三维故障特征,刻画检测对象内短路故障特征属性。然后,构建基于Wasserstein测度的内短路故障特征距离矩阵,检测三维空间各点稀疏特性,客观划定故障聚类,实现内短路故障检测。搭建锂离子电池内短路实验平台、建立锂离子电池电–热耦合仿真模型,算例结果表明该文方法能够准确识别疑似内短路故障事件段,在不同串并联形式及故障类型下实现故障检测,证明了该文方法的正确性与可行性。 展开更多
关键词 内短路故障检测 事件段检测 故障特征 Wasserstein距离 改进谱聚类算法
在线阅读 下载PDF
融合密度和划分的文本聚类算法
10
作者 刘龙 刘新 +1 位作者 蔡林杰 唐朝 《计算机与数字工程》 2024年第1期178-183,共6页
文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中... 文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中的K-均值算法可以有效地聚类文档,但是算法的性能非常依赖于初始中心点的选择。论文提出了一种新的融合密度和划分的文本聚类算法。首先,通过密度选择适当的聚类中心点集合,然后使用最远距离的想法逐渐选择初始类中心点,最后使用划分方法对数据集进行聚类。实验表明,该算法的聚类效果稳定,聚类效果良好。 展开更多
关键词 文档聚类 BERT K-均值算法 密度 最远距离
在线阅读 下载PDF
面向光伏集群扩展规划的两阶段分布鲁棒优化
11
作者 曾君 王天伦 +1 位作者 黄智鹏 张轩 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第9期1-11,共11页
随着双碳目标的深入推进,可再生能源的渗透率逐年攀升,其消纳问题备受关注。分布式可再生能源集群是一种消纳可再生能源的新模式,在规划时需要着重考虑源荷不确定性的影响。以分布式光伏集群新增光伏并网规划为背景,计及源荷的不确定性... 随着双碳目标的深入推进,可再生能源的渗透率逐年攀升,其消纳问题备受关注。分布式可再生能源集群是一种消纳可再生能源的新模式,在规划时需要着重考虑源荷不确定性的影响。以分布式光伏集群新增光伏并网规划为背景,计及源荷的不确定性,提出了一种基于两阶段分布鲁棒优化的光伏集群扩展规划方法。考虑规划阶段和运行阶段侧重的不同,建立了以年等值成本最小为目标、考虑机组出力约束和电网承载能力的两阶段分布鲁棒优化模型。为了提高计算效率,结合K-means聚类和极限场景法对区域分布式光伏和随机负荷的历史数据进行削减和修正,并基于修正后的场景集构造了基于Wasserstein距离的概率分布模糊集。接着采用列和约束生成算法将建立的两阶段分布鲁棒优化模型分解为主问题和子问题,通过主问题和子问题的迭代进行求解,进一步提高了求解效率。其中,为实现子问题的求解,引入了拉格朗日对偶法将子问题转化为确定性优化问题。最后,以某分布式光伏集群为例开展算例分析,结果表明:所提的基于两阶段分布鲁棒优化的光伏集群扩展规划方法可以有效协调规划运行方案的经济性和鲁棒性,根据历史场景集的大小和可靠程度可以灵活调整模型控制参数以满足多种工程应用场景下对可靠性和经济性的不同需求。 展开更多
关键词 光伏集群 极限场景 Wasserstein距离 分布鲁棒优划 列与约束生成算法
在线阅读 下载PDF
基于改进FCM的冲压件缺陷图像分割算法
12
作者 张玉杰 高晗 《计算机工程》 CAS CSCD 北大核心 2024年第10期342-351,共10页
在工业质检过程中,冲压件缺陷图像分割作为缺陷检测的重要环节,直接影响缺陷检测效果。而传统的模糊C均值(FCM)聚类算法未考虑到空间邻域信息,对于噪声干扰较为敏感,导致分割精度较差,且其整体易受初始值的影响,造成收敛速度变慢。针对... 在工业质检过程中,冲压件缺陷图像分割作为缺陷检测的重要环节,直接影响缺陷检测效果。而传统的模糊C均值(FCM)聚类算法未考虑到空间邻域信息,对于噪声干扰较为敏感,导致分割精度较差,且其整体易受初始值的影响,造成收敛速度变慢。针对上述问题,提出一种改进的FCM算法。采用内核诱导距离中的简单两项代替传统的欧氏距离,将原有的空间像素映射到高维特征空间,提高线性可分概率和计算速度;利用图像像素之间的空间相关性,通过引入改进的马尔可夫随机场对FCM目标函数进行修正,提高算法的抗噪能力以及分割精度;采用秃鹰搜索(BES)算法确定FCM的初始聚类中心,提高算法的收敛速度,同时避免算法陷入局部极值的情况。为验证改进FCM算法的性能,选取划分熵、划分系数、Xie_Beni系数以及迭代次数作为评价指标,并与近年来先进的图像分割算法进行对比。实验结果表明,改进FCM算法具有更好的抗噪能力,能得到更好的缺陷分割效果,对工业生产中的冲压件缺陷检测有一定的应用价值。 展开更多
关键词 模糊C均值聚类 工业应用 冲压件缺陷 内核诱导距离 马尔可夫随机场 秃鹰搜索算法
在线阅读 下载PDF
考虑节点功率储备与GIN中心性的主动配电网动态集群电压控制 被引量:7
13
作者 杨悦 陈宇航 +4 位作者 成龙 孙玮澳 顾欣然 郜佳兴 单继忠 《电网技术》 EI CSCD 北大核心 2024年第2期618-629,共12页
为应对大规模分布式光伏(photovoltaic,PV)接入引起的主动配电网电压越限问题,降低控制策略的时序复杂性,提出一种考虑节点功率储备与节点影响力(global importance of each node,GIN)的主动配电网动态集群电压控制方法。首先,通过考虑... 为应对大规模分布式光伏(photovoltaic,PV)接入引起的主动配电网电压越限问题,降低控制策略的时序复杂性,提出一种考虑节点功率储备与节点影响力(global importance of each node,GIN)的主动配电网动态集群电压控制方法。首先,通过考虑系统各节点的功率储备度,定义聚类算法的电压灵敏度-功率储备度(voltage sensitivity-power reserve,VS-PR)综合电气距离量度。进而,以GIN算法改进亲和力传播(affinity propagation,AP)聚类算法,实现网络集群划分与主导节点选取。然后,建立主动配电网集群电压控制模型,并通过动态粒子群算法(dynamic particle swarm optimization,D-PSO)进行模型求解。最后,通过建立基于MATLAB 2021b平台的IEEE 33节点仿真算例对比分析,验证了所提动态集群划分与电压控制方法的正确性和有效性。 展开更多
关键词 主动配电网 电压控制 源–网集群 分布式光伏 综合电气距离 亲和力传播算法 节点影响力
在线阅读 下载PDF
无线传感器网络中一种基于聚合层次聚类的分簇路由算法 被引量:1
14
作者 张芳 高翠芳 《计算机应用研究》 CSCD 北大核心 2024年第9期2805-2814,共10页
针对无线传感器网络中节点连接以及能量受限不足的问题,为了延长网络寿命,提出了一种基于AHC的分簇路由算法(HACCRA)。该算法首先运用AHC对网络节点分簇,接着为簇首选择、簇形成和路径构建分别定义了恰当的决策目标函数,运用能量阈值、... 针对无线传感器网络中节点连接以及能量受限不足的问题,为了延长网络寿命,提出了一种基于AHC的分簇路由算法(HACCRA)。该算法首先运用AHC对网络节点分簇,接着为簇首选择、簇形成和路径构建分别定义了恰当的决策目标函数,运用能量阈值、提出距离阈值、并且路由过程优先考虑簇首节点之间的一对一连接,有效解决了路由算法中分簇和路由不衔接的问题。仿真结果表明,与JCR、ICR以及DCK-LEACH相比,HACCRA能够更好地实现网络节点的能耗均衡,保证网络数据传输的连接性,从而延长网络寿命。 展开更多
关键词 聚合层次聚类算法 距离阈值 一对一连接 能耗均衡 分簇路由算法
在线阅读 下载PDF
RLDEAO优化的空气质量数据聚类分析
15
作者 田闯 黄鹤 +2 位作者 杨澜 王会峰 茹锋 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2024年第5期542-553,共12页
对空气质量数据进行聚类,传统聚类方法因受初始点的影响,存在随机性高、聚类精度低以及多个中心点出现在同一簇中的问题,为此提出了一种反向学习差分进化天鹰优化器(RLDEAO)优化的K-means互补迭代空气质量数据聚类方法。天鹰优化器(aqui... 对空气质量数据进行聚类,传统聚类方法因受初始点的影响,存在随机性高、聚类精度低以及多个中心点出现在同一簇中的问题,为此提出了一种反向学习差分进化天鹰优化器(RLDEAO)优化的K-means互补迭代空气质量数据聚类方法。天鹰优化器(aquila optimizer,AO)算法具有很强的探索能力,不易受初始点的影响且更易实现,但易陷入局部最优。基于自适应逐维小孔成像反向学习策略、停滞扰动结合莱维飞行策略以及生物进化策略等改进思想,对AO算法进行了改进,有效提高了搜索性能,避免了局部最优;在求取聚类中心点时,设计了一种加权最大最小距离积法(weighted maximum minimum distance product,WMMP),能反映各特征的重要性,对改进聚类结果作用良好;将RLDEAO与WMMP相结合优化K-means互补迭代,提高了搜索速率和搜索精度。通过在多个数据集上的聚类测试,发现RLDEAO-KMC算法的收敛精度和聚类效果较AO-KMC、FCM、KMC、KMC++算法更优。可知,RLDEAO-KMC算法可以更高效地对空气质量数据进行聚类分析,有针对性地做出预测和应对。 展开更多
关键词 K-MEANS聚类算法 天鹰优化器(AO) 加权最大最小距离积法
在线阅读 下载PDF
基于自适应布谷鸟优化特征选择的K-means聚类 被引量:6
16
作者 孙林 刘梦含 《计算机应用》 CSCD 北大核心 2024年第3期831-841,共11页
K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首... K-means聚类算法随机确定初始聚类数目,而且原始数据集中含有大量的冗余特征会导致聚类时精度降低,而布谷鸟搜索(CS)算法存在收敛速度慢和局部搜索能力弱等问题,为此提出一种基于自适应布谷鸟优化特征选择的K-means聚类算法(DCFSK)。首先,为提升CS算法的搜索速度和精度,在莱维飞行阶段,设计了自适应步长因子;为调节CS算法全局搜索和局部搜索之间的平衡、加快CS算法的收敛,动态调整发现概率,进而提出改进的动态CS算法(IDCS),在IDCS的基础上构建了结合动态CS的特征选择算法(DCFS)。其次,为提升传统欧氏距离的计算精确度,设计同时考虑样本和特征对距离计算贡献程度的加权欧氏距离;为了确定最佳聚类数目的选取方法,依据改进的加权欧氏距离构造了加权簇内距离和簇间距离。最后,为克服传统K-means聚类目标函数仅考虑簇内的距离而未考虑簇间距离的缺陷,提出基于中位数的轮廓系数的目标函数,进而设计了DCFSK。实验结果表明,在10个基准测试函数上,IDCS的各项指标取得了较优的结果;相较于K-means、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)等算法,在6个合成数据集与6个UCI数据集上,DCFSK的聚类效果最佳。 展开更多
关键词 布谷鸟搜索算法 K-MEANS聚类 欧氏距离 特征选择 轮廓系数
在线阅读 下载PDF
基于神经网络的聚类算法研究 被引量:2
17
作者 胡钦华 党涛 邓见光 《电子设计工程》 2024年第22期186-190,共5页
聚类作为一种无监督学习算法,在处理大规模数据、参数值选择、噪声异常值等方面效果不佳。为了充分考虑算法的有效性和稳定性,该文将神经网络与传统聚类算法相结合,介绍了自组织特征映射、学习向量量化和自适应共振理论三种基于神经网... 聚类作为一种无监督学习算法,在处理大规模数据、参数值选择、噪声异常值等方面效果不佳。为了充分考虑算法的有效性和稳定性,该文将神经网络与传统聚类算法相结合,介绍了自组织特征映射、学习向量量化和自适应共振理论三种基于神经网络的聚类算法。并结合常见的距离度量和相似性度量来验证该类算法在自适应学习和噪声容忍性方面的优势,从而弥补传统聚类算法的不足。全文工作将进一步指导我们深入研究聚类算法在深度神经网络中的应用。 展开更多
关键词 神经网络 聚类算法 距离度量 相似性度量
在线阅读 下载PDF
基于人工鱼群的自适应密度峰值聚类算法
18
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 聚类算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
在线阅读 下载PDF
基于分段动态时间弯曲距离的高损线路窃电检测方法
19
作者 魏梅芳 阳靖 +1 位作者 黄頔 苏盛 《南方电网技术》 CSCD 北大核心 2024年第8期106-114,共9页
利用高损线路中窃电用户用电量与线损电量之间的关联关系识别窃电用户,是降低窃电检测误报率的重要途径,但相关方法对用户负荷时序平稳性等方面有严格要求,限制了其工程应用。提出了基于分段动态时间弯曲距离的高损线路窃电用户识别方... 利用高损线路中窃电用户用电量与线损电量之间的关联关系识别窃电用户,是降低窃电检测误报率的重要途径,但相关方法对用户负荷时序平稳性等方面有严格要求,限制了其工程应用。提出了基于分段动态时间弯曲距离的高损线路窃电用户识别方法。首先,运用启发式分割算法对各用户用电量序列和线损电量序列进行数据变换,实现特征提取和数据降维;然后,利用动态时间弯曲距离找出与线损电量形态最相似的用户用电量,分析它们之间的联动性;最后,提出基于分段动态时间弯曲的密度聚类方法,实现用户用电量聚类,得到具有相同波动方向的用电量簇集,并将与线损电量形态上最相似且波动方向相同的用电电量所对应的用户定为窃电嫌疑用户。基于高损线路的实际数据进行算例仿真,结果表明所提方法相较于对比方法具有更好的精确度及更低的误报率。 展开更多
关键词 高损线路 启发式分割算法 动态时间弯曲距离 密度聚类
在线阅读 下载PDF
异构并行计算下高维混合型数据聚类算法研究 被引量:2
20
作者 祝鹏 《现代电子技术》 北大核心 2024年第9期139-142,共4页
高维数据维度增加,数据空间的体积呈指数增长,容易陷入“维数灾难”,导致聚类算法执行效率低,为此,提出异构并行计算下高维混合型数据聚类算法。构建高维混合型数据相异度矩阵,提取高维混合型数据的统计序列特征值,利用时间窗口进行特... 高维数据维度增加,数据空间的体积呈指数增长,容易陷入“维数灾难”,导致聚类算法执行效率低,为此,提出异构并行计算下高维混合型数据聚类算法。构建高维混合型数据相异度矩阵,提取高维混合型数据的统计序列特征值,利用时间窗口进行特征优化。采用K⁃Prototypes聚类算法提取高维混合型数据的统计序列特征,评估数据与类中心的相异性,计算数据与类中心的欧氏距离,实现高维混合型数据聚类。采用异构并行计算技术进行高维混合型数据K⁃Prototypes聚类的并行化处理,合理分配CPU与GPU工作,达到CPU与GPU的工作负载平衡,提高K⁃Prototypes的聚类效率。实验结果表明,此算法对于高维混合型数据的聚类效果好、运行时间短、性能稳定。 展开更多
关键词 异构并行计算 高维混合型数据 K⁃Prototypes聚类算法 欧氏距离 统计序列特征 负载平衡
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部