一种基于密度单元的自扩展聚类算法被引量：7

An Self-expanded Clustering Algorithm Based on Density Units

在线阅读下载PDF

导出

摘要提出一种高效的基于密度单元的自扩展聚类算法SECDU.首先将数据空间等分为若干个密度单元,再根据数据点的位置将其划分到所属的密度单元中,然后针对密度单元进行聚类.聚类首先产生在数据最密集的区域,然后向周围低密度区域延伸.聚类在延伸的过程中体积逐渐增大,密度逐渐减小,直到聚类的密度达到一个事先规定的限度时为止.算法在保留原有数据分布特性的前提下利用密度单元对数据进行压缩,并在保证具有较好效果的前提下大幅度地提高了聚类的速度. An efficient self-expanded clustering algorithm based on density units （SECDU） is presented. The whole data space is divided into several density units equally. Each data point is put into a density unit according to the data point possition. The area with the highest data density is the starting point of clustering and it is expanded to the low-density area. The whole process will not stop until densities of all clusters reduce to the threshold set in advance. By compressing data into data units, SECDU can cluster large dataset at a high speed without destroying distribution feature.

作者于勇前赵相国王国仁陈衡岳

机构地区东北大学信息科学与工程学院

出处《控制与决策》 EI CSCD 北大核心 2006年第9期974-978,共5页 Control and Decision

基金国家自然科学基金项目(60273079 60573089)

关键词聚类分析密度单元聚类空间聚类算法 Clustering analysis Density unit Cluster space Cluster algorithm

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1Macqueen J.K-means:Some Methods for Classification and Analysis of Multivariate Observations[A].The 5th Berkeley Symp on Mathematical Statistics and Probability[C].Berkeley,1976:56-68.
2Markus M,Breunig,Hans-Peter Kriegel,et al.Data Bubbles:Quality Preserving Performance Boosting for Hierarchical Clustering[A].ACM SIGMOD[C].Santa Barbara,2001:99-112.
3Samer Nassar,Jorg Sander,Corrine Cheng.Incremental and Effective Data Summarization for Dynamic Hierarchical Clustering[A].ACM SIGMOD[C].Paris,2004:13-18.
4Guha S,Rastogi R,Shim K.CURE:An Efficient Clustering Algorithm for Large Databases[A].ACM Special Interest Group on Management of Data[C].Washington,1998:73-84.
5Zhang T,Ramakrishnan R,Livny M.BIRCH:An Efficient Data Clustering Method for Very Large Databases[A].ACM SIGMOD Int Conf on Management of Data[C].Montreal,1996:103-114.
6Ankerst M,Breunig M,Kriegel H,et al.OPTICS:Ordering Points to Identify the Clustering Structure[A].ACM Special Interest Group on Management of Data[C].Philadelphia,1999:49-60.
7Sander J.Density-based Clustering in Spatial Databases:The Algorithm GDBSCAN and It Applications[J].Data Mining and Konwledge Discovery,1998,2(2):169-194.
8Ester M,Kriegel H,Sander J.A Density-based Lgorithm for Discovering Clusters in Large Spatial Databases with Noise[A].Knowledge Discovery and Data Mining[C].Portland,1996:226-231.
9王明善,沈恒慈.概率论与数理统计[M].北京:高等教育出版社,1999.

同被引文献72

1张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
2林岩,胡祥培,王旭茵.物流系统优化中的定位——运输路线安排问题(LRP)研究评述[J].管理工程学报,2004,18(4):45-49. 被引量：35
3王凌,段江涛,王保保.GIS中最短路径的算法研究与仿真[J].计算机仿真,2005,22(1):117-120. 被引量：30
4李怡,张铁柱,滕春贤.基于GIS的配送车辆路线规划的研究[J].哈尔滨理工大学学报,2006,11(1):51-55. 被引量：5
5刘巧歌,付梦印,邓志红.前向神经网络学习速率的自适应算法(英文)[J].系统仿真学报,2006,18(3):698-700. 被引量：6
6罗世华,刘祥官.高炉铁水含硅量的分形结构分析[J].物理学报,2006,55(7):3343-3348. 被引量：6
7于希宁,程锋章,朱丽玲,王毅佳.基于T-S模型的自适应神经模糊推理系统及其在热工过程建模中的应用[J].中国电机工程学报,2006,26(15):78-82. 被引量：24
8梁栋,白晨光,邱贵宝,温良英,陈登福,董凌燕.高炉炉况的智能化判断方法[J].钢铁研究学报,2006,18(9):56-58. 被引量：5
9张小宁,林航飞,陈小鸿,刘淼.剩余最短路径算法应用于起迄点交通调查统计[J].同济大学学报（自然科学版）,2006,34(10):1335-1339. 被引量：5
10郭建科,张仁平,邹孙楷,张新建.Dijktra改进算法及其在地理信息系统中的应用[J].计算机系统应用,2007,16(1):59-62. 被引量：9

引证文献7

1于勇前,赵相国,陈衡岳,王国仁.基于引力概念的聚类质量评估算法[J].东北大学学报（自然科学版）,2007,28(8):1109-1112. 被引量：3
2张洪涛,张坤,马培军.参数可调的自扩展聚类算法及其应用[J].哈尔滨工业大学学报,2007,39(11):1695-1698. 被引量：1
3王华强,顾金晨.高炉铁水硅含量的智能预测[J].合肥工业大学学报（自然科学版）,2008,31(1):73-76.
4史亚蓉,万迪昉,李双燕,吕珍玉.基于GIS的物流配送路线规划研究[J].系统工程理论与实践,2009,29(10):76-84. 被引量：24
5吴杨,王韬,李进东.基于密度的划分式聚类过程参数选择算法[J].控制与决策,2016,31(1):21-29. 被引量：5
6王兆丰,单甘霖.一种基于k-均值的DBSCAN算法参数动态选择方法[J].计算机工程与应用,2017,53(3):80-86. 被引量：23
7李霖,杨宇翔,吴永强.基于高阶累积量非线性变换的JTIDS多用户聚类分选[J].电信技术研究,2019,0(2):32-38.

二级引证文献56

1芦斌.单车场大规模车辆路径问题求解框架[J].现代商贸工业,2010,22(17):365-366.
2陶运信,皮德常.一种快速移动对象轨道聚类算法[J].高技术通讯,2010,20(1):99-105.
3王冬旭,姚佩阳,蔡彬彬,郭威武.基于聚类的ACM模型门限阈值的自适应算法[J].火力与指挥控制,2010,35(10):40-42.
4谷炜,张群,胡睿.基于改进K-means聚类的物流配送区域划分方法研究[J].中国管理信息化,2010,13(24):60-63. 被引量：15
5林威,林振山.GIS在我国物流领域中的应用研究[J].物流工程与管理,2011,33(2):1-5. 被引量：17
6潘文安.Distribution area demarcation for logistic centers under geographical information system decision support system[J].Journal of Chongqing University,2011,10(1):14-22.
7陆阳阳.基于GIS的集装箱港口空间分析[J].物流工程与管理,2011,33(5):1-3. 被引量：1
8刘启亮,邓敏,彭东亮,王佳璆.基于力学思想的空间聚类有效性评价[J].武汉大学学报（信息科学版）,2011,36(8):982-986. 被引量：1
9胡勇,宗真,罗文,袁林旺.多条件约束应急疏散路径分析的几何代数方法[J].地理与地理信息科学,2012,28(5):47-50. 被引量：4
10涂伟,李清泉,方志祥.一种大规模车辆路径问题的启发式算法[J].武汉大学学报（信息科学版）,2013,38(3):307-310. 被引量：9

1孙志伟,赵政.DBSCAN在非空间属性处理上的扩展[J].计算机应用,2005,25(6):1379-1381. 被引量：4
2吴新根,罗立民,鲍旭东,严玉龙,傅瑶.一种基于Hopfield网络的MRI图像分割方法[J].电子科技导报,1998(12):24-26. 被引量：1
3瞿中,林丽丹,郭阳.形态学与区域延伸相结合的图像裂缝检测算法研究[J].计算机科学,2014,41(11):297-300. 被引量：21
4章银娥.基于颜色和形状的模板匹配的钉螺识别计数研究[J].赣南师范学院学报,2012,33(6):33-36. 被引量：2
5邱保志,沈钧毅.基于扩展和网格的多密度聚类算法[J].控制与决策,2006,21(9):1011-1014. 被引量：25
6刘远超,王晓龙,徐志明,关毅.文档聚类综述[J].中文信息学报,2006,20(3):55-62. 被引量：65
7闫光辉,何瑞春.基于神经网络、网格和密度的聚类方法的设计[J].兰州铁道学院学报,2003,22(1):94-97. 被引量：2
8林瑶,田捷,张晓鹏.基于模糊连接度的FCM分割方法在医学图像分析中的应用[J].中国体视学与图像分析,2001,6(2):103-108. 被引量：17
9王常武,王秀芹,魏真真,王宝文,刘文远,李永强.一种可扩展半径的RNA二级结构密度聚类算法[J].小型微型计算机系统,2015,36(9):1968-1972.
10宗瑜,李明楚,徐贯东,张彦春.局部显著单元高维聚类算法[J].电子与信息学报,2010,32(11):2707-2712. 被引量：1

控制与决策

2006年第9期

浏览历史

内容加载中请稍等...

一种基于密度单元的自扩展聚类算法被引量：7

参考文献9

同被引文献72

引证文献7

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

一种基于密度单元的自扩展聚类算法 被引量：7

参考文献9

同被引文献72

引证文献7

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

一种基于密度单元的自扩展聚类算法被引量：7