基于区域划分的DBSCAN多密度聚类算法被引量：30

Multi-density clustering algorithm DBSCAN based on region division

在线阅读下载PDF

导出

摘要 DBSCAN聚类算法使用固定的Eps和min Pts,处理多密度的数据效果不理想,并且算法的时间复杂度为O(N2)。针对以上问题,提出一种基于区域划分的DBSCAN多密度聚类算法。算法利用网格相对密度差把数据空间划分成密度不同的区域,每个区域的Eps根据该区域的密度计算自动获得,并利用DBSCAN算法进行聚类,提升了DBSCAN的精度;避免了DBSCAN在查找密度相连时需要遍历所有数据的不足,从而改善了算法效率。实验表明算法能有效地对多密度数据进行聚类,对各种数据的适应力较强,效率较优。 Because of the fixed Eps and min Pts,DBSCAN clustering algorithm is not ideal for multi-density data,and its time complexity is O（ N2）. Aiming at the above problems,this paper proposed a multi-density clustering algorithm DBSCAN based on region division. This algorithm used the relative grid density difference to divide the spatial data into different density regions,then generated different Eps automatically according to the different density of each region,and used DBSCAN algorithm to improve the accuracy. This idea kept DBSCAN from traversing of all data when it searched for density connected region. So it also improved the algorithm efficiency. Experiments show that the algorithm can effectively cluster the multi-density data. It has a better adaptability to various kinds of data and better efficiency.

作者韩利钊钱雪忠罗靖宋威 Han Lizhao;Qian Xuezhong;Luo Jing;Song Wei(Engineering Research Center of lnternet of Things Technology Applications for Ministry of Education,Jiangnan University,Wuxi Jiangsu 214122,China)

机构地区江南大学物联网技术应用教育部工程研究中心

出处《计算机应用研究》 CSCD 北大核心 2018年第6期1668-1671,1685,共5页 Application Research of Computers

基金中央高校基础研究资助项目(JUSRP51510 JUSRP51635B)

关键词区域划分多密度相对密度差 DBSCAN聚类 region division muhi-density relative density difference DBSCAN clustering

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1冯振华,钱雪忠,赵娜娜.Greedy DBSCAN:一种针对多密度聚类的DBSCAN改进算法[J].计算机应用研究,2016,33(9):2693-2696. 被引量：45
2周水庚,周傲英,曹晶,胡运发.一种基于密度的快速聚类算法[J].计算机研究与发展,2000,37(11):1287-1292. 被引量：89
3王桂芝,王广亮.改进的快速DBSCAN算法[J].计算机应用,2009,29(9):2505-2508. 被引量：24
4黄红伟,黄天民.基于网格相对密度差的扩展聚类算法[J].计算机应用研究,2014,31(6):1702-1705. 被引量：12
5刘淑芬,孟冬雪,王晓燕.基于网格单元的DBSCAN算法[J].吉林大学学报（工学版）,2014,44(4):1135-1139. 被引量：24
6冯玲,刘克剑,唐福喜,孟庆瑞.一种基于网格查询的改进DBSCAN算法[J].西华大学学报（自然科学版）,2016,35(5):25-29. 被引量：8
7张枫,邱保志.基于网格的高效DBSCAN算法[J].计算机工程与应用,2007,43(17):167-169. 被引量：8

二级参考文献56

1张海龙,王仁彪,聂俊,刘进忠.海量数据的网格启发信息密度聚类算法[J].吉林大学学报（工学版）,2011,41(S2):254-258. 被引量：2
2周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
3陈燕俐,洪龙,金达文,朱梧槚.一种简单有效的基于密度的聚类分析算法[J].南京邮电学院学报（自然科学版）,2005,25(4):24-29. 被引量：8
4邱保志,沈钧毅.基于扩展和网格的多密度聚类算法[J].控制与决策,2006,21(9):1011-1014. 被引量：25
5CHEN M S, HAN J H, YU P S. Data mining: An overview from a database perspective [ J]. IEEE Transactions on Knowledge and Data Engineering, 1996, 8(6): 866 -883.
6KAUFAN L, RPUSSEEUW P J. Finding groups in data: An introduction to cluster analysis [ M]. New York: John Wiley & Sons, 1990.
7ESTER M, KRIEGEL H P, XU X W. Knowledge discovery in large SPATIAL database: Focusing techniques for efficient class identification [ C]//Proceedings of the 4th International Symposium on Advances in Spatial Databases, LNCS 951. London: Springer-Verlag, 1995:67-82.
8ESTER M, KRIEGEL H P, SANDER J, et al. A density-based algorithm for discovering clusters in large spatial database with noise [ C]//KDD - 96: Proceedings of the 2nd International Conference on Knowledge Discovering and DataMining. Portland, Oregon: [ s. n.], 1996:226-231.
9GUHA S, RASTOGI R, SHIM K. CURE: An efficient clustering algorithm for large databases [ C]// Proceedings of the 1998 ACM SIGMOD International Conference on Management of Data. New York: ACM Press, 1998:73-84.
10AGRAWAL R, GEHRKE J, GUNOPOLOS D, et al. Automatic subspace clustering of high dimensional data for data mining application [C]// Proceedings of the ACM SIGMOD International Conference on Very Large Data Bases. Roma: Morgan Kaufmann Publishers, 2001:331-340.

共引文献185

1杨然,王虹,孙传波,余国才.基于因子图优化的DBSCAN聚类组合导航算法[J].微波学报,2023,39(S01):409-413. 被引量：1
2侯冀超,谢成心,孟凡兴,温秀梅.基于模糊聚类处理月亮型数据的研究与实现[J].河北建筑工程学院学报,2022,40(3):173-178.
3梁敏君,倪志伟,倪丽萍,杨葛钟啸.基于网格与分形维数的聚类算法[J].计算机应用,2009,29(3):830-832. 被引量：4
4周文勇.改进的K-均值聚类算法[J].光盘技术,2007(2):54-56. 被引量：6
5王海,王忠民.一种基于密度和网格的聚类算法在KDD中的应用[J].计算机工程与应用,2004,40(24):180-182. 被引量：3
6周永权,焦李成.高属性维稀疏数据聚类回归逻辑神经网络模型及学习算法[J].电子学报,2004,32(8):1342-1345. 被引量：3
7林小红,蒋伟进.基于RS近似算法的医疗诊断知识挖掘[J].海军工程大学学报,2004,16(5):48-51.
8薛永生,翁伟,文娟,王劲波,张宇.LSNCCP——一种基于最大不相含核心点集的聚类算法[J].计算机研究与发展,2004,41(11):1930-1935. 被引量：2
9郭伟,唐晓君,刘万军.一种基于划分的聚类算法分析与改进[J].辽宁工程技术大学学报（自然科学版）,2004,23(6):826-828. 被引量：4
10万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,26(1):177-179. 被引量：16

同被引文献270

1宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
2罗志昌,张松,杨文鸣,杨子彬.脉搏波波形特征信息的研究[J].北京工业大学学报,1996,22(1):71-79. 被引量：120
3陈育华,褚俊.超声诊断颈动脉硬化新进展[J].医学综述,2006,12(18):1142-1144. 被引量：5
4张莉,常本康,余松涛.CT与MRI医学图像融合算法及结果分析[J].医疗卫生装备,2006,27(10):5-6. 被引量：5
5向长波,刘太辉,宋建中.基本矩阵的鲁棒贪心估计算法[J].计算机辅助设计与图形学学报,2007,19(5):651-655. 被引量：11
6孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1083
7陶少华,刘玉华,许凯华,贾永灿.基于容量维数的复杂网络自相似性研究[J].计算机工程,2008,34(2):175-177. 被引量：6
8廖明.建立分层分类的人力资源规划体系[J].中国人力资源开发,2008,25(2):20-23. 被引量：17
9朱殊洋.就业变动下马克思宏观经济系统的动力学分析[J].马克思主义研究,2008(2):79-87. 被引量：6
10肖士利,叶文华.数控机床的现场数据实时采集和监视系统的研究[J].中国制造业信息化（学术版）,2008,37(6):38-42. 被引量：17

引证文献30

1林涛,马同宽,秦冬阳,董栅.基于改进DBSCAN算法的风机故障诊断研究[J].现代电子技术,2018,41(21):146-149. 被引量：4
2刘勇,何婧,姚绍文,向毅,张浩.基于重心点转移的St-DBSCAN改进算法[J].计算机技术与发展,2018,28(11):6-11. 被引量：2
3孙悦,宋瑞,邱果.基于乘客需求数据的定制商务班车站点选址方法[J].山东科学,2019,32(1):102-112. 被引量：6
4万静,崔美玉,何云斌,李松.障碍空间中基于Voronoi图的不确定数据聚类算法[J].计算机研究与发展,2019,56(5):977-991. 被引量：6
5王冬,张焱,姜俊奎.基于浮动车轨迹数据的城市路网提取[J].中国科技论文,2019,14(2):226-231. 被引量：3
6杨忠炯,王臣臣,周立强,易圣先.基于密度聚类的线段特征提取方法[J].制造业自动化,2019,41(6):88-91. 被引量：1
7王冬,张焱,姜俊奎.车载激光点云中行道树及属性信息提取[J].中国科技论文,2019,14(5):510-517. 被引量：10
8牛少章,欧毓毅,凌捷,顾国生.基于网格查询的局部离群点检测算法[J].计算机工程与应用,2019,55(17):89-94. 被引量：2
9陈皓,冀敏杰,郭紫园,夏雨.一种时间序列数据的动态密度聚类算法[J].控制理论与应用,2019,36(8):1304-1314. 被引量：7
10牛少章,欧毓毅,凌捷,顾国生.利用区域划分的多密度快速聚类算法[J].计算机工程与应用,2019,55(18):61-66. 被引量：2

二级引证文献85

1郭鹏飞,李海霞,常海艳,白柯鑫,张煜.基于大数据的海上目标隐性关联规则挖掘方法[J].网络安全与数据治理,2023,42(S01):71-77. 被引量：2
2顾清华,薛步青,卢才武,宋江珊.基于D-LinkNet网络的露天矿道路智能识别与路网建模[J].煤炭学报,2020,45(S02):1100-1108. 被引量：8
3廖禹韬,吴黎明,王桂棠,霍启乐.基于深度相机的金属柜体三维重建[J].电子测量技术,2023,46(20):36-40. 被引量：1
4Qi Zhang,Jianshe Cao,Yanfeng Sui.Development of a research platform for BEPCⅡ accelerator fault diagnosis[J].Radiation Detection Technology and Methods,2020,4(3):269-276.
5邵文,贾顺平,曹文娟.基于混合车型的灵活型接驳公交路径协同优化研究[J].山东科学,2019,32(4):64-73. 被引量：8
6Aamir Hussain,刘锴,张曦月,宫小雯.低公交占有率地区需求响应公交选择意愿研究——以巴基斯坦卡拉奇市为例[J].科技创新与应用,2020(16):28-30.
7杨振虎.基于闭环控制的齿轮传递误差研究[J].机械设计与制造工程,2020,49(4):120-124. 被引量：1
8谢志伟,平继伟,彭博,徐兆阳.基于邻域特征的电子地图道路交叉点自动提取[J].中国科技论文,2020,15(5):599-604. 被引量：5
9肖勇,钱斌,蔡梓文,洪亮,苏盛.电力物联网终端非法无线通信链路检测方法[J].电工技术学报,2020,35(11):2319-2327. 被引量：40
10林虎,顾栋,康琳.基于梯度提升决策树的低压台区线损率预测[J].信息技术,2020,44(8):108-113. 被引量：11

1谢陈.64层螺旋CT心脏双期扫描对诊断左房血栓及血栓前状态的应用[J].血栓与止血学,2018,24(3):364-366. 被引量：4
2张丽杰,朱慧云.影响中国的热带气旋生成源地研究[J].热带气象学报,2018,34(3):289-296. 被引量：4
3宁建飞.基于spark框架的DBSCAN文本聚类算法[J].汕头大学学报（自然科学版）,2018,33(2):73-80. 被引量：2
4魏方圆,黄德才.基于区间数的多维不确定性数据UID-DBSCAN聚类算法[J].计算机科学,2017,44(B11):442-447. 被引量：3
5张晶元.当前混凝土配合比设计存在的问题[J].四川水泥,2018(3):11-11.
6李建蓉.煤层混合粒子群声阻抗反演算法设计与仿真[J].苏州市职业大学学报,2018,29(2):23-26.
7宋崇武,王金保.过热水蒸汽流量测量温度压力补偿系统用的最佳密度方程式程序[J].辽宁石油化工大学学报,1982,16(2):86-93. 被引量：1
8牛丽媛,张桂芸.基于Storm的分布式实时数据流密度聚类算法[J].天津师范大学学报（自然科学版）,2018,38(3):72-76. 被引量：3
9蒙西,乔俊飞,李文静.基于快速密度聚类的RBF神经网络设计[J].智能系统学报,2018,13(3):331-338. 被引量：9
10杨梅,谭泽富,蔡黎.基于自适应形状上下文特征的实时杆号识别[J].计算机工程与应用,2018,54(12):187-191. 被引量：4

计算机应用研究

2018年第6期

浏览历史

内容加载中请稍等...

基于区域划分的DBSCAN多密度聚类算法被引量：30

参考文献7

二级参考文献56

共引文献185

同被引文献270

引证文献30

二级引证文献85

相关作者

相关机构

相关主题

浏览历史

基于区域划分的DBSCAN多密度聚类算法 被引量：30

参考文献7

二级参考文献56

共引文献185

同被引文献270

引证文献30

二级引证文献85

相关作者

相关机构

相关主题

浏览历史

基于区域划分的DBSCAN多密度聚类算法被引量：30