基于数据取样的DBSCAN算法被引量：27

SDBSCAN:A SAMPLING-BASED DBSCAN ALGORITHM FOR LARGE-SCALE SPATIAL DATABASES

在线阅读下载PDF

导出

摘要聚类是数据挖掘领域中的一个重要研究课题 .聚类技术在许多领域有着广泛的应用 .基于密度的聚类算法DBSCAN是一种有效的空间聚类算法 ,它能够发现任意形状的类并且有效地处理噪声 ,用户只需输入一个参数就可以进行聚类分析 .但是 ,DBSCAN算法在对大规模空间数据库进行聚类分析时需要较大的内存支持和 I/ O消耗 .本文在分析 DBSCAN算法不足的基础上 ,提出一种基于数据取样的 DBSCAN算法 ,使之能够有效地处理大规模空间数据库 .二维空间数据测试结果表明本文算法是可行、有效的 . Clustering, a useful technique for data mining, has promising applicati on perspective in many fields, such as pattern recognition, image processing and data compression etc. DBSCAN is a density-based clustering algorithm that can d iscover clusters of arbitrary shape and effectively handle noise, and requires o nly one input parameter. However, while dealing with large-scale databases, DBS C AN requires a lot of memory and can incur high I/O overhead. In this paper, we p resent a sampling-based DBSCAN algorithm(SDBSCAN)for clustering large-scale da tabases. Experimental results demonstrate that our algorithm is feasible and eff ective.

作者周水庚范晔周傲英

机构地区复旦大学计算机科学系

出处《小型微型计算机系统》 EI CSCD 北大核心 2000年第12期1270-1274,共5页 Journal of Chinese Computer Systems

基金国家自然科学基金!(项目编号 6 97430 0 1) 国家教委博士点基金的资助

关键词空间数据库数据挖掘 DBSCAN算法数据取样 Large scale database Data mining Clustering Sampling DBSCAN algorithm

分类号 TP392 [自动化与计算机技术—计算机应用技术] P208 [天文地球—地图制图学与地理信息工程]

引文网络
相关文献

参考文献7

1周水庚.DBSCAN算法的扩展技术.复旦大学计算机科学系技术报告[M].,1999,4..
2周水庚，复旦大学计算机科学系技术报告，1999年
3Zhang W，Proceedings of the 23rd VLDB Conference，1997年，186页
4Chen M S，IEEE Trans.KDE，1996年，8卷，6期，866页
5Zhang T，Proceedings of the ACM SIG-MOD International Conference on Management of Data，1996年，103页
6Ester M，Proceedings of 4th Int Symposiumon Large Spatial Databases，1995年，951卷，67页
7Ng R T，Proceedings of the 20th VLDB Conference，1994年，144页

同被引文献159

1张曙红,孙建勋,诸克军.基于遗传优化的采样模糊C均值聚类算法[J].系统工程理论与实践,2004,24(5):121-125. 被引量：21
2宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
3张利彪,周春光,马铭,刘小华.基于粒子群算法求解多目标优化问题[J].计算机研究与发展,2004,41(7):1286-1291. 被引量：229
4周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
5吕巍,蒋波,陈洁.基于K-means算法的中国移动市场顾客行为细分策略研究[J].管理学报,2005,2(1):80-84. 被引量：15
6赵法信,王国业.数据挖掘中聚类分析算法研究[J].通化师范学院学报,2005,26(2):11-13. 被引量：13
7张宁,贾自艳,史忠植.使用KNN算法的文本分类[J].计算机工程,2005,31(8):171-172. 被引量：100
8冉延平,余昭平,贾利新,康学福.基于混合模型的聚类算法研究[J].河南科学,2005,23(3):324-327. 被引量：3
9何振峰,熊范纶.结合限制的分隔模型及K-Means算法[J].软件学报,2005,16(5):799-809. 被引量：23
10刘高军,朱嬿.基于数据挖掘技术的建筑企业信用评价[J].中国矿业大学学报,2005,34(4):494-499. 被引量：21

引证文献27

1胡文瑜,孙志挥,周晓云.基于最优K相异性的密度聚类算法研究[J].计算机工程与应用,2005,41(22):171-173. 被引量：2
2胡文瑜,孙志挥,周晓云.基于相异性选择的密度聚类算法研究[J].小型微型计算机系统,2006,27(9):1601-1604. 被引量：2
3郑洪英,倪霖,肖迪.大规模数据集聚类中的数据分区及应用研究[J].计算机应用研究,2007,24(2):203-205. 被引量：1
4王翠茹,朵春红.一种改进的基于密度的DBSCAN聚类算法[J].广西师范大学学报（自然科学版）,2007,25(4):104-107. 被引量：4
5冯少荣,肖文俊.DBSCAN聚类算法的研究与改进[J].中国矿业大学学报,2008,37(1):105-111. 被引量：90
6冯少荣,肖文俊.一种提高DBSCAN聚类算法质量的新方法[J].西安电子科技大学学报,2008,35(3):523-529. 被引量：14
7聂跃光,陈立潮,陈湖.基于密度的空间聚类算法研究[J].计算机技术与发展,2008,18(8):91-94. 被引量：6
8周董,刘鹏.VDBSCAN:变密度聚类算法[J].计算机工程与应用,2009,45(11):137-141. 被引量：22
9刘金岭.基于语义密度的文本聚类研究[J].计算机工程,2010,36(5):81-83. 被引量：7
10鲁淑霞,曹贵恩,孟洁,王华超.基于取样的潜在支持向量机序列最小优化算法[J].河北大学学报（自然科学版）,2011,31(2):113-117. 被引量：1

二级引证文献220

1李方平,吴楠,郭运华,胡艺川,王旭一,李新平.水电工程智能安全监测体系特征及发展趋势[J].人民长江,2021,52(S02):259-264. 被引量：8
2宗长富,文龙,何磊.基于欧几里得聚类算法的三维激光雷达障碍物检测技术[J].吉林大学学报（工学版）,2020,50(1):107-113. 被引量：25
3熊敏,江德军,高志良,何海锋,罗冲.大坝监测数据多维度LSTM异常检测与恢复[J].电子测量技术,2023,46(6):51-56. 被引量：3
4毕方明,张虹,曹天杰.非均匀Hilbert曲线的生成算法[J].中国矿业大学学报,2009,38(5):729-734. 被引量：3
5陈斌.数据仓库技术在现代化支付系统数据分析中的应用[J].微型电脑应用,2007,23(6):56-58. 被引量：1
6胡文瑜,孙志挥,张柏礼.分布式数据挖掘中的最优K相异性取样技术[J].东南大学学报（自然科学版）,2008,38(3):385-389. 被引量：5
7徐德,谭维,杨燕,侯天子,黄乐.I-Miner环境下聚类分析算法研究与实现[J].现代计算机,2009,15(2):30-34.
8陆宇,岳昆,刘惟一.一种基于贝叶斯网的交通拥堵预测方法[J].云南大学学报（自然科学版）,2010,32(S1):355-363. 被引量：5
9李乐,陈鸿昶,李鹏.一种改进的基于密度的聚类算法[J].电子技术应用,2009,35(9):101-104. 被引量：2
10赵杰,杨柳.聚类分析算法dBscan的改进与实现[J].微电子学与计算机,2009,26(11):189-192. 被引量：14

1王蓉,刘宏波,陈黎明.数据挖掘在XML的维修管理系统中的应用研究[J].微计算机信息,2007,23(3):174-175. 被引量：5
2金湖庭,吴晓苏,汪秉权.数据采样圆弧插补算法及其应用研究[J].造船技术,2007,35(2):12-15. 被引量：4
3戢宏.导航设备的多信号采样与处理[J].空中交通管理,2005(6):28-30.
4杨晓东,李庆洪.数据挖掘技术及其应用简介[J].重庆通信业,2005(1):72-73.
5陈文斌.基于ERP的供电所量化绩效考核[J].农电管理,2002(6):26-27.
6郭锡钦,曾书儿,王金钊.地面气象观测系统中的数据取样及处理[J].气象科技,1993,21(3):88-92. 被引量：1
7曾泽林,段明秀.基于密度的聚类算法DBSCAN的研究与实现[J].科技信息,2012(30):163-163. 被引量：3
8李新延,李德仁.DBSCAN空间聚类算法及其在城市规划中的应用[J].测绘科学,2005,30(3):51-53. 被引量：39
9周红芳,赵雪涵,周扬.基于限定区域数据取样的密度聚类算法[J].计算机应用,2012,32(8):2182-2185. 被引量：5
10殷峻.一个基于SEMMA的数据挖掘应用实例[J].冶金自动化,2003,27(3):5-7. 被引量：1

小型微型计算机系统

2000年第12期

浏览历史

内容加载中请稍等...

基于数据取样的DBSCAN算法被引量：27

参考文献7

同被引文献159

引证文献27

二级引证文献220

相关作者

相关机构

相关主题

浏览历史

基于数据取样的DBSCAN算法 被引量：27

参考文献7

同被引文献159

引证文献27

二级引证文献220

相关作者

相关机构

相关主题

浏览历史

基于数据取样的DBSCAN算法被引量：27