一种基于共享近邻亲和度的聚类算法被引量：3

Shared nearest neighbor affinity based clustering algorithm

在线阅读下载PDF

导出

摘要为解决密度聚类算法在处理高维和多密度数据集时聚类结果不精确的问题,提出一种基于共享近邻亲和度(SNNA)的聚类算法。该算法引入k近邻和共享近邻,定义共享近邻亲和度作为对象的局部密度度量。算法首先根据亲和度来提取核心点,然后利用广度优先搜索算法对核心点进行聚类,最后对非核心点进行指派即完成整个数据集的聚类。实验结果表明,该算法能够发现任意形状、大小、密度的聚类;与同类算法相比,SNNA算法在处理高维数据时具有较高的聚类准确率。 In order to solve the problem of inaccurate clustering results when dealing with high-dimensional and multidensity datasets,a Shared Nearest Neighbor Affinity(SNNA)based clustering algorithm is put forward.The algorithm incorporates k nearest neighbor and shared nearest neighbor,and defines shared neighbor affinity as the local density measure of the object.The algorithm firstly extracts the core points according to the affinity,then uses the breadth first search algorithm to cluster the core points,and finally assigns the non-core points to the right cluster to complete the clustering of the whole data set.Experimental results show that the algorithm can find clusters of arbitrary shape,size and density.Compared with other similar algorithms,SNNA has higher clustering accuracy when dealing with high-dimensional data.

作者邱保志辛杭 QIU Baozhi;XIN Hang(School of Information Engineering,Zhengzhou University,Zhengzhou 450001,China)

机构地区郑州大学信息工程学院

出处《计算机工程与应用》 CSCD 北大核心 2018年第18期184-187,222,共5页 Computer Engineering and Applications

基金河南省基础与前沿基金(No.152300410191)

关键词聚类密度共享近邻亲和度数据挖掘 clustering density shared nearest neighbor affinity data mining

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1马帅,王腾蛟,唐世渭,杨冬青,高军.一种基于参考点和密度的快速聚类算法[J].软件学报,2003,14(6):1089-1095. 被引量：108
2刘贝贝,马儒宁,丁军娣.大数据的密度统计合并算法[J].软件学报,2015,26(11):2820-2835. 被引量：2
3周国兵,吴建鑫,周嵩.一种基于近邻表示的聚类方法[J].软件学报,2015,26(11):2847-2855. 被引量：11
4倪巍伟,孙志挥,陆介平.k-LDCHD——高维空间k邻域局部密度聚类算法[J].计算机研究与发展,2005,42(5):784-791. 被引量：18
5马闯,吴涛,段梦雅.基于K近邻隶属度的聚类算法研究[J].计算机工程与应用,2016,52(10):55-58. 被引量：11
6张丽,崔卫东,邱保志.基于划分与层次方法的混合聚类算法[J].计算机工程与应用,2010,46(16):127-129. 被引量：2

二级参考文献76

1Han Jia-wei,Kamber M.Data ming:Concepts and techniques[M].[S.l] :Morgan Kaufmann Publishers Press.2000.
2Zhang Tian,Ramakrishnan R,Linvy M.BIRCH:An efficient data clustering method for large databases[C] //Proc of 1996 ACM-SIG-MOD Int Conf on Management of Data,Montreal,Quebec,1996:103-114.
3Guha S,Rastogi R,Shim K.CURE:An efficient clustering algorithm for large database[C] //SIGMOD'98,Seattle,Washington,1998:73-84.
4Hsu Chih-Ming,Chen Ming-Syan.Subspace clustering of high dimensional spatial data with noises[C] //PAKDD 2004,LNAI 3056,2004:31-40.
5Karypis G,Han E H,Kumar V.Chameleon:A hierarchical clustering algorithm using dynamic modeling[J].IEEE Computer,1999,32(8):68-75.
6Han JW, Kambr M. Data Mining Concepts and Techniques. Beijing: Higher Education Press, 2001. 145-176.
7Kaufan L, Rousseeuw PJ. Finding Groups in Data: an Introduction to Cluster Analysis. New York: John Wiley & Sons, 1990.
8Ester M, Kriegel HP, Sander J, Xu X. A density based algorithm for discovering clusters in large spatial databases with noise. In:Simoudis E, Han JW, Fayyad UM, eds. Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining.Portland: AAAI Press, 1996. 226-231.
9Guha S, Rastogi R, Shim K. CURE: an efficient clustering algorithm for large databases. In: Haas LM, Tiwary A, eds. Proceedings of the ACM SIGMOD International Conference on Management of Data. Seattle: ACM Press, 1998. "73-84.
10Agrawal R, Gehrke J, Gunopolos D, Raghavan P. Automatic subspace clustering of high dimensional data for data mining application. In: Haas LM, Tiwary A, eds. Proceedings of the ACM SIGMOD International Conference on Management of Data.Seattle: ACM Press, 1998.94-105.

共引文献144

1李玉鑑.自适应K-均值聚类算法[J].计算机研究与发展,2007,44(z2):100-104. 被引量：5
2陈小全,张继红.基于改进粒子群算法的聚类算法[J].计算机研究与发展,2012,49(S1):287-291. 被引量：31
3薛永生,翁伟,文娟,王劲波,张宇.LSNCCP——一种基于最大不相含核心点集的聚类算法[J].计算机研究与发展,2004,41(11):1930-1935. 被引量：2
4陈燕,耿国华,郑建国.一种改进的基于密度的聚类算法[J].微机发展,2005,15(3):17-19. 被引量：13
5王恬宇.基于空间聚类的图像检索方法[J].情报杂志,2005,24(4):108-109.
6董子祥,赵阔.解决大学生心理问题的重要手段——网络化教育[J].社会科学论坛（学术研究卷）,2005(4):100-101.
7石陆魁,何丕廉.一种基于密度的高效聚类算法[J].计算机应用,2005,25(8):1824-1826. 被引量：21
8文登敏,张丽梅.基于对象“形状”的聚类算法[J].计算机应用与软件,2005,22(12):121-123.
9陈卓,孟庆春,魏振钢,任丽婕,窦金凤.一种基于网格和密度凝聚点的快速聚类算法[J].哈尔滨工业大学学报,2005,37(12):1654-1657. 被引量：14
10李锁花,孙志挥,周晓云.基于特征向量的分布式聚类算法[J].计算机应用,2006,26(2):379-382. 被引量：6

同被引文献17

1曹泽文,周姚.基于MapReduce的JP算法设计与实现[J].计算机工程,2012,38(24):14-16. 被引量：6
2黄钢,吴超仲,吕能超.基于改进DBSCAN算法的激光雷达目标物检测方法[J].交通信息与安全,2015,33(3):23-28. 被引量：10
3张晓芳.基于机器学习的激光雷达目标自动检测方法研究[J].激光杂志,2016,37(10):137-141. 被引量：2
4张永博,李必军,陈诚.激光点云在无人驾驶路径检测中的应用[J].测绘通报,2016(11):67-71. 被引量：7
5段建民,任璐,王昶人,刘丹.基于四线激光雷达的道路信息提取与目标检测[J].激光杂志,2017,38(6):32-37. 被引量：5
6宋柱,付锐,张名芳,刘新雨.分区基于密度的聚类算法在激光雷达行人检测系统中的应用[J].科学技术与工程,2017,17(18):282-287. 被引量：7
7段建民,王昶人,任璐,刘丹.基于多层激光雷达的可行驶区域信息提取算法[J].电子技术应用,2017,43(10):78-82. 被引量：9
8王尔申,杨福霞,贾超颖,曲萍萍,庞涛.基于加权最小二乘法的RAIM算法研究[J].电光与控制,2017,24(11):7-10. 被引量：12
9石庭敏,蔡云飞,闫明.基于双多线激光雷达的低矮道边检测[J].计算机与数字工程,2017,45(12):2368-2372. 被引量：4
10鲍舒婷,孙丽萍,郑孝遥,郭良敏.基于共享近邻相似度的密度峰聚类算法[J].计算机应用,2018,38(6):1601-1607. 被引量：8

引证文献3

1高月,杨小飞,马盈仓,汪义瑞.基于共享k-近邻与共享逆近邻的密度峰聚类[J].计算机工程与应用,2019,55(20):43-51. 被引量：5
2段建民,冉旭辉,李帅印,管越.基于改进JP算法的激光雷达可行驶区域检测[J].应用激光,2020,40(3):519-525. 被引量：9
3周欢欢,郑伯川,张征,张琦.基于自适应近邻参数的密度峰聚类算法[J].计算机应用,2022,42(5):1464-1471. 被引量：1

二级引证文献15

1高月,杨小飞,马盈仓,汪义瑞.基于共享逆近邻与指数核的密度峰聚类算法[J].纺织高校基础科学学报,2020,33(2):78-84.
2张要,马盈仓,杨小飞,朱恒东,杨婷.基于L_(2,1)-范数距离的约束相似矩阵的聚类算法[J].计算机工程与设计,2021,42(3):726-733. 被引量：2
3袁山山,罗海燕,王丽,龚强,陈龙,徐彬.轻量级激光雷达虚点滤波算法研究[J].应用激光,2021,41(2):387-390. 被引量：8
4周欢欢,张征,张琦.结合共享近邻和共享逆近邻的密度峰聚类[J].西华师范大学学报（自然科学版）,2022,43(1):108-115. 被引量：1
5王玄,潘卫军,王昊,罗玉明.近地阶段ARJ21飞机尾涡探测及演化分析[J].应用激光,2022,42(1):83-90. 被引量：2
6李沛武,张永芳,黄逸翠,刘紫亮,居翔.基于双重密度和簇间近邻度的密度峰值聚类算法[J].南昌工程学院学报,2022,41(4):29-36. 被引量：3
7潘文标,元文浩.基于密度划分的云数据分块存储方法仿真[J].计算机仿真,2022,39(8):456-459. 被引量：2
8郭永春,刘文博,罗作煌.一种非结构化道路的局部可行驶区域感知方法[J].地理空间信息,2022,20(12):23-26. 被引量：2
9于淼,张晞,龚子任,黄丽莎,蒙俊舟,李华志,王章宇.基于LiDAR的煤矿井下自动驾驶边界检测与跟踪方法研究[J].煤炭工程,2023,55(6):145-151. 被引量：3
10褚昕悦,赵旭,李连鹏,刘文,代牮.基于体素特征融合的FOD目标智能认知[J].应用激光,2023,43(8):151-158. 被引量：1

1吴云鹏,赵晨阳,时增林,叶阳东.基于流密度的多重交互集体行为识别算法[J].计算机学报,2017,40(11):2519-2532. 被引量：6
2郑虹,周丽媛,韩旭明.布谷鸟优化的密度峰值快速搜索聚类算法[J].长春工业大学学报,2018,39(3):253-260. 被引量：6
3马福民,逯瑞强,张腾飞.基于局部密度自适应度量的粗糙K-means聚类算法[J].计算机工程与科学,2018,40(1):184-190. 被引量：15
4张晨,王明根,李宇豪,王洁,霍迎秋.基于图论和广度优先搜索算法的分酒问题一般解的研究[J].数字技术与应用,2018,36(4):38-39. 被引量：1
5易艳春,马思思,关卫军.紧凑的城市是低碳的吗?[J].城市规划,2018,42(5):31-38. 被引量：10
6毛琦梁.异质性、基础设施与地区生产率——基于中国地级地区空间杜宾模型的实证研究[J].现代经济探讨,2017(11):102-110. 被引量：4
7LI Shuoming,CHEN Lei,CHEN Shihong.An SNN Ontology Based Environment Monitoring Method for Intelligent Irrigation System[J].Journal of Shanghai Jiaotong university(Science),2018,23(4):577-583.
8王骏,黄德才.一种新的位置不确定性聚类算法UCNDBSCAN[J].小型微型计算机系统,2018,39(8):1633-1640. 被引量：4
9解瑞云,赵欣莹.海上失事飞机黑匣子定位分析与建模[J].河南机电高等专科学校学报,2018,26(4):18-22. 被引量：1
10于彦伟,贾召飞,曹磊,赵金东,刘兆伟,刘惊雷.面向位置大数据的快速密度聚类算法[J].软件学报,2018,29(8):2470-2484. 被引量：33

计算机工程与应用

2018年第18期

浏览历史

内容加载中请稍等...

一种基于共享近邻亲和度的聚类算法被引量：3

参考文献6

二级参考文献76

共引文献144

同被引文献17

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

一种基于共享近邻亲和度的聚类算法 被引量：3

参考文献6

二级参考文献76

共引文献144

同被引文献17

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

一种基于共享近邻亲和度的聚类算法被引量：3