一种基于流形距离的迭代优化聚类算法被引量：11

Iterative Optimization Clustering Algorithm Based on Manifold Distance

在线阅读下载PDF

导出

摘要针对传统欧氏距离测度描述复杂结构的数据分布会失效的问题,引入能有效反映样本集固有的全局一致性信息的流形距离作为样本间相似度度量测度,并设计了反映类内相似度大、类间相似度小的聚类目标的准则函数,把数据聚类转化成准则函数优化问题,提出了一种迭代优化的聚类算法.通过4个人工数据集的仿真试验结果表明,新方法的参数很少且实现简单,由于实现过程中没有引入随机操作,因此结果比较确定.与标准k均值算法相比,新方法能够自动确定聚类数目,对于样本空间分布复杂的聚类问题具有良好的分类效果. Aiming at the problem that classical Euclidean distance metric may be invalid when it is used to measure the complicated data structures, a manifold distance based on similarity metric and being able to measure the geodesic distance along the manifold is introduced, and a criterion function used to express the clustering target is designed, where the samples in the same cluster are somehow more similar than samples in different one. Accordingly, the clustering problem is converted to function optimization problem, and an iterative optimization clustering algorithm is proposed. The steps of the algorithm are discussed in detail. Simulation results on four artificial datasets with different manifold structures show that the new algorithm is more straightforward due to the less pre-defined parameters and it is a deterministic algorithm due to the lack of random operations. A comparison with k-means clustering algorithms indicates the ability to determine the cluster number automatically and identify complex non-convex clusters.

作者王娜杜海峰王孙安

机构地区西安交通大学机械工程学院西安交通大学公共管理与复杂性科学研究中心

出处《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第5期76-79,共4页 Journal of Xi'an Jiaotong University

基金国家自然科学基金资助项目(50505034) 教育部博士点新教师基金资助项目(20070698022).

关键词流形距离准则函数聚类 manifold distance criterion function clustering

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1DUDA R O, HART P E, STORK D G. Pattern classification [M]. New York, USA: Wiley, 2001: 538- 548.
2SU Muchu, CHOU C H. A modified version of the kmeans algorithm with a distance based on cluster sym- metry [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001, 23(6): 674-680.
3ZHOU Dengyong, BOUSQUET O, LAL T N, et al. Learning with local and global consistency [C]//Advances in Neural Information Processing Systems: 16. Cambridge, USA: MIT Press, 2004:321-328.
4TENENBAUM J B, DE SILVA V, LANGFORD J C. A global geometric framework for nonlinear dimensionality reduction [J]. Science, 2000, 290(550): 2319- 2323.
5SHAKHNAROVICH G, DARRELL T, INDYK P. Nearest-neighbor methods in learning and vision [M]. Cambridge, USA.. MIT Press, 2005.
6FLOYD R W. Algorithm 97 : shortest path [J]. Communications of the ACM, 1962, 5(6): 345.
7MACQUEEN J B. Some methods for classification and analysis of multivariate observations [C]///The 5th Berkeley Symposium on Mathematical Statistics and Probability. Berkeley, USA: Univ of Calif Press, 1967: 281-297.

同被引文献164

1李秀明,石照耀.基于方程的椭圆轮廓度的评定[J].北京工业大学学报,2009,35(10):1303-1307. 被引量：6
2冯志伟.特思尼耶尔的从属关系语法[J].当代语言学,1983(1):63-65. 被引量：48
3伍忠东,高新波,谢维信.基于核方法的模糊聚类算法[J].西安电子科技大学学报,2004,31(4):533-537. 被引量：75
4WANGShun-jiu,YANGZhi-feng,DINGJing.Projection pursuit cluster model and its application in water quality assessment[J].Journal of Environmental Sciences,2004,16(6):994-995. 被引量：20
5周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
6刘纪平,汪宏斌,汪诚波,周洞汝.基于模糊最近邻的高维数据聚类[J].小型微型计算机系统,2005,26(2):261-263. 被引量：5
7车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：119
8罗健旭,邵惠鹤.软测量建模数据的过失误差侦破——一种基于聚类分析的方法[J].仪器仪表学报,2005,26(3):238-241. 被引量：9
9张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：61
10金福江,周丽春.化工软测量技术研究进展[J].化工进展,2005,24(12):1379-1382. 被引量：14

引证文献11

1刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：27
2王家耀,谢明霞,郭建忠,陈科.基于相似性保持和特征变换的高维数据聚类改进算法[J].测绘学报,2011,40(3):269-275. 被引量：8
3杨瑞瑞,牛建强,孟红飞.基于流形距离的迭代聚类算法路面裂缝提取[J].计算机工程,2011,37(12):212-214. 被引量：4
4陈定三,杨慧中.基于局部重构融合流形聚类的多模型软测量建模[J].化工学报,2011,62(8):2281-2286. 被引量：12
5周涛,陆惠玲.数据挖掘中聚类算法研究进展[J].计算机工程与应用,2012,48(12):100-111. 被引量：145
6杨清宇,孙凤伟,张曌,张迪,庄健.利用测地线距离的改进谱聚类算法[J].西安交通大学学报,2012,46(8):1-7. 被引量：5
7雷霖,熊伟,景宁,肖建夫.一种基于流形距离的中文语块聚类分析方法[J].北京大学学报（自然科学版）,2013,49(1):126-132. 被引量：2
8Xingmei Wang,Zhipeng Liu,Jianchuang Sun,Shu Liu.Sonar Image Detection Algorithm Based on Two-Phase Manifold Partner Clustering[J].Journal of Harbin Institute of Technology(New Series),2015,22(4):105-114. 被引量：1
9李伟,呼延菊,沙爱民,孙朝云,郝雪丽.基于3D数据和双尺度聚类算法的路面裂缝检测[J].华南理工大学学报（自然科学版）,2015,43(8):99-105. 被引量：8
10王金永,董玉民.改进粒子群算法在数据聚类中的应用[J].长春工业大学学报,2015,36(6):664-672. 被引量：4

二级引证文献217

1Weixing Wang,Mengfei Wang,Hongxia Li,Heng Zhao,Kevin Wang,Changtao He,Jun Wang,Sifan Zheng,Jiabin Chen.Pavement crack image acquisition methods and crack extraction algorithms:A review[J].Journal of Traffic and Transportation Engineering(English Edition),2019,6(6):535-556. 被引量：29
2肖彭昊,杨修伟,范媛媛.基于VGGNet-plus的路面裂痕自动分类识别方法[J].电子器件,2022,45(2):490-493. 被引量：1
3吕业,杨慧中,雷瑜,陶洪峰.基于环路能量聚类的多模型软测量建模[J].化工自动化及仪表,2012,39(11):1409-1413. 被引量：2
4马世发,金兵兵,秦亮军,胡高.基于粒子群双重空间聚类的城镇地价空间分异规律挖掘[J].热带地理,2012,32(2):179-184.
5彭小奇,孙元,唐英.一种软测量模型性能监测评价及其自适应校正方法[J].化工学报,2012,63(5):1474-1483. 被引量：5
6丁维龙,韩燕波,王菁,赵卓峰.时间滑动窗口上数据流极值聚集的空间优化[J].西安交通大学学报,2012,46(11):106-111. 被引量：1
7陈科,成毅,谢明霞,艾彬.基于服务簇的空间信息服务自动发现[J].计算机工程,2012,38(24):182-187. 被引量：4
8赵斐,陆宁云,杨毅.基于工况识别的注塑过程产品质量预测方法[J].化工学报,2013,64(7):2526-2534. 被引量：10
9张俊娜,毛文涛,穆晓霞,范海菊.基于局部差商信息修正的全局多模型建模方法[J].计算机工程与设计,2013,34(7):2551-2555. 被引量：1
10刘永立.一种利用多主体领域系统进行数据聚类的新方法[J].电子器件,2014,37(1):150-153. 被引量：1

1高倩,戴月明.用于文本聚类的模糊谱聚类算法[J].计算机工程与应用,2010,46(13):142-144. 被引量：2
2韩晓翠.基于DCT和MMC的人脸识别方法[J].计算机工程与设计,2010,31(14):3284-3286. 被引量：2
3惠为君,王敬东.一种新的景象匹配的度量方法[J].盐城工学院学报（自然科学版）,2003,16(2):19-21.
4孙鑫.一种自适应的模糊C均值聚类图像分割方法[J].山西电子技术,2014(6):23-24.
5林志庆.一个自动确定聚类数目的微粒群算法[J].福建工程学院学报,2011,9(6):607-612.
6林辉.改进模糊聚类在客户关系管理(CRM)中的应用[J].河南科学,2013,31(10):1668-1670.
7吴晓军,刘伟军,王天然,温佩芝.改进的基于欧氏距离测度网格模型体素化算法[J].计算机辅助设计与图形学学报,2004,16(4):592-597. 被引量：16
8李勇发,左小清,杨芳,林思,张建柱.基于FCM聚类及其改进的遥感图像分割算法[J].浙江农业科学,2017,58(3):518-520. 被引量：4
9徐晨凯,高茂庭.改进的最小生成树自适应分层聚类算法[J].计算机工程与应用,2014,50(22):149-153. 被引量：7
10张旭,郭晨.基于克隆选择的快速动态聚类算法[J].计算机工程,2007,33(23):16-18. 被引量：2

西安交通大学学报

2009年第5期

浏览历史

内容加载中请稍等...

一种基于流形距离的迭代优化聚类算法被引量：11

参考文献7

同被引文献164

引证文献11

二级引证文献217

相关作者

相关机构

相关主题

浏览历史

一种基于流形距离的迭代优化聚类算法 被引量：11

参考文献7

同被引文献164

引证文献11

二级引证文献217

相关作者

相关机构

相关主题

浏览历史

一种基于流形距离的迭代优化聚类算法被引量：11