一种基于MST的自适应优化相异性度量的半监督聚类方法被引量：1

A Semi-Supervised Clustering Method of Adaptively Optimizing the Dissimilarity Based on MST

在线阅读下载PDF

导出

摘要针对混合属性空间中具有同一(或相近)分布特性的带类别标记的小样本集和无类别标记的大样本数据集,提出了一种基于MST的自适应优化相异性度量的半监督聚类方法。该方法首先采用决策树方法来获取小样本集的"规则聚类区域",然后根据"同一聚类的数据点更为接近"的原则自适应优化建构在该混合属性空间中的相异性度量,最后将优化后的相异性度量应用于基于MST的聚类算法中,以获得更为有效的聚类结果。仿真实验结果表明,该方法对有些数据集是有改进效果的。为进一步推广并在实际中发掘出该方法的应用价值,本文在最后给出了一个较有价值的研究展望。 This paper presents an MST-based semi-supervised clustering method of adaptively optimizing dissimilarity, when clustering an unlabeled data set which has the same or a similar distribution with a labeled sample in one hybrid attributes space. First, we can obtain ＂regular cluster regions＂ by u- sing a decision-tree method, and then adaptively optimize the dissimilarity of the hybrid attributes space based on the principia, ＂data points in the same clusters should have more similarity than those in other clusters＂. Finally, the optimized dissimilarity is applied to an MST-based clustering method. From some simulated experiments of several UCI data set.~, we know that this kind of semi-supervised elustering method can often get better clustering quality. In the end, it gives a research expectation to disinter and popularize this method.

作者陈新泉

机构地区重庆三峡学院计算机科学与工程学院上饶师范学院数学与计算机科学学院

出处《计算机工程与科学》 CSCD 北大核心 2011年第10期154-158,共5页 Computer Engineering & Science

基金江西省教育厅资助科研项目(GJJ10253)

关键词相异性度量半监督聚类混合属性 dissimilarity semi supervised clustering hybrid attributes

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1Chen X Q. Weighted Clustering and Evolutionary Analysis of Hybrid Attributes Data Streams[J]. Journal of Computers, 2008, 3(12):60-67.
2Chen X Q, Peng H, Hu J S. An Adaptive Optimization Method of Configuring Feature Weight Group[C]//Proc of the 5th ICMLC, 2006:1281-1286.
3Frank A, Asuncion A. UCI Machine Learning Repository [EB/OL]. [2011-05-12]. http://archive, ics. uci. edu/ml.
4Cormen T H, Leiserson C E, Rivest R L. Introduction to Algorithms[M]. Second Edition. The MIT Press , 2001.
5李春堡,尹为民,李蓉蓉,等.数据结构教程[M].第3版.北京:清华大学出版社,2009.
6Frey B J, Dueck D. Clustering by Passing Messages Between DataPoints[J]. Science, 2007, 315(16):972-976.

同被引文献16

1崔光照,曹玲芝,张勋才,王延峰.基于密度的最小生成树聚类算法研究[J].计算机工程与应用,2006,42(5):156-158. 被引量：6
2欧阳浩,肖建华.基于网格的最小生成树聚类算法[J].计算机与现代化,2006(12):81-82. 被引量：3
3毛韶阳,李肯立,王志和.最小生成树聚类方法研究[J].怀化学院学报,2007,26(5):38-40. 被引量：2
4Han J W, Kamber M.Data mining: concepts and techniques[M]. San Francisco : Morgan Kaufmann, 2000.
5Gygorash O, Zhou Yah, Jorgensen Z.Minimum spanning tree based clustering algorithms[C]//18th IEEE International Conference on Tools with Artificial Intelligence, 2006: 73-81.
6Zahn C T.Graph-theoretical methods for detecting and describing gestalt clusters[J].IEEE Transactions on Com- puters, 1971,20( 1 ) : 68-86.
7Jain A, Murty M, Flynn P.Data clustering: A review[J]. ACM Computing Surveys, 1999,31 (3) : 264-323.
8Graham R L, Hell Pavol.On the History of the Minimum Spanning Tree Problem[J].Annals of the History of Computing, 1985,7( 1 ) :43-57.
9Macqueen J.Some methods for classification and analysis of multivariate observations[C]//Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability, 1967 : 281-297.
10Ester M, Kriegel H P, Sander J, et al.A density-based algorithm for discovering clusters in large spatial data- bases with noise[C]//Proceeding the 2nd International Conference on Knowledge Discovery and Data Mining (KDD). Portland, 1996 : 226-231.

引证文献1

1徐晨凯,高茂庭.改进的最小生成树自适应分层聚类算法[J].计算机工程与应用,2014,50(22):149-153. 被引量：7

二级引证文献7

1岳金柱,王德来.对易县“两山”划分和“四荒”拍卖的思考[J].河北林果研究,2000,15(1):20-23. 被引量：3
2邱雪松,蔺艳斐,邵苏杰,郭少勇,于军.一种面向智能电网数据采集的传感器聚合布局构造算法[J].电子与信息学报,2015,37(10):2411-2417. 被引量：15
3薛瑞,刘宏兵,司倩楠.边权相同的最小生成树改进算法[J].信阳师范学院学报（自然科学版）,2015,28(4):597-600. 被引量：2
4颜金彪,郑文武,段晓旗,邓运员,郭元军,胡最.改进的最小生成树自适应空间点聚类算法[J].地球信息科学学报,2018,20(7):887-894. 被引量：3
5乔琳,胡涛,朱金悦.基于最小生成树的K-means驴友结伴推荐算法研究[J].现代商业,2017(16):172-173. 被引量：2
6陈靖飒,程开丰,吴怀岗.一种新型高效的无参数化聚类算法[J].小型微型计算机系统,2020,41(4):699-703. 被引量：3
7周小亮,吴东洋,曹磊,王玉鹏,业宁.基于修剪树的优化聚类中心算法[J].南京大学学报（自然科学版）,2021,57(2):167-176. 被引量：1

1陆林花.一种新的基于遗传算法的动态聚类算法[J].计算机仿真,2009,26(7):122-125. 被引量：5
2郭一鹏,梁吉业,赵兴旺.基于MapReduce的混合数据孤立点检测算法[J].小型微型计算机系统,2014,35(9):1961-1966. 被引量：3
3范阿琳,任树华.一种融合变异系数的k-mean聚类分析方法[J].计算机工程与应用,2012,48(35):114-117. 被引量：5
4常茜茜,张月琴.一种基于划分的混合数据聚类算法[J].计算机应用与软件,2014,31(6):154-157. 被引量：5
5李照奎,丁立新,王岩,何进荣,周凌云.基于拉普拉斯方向的差值线性判别分析[J].计算机科学,2014,41(6):161-165. 被引量：2
6梁波,戴芳,赵凤群.边缘跟踪算法的图像线条画生成[J].中国图象图形学报,2011,16(11):2074-2080. 被引量：1
7赵兴旺,梁吉业.一种基于信息熵的混合数据属性加权聚类算法[J].计算机研究与发展,2016,53(5):1018-1028. 被引量：44
8胡晓雪,赵嵩正,吴楠.面向分类属性数据的一种改进相异性度量及其在客户细分中的应用[J].计算机应用研究,2016,33(2):400-403. 被引量：4
9李志华,顾言,陈孟涛,王士同,陈秀宏.异构数据的结构熵聚类算法[J].计算机科学,2011,38(2):171-174. 被引量：5
10陈新泉.推进式优化特征权重的K-中心点聚类方法[J].计算机工程与应用,2011,47(29):175-181. 被引量：1

计算机工程与科学

2011年第10期

浏览历史

内容加载中请稍等...

一种基于MST的自适应优化相异性度量的半监督聚类方法被引量：1

参考文献6

同被引文献16

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

一种基于MST的自适应优化相异性度量的半监督聚类方法 被引量：1

参考文献6

同被引文献16

引证文献1

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

一种基于MST的自适应优化相异性度量的半监督聚类方法被引量：1