基于k最相似聚类的子空间聚类算法被引量：8

Subspace Clustering Algorithm Based on k Most Similar Clustering

在线阅读下载PDF

导出

摘要子空间聚类是聚类研究领域的一个重要分支和研究热点,用于解决高维聚类分析面临的数据稀疏问题。提出一种基于k最相似聚类的子空间聚类算法。该算法使用一种聚类间相似度度量方法保留k最相似聚类,在不同子空间上采用不同局部密度阈值,通过k最相似聚类确定子空间搜索方向。将处理的数据类型扩展到连续型和分类型,可以有效处理高维数据聚类问题。实验结果证明,与CLIQUE和SUBCLU相比,该算法具有更好的聚类效果。 Subspace clustering is an important part and research hotspot in clustering research, which resolves the problem of clustering sparse data in high dimensional data environment. A subspace clustering algorithm based on k most similar clustering is presented. This algorithm holds the k most similar clustering by the similarity of the clusters, discovers the different subspace through the different local density threshold, ascertains the subspace search direction by the k most similar clustering and clusters both continuous data and categorical data. The high dimensional data can be effectively clustered in this algorithm. Experimental results show that this algorithm is more effective in clustering than CLIQUE and SUBCLU.

作者单世民闫妍张宪超

机构地区大连理工大学软件学院

出处《计算机工程》 CAS CSCD 北大核心 2009年第14期4-6,共3页 Computer Engineering

基金国家自然科学基金资助项目(70671016 60873180 60673066)

关键词聚类算法子空间聚类高维数据 clustering algorithm subspace clustering high dimensional data

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1Jiawei H,Kamber M.数据挖掘:概念与技术[M].北京:机械工业出版社,2001.
2Rakesh A,Johannes G,Dimitrios G,et al.Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications[C]//Proc.of SIGMOD'98.Washington,USA:ACM Press,1998.
3Lance P,Ehtesham H,Huan L.Subspace Clustering for High Dimensional Data:A Review[C]//Proc.of SIAM'04.New York,USA:ACM Press,2004.
4Karin K,Hans-p K,Peer K.Density-connected Subspace Clustering for High Dimensional Data[C]//Proc.of SIAM'04.New York,USA:ACM Press,2004.
5Sudipto G,Rajeev R,Kyuseok S.ROCK:A Robust Clustering Algorithm for Categorical Attributes[C]//Proc.of ICDE'99.[S.1.]:IEEE Computer Society,1999.

共引文献4

1王占刚,庄大方,邱冬生.可视化技术在空间数据挖掘中的应用[J].计算机工程,2007,33(18):67-68. 被引量：6
2孙玲芳,张婧.基于RFM模型和协同过滤的电子商务推荐机制[J].江苏科技大学学报（自然科学版）,2010,24(3):285-289. 被引量：9
3齐浩,马力.聚类分析的并行化实现技术研究[J].电子设计工程,2015,23(2):48-50. 被引量：1
4王俊.基于GIS空间数据挖掘技术的广州市村庄规划评估应用研究[J].城乡规划（城市地理学术版）,2015,0(4):69-76. 被引量：1

同被引文献65

1熊刚,孟姣,曹自刚,王勇,郭莉,方滨兴.网络流量分类研究进展与展望[J].集成技术,2012,1(1):32-42. 被引量：24
2陈振洲,李磊,姚正安.基于SVM的特征加权KNN算法[J].中山大学学报（自然科学版）,2005,44(1):17-20. 被引量：52
3刘勇国,张伟,陈克非,廖晓峰.基于禁忌搜索的聚类簇数目估算算法[J].计算机科学,2005,32(1):168-171. 被引量：2
4王生生,刘大有,曹斌,刘杰.一种高维空间数据的子空间聚类算法[J].计算机应用,2005,25(11):2615-2617. 被引量：12
5任永功,于戈.一种多维数据的聚类算法及其可视化研究[J].计算机学报,2005,28(11):1861-1865. 被引量：13
6杜奕,卢德唐,黄丰,王磊.一种面向高维符号数据的随机投影聚类算法[J].小型微型计算机系统,2006,27(9):1605-1607. 被引量：2
7刘建晔,李芳.一种基于密度的高性能增量聚类算法[J].计算机工程,2006,32(21):76-78. 被引量：12
8姜斌,黎湘,王宏强,郭桂蓉.模式分类方法研究[J].系统工程与电子技术,2007,29(1):99-102. 被引量：6
9刘文军,谷云东,李洪兴.基于加权综合的分类算法(英文)[J].模糊系统与数学,2007,21(1):128-136. 被引量：2
10陈慧萍,王煜,王建东.子空间聚类算法的研究新进展[J].计算机仿真,2007,24(3):6-10. 被引量：3

引证文献8

1向剑平,唐常杰,郑皎凌,易树鸿.基于中心距序降维的聚类算法[J].计算机工程,2010,36(12):58-60. 被引量：1
2关庆,邓赵红,王士同.子空间可能性聚类机制研究[J].计算机工程,2011,37(5):224-226.
3王亮.一种模糊加权软子空间聚类[J].科技致富向导,2011(11):65-66.
4王荣秀,曹晓莉,孙怀义,胡卫军,江朝元.污水处理装置运行状态的含时正交基分类模型[J].计算机工程,2011,37(17):233-235. 被引量：1
5张健飞,陈黎飞,郭躬德,李南.多代表点的子空间分类算法[J].计算机科学与探索,2011,5(11):1037-1047. 被引量：6
6周冬,苏勇,黄烨.子空间聚类算法在高维数据异常检测中的应用[J].信息技术,2013,37(3):168-171.
7张思亮,李广霞.子空间聚类在入侵检测中的应用[J].计算机安全,2013(12):2-6. 被引量：2
8李丹丹,田春伟,李佰洋,孙广路,康健.基于子空间聚类的网络流量分类方法[J].哈尔滨理工大学学报,2015,20(2):63-68. 被引量：3

二级引证文献13

1向剑平,乔少杰,胡剑.基于聚类分析的申贷信用等级评价方法[J].云南大学学报（自然科学版）,2011,33(6):639-644. 被引量：1
2李南,郭躬德,陈黎飞.基于少量类标签的概念漂移检测算法[J].计算机应用,2012,32(8):2176-2181. 被引量：7
3朱万浩,方昌始.基于RSView的污水处理监控系统设计[J].自动化与仪器仪表,2013(3):50-52. 被引量：8
4兰天,郭躬德.基于RSKNN分类改进算法[J].计算机系统应用,2013,22(12):85-92.
5卢伟胜,郭躬德,严宣辉,陈黎飞.SMwKnn:基于类别子空间距离加权的互k近邻算法[J].计算机科学,2014,41(2):166-169. 被引量：7
6陈雪云,卢伟胜.GSwMKnn:基于类别基尼系数子空间的加权互K近邻算法[J].计算机系统应用,2014,23(2):137-141. 被引量：1
7郭躬德,李南,陈黎飞.一种基于混合模型的数据流概念漂移检测算法[J].计算机研究与发展,2014,51(4):731-742. 被引量：13
8蒋建军,刘彤.一种AMP架构下的处理器负载均衡改进方法[J].山东农业大学学报（自然科学版）,2015,46(1):96-100. 被引量：1
9韩红章.基于目标协同规划的网络入侵特征聚类仿真[J].计算机仿真,2015,32(4):273-276. 被引量：2
10李南,钟一文.多代表点的数据流分类算法[J].小型微型计算机系统,2015,36(7):1535-1539. 被引量：2

1王烨,张子春,宋文超,刘恒军,黄勇,刘增良.多层α-核散列聚类的异常数据社团发现算法[J].信息安全与通信保密,2014,0(9):94-97. 被引量：1
2王雅,杨启耀.基于相似聚类分析的毕业设计成绩评价体系研究[J].黄石理工学院学报,2010,26(3):4-5. 被引量：1
3马宇川.开辟第三战场汇聚更多创新——-IDF16英特尔信息技术峰会[J].微型计算机,2016,0(15):5-12.
4Microchip16位单片机新增8款器件[J].中国公共安全,2007,0(05B):34-34.
5Microchip推出新款的16位单片机[J].电源技术应用,2007,10(5):31-31.
6于东,荀恩东.基于Word Embedding语义相似度的字母缩略术语消歧[J].中文信息学报,2014,28(5):51-59. 被引量：6
7冯中慧,鲍军鹏,沈钧毅.基于EM算法的文本聚类优化研究[J].信息与控制,2006,35(5):657-661. 被引量：2
8韩春燕,刘玉娇,琚生根,李若晨,苏翀.中文微博命名体识别[J].四川大学学报（自然科学版）,2015,52(3):511-516. 被引量：9
9刘靖侨,周波,董金祥.对象—关系型数据库系统的类型扩展[J].计算机应用研究,2002,19(4):23-26.
10刘作国,陈笑蓉.高斯加权的重构性K-NN算法研究[J].中文信息学报,2015,29(5):112-116. 被引量：1

计算机工程

2009年第14期

浏览历史

内容加载中请稍等...

基于k最相似聚类的子空间聚类算法被引量：8

参考文献5

共引文献4

同被引文献65

引证文献8

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于k最相似聚类的子空间聚类算法 被引量：8

参考文献5

共引文献4

同被引文献65

引证文献8

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于k最相似聚类的子空间聚类算法被引量：8