采用属性聚类的高维子空间聚类算法被引量：13

Subspace Clustering through Attribute Clustering

在线阅读下载PDF

导出

摘要为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意2个非冗余属性的相关度,进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感. Many recently proposed subspace clustering methods suffer from two severe problems： First, the algorithms typically scale exponentially with the data dimensionality or the subspace dimensionality of clusters. Second, the clustering results are often sensitive to input parameters. A fast algorithm of subspace clustering using attribute clustering is proposed to overcome these limitations. This algorithm first filters out redundant attributes by computing the gini coefficient. To evaluate the correlation of each two non-redundant attributes, the relation matrix of non-redundant attributes is constructed based on the relation function of two dimensional united gini coefficients. After applying overlapping clustering algorithm on relation matrix, the candidate of all interesting subspaces is achieved. Finally, all subspace dusters can be gotten by clustering on interesting subspaces. Experiments on both synthesis and real datasets show that the new algorithm not only achieves a significant gain of runtime and quality to find subspace clusters but also is insensitive to input parameters.

作者牛琨张舒博陈俊亮

机构地区北京邮电大学网络与交换技术国家重点实验室中国电信北京研究院决策研究部

出处《北京邮电大学学报》 EI CAS CSCD 北大核心 2007年第3期1-5,共5页 Journal of Beijing University of Posts and Telecommunications

基金国家"973计划"项目(2007CB307100) 国家自然科学基金项目(60432010)

关键词子空间聚类高维数据属性聚类 subspace clustering high dimensional data attribute clustering

分类号 TN929.53 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1Agrawal R,Gehrke J,Gunopulos D,et al.Automatic subspace clustering of high dimensional data for data mining applications[C]∥In Proc ACM SIGMOD Int Conf on Management of Data.Washington:ACM Press,1998:94-105.
2Agrawal R,Gehrke J,Gunopulos D,et al.Automatic subspace clustering of high dimensional data[J].Data Mining and Knowledge Discovery,2005,11(1):5-33.
3Cheng C H,Fu A W,Zhang Y.Entropy-based subspace clustering for mining numerical data[C]∥In Proceedings of the 5th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.USA:ACM Press,1999:84-93.
4Goil S,Nagesh H S,Choudhary A.MAFIA:efficient and scalable subspace clustering for very large data sets[Z].Technique Report No.CPDC-TR-9906-010,Center for Parallel and Distributed Computing,Dept of Electrical and Computer Engineering.Northwestern University:Evanston IL,1999.
5Procopiuc C M,Johes M,Agarwal P K,et al.A Monte Carlo algorithm for fast projective clustering[C]∥Proc ACM SIGMOD Int Conf on Management of Data.Madison:ACM Press,2002:418-427.
6Huang Z,Ng M,Rong H.Automated variable weighting in k-means type clustering[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(5):657-668.
7Kriegel H,Kroger P,Renz M,et al.A generic framework for efficient subspace clustering of high-dimensional data[C]∥Proc of 5^th IEEE Int Conf on Data Mining.New Orleans:IEEE Press,2005:250-257.

同被引文献127

1熊刚,孟姣,曹自刚,王勇,郭莉,方滨兴.网络流量分类研究进展与展望[J].集成技术,2012,1(1):32-42. 被引量：24
2房向明,杨寿保,郭磊涛,张蕾.网格计算系统的安全体系结构模型研究[J].计算机科学,2004,31(7):63-65. 被引量：8
3王太雷.个性化推荐系统中相似模式聚类研究[J].计算机工程,2005,31(10):156-158. 被引量：3
4朱蔚恒,印鉴,谢益煌.基于数据流的任意形状聚类算法[J].软件学报,2006,17(3):379-387. 被引量：51
5朱陶业,李应求,张颖,张学庄,何朝阳.提高时间序列气象适应性的短期电力负荷预测算法[J].中国电机工程学报,2006,26(23):14-19. 被引量：46
6刘青宝,邓苏,张维明.基于相对密度的聚类算法[J].计算机科学,2007,34(2):192-195. 被引量：13
7李双虎,张风海.一个新的聚类有效性分析指标[J].计算机工程与设计,2007,28(8):1772-1774. 被引量：14
8王国仁,黄健美,王斌,韩东红,乔百友,于戈.基于最大间隙空间映射的高维数据索引技术[J].软件学报,2007,18(6):1419-1428. 被引量：9
9Eric M, Dukic M L, Ohradovic M. Frequency hopping signal separation by spatio-frequeney analysis based on music method[J]. Spread Spectrum Techniques and Applications, 2000: 78-82.
10Liu Xiangqian, Sidiropoulos N D, Swami A. Code blind reception of fh signals over multipath fading channels[ C]// Acoustics Speech and Signal Processing. Hong Kong, [s. n. ], 2003: 592-595.

引证文献13

1王斌,陈秋华,王翠柏.基于聚类的跳频信号分选[J].北京邮电大学学报,2009,32(2):80-84. 被引量：14
2夏英,李克非.基于属性相关性分析的子空间搜索算法[J].重庆邮电大学学报（自然科学版）,2009,21(4):544-548. 被引量：2
3朱思峰,刘芳,柴争义.免疫聚类算法在基因表达数据分析中的应用[J].北京邮电大学学报,2010,33(2):54-57. 被引量：9
4郭伟光,章蕾.基于用户模式聚类的协同过滤个性化推荐方法[J].情报杂志,2011,30(2):160-163. 被引量：5
5祝琴,戴爱明.高维稀疏数据对象—属性的非关联子空间分析[J].中国管理信息化,2011,14(9):27-29.
6郭景峰,易莉桦.基于相对熵和子空间二次过滤的CLIQUE改进算法[J].燕山大学学报,2011,35(4):359-365. 被引量：1
7刘剑涛.个性化推荐系统中用户多态聚类研究[J].现代图书情报技术,2012(2):18-22. 被引量：5
8吴玲玉,白尘.兼顾属性距离及关系强度的密度聚类算法[J].计算机应用研究,2013,30(11):3283-3286. 被引量：2
9周伟强,汤春香,王丽娟.基于主属性网格资源分类组织模式[J].河南农业大学学报,2014,48(5):658-662.
10李丹丹,田春伟,李佰洋,孙广路,康健.基于子空间聚类的网络流量分类方法[J].哈尔滨理工大学学报,2015,20(2):63-68. 被引量：3

二级引证文献139

1罗澍忻,麻敏华,蒋林,靳冰洁,林勇,刁旭昊,黎灿兵,杨波.考虑多时间尺度数据的中长期负荷预测方法[J].中国电机工程学报,2020,40(S01):11-19. 被引量：42
2赵庆杭,王昕,郑益慧,李立学.基于特征融合与随机森林的吊车碰线预警算法[J].高电压技术,2020,46(2):471-479. 被引量：14
3李永毅,石蓉,郎锐,王开艳,贾嵘,杨海波.基于对数平均迪氏指数分解法的陕西省居民用电影响因素分析[J].电网与清洁能源,2019,35(6):40-45. 被引量：3
4苑春燕,李爱华.基于信息增益和相关性的贝叶斯分类算法研究[J].网络与信息,2010,24(2):30-31.
5向娴,汤建龙.基于改进的支持向量聚类的雷达信号分选[J].航天电子对抗,2011,27(1):50-53. 被引量：2
6朱思峰,刘芳,柴争义.基于免疫计算的WCDMA网络基站选址优化[J].电子与信息学报,2011,33(6):1492-1495. 被引量：12
7朱思峰,陈国强,张新刚.免疫记忆克隆算法求解3G基站选址优化问题[J].华中科技大学学报（自然科学版）,2011,39(7):63-66. 被引量：3
8王世强,张登福,毕笃彦,雍霄驹.基于快速支持向量聚类和相似熵的多参雷达信号分选方法[J].电子与信息学报,2011,33(11):2735-2741. 被引量：27
9朱思峰,刘芳,戚玉涛,柴争义,吴建设.异构无线网络中基于免疫计算的联合会话接纳控制[J].电子学报,2011,39(11):2648-2653. 被引量：5
10齐昶,王斌,丁海军.基于KHM聚类算法的跳频信号分选[J].声学技术,2011,30(6):547-551. 被引量：10

1王佳飞.一种改进型LMS自适应滤波算法及其分析[J].广东通信技术,2013,33(12):62-64.
2张保龙,黄海燕.二度人脉聚类算法设计[J].现代电子技术,2016,39(9):126-127.
3通讯技术[J].中国学术期刊文摘,2008,14(4):150-154.
4吕惠志,苑立波,孙晶华,孙秋华.光学双稳态半导体激光器的理论分析[J].光学学报,1995,15(11):1491-1497.
5长虹移动DVD-P701B[J].消费电子,2003,0(9):103-103.
6张卫华.基于矩阵的apriori算法的改进[J].电子设计工程,2015,23(13):52-54. 被引量：6
7智进亮.在LTE环境下运营WLAN必要性分析[J].电信工程技术与标准化,2013,26(6):60-62. 被引量：1
8何大可,万蓉.一种素数域上的非超奇椭圆曲线构造方案[J].西南民族大学学报（自然科学版）,2003,29(1):9-15. 被引量：1
9周牒岚,陈琳,向华.数据挖掘算法研究[J].现代电子技术,2011,34(20):75-78. 被引量：8
10郑健,别红霞,类春阳,张雪坤,房明.优化循环转移矩阵偏移量的QC-LDPC码构造[J].北京邮电大学学报,2014,37(1):16-19. 被引量：1

北京邮电大学学报

2007年第3期

浏览历史

内容加载中请稍等...

采用属性聚类的高维子空间聚类算法被引量：13

参考文献7

同被引文献127

引证文献13

二级引证文献139

相关作者

相关机构

相关主题

浏览历史

采用属性聚类的高维子空间聚类算法 被引量：13

参考文献7

同被引文献127

引证文献13

二级引证文献139

相关作者

相关机构

相关主题

浏览历史

采用属性聚类的高维子空间聚类算法被引量：13