基于并行遗传算法的K-means聚类研究被引量：17

Research of K-means Clustering Method Based on Parallel Genetic Algorithm

在线阅读下载PDF

导出

摘要针对传统K-means聚类算法对初始聚类中心的选择敏感,以及聚类数K难以确定的问题,提出一种基于并行遗传算法的K-means聚类方法。该方法采用一种新型的可变长染色体编码方案,随机选择样本点作为初始聚类中心形成染色体,然后结合K-means算法的高效性和并行遗传算法的全局优化能力,通过种群内的遗传、变异和种群间的并行进化、联姻,有效地避免了局部最优解的出现,同时得到了优化的聚类数目和聚类结果。实验表明该方法是一种精确高效的聚类方法。 As K-means Clustering Algorithm is sensitive to the choice of the initial cluster centers and it＇s difficult to determine the cluster number, we propose a K-means Clustering Method Based on Parallel Genetic Algorithm. In the method, we adopt a new strategy of Variable-Length Chromosome Encoding and randomly chose initial clustering centers to form chromosomes among samples. Combining the efficiency of K-means Algorithm with the global optimization ability of Parallel Genetic Algorithm, the local optimal solution is avoided and the optimum number and optimum result of cluster are obtained by means of heredity, mutation in the community, and parallel evolution, intermarriage among communities. Experiments indicated that this algorithm is efficient and accurate.

作者戴文华焦翠珍何婷婷

机构地区咸宁学院计算机系华中师范大学计算机科学系

出处《计算机科学》 CSCD 北大核心 2008年第6期171-174,共4页 Computer Science

基金国家自然科学基金(No60442005,No60673040) 国家社会科学基金(No06BYY029) 教育部重点研究项目(No105117) 湖北省教育厅科(NoD200728002)

关键词并行遗传算法可变长染色体编码 K-MEANS算法聚类 Parallel genetic algorithm, Variable-length chromosome encoding, K-means algorithm, Clustering

分类号 TP301.6 [自动化与计算机技术—计算机系统结构] O242.23 [理学—计算数学]

引文网络
相关文献

参考文献11

1Larsen B, Aone C. Fast and effective text mining using linear time document clustering[A] //Proc, of the Fifth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Diego, CA, August 1999:16-22
2MacQueen J B. Some methods for classification and analysis of multivariate observations//Proc. of the 5th Berkeley Symposium on Mathematical Statistics and Probability. 1967:281-297
3Zhao Y, Karypis G. Criterion Functions for Document Clustering: Experiments and Analysis[R]. Technical Report. # 01- 04. Department of Computer Science, University of Minnesota, 2001
4Steinbach M, Karypis G, Kumar V. A comparison of Document Clustering Techniques[R]. Department of Comp Sci & Eng University of Minnesota, 2000:1-20
5Salton G, Wang A, Yang C S. A vector space model for autornatic indexing[J]. Communication of the ACM, 1975, 18(11) : 613-620
6Muhlenbein H. Evolution in time and space-the parallel genetic algorithm. In Rawlins, Foundations of Genetic Algorithms: Morgan Kaufmann, 1991
7Hung S L, Adeli H. A parallel genetic/neural network learning algorithm for MIMD shared memory machines. IEEE Transactions on Neural Networks, 1994, 5(6):900-908
8Liu Juan, Iba H. Selecting informative genes with parallel GA in tissue classification. Genome Informaties, 2001, 3(12): 14- 23
9Goldberg D E, Deb K, Korb B. Don't Worry Be Messy//Proc. of ICGA. 1991:24-30
10Ramze R M, Lelieveldt B P F, Reiber J H C. A new cluster validity indexes for the fuzzy c-mean[J]. Pattern Recognition Letters, 1998, 19:237-246

同被引文献148

1刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：23
2张石磊,武装.一种基于Hadoop云计算平台的聚类算法优化的研究[J].计算机科学,2012,39(S2):115-118. 被引量：29
3江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：80
4高洁,吉根林.文本分类技术研究[J].计算机应用研究,2004,21(7):28-30. 被引量：36
5吕强,俞金寿.基于混合遗传算法的K-Means最优聚类算法[J].华东理工大学学报（自然科学版）,2005,31(2):219-222. 被引量：8
6王家耀,张雪萍,周海燕.一个用于空间聚类分析的遗传K-均值算法[J].计算机工程,2006,32(3):188-190. 被引量：19
7温广辉,王明旭,郭嗣琮.一种求解 TSP 问题的新型遗传编码方案[J].科学技术与工程,2006,6(2):206-208. 被引量：8
8李培强,李欣然,陈辉华,唐外文.基于模糊聚类的电力负荷特性的分类与综合[J].中国电机工程学报,2005,25(24):73-78. 被引量：133
9侯振杰,麻硕士,裴喜春,潘新.一种基于遗传算法的骨髓细胞图像分割方法[J].计算机工程与科学,2006,28(10):63-65. 被引量：3
10张红斌,汤涌,张东霞,侯俊贤.负荷建模技术的研究现状与未来发展方向[J].电网技术,2007,31(4):6-10. 被引量：48

引证文献17

1孟娜娜,徐振明.一种基于划分的无监督优化算法[J].计算机工程,2011,37(S1):168-170. 被引量：1
2乔斌,王春光.基于聚类遗传算法的损伤苹果切片图像分割方法[J].自动化技术与应用,2009,28(7):5-7.
3顾春琴,陶乾,吴家培,常会友,姚卿达,衣杨.基于混合自适应遗传算法的工作流挖掘优化[J].计算机科学,2010,37(3):234-238. 被引量：5
4王小青.基于并行遗传算法的KNN分类方法[J].西南师范大学学报（自然科学版）,2010,35(2):103-106. 被引量：3
5田胜利,熊德兰.基于改进仿射传播聚类的文本自适应模糊聚类[J].小型微型计算机系统,2010,31(11):2287-2290. 被引量：3
6张济强,高玉良.遗传模拟退火算法在k—means聚类中的应用[J].电脑知识与技术,2012,8(3):1611-1613. 被引量：1
7王顶,马娟,赵颐轩.基于RSS空时处理的指纹定位算法[J].计算机应用研究,2012,29(12):4726-4728. 被引量：7
8贾瑞玉,管玉勇,李亚龙.基于MapReduce模型的并行遗传k-means聚类算法[J].计算机工程与设计,2014,35(2):657-660. 被引量：22
9王晓飞,聂生东,王远军.改进的K-均值聚类算法及其在脑组织分割中的应用[J].中国医学物理学杂志,2014,31(2):4760-4764. 被引量：3
10黄毅成,杨洪耕.改进遗传K均值算法在负荷特性分类的应用[J].电力系统及其自动化学报,2014,26(7):70-75. 被引量：21

二级引证文献97

1龙浠玉,张新主,章新平,李巧媛.洞庭湖流域雨季极端降水事件的环流演变特征分析[J].水土保持研究,2020,27(2):158-164. 被引量：7
2段翔兮,高剑,李熠,龙呈,邹琬,何锐.基于大数据挖掘技术的电网电压越限成因诊断方法研究[J].电子测量技术,2020,43(8):81-85. 被引量：9
3周戈,曾智.改进的遗传算法在数字滤波器优化应用研究[J].计算机仿真,2011,28(12):215-218. 被引量：2
4李莉,李洪奇,谢绍龙.基于变异粒子群算法的过程挖掘[J].计算机集成制造系统,2012,18(3):634-638. 被引量：4
5文一凭,陈志刚,陈铁民.基于工作流网的成批处理工作流模型挖掘方法[J].计算机集成制造系统,2012,18(8):1795-1800. 被引量：1
6盛景军,王晴,侯立峰,朱海洋.基于Pareto适应度的混合遗传算法在多式联运问题中的应用[J].西南师范大学学报（自然科学版）,2012,37(9):43-47. 被引量：10
7于吉红,白晓明,吕俊伟.改进相似度的仿射传播聚类算法[J].小型微型计算机系统,2013,34(3):602-605. 被引量：3
8高平,毛力,宋益春.基于改进差分进化的K-均值聚类算法[J].电脑知识与技术,2013,9(8):5064-5067. 被引量：5
9侯保华.基于无线射频定位技术的智能档案管理[J].哈尔滨商业大学学报（自然科学版）,2014,30(2):249-252. 被引量：1
10徐鹏,姜凤茹.粒子群算法和K近邻相融合的网络入侵检测[J].计算机工程与应用,2014,50(11):95-98. 被引量：6

1戴文华,焦翠珍,何婷婷.基于遗传算法的自适应文本模糊聚类研究[J].计算机科学,2008,35(8):134-137. 被引量：1
2何婷婷,戴文华,焦翠珍.基于混合并行遗传算法的文本聚类研究[J].中文信息学报,2007,21(4):55-60. 被引量：11
3NVIDIA开拓亚太市场，在北京建立代表处[J].电子与电脑,2005,5(7):146-146.
4吴晓琴,陈圣兵,何立新.改进遗传算法在文本聚类中的应用研究[J].巢湖学院学报,2013,15(3):27-31.
5融合时代的运维＋应用[J].网管员世界,2010(10):12-12.
6王小青.基于并行遗传算法的KNN分类方法[J].西南师范大学学报（自然科学版）,2010,35(2):103-106. 被引量：3
7许福永,林晓辉.计算机网络中路由选择的优化研究[J].甘肃工业大学学报,2003,29(1):86-89. 被引量：14
8李彤,王黎霞.支持第四代语言的并行进化式软件开发模型CESD[J].计算机科学,1996,23(5):79-81. 被引量：12
9孟佳娜,王立宏.基于异构多种群的一种改进遗传算法[J].微电子学与计算机,2004,21(6):71-73. 被引量：5
10宫尚宝,郭玉翠.基于遗传算法的模糊聚类分析[J].模糊系统与数学,2010,24(6):123-128. 被引量：10

计算机科学

2008年第6期

浏览历史

内容加载中请稍等...

基于并行遗传算法的K-means聚类研究被引量：17

参考文献11

同被引文献148

引证文献17

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于并行遗传算法的K-means聚类研究 被引量：17

参考文献11

同被引文献148

引证文献17

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于并行遗传算法的K-means聚类研究被引量：17