最优聚类个数和初始聚类中心点选取算法研究被引量：83

Algorithm research of optimal cluster number and initial cluster center

在线阅读下载PDF

导出

摘要传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定且准确率较低。基于SSE来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集、聚类中心点之间距离相对较远的选取原则来选取初始聚类中心点,避免初始聚类中心点集中在一个小的范围,防止陷入局部最优。实验证明,该算法能选取最优的k值,通过用标准的UCI数据库进行实验,采用的算法能选择出唯一的初始中心点,聚类准确率较高、误差平方和较小。 The cluster k of traditional K-means algorithm could not determine beforehand and the initial clustering centers of K-means algorithm were randomly selected, which might resuh in low accurary and unstable clustering. This paper based on the SSE for selecting the number of clusters k, based on the principle that the clustering center of the surrounding area was relatively dense, and between the clustering center distance was relatively far, selected the initial clustering center to avoid the initial clustering center focused on a small range,prevented fall into local optimum. In the case of the number of categories k was given. This paper used the standard UCI data sets for test. Tests show that, this method can select the optimal value of k, it can choose the only center of initial clustering and have the higher accuracy and the minimum errors.

作者张素洁赵怀慈

机构地区中国科学院沈阳自动化研究所中国科学院大学中国科学院光电信息处理重点实验室辽宁省图像理解与视觉计算重点实验室

出处《计算机应用研究》 CSCD 北大核心 2017年第6期1617-1620,共4页 Application Research of Computers

关键词 K-MEANS算法聚类中心准确率误差平方和 K-means algorithm cluster centers accuracy squared error

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献12

1谢娟英,郭文娟,谢维信,高新波.基于样本空间分布密度的初始聚类中心优化K-均值算法[J].计算机应用研究,2012,29(3):888-892. 被引量：53
2秦亮,张文广,史贤俊,肖支才.基于免疫克隆算法的多目标聚类方法[J].信息与控制,2013,42(1):8-12. 被引量：7
3张靖,段富.优化初始聚类中心的改进k-means算法[J].计算机工程与设计,2013,34(5):1691-1694. 被引量：56
4冯波,郝文宁,陈刚,占栋辉.K-means算法初始聚类中心选择的优化[J].计算机工程与应用,2013,49(14):182-185. 被引量：51
5郑丹,王潜平.K-means初始聚类中心的选择算法[J].计算机应用,2012,32(8):2186-2188. 被引量：35
6仝雪姣,孟凡荣,王志晓.对k-means初始聚类中心的优化[J].计算机工程与设计,2011,32(8):2721-2723. 被引量：29
7熊忠阳,陈若田,张玉芳.一种有效的K-means聚类中心初始化方法[J].计算机应用研究,2011,28(11):4188-4190. 被引量：87
8王赛芳,戴芳,王万斌,张晓宇.基于初始聚类中心优化的K-均值算法[J].计算机工程与科学,2010,32(10):105-107. 被引量：24
9苏锦旗,薛惠锋,詹海亮.基于划分的K-均值初始聚类中心优化算法[J].微电子学与计算机,2009,26(1):8-11. 被引量：34
10韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152. 被引量：94

二级参考文献101

1袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：48
2万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,26(1):177-179. 被引量：16
3张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：61
4杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：192
5李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
6钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
7王洪春,彭宏.基于模糊C-均值的增量式聚类算法[J].微电子学与计算机,2007,24(6):156-157. 被引量：22
8袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：155
9黄光球,王西邓,刘冠.基于网格划分策略的改进人工鱼群算法[J].微电子学与计算机,2007,24(7):83-86. 被引量：18
10Han J W, Kamber M. Data mining concepts and techniques[ M].北京:高等教育出版社,2002:335-394.

共引文献598

1杨捷,李沛霖,罗成臣,洪锋.基于数据挖掘的电网用户行为分析[J].云南大学学报（自然科学版）,2020,42(S02):38-43. 被引量：24
2赵春丽,王延博,万润之,孙丽平.基于R语言探析中医药治疗哮喘发作期的用药规律[J].世界科学技术-中医药现代化,2023,25(3):1011-1019. 被引量：6
3段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
4张红荣,张峰.传统的K-means聚类算法的研究与改进[J].咸阳师范学院学报,2010,25(4):59-62. 被引量：4
5吴东飞,金玉龙,蒋建国.基于TMS320DM6467和TMS320C6472的高清视频处理系统[J].数据采集与处理,2012,27(S2):227-234.
6高飞,鱼江,任芳,黄保瑞,次旺多吉.四维文档向量模型的k-means新闻文本聚类算法[J].西藏大学学报（社会科学版）,2013,28(4):109-112.
7王海,高岭,陈东棋,任杰.一种基于用户行为的嵌入式功耗优化方法[J].系统仿真学报,2015,27(2):320-326.
8周爱武,汪贤惠,刘慧婷.基于HowNet词汇相关性的文本聚类[J].微电子学与计算机,2015,32(4):90-93. 被引量：4
9陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
10鲁婧婧,张晋昕,袁向东,骆福添,古萍,张熙,薛允莲.欧氏距离的加权处理对K-means法聚类效果的改进[J].中国医院统计,2008,15(1):9-12. 被引量：1

同被引文献468

1冯建英,王博,吴丹丹,穆维松,田东.用户画像技术与其在农业领域应用研究进展[J].农业机械学报,2021,52(S01):385-395. 被引量：7
2刘友超,张曦煌.基于自然最近邻相似图的谱聚类[J].计算机应用研究,2020,37(1):30-33. 被引量：7
3俞骏威,张黎明,陈凯,熊璐,余卓平,陈广.基于道路消失点的远距离路面微小障碍物检测[J].同济大学学报（自然科学版）,2019,47(S01):213-216. 被引量：3
4简立军.浅析当前建筑工地存在的安全问题及对策[J].四川建筑,2005,25(z1):303-304. 被引量：3
5周智慧.发展性课堂教学评价体系探讨[J].教育探索,2010(6):47-48. 被引量：20
6吴必虎,金华荏,张丽.旅游解说系统的规划和管理[J].旅游学刊,1999,14(1):44-46. 被引量：244
7李冠楠,谭庆昌,张阔,张宇鹏.基于电致发光影像的太阳能电池瑕疵检测[J].发光学报,2013,34(10):1400-1407. 被引量：2
8王艳辉,黄雅坤,李曼.基于组合赋权方法的城轨线路运营安全评价[J].同济大学学报（自然科学版）,2013,41(8):1243-1248. 被引量：19
9蔡志敏,王晏民,黄明.基于KD树散乱点云数据的Guass平均曲率精简算法[J].测绘通报,2013(S1):44-46. 被引量：6
10冯兵,李芝棠,花广路.基于灰度—梯度共生矩阵的图像型垃圾邮件识别方法[J].通信学报,2013,34(S2):1-4. 被引量：11

引证文献83

1周斌,苏鹏,高鹏.基于改进YOLOv3算法的挖掘机检测方法[J].数字制造科学,2022(2):141-145. 被引量：2
2何柱裕,王丽.迟发性运动障碍的药物治疗[J].中国药师,2000,3(2):111-111. 被引量：1
3郝美薇,戴华林,郝琨.基于密度的K-means算法在轨迹数据聚类中的优化[J].计算机应用,2017,37(10):2946-2951. 被引量：8
4魏湧明,全吉成,侯宇青阳.基于YOLOv2的无人机航拍图像定位研究[J].激光与光电子学进展,2017,54(11):95-104. 被引量：58
5王日宏,崔兴梅.融合集群度与距离均衡优化的K-均值聚类算法[J].计算机应用,2018,38(1):104-109. 被引量：3
6卫星君,顾清华.基于特征指标推荐系统托攻击半监督检测[J].计算机应用研究,2018,35(7):2185-2188. 被引量：2
7王曙光,吕攀飞.改进YOLO v2的装甲车辆目标识别[J].计算机与现代化,2018(9):68-71. 被引量：10
8王殿伟,何衍辉,李大湘,刘颖,许志杰,王晶.改进的YOLOv3红外视频图像行人检测算法[J].西安邮电大学学报,2018,23(4):48-52. 被引量：18
9乔琳,胡涛,朱金悦.基于最小生成树的K-means驴友结伴推荐算法研究[J].现代商业,2017(16):172-173. 被引量：2
10张瑞林,张俊为,桂江生,高春波,包晓安.基于改进YOLOv2网络的遗留物检测算法[J].浙江理工大学学报（自然科学版）,2018,39(3):325-332. 被引量：3

二级引证文献713

1陈征,刘长龙,张乐,张玺亮,徐元德,蓝飞,蒋少玖.一种用于海上平台缆控注水井的多类型指针式仪表识别方法[J].系统仿真技术,2022,18(2):103-108. 被引量：4
2谢瑶瑶,邓三鸿,王昊,章学周.基于SAO语义挖掘的用户需求-专利技术匹配[J].数据分析与知识发现,2024,8(8):213-225.
3吕璐成,罗文馨,许景龙,王莉莉,马丽婧,赵亚娟.专利情报方法、工具、应用研究进展及新技术应用趋势[J].情报学进展,2020(1):235-278. 被引量：10
4卫星君,李海霞.针对商品推荐系统的混淆托攻击半监督检测研究[J].科技促进发展,2020,16(9):1125-1133.
5尚珍宇(译),程可欣,简钰清,王志芳,王颖(译),周佳怡(译).社交媒体文本数据分析方法对比与适用性研究:以北京市城市公园感知为例[J].景观设计学（中英文）,2023,11(5):8-29. 被引量：1
6姜阔胜,徐瑞,王迪.基于深度学习的铜封帽内螺纹缺陷检测研究[J].安徽理工大学学报（自然科学版）,2022,42(3):93-98. 被引量：1
7李琪琪,花向红,赵不钒,陶武勇,戚瀚文.一种基于曲率泊松碟采样的散乱点云精简方法[J].测绘通报,2020(S01):176-180. 被引量：15
8李娜,周林宏,杨戈,杨秀璋,杨楠.一种基于改进YOLOv3的甲板灯光异常检测方法[J].船舶工程,2021,43(S02):53-58. 被引量：2
9滑江,孙钰,周彦斌,蔡曙日,龚尚文.基于K-means方法的气象数据分区在公路养护的应用[J].公路交通科技,2022,39(S01):19-23. 被引量：1
10王刘旺,周自强,林龙,韩嘉佳.人工智能在变电站运维管理中的应用综述[J].高电压技术,2020,46(1):1-13. 被引量：85

1尚敬强,原思聪,卫东东,肖畅.基于遗传算法的BP神经网络在塔式起重机故障诊断中的应用[J].起重运输机械,2012(4):61-64. 被引量：7
2王盘岗.ARP欺骗及其对策[J].消费导刊,2009,0(11):134-134.
3张亚勤.服务催生云计算[J].软件和信息服务,2010(7):44-45.
4周靖.指令集的进步——MMX和SSE[J].微型计算机,1999(4):29-29.
5赖桃桃,冯少荣.聚类算法中的相似性度量方法研究[J].心智与计算,2008,0(2):176-181. 被引量：8
6周鑫,张化祥.k-means算法的研究与改进[J].微计算机信息,2008,24(30):269-270. 被引量：7
7李青,曹林平.一维自组织映射聚类数的自适应确定[J].火力与指挥控制,2004,29(4):100-102.
8陈涛.基于文化算法的支持向量机组合预测模型[J].统计与决策,2010,26(21):149-152. 被引量：3
9阮征.运用组策略，巧妙隐藏分区[J].现代计算机（中旬刊）,2005(8):84-84.
10李健.用邮箱来写Blog[J].软件指南,2007(1):55-55.

计算机应用研究

2017年第6期

浏览历史

内容加载中请稍等...

最优聚类个数和初始聚类中心点选取算法研究被引量：83

参考文献12

二级参考文献101

共引文献598

同被引文献468

引证文献83

二级引证文献713

相关作者

相关机构

相关主题

浏览历史

最优聚类个数和初始聚类中心点选取算法研究 被引量：83

参考文献12

二级参考文献101

共引文献598

同被引文献468

引证文献83

二级引证文献713

相关作者

相关机构

相关主题

浏览历史

最优聚类个数和初始聚类中心点选取算法研究被引量：83