摘要
针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果的判断,在标准数据集上的实验结果有效地验证了这点。并进一步将此有效性分析方法应用于文本聚类。
Several methods were used to study the validity of clustering result.According to the comparison of many different methods,a novel method called silhouette coefficient was proposed in this paper and was applied to evaluate the K-means algorithm.This method could achieve the better judgement for the clustering effect than the others.Finally,the extensive experiments performed on standard dataset verify the effectiveness of the proposed method.
出处
《计算机应用》
CSCD
北大核心
2010年第12期139-141,198,共4页
journal of Computer Applications
基金
国家自然科学基金资助项目(60903099)
关键词
聚类
K均值算法
轮廓系数
有效性分析
无监督
clustering
K-means algorithm
silhouette coefficient
validity analysis
unsupervised