-
题名IncSNN——一种基于密度的增量聚类算法
被引量:5
- 1
-
-
作者
孙焕良
邱菲
刘俊岭
朱叶丽
-
机构
沈阳建筑大学信息与控制工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第z3期309-313,共5页
-
基金
国家自然科学基金项目(60473073,60573090)
辽宁省自然科学基金项目(20052006)
辽宁省教育厅攻关计划基金项目(05L354)
-
文摘
基于密度的聚类算法是一类重要的聚类算法,能发现任意形状的簇,但由于它的时间复杂度较高,因此设计有效的增量更新算法是一个重要研究方向.在SNN算法的基础上,提出一种基于密度的增量聚类算法-IncSNN.该算法将所更新对象的空间进行划分,定义了基于该划分的最近邻居的概念,进而确定了受影响对象的集合,当算法更新时,只需要对受影响的数据进行处理.由于受影响对象的集合远小于原数据集合,因此显著提高了算法的效率.实验结果验证了IncSNN的有效性.
-
关键词
聚类分析
SNN
增量聚类算法
基于密度的算法
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种发现多层次密度的聚类算法
- 2
-
-
作者
孙焕良
毕占举
刘俊岭
周祥国
许景科
-
机构
沈阳建筑大学信息科学与工程学院
沈阳药科大学计算中心
沈阳建筑大学计算中心
辽宁公安司法管理干部学院
-
出处
《沈阳建筑大学学报(自然科学版)》
CAS
2006年第2期329-333,共5页
-
基金
辽宁省自然科学基金(20052006)
辽宁省教育厅攻关计划项目(05L354)
-
文摘
目的提出一种可以发现不同密度层次分布的聚类算法,解决多层次不同密度数据集的聚类问题.方法采用对数据对象的k-邻居距离进行排序,利用线性回归分析方法发现密度区域变化的边界,对同一个密度区域中的点利用DBSCAN算法进行聚类,获得了多密度级别的类.结果使用真实数据集与人工数据集测试结果表明,此算法可以发现现有算法所不能发现的模式.结论算法在时间效率上与DB-SCAN相同,空间效率上随着输入数据的数目增加而线性增长,同时此算法可适用于高维数据集.
-
关键词
数据挖掘
聚类
基于密度的算法
DBSCAN
-
Keywords
data mining
clustering
density-based algorithms
DBSCAN
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名ISNN:一种基于密度的高效增量聚类算法
- 3
-
-
作者
孙焕良
邱菲
朱叶丽
王永会
-
机构
沈阳建筑大学信息与控制工程学院
-
出处
《沈阳建筑大学学报(自然科学版)》
CAS
2006年第6期1015-1018,共4页
-
基金
辽宁省自然科学基金(20052006)
辽宁省教育厅攻关计划(05L354)
-
文摘
目的提高算法效率,减少磁盘访问次数,提出一种基于密度的高效增量聚类算法ISNN.方法将更新对象的空间进行划分,定义了基于该划分的最近邻居概念,在此基础上应用一种剪枝策略来确定受影响对象的集合,数据更新时,只需要对受影响对象集合进行处理.结果受影响对象集合远小于原数据集合,显著地提高了算法效率.结论实验表明,ISNN在效率和磁盘访问次数上都显著优于SNN算法.
-
关键词
聚类分析
SNN
增量聚类算法
基于密度的算法
ISNN
-
Keywords
cluster analysis
SNN
incremental clustering algorithm
the density-based algorithm
ISNN
-
分类号
TP311.131
[自动化与计算机技术—计算机软件与理论]
-