期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于BayesShrink阈值估计的混合属性数据聚类优化仿真
1
作者 董华松 连远锋 《计算机仿真》 2024年第5期460-464,共5页
与单一属性数据不同,混合属性数据通常存在尺度不一致的特点,为了可以得到准确率更高的混合属性聚类结果,提出一种基于k最近邻的混合属性聚类算法。采用高频系数滑动窗口准确估计含有噪声的混合属性数据噪声方差,通过BayesShrink阈值估... 与单一属性数据不同,混合属性数据通常存在尺度不一致的特点,为了可以得到准确率更高的混合属性聚类结果,提出一种基于k最近邻的混合属性聚类算法。采用高频系数滑动窗口准确估计含有噪声的混合属性数据噪声方差,通过BayesShrink阈值估计算法得到最佳阈值,对混合属性数据展开去噪。采用k最近邻方法展开数据聚类,在去噪后的数据样本贡献度中加入特征权重,并计算融入贡献度后的特征权重欧几里得距离,距离越近,说明数据属于同一类别的概率就越大,对全部样本特征展开加权处理后,构建混合属性聚类模型,利用粒子群算法对模型展开寻优,获取最优加权特征向量,实现混合属性数据聚类。仿真结果表明,所提算法可以有效提升混合属性聚类结果的精度和聚类效率。 展开更多
关键词 混合属性数据 阈值估计算法 粒子群算法
在线阅读 下载PDF
混合属性数据深度无监督融合特征学习方法
2
作者 何慧霞 武森 +2 位作者 魏桂英 谢嘉瑶 高晓楠 《计算机科学与探索》 CSCD 北大核心 2024年第7期1852-1864,共13页
高质量的特征表示是实现数据精准挖掘的关键。针对现有特征学习方法难以有效提取混合属性数据中不同属性之间关联和数据内部真实信息的问题,提出一种面向混合属性数据的深度无监督融合特征学习模型(DUFERM)。该模型建立了一个双模态自... 高质量的特征表示是实现数据精准挖掘的关键。针对现有特征学习方法难以有效提取混合属性数据中不同属性之间关联和数据内部真实信息的问题,提出一种面向混合属性数据的深度无监督融合特征学习模型(DUFERM)。该模型建立了一个双模态自编码器框架,对分类属性和数值属性采用不同路径进行建模,并采用深度多模态融合策略加深两种属性之间的联系;针对分类属性构建基于加权异构网络的离散特征自编码器,充分挖掘分类属性内部的结构和语义信息,针对数值属性构建连续特征自编码器,两个独立的自编码器以联合表示的形式组合在公共潜在表示层中;最后以预训练和联合训练相结合的无监督训练方式获得混合属性数据的融合特征表示。在10个公开数据集上的大量实验表明,所提DUFERM模型在各项评价指标上的综合性能优于现有经典的和新颖的混合属性数据特征学习方法,可以充分提取混合属性数据内部潜在特征,取得高质量的融合特征表示结果并提升下游数据挖掘任务的准确性。 展开更多
关键词 混合属性数据 融合特征学习 无监督 数据挖掘
在线阅读 下载PDF
基于K-prototypes的混合属性数据聚类算法 被引量:16
3
作者 陈韡 王雷 蒋子云 《计算机应用》 CSCD 北大核心 2010年第8期2003-2005,2110,共4页
通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加精确反映样本间的差异;在此基础上提出了一种用于处理混合属性数据的聚类算法,并将改进后的算法应用于英... 通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加精确反映样本间的差异;在此基础上提出了一种用于处理混合属性数据的聚类算法,并将改进后的算法应用于英语借词数据的聚类分析中。实验结果表明,与K-prototypes算法相比,改进后的算法具有更好的稳定性和更高的精度。 展开更多
关键词 聚类 K-prototypes算法 混合属性数据 相异度
在线阅读 下载PDF
混合属性数据聚类的新方法 被引量:7
4
作者 白天 冀进朝 +1 位作者 何加亮 周春光 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2013年第1期130-134,共5页
提出了一种数值型和类别型混合属性数据聚类的全局算法。算法通过随机选取足够多的初始原型来覆盖数据集的全局分布信息,然后通过评估函数迭代地消去多余的原型。最后对本文算法进行了验证,证明了该算法的有效性和收敛性。并与其他已有... 提出了一种数值型和类别型混合属性数据聚类的全局算法。算法通过随机选取足够多的初始原型来覆盖数据集的全局分布信息,然后通过评估函数迭代地消去多余的原型。最后对本文算法进行了验证,证明了该算法的有效性和收敛性。并与其他已有同类型算法的聚类结果进行比较,说明本文算法对混合属性数据具有更高的聚类准确度,为解决混合型数据聚类问题提供了一种新途径。 展开更多
关键词 人工智能 数据聚类 数据挖掘 K原型算法 混合属性数据
在线阅读 下载PDF
基于残差分析的混合属性数据聚类算法 被引量:12
5
作者 邱保志 张瑞霖 李向丽 《自动化学报》 EI CSCD 北大核心 2020年第7期1420-1432,共13页
针对混合属性数据聚类结果精度不高、聚类结果对参数敏感等问题,提出了基于残差分析的混合属性数据聚类算法(Clustering algorithm for mixed data based on residual analysis)RA-Clust.算法以改进的熵权重混合属性相似性度量对象间的... 针对混合属性数据聚类结果精度不高、聚类结果对参数敏感等问题,提出了基于残差分析的混合属性数据聚类算法(Clustering algorithm for mixed data based on residual analysis)RA-Clust.算法以改进的熵权重混合属性相似性度量对象间的相似性,以提出的基于KNN和Parzen窗的局部密度计算方法计算每个对象的密度,通过线性回归和残差分析进行聚类中心预选取,然后以提出的聚类中心目标优化模型确定真正的聚类中心,最后将其他数据对象按照距离高密度对象的最小距离划分到相应的簇中,形成最终聚类.在合成数据集和UCI数据集上的实验结果验证了算法的有效性.与同类算法相比,RA-Clust具有较高的聚类精度. 展开更多
关键词 聚类 残差分析 线性回归 混合属性数据 聚类中心
在线阅读 下载PDF
一种基于图划分的混合属性数据聚类算法 被引量:2
6
作者 黄树成 李甜 沙爱晖 《计算机应用与软件》 CSCD 北大核心 2013年第7期11-13,135,共4页
实际应用中存在着大量同时具有数值型和符号型属性的混合属性数据,研究混合属性数据的聚类具有重要意义。经典聚类算法仅仅处理数值型数据或符号型属性数据,对混合属性数据往往无效。现有混合属性数据聚类算法分别将数值型属性和符号型... 实际应用中存在着大量同时具有数值型和符号型属性的混合属性数据,研究混合属性数据的聚类具有重要意义。经典聚类算法仅仅处理数值型数据或符号型属性数据,对混合属性数据往往无效。现有混合属性数据聚类算法分别将数值型属性和符号型属性数据单独计算,忽视了两种属性之间的相关性,聚类效果不理想。提出一种基于图划分的混合属性数据聚类算法。算法将一行属性值定义为一个图节点,计算图节点的相似性,采用一种自适应调节属性权重的方法,将数值和符号属性的相似性统一成一个互联合相似度矩阵。用图划分方法对数据进行聚类划分,通过迭代寻优的方法调整数据之间的契合度,从而求得类内相似度最大并寻得最优解。实验结果表明,混合属性聚类算法与其他方法相比具有明显的优势。 展开更多
关键词 混合属性数据 图划分 谱聚类
在线阅读 下载PDF
一种实现混合属性数据流聚类的算法 被引量:1
7
作者 朱俚治 朱梧檟 《计算技术与自动化》 2016年第2期34-37,共4页
在当今的网络中存在三种形式的数据流,连续型数据流,标称型数据流和混合属性数据流。由于目前在数据挖掘中大部分算法只能处理一种属性的数据流,而处理混合属性数据流的算法却很少,但在数据挖掘的实际应用中常常需要将不同属性的数据流... 在当今的网络中存在三种形式的数据流,连续型数据流,标称型数据流和混合属性数据流。由于目前在数据挖掘中大部分算法只能处理一种属性的数据流,而处理混合属性数据流的算法却很少,但在数据挖掘的实际应用中常常需要将不同属性的数据流进行相互区分。事实上研究人员在区分不同属性数据流时,首先是将不同属性的流进行聚类,其次是对不同属性的流进行识别。在查阅有了有关资料和参考文献后,本文提出了一种对混合属性数据流的聚类算法,该算法的聚类思想是:1提取混合属性数据流的分类属性,2使用k-近邻算法计算数据流分类属性的相似性,3根据k-近邻算法对数据流相似度的计算结果,使用k-均值聚类算法对混合属性数据流进行聚类,4给出聚类的算法。 展开更多
关键词 混合属性数据 相似性 K-近邻算法 K-均值聚类 分类属性
在线阅读 下载PDF
一种改进的混合属性数据聚类算法 被引量:1
8
作者 陈丹 王振华 《电脑知识与技术(过刊)》 2010年第13期2713-2716,共4页
K-prototypes算法是处理混合属性数据的主要聚类算法,但是存在对初值敏感、参数依赖和易受"噪声"干扰等问题。为了克服以上缺点,该文对K-prototypes算法的初始中心点选择进行了研究与分析,提出了一种基于近邻法的初始中心点... K-prototypes算法是处理混合属性数据的主要聚类算法,但是存在对初值敏感、参数依赖和易受"噪声"干扰等问题。为了克服以上缺点,该文对K-prototypes算法的初始中心点选择进行了研究与分析,提出了一种基于近邻法的初始中心点选择策略对算法进行改进,算法先利用近邻法获得初始中心点集和k值,然后进行K-prototypes运算,最后加入识别异常数据点的规则。改进后的算法成功解决了传统K-prototypes算法的缺陷,而且具有更好的分类精度和稳定性。经实验证明,改进算法是正确和有效的,明显优于传统的K-prototypes算法。 展开更多
关键词 聚类分析 初始中心点 K-原型算法 聚类算法 混合属性数据
在线阅读 下载PDF
基于E-t-SNE的混合属性数据降维可视化方法 被引量:28
9
作者 魏世超 李歆 +2 位作者 张宜弛 周晓锋 李帅 《计算机工程与应用》 CSCD 北大核心 2020年第6期66-72,共7页
针对传统的t分布随机近邻嵌入(t-SNE)算法只能处理单一属型数据,不能很好地处理混合属性数据的问题,提出一种扩展的t-SNE降维可视化算法E-t-SNE,用于处理混合属性数据。该方法引入信息熵概念来构建分类属性数据的距离矩阵,采用分类属性... 针对传统的t分布随机近邻嵌入(t-SNE)算法只能处理单一属型数据,不能很好地处理混合属性数据的问题,提出一种扩展的t-SNE降维可视化算法E-t-SNE,用于处理混合属性数据。该方法引入信息熵概念来构建分类属性数据的距离矩阵,采用分类属性数据距离与数值属性数据欧式距离相结合的方式构建混合属性数据距离矩阵,将新的距离矩阵输入t-SNE算法对数据进行降维并在二维空间可视化展示。此外,为验证算法有效性,采用k近邻(kNN)算法对混合数据降维后的效果进行评价。通过在UCI数据集上的实验表明,该方法在处理混合属性数据方面,不仅具有较好的可视化能力,而且能有效地对不同类别的数据进行降维分簇,提升后续分类器的分类准确率。 展开更多
关键词 t-SNE算法 混合属性数据 降维 可视化
在线阅读 下载PDF
基于信息熵的混合属性数据谱聚类算法 被引量:13
10
作者 姜智涵 朱军 +1 位作者 周晓锋 李帅 《计算机应用研究》 CSCD 北大核心 2019年第8期2256-2260,共5页
针对传统的聚类算法只能处理单属性的数据,不能很好地处理混合属性数据的聚类问题,以及目前大多数混合属性数据聚类算法对初始化敏感,不能处理任意形状的数据的问题,提出一种基于信息熵的混合属性数据谱聚类算法,用于处理混合类型数据... 针对传统的聚类算法只能处理单属性的数据,不能很好地处理混合属性数据的聚类问题,以及目前大多数混合属性数据聚类算法对初始化敏感,不能处理任意形状的数据的问题,提出一种基于信息熵的混合属性数据谱聚类算法,用于处理混合类型数据。提出了一种新的相似性度量方式,利用谱聚类算法中的数值型数据构成的高斯核函数矩阵与新的基于信息熵的分类型数据构成的影响因子矩阵相结合代替了传统的相似度矩阵,新的相似度矩阵避免了数值属性与分类属性数据之间的转换和参数调整;把新的相似度矩阵运用到谱聚类算法中,以便于处理任意形状的数据,最终得出聚类结果。通过在UCI的数据集上的实验表明,该算法能有效地处理混合属性数据的聚类问题,且具有较高的稳定性以及良好的鲁棒性。 展开更多
关键词 混合属性数据 谱聚类 高斯核函数 影响因子
在线阅读 下载PDF
混合属性数据集分布一致性度量的新方法 被引量:3
11
作者 何玉林 金一 +2 位作者 戴德鑫 黄柏皓 黄家杰 《深圳大学学报(理工版)》 EI CAS CSCD 北大核心 2021年第2期170-179,共10页
数据分布一致性的度量是大数据随机样本划分生成过程中的一个关键问题,如何针对混合属性的数据集进行合理有效的分布一致性度量是目前随机样本划分技术研究的重点.提出一种新的基于深度编码和最大平均差异的混合属性数据集分布一致性度... 数据分布一致性的度量是大数据随机样本划分生成过程中的一个关键问题,如何针对混合属性的数据集进行合理有效的分布一致性度量是目前随机样本划分技术研究的重点.提出一种新的基于深度编码和最大平均差异的混合属性数据集分布一致性度量方法,不直接对两个不同的原始数据集进行分布一致性的度量,而是首先对混合属性中的离散属性进行独热编码,得到独热编码数据集;之后对独热编码数据集进行自编码处理,得到深度编码数据集;最后基于最大均值差异指标对两个不同的深度编码数据集进行分布一致性的度量.在Adult、Australian、CRX和German标准混合属性数据集上对所提方法进行性能实验验证,结果表明,与基于离散属性独热编码的最大平均差异方法和基于连续属性二进制化的相似性度量方法相比,新方法能够更加准确地对混合属性数据进行分布一致性的度量. 展开更多
关键词 人工智能 随机样本划分 分布一致性 最大均值差异 混合属性数据 独热编码 深度编码
在线阅读 下载PDF
DCKPDP:改进k-prototype聚类的差分隐私混合属性数据发布方法 被引量:8
12
作者 张星 张兴 《计算机应用研究》 CSCD 北大核心 2022年第1期249-253,共5页
当前混合属性数据发布中隐私保护方法大多存在隐私保护效果不佳或数据效用较差的问题,采用差分隐私与优化的k-prototype聚类方法相结合,提出改进k-prototype聚类的差分隐私混合属性数据发布方法(DCKPDP)。为解决传统k-prototype聚类算... 当前混合属性数据发布中隐私保护方法大多存在隐私保护效果不佳或数据效用较差的问题,采用差分隐私与优化的k-prototype聚类方法相结合,提出改进k-prototype聚类的差分隐私混合属性数据发布方法(DCKPDP)。为解决传统k-prototype聚类算法没有考虑不同数值型属性对聚类结果有较大影响的问题,利用信息熵为每个数值型属性添加属性权重;为解决聚类初始中心点人为规定或者由随机算法随机确定,导致聚类结果精确度不高的问题,结合数据对象的局部密度和高密度对聚类过程中初始中心点进行自适应选择;为解决数据信息泄露风险较高的问题,对聚类中心值进行差分隐私保护。实验结果表明,DCKPDP算法满足差分隐私保护所需的噪声量更小,数据的可用性更好。 展开更多
关键词 差分隐私 混合属性数据 k-prototype聚类 密度优化 信息熵
在线阅读 下载PDF
面向混合型属性数据的改进谱聚类算法
13
作者 陈晓曼 陈玉 苏欢 《陕西师范大学学报(自然科学版)》 北大核心 2025年第1期71-80,共10页
混合型属性数据是最为常见的一种数据集类型,针对该类型数据的聚类算法是聚类分析的研究热点之一。由于谱聚类算法具有适合于任意形状数据的聚类问题且能收敛于全局最优解的优势,因而从相似性度量的角度出发,基于杰卡德(Jaccard)距离、... 混合型属性数据是最为常见的一种数据集类型,针对该类型数据的聚类算法是聚类分析的研究热点之一。由于谱聚类算法具有适合于任意形状数据的聚类问题且能收敛于全局最优解的优势,因而从相似性度量的角度出发,基于杰卡德(Jaccard)距离、马氏(Mahalanobis)距离的思想,设计一种适用于混合型属性数据的相似性度量,并利用其实现谱聚类的混合型属性数据扩展,构建一种改进的谱聚类算法(IJM-SC)。将构建的算法应用于UCI机器学习数据库中心脏病数据集等3个混合型属性数据集进行聚类,验证算法对混合型属性数据聚类的优越性,通过与现有一些算法比较效果指标,结果表明提出算法能够更好地实现对混合型属性数据的聚类。 展开更多
关键词 混合属性数据 谱聚类 Jaccard距离 马氏距离
在线阅读 下载PDF
一种面向混合属性数据聚类的新算法 被引量:5
14
作者 廖志芳 罗浩 +1 位作者 樊晓平 刘克准 《控制与决策》 EI CSCD 北大核心 2009年第5期697-700,705,共5页
在分析传统聚类算法的基础上,提出一种针对混合属性数据的聚类算法.该算法利用格论中简单元组及超级元组将对象属性转化为格模型建立,以对象间格覆盖数来衡量类间相似度,根据高覆盖数高相似度的原则选择聚类中心进行聚类.在公共数据集... 在分析传统聚类算法的基础上,提出一种针对混合属性数据的聚类算法.该算法利用格论中简单元组及超级元组将对象属性转化为格模型建立,以对象间格覆盖数来衡量类间相似度,根据高覆盖数高相似度的原则选择聚类中心进行聚类.在公共数据集上的实验结果表明,该算法在不增加空间复杂度的基础上,有效地提高了混合属性数据聚类的质量. 展开更多
关键词 混合属性数据 覆盖格 相似度
原文传递
基于相对密度的混合属性数据增量聚类算法 被引量:12
15
作者 黄德才 李晓畅 《控制与决策》 EI CSCD 北大核心 2013年第6期815-822,共8页
传统的基于密度的带噪声空间数据聚类算法主要存在以下问题:聚类只对具有数值属性的数据有效,而对具有非数值属性的数据失效;参数设置困难且聚类结果对参数较为敏感;聚类的度量以绝对密度值为标准,无法发现密度等级不同的聚类结果.针对... 传统的基于密度的带噪声空间数据聚类算法主要存在以下问题:聚类只对具有数值属性的数据有效,而对具有非数值属性的数据失效;参数设置困难且聚类结果对参数较为敏感;聚类的度量以绝对密度值为标准,无法发现密度等级不同的聚类结果.针对以上问题,提出一种面向混合属性数据的、基于相对密度的聚类算法RDBC M,同时提出解决这类问题的增量式聚类算法,并从理论和仿真实验两方面分析、验证了算法的有效性和加速效果. 展开更多
关键词 相对密度 绝对密度 混合属性数据 增量聚类
原文传递
一种适用于混合属性数据的K近邻方法 被引量:2
16
作者 刘佳宇 周凌云 +2 位作者 吴秋峰 孟翔燕 邓华玲 《数学的实践与认识》 北大核心 2020年第16期132-143,共12页
对于传统K近邻算法只适用于数值属性数据类型的问题,提出了一种基于对混合属性数据中的不同属性列赋予不同权值的K近邻算法(K Nearest Neighbor for Mixed-attribute Data,KNNM),使新的K近邻算法能够适用于混合属性数据.由于混合数据间... 对于传统K近邻算法只适用于数值属性数据类型的问题,提出了一种基于对混合属性数据中的不同属性列赋予不同权值的K近邻算法(K Nearest Neighbor for Mixed-attribute Data,KNNM),使新的K近邻算法能够适用于混合属性数据.由于混合数据间数值属性部分与分类属性部分对整体相似性度量的贡献率不同,又各分量对其所属的属性部分的相似性度量的贡献率不同的特点.提出了考虑数值属性部分与分类属性部分作为整体对混合属性数据间的相似性度量的贡献率,并考虑不同属性数据的各分量对其所属的数据间的相似性度量的贡献率的向量参数计算方法,以此提出了一种适用于混合属性数据的K近邻方法.在5个UCI数据集上的实验结果表明KNNM算法在准确率,宏平均召回率,宏平均精度、宏平均值和ROC均优于传统K近邻算法,以此说明KNNM方法在混合属性数据上的适用性与有效性. 展开更多
关键词 混合属性数据 相似性度量 K近邻 参数计算方法 主成分分析法
原文传递
基于群体智能算法的混合属性大数据聚类仿真 被引量:2
17
作者 古险峰 汤永利 《计算机仿真》 北大核心 2023年第9期458-461,481,共5页
数据挖掘技术可以从大量无规则的数据集中获取有效的信息,由于大多数的数据为混合性数据,为了提高处理混合属性数据算法的性能和聚类质量,提出基于群体智能算法的混合属性大数据聚类方法。首先将数据集分为数值和分类两个属性子集,采用... 数据挖掘技术可以从大量无规则的数据集中获取有效的信息,由于大多数的数据为混合性数据,为了提高处理混合属性数据算法的性能和聚类质量,提出基于群体智能算法的混合属性大数据聚类方法。首先将数据集分为数值和分类两个属性子集,采用对应的聚类方法对两个子集进行多次聚类,并利用共识函数对聚类的结果进行融合,构建出混合属性数据分段融合框架。然后为了避免类中心数据一致导致的空簇问题,利用信息熵对数值属性数据加权处理,再采用平均差异度方法选择每个数据对象的初始聚类中心。最后对待分类数据样本的聚类中心编码,为了衡量聚类问题的有效性,采用适应度函数对个体的好坏进行评价,利用改进粒子群智能优化算法的全局搜索能力找到数据集中的最优解、每次迭代后粒子更新后的最优位置。实验结果表明,上述方法聚类质量和聚类精度较高,不仅可以提高粒子的搜索效率,还能增强算法的鲁棒性。 展开更多
关键词 混合属性数据 共识函数 信息熵 平均差异度 改进粒子群
在线阅读 下载PDF
有混合数据输入的自适应模糊神经推理系统 被引量:5
18
作者 张宇献 郭佳强 +1 位作者 钱小毅 王建辉 《自动化学报》 EI CSCD 北大核心 2019年第9期1743-1755,共13页
现有数据建模方法大多依赖于定量的数值信息,而对于数值与分类混合输入的数据建模问题往往根据分类变量组合建立多个子模型,当有多个分类变量输入时易出现子模型数据分布不均匀、训练耗时长等问题.针对上述问题,提出一种具有混合数据输... 现有数据建模方法大多依赖于定量的数值信息,而对于数值与分类混合输入的数据建模问题往往根据分类变量组合建立多个子模型,当有多个分类变量输入时易出现子模型数据分布不均匀、训练耗时长等问题.针对上述问题,提出一种具有混合数据输入的自适应模糊神经推理系统模型,在自适应模糊推理系统的基础上,引入激励强度转移矩阵和结论影响矩阵,采用基于高氏距离的减法聚类辨识模型结构,通过混合学习算法训练模型参数,使数值与分类混合数据对模糊规则的前后件参数同时产生作用,共同影响模型输出.仿真实验分析了分类数据对模型规则后件的作用以及结构辨识算法对模糊规则数的影响,与其他几种混合数据建模方法对比表明本文所提出的模型具有较高的预测精度和计算效率. 展开更多
关键词 自适应模糊推理系统 结构辨识 激励强度转移矩阵 后件影响矩阵 混合属性数据
在线阅读 下载PDF
一种改进的BIRCH聚类算法 被引量:27
19
作者 蒋盛益 李霞 《计算机应用》 CSCD 北大核心 2009年第1期293-296,共4页
BIRCH算法是一种适应于大规模数据集的聚类算法,通过对所有叶节点设定统一阈值T来构建聚类特征(CF)树,并在各阶段采取不同的阈值来重建树,但没有给出一个合理设定阈值初值T及如何在各阶段提升阈值大小的具体方法。另外BIRCH算法只能处... BIRCH算法是一种适应于大规模数据集的聚类算法,通过对所有叶节点设定统一阈值T来构建聚类特征(CF)树,并在各阶段采取不同的阈值来重建树,但没有给出一个合理设定阈值初值T及如何在各阶段提升阈值大小的具体方法。另外BIRCH算法只能处理数值型数据,这使其应用受到限制。针对以上不足,对BIRCH算法做了以下改进:1)改进原BIRCH算法的CF结构,使其可以处理混合型属性数据集;2)启发式为BIRCH算法选择初始阈值T并给出了第二阶段提升阈值的具体操作方法;3)对BIRCH算法的参数B和L做了探讨,指出当参数B=L时算法性能相近,并提出为获得较好聚类效果时B值的取值范围。实验结果表明,改进后的BIRCH算法具有较好的性能。 展开更多
关键词 BIRCH算法 聚类 阈值 混合属性数据 数据挖掘
在线阅读 下载PDF
AC和FKP融合算法在民族突发事件聚类分析中的应用 被引量:2
20
作者 云健 刘勇奎 +1 位作者 陈华 于洪志 《华中科技大学学报(社会科学版)》 CSSCI 北大核心 2009年第1期117-121,共5页
近年来,我国民族突发事件的频发度及危害性均呈上升趋势。民族突发事件复杂程度高、涉及因素多、应急决策难度大,因此智能辅助决策非常必要。聚类分析是民族突发事件应急辅助决策的研究重点。目前,该项工作在我国尚处于起步阶段。针对FK... 近年来,我国民族突发事件的频发度及危害性均呈上升趋势。民族突发事件复杂程度高、涉及因素多、应急决策难度大,因此智能辅助决策非常必要。聚类分析是民族突发事件应急辅助决策的研究重点。目前,该项工作在我国尚处于起步阶段。针对FKP(Fuzzy K-Prototypes,模糊K原型)聚类算法存在易陷于局部最优解和对初始参数敏感的缺陷,提出了一种AC(Ant Colony,蚁群)和FKP融合的聚类算法。聚类分析结果表明:应用该算法能得出民族突发事件的发生规律,因此该算法可用于民族突发事件的应急智能辅助决策。以上工作为维护国家安全提供了智能化支持。 展开更多
关键词 模糊K原型聚类算法 蚁群算法 混合属性数据 民族突发事件 聚类分析
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部