期刊文献+
共找到674篇文章
< 1 2 34 >
每页显示 20 50 100
改进的采样算法与无监督聚类相结合的软件缺陷预测模型
1
作者 石海鹤 周世文 +1 位作者 钟林辉 肖正兴 《江西师范大学学报(自然科学版)》 CAS 北大核心 2024年第3期301-310,共10页
该文首先在自适应综合过采样算法ADASYN(adaptive synthetic sampling)的基础上,考虑少数类内部不同密度簇之间的连接性问题,将与采样点距离为中等的点纳入新样本生成范围,改进得到T-ADASYN过采样优化算法,有效地增加了少数类内部不同... 该文首先在自适应综合过采样算法ADASYN(adaptive synthetic sampling)的基础上,考虑少数类内部不同密度簇之间的连接性问题,将与采样点距离为中等的点纳入新样本生成范围,改进得到T-ADASYN过采样优化算法,有效地增加了少数类内部不同密度簇的连接性,生成了分布更为均衡的数据集.然后使用基于连接的spectral clustering算法进行聚类预测操作,将过采样算法和无监督聚类相结合,提出一种新型实用的软件缺陷预测模型TA-SC(T-ADASYN+spectral clustering).以F-score为评价指标,spectral clustering为聚类模型进行验证.实验结果表明:改进的T-ADASYN过采样算法在公开的PROMISE数据集和NASA数据集上比常用的过采样算法均有6%的性能提升,且TA-SC模型在PROMISE和NASA 2个数据集上比常用聚类算法分别有3%和2%的性能提升. 展开更多
关键词 软件缺陷预测 别不平衡 过采样算法 算法 无监督学习
在线阅读 下载PDF
一种基于粗糙熵的改进K-modes聚类算法
2
作者 刘财辉 曾雄 谢德华 《南京理工大学学报》 CAS CSCD 北大核心 2024年第3期335-341,共7页
K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分... K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分考虑每个属性对聚类结果的影响。针对上述问题,该文将粗糙熵引入K-modes算法。首先利用粗糙集属性约简算法消除冗余属性,确定各属性的重要程度;然后利用粗糙熵确定每个属性的权重,从而定义新的类内距离。将该文所提算法与传统的K-modes聚类算法分别在4组公开数据集上进行对比试验。试验结果表明,该文所提算法聚类准确率比传统的K-modes聚类算法更高。 展开更多
关键词 K-modes算法 粗糙集 粗糙 属性约简 权重
在线阅读 下载PDF
基于凝聚层次聚类算法的ATT&CK模型改进
3
作者 徐明迪 崔峰 《计算机与数字工程》 2024年第1期201-205,239,共6页
在应用ATT&CK模型(网络攻击模型)进行网络安全威胁分析的过程中,ATT&CK模型提供的技术集合过于复杂。针对ATT&CK模型应用复杂的问题,论文对模型的技术集进行聚类简化研究,提出了基于聚类算法的模型改进方法,首先对ATT&C... 在应用ATT&CK模型(网络攻击模型)进行网络安全威胁分析的过程中,ATT&CK模型提供的技术集合过于复杂。针对ATT&CK模型应用复杂的问题,论文对模型的技术集进行聚类简化研究,提出了基于聚类算法的模型改进方法,首先对ATT&CK模型的技术集合进行量化和聚类趋势评估,然后对量化的数据应用凝聚层次聚类算法得到简化的聚类结果,最后通过实验验证模型改进有效性。 展开更多
关键词 网络攻击模型 ATT&CK 算法 层次
在线阅读 下载PDF
融合熵聚类和增广变邻策略的蚁群优化算法 被引量:2
4
作者 李晗珂 游晓明 刘升 《计算机集成制造系统》 EI CSCD 北大核心 2024年第6期2115-2129,共15页
针对蚁群算法求解大规模旅行商问题时存在收敛速度慢、易陷入局部最优的问题,提出一种融合熵聚类和增广变邻策略的蚁群优化算法。首先提出融合信息熵的聚类策略,利用熵确定最佳截断距离对数据集进行合理划分;通过求解每个子簇形成初始路... 针对蚁群算法求解大规模旅行商问题时存在收敛速度慢、易陷入局部最优的问题,提出一种融合熵聚类和增广变邻策略的蚁群优化算法。首先提出融合信息熵的聚类策略,利用熵确定最佳截断距离对数据集进行合理划分;通过求解每个子簇形成初始路径,并为全局寻优提供导向信息素,从而提升收敛速度。其次提出增广变邻策略,将蚂蚁分为爬行蚁和滑翔蚁,滑翔蚁引入的增广变邻策略在迭代后更新节点和邻居信息素,而且通过邻居数量随最优解质量动态匹配,来强化邻居节点探索,以平衡收敛速度与解的质量。当算法陷入停滞时,利用路径相似性机制平滑非公共路径信息素,帮助算法跳出局部最优。通过对旅行商问题数据集进行实验仿真表明,所提算法有效平衡了收敛速度与解的精度,尤其对于大规模问题,显著提高了解的质量。 展开更多
关键词 蚁群算法 旅行商问题 增广变邻 路径相似性
在线阅读 下载PDF
基于约束动态更新的半监督层次聚类算法 被引量:20
5
作者 周晨曦 梁循 齐金山 《自动化学报》 EI CSCD 北大核心 2015年第7期1253-1263,共11页
提出了一种基于约束动态更新的半监督层次聚类算法.与现存的半监督层次聚类算法类似,该算法也使用了必连和不连约束.但不同的是,该算法并不是在对满足必连约束的数据样本点进行预先划分的基础上依据不连约束进行聚合操作,而是首先将约... 提出了一种基于约束动态更新的半监督层次聚类算法.与现存的半监督层次聚类算法类似,该算法也使用了必连和不连约束.但不同的是,该算法并不是在对满足必连约束的数据样本点进行预先划分的基础上依据不连约束进行聚合操作,而是首先将约束扩展为一个闭包,然后在这此基础上直接依据不连约束进行聚合操作,并在聚合的过程中依据聚类结果动态地更新必连和不连约束,以保证最终的聚类结果同时满足必连和不连约束.该算法的优势在于省略了对必连约束的数据样本点进行预先划分的步骤,这一改进能够保证数据样本点获得更为合理的聚合顺序,从而得到更为准确的聚类结果.本文具体给出了该算法基于Ward层次聚类算法的实现,提出了C-Ward算法.实验表明,与其他同类算法相比,无论是在人工模拟数据集还是在现实数据集上,本文提出的算法都表现出了更高的准确性和更强的稳定性. 展开更多
关键词 监督 层次 约束 动态更新 Ward算法
在线阅读 下载PDF
无线传感器网络中一种基于聚合层次聚类的分簇路由算法 被引量:1
6
作者 张芳 高翠芳 《计算机应用研究》 CSCD 北大核心 2024年第9期2805-2814,共10页
针对无线传感器网络中节点连接以及能量受限不足的问题,为了延长网络寿命,提出了一种基于AHC的分簇路由算法(HACCRA)。该算法首先运用AHC对网络节点分簇,接着为簇首选择、簇形成和路径构建分别定义了恰当的决策目标函数,运用能量阈值、... 针对无线传感器网络中节点连接以及能量受限不足的问题,为了延长网络寿命,提出了一种基于AHC的分簇路由算法(HACCRA)。该算法首先运用AHC对网络节点分簇,接着为簇首选择、簇形成和路径构建分别定义了恰当的决策目标函数,运用能量阈值、提出距离阈值、并且路由过程优先考虑簇首节点之间的一对一连接,有效解决了路由算法中分簇和路由不衔接的问题。仿真结果表明,与JCR、ICR以及DCK-LEACH相比,HACCRA能够更好地实现网络节点的能耗均衡,保证网络数据传输的连接性,从而延长网络寿命。 展开更多
关键词 层次算法 距离阈值 一对一连接 能耗均衡 分簇路由算法
在线阅读 下载PDF
基于图书共借关系的读者聚类算法
7
作者 廖兴思 《中国新技术新产品》 2025年第3期39-42,共4页
发现具有相似借阅倾向的读者群体,并针对不同群体进行个性化读者服务,能够有效提升高校图书馆的读者服务质量,促进高校师生学习和科研进步。首先,本文设计了基于图书共借关系的读者聚类算法框架,讨论了算法中的读者距离定义、簇间距离... 发现具有相似借阅倾向的读者群体,并针对不同群体进行个性化读者服务,能够有效提升高校图书馆的读者服务质量,促进高校师生学习和科研进步。首先,本文设计了基于图书共借关系的读者聚类算法框架,讨论了算法中的读者距离定义、簇间距离选取和停机条件3个关键设计。其次,本文介绍了算法实现,包括如何基于图书馆的数据库系统高效计算读者距离,如何利用scipy程序库实现读者凝聚层次聚类算法。最后,在某高校图书馆图书外借数据集上进行验证。结果表明,该算法能够有效发现高校中具有相似借阅倾向的读者群,优于传统的根据读者类型和所属院系的读者群体划分方法。 展开更多
关键词 数据挖掘 算法 层次 高校图书馆 读者服务 个性化服务 读者
在线阅读 下载PDF
基于分裂层次半监督谱聚类算法的风电场机群划分方法 被引量:18
8
作者 林俐 潘险险 《电力自动化设备》 EI CSCD 北大核心 2015年第2期8-14,共7页
在谱聚类技术的基础上,面向风电场动态等值建模,提出一种基于分裂层次半监督谱聚类算法的风电场机群划分方法。首先根据风电机组的实测运行数据,构造一个可以体现原始数据结构且能为分类提供更多有效信息的特征向量矩阵Y。进而利用获取... 在谱聚类技术的基础上,面向风电场动态等值建模,提出一种基于分裂层次半监督谱聚类算法的风电场机群划分方法。首先根据风电机组的实测运行数据,构造一个可以体现原始数据结构且能为分类提供更多有效信息的特征向量矩阵Y。进而利用获取的部分样本组的先验信息,采用自顶向下的簇分裂策略,对Y中的样本组进行半监督聚类划分,得到风电机组的机群划分结果 ,采用容量加权法计算各机群等值风电机组的参数,建立风电场的动态等值模型。以某实际风电场为例进行仿真验证,结果表明,采用所提方法建立的动态等值模型与详细模型较接近,能够较准确地反映风电场的动态响应特性。 展开更多
关键词 分裂层次 监督 风电场 机群划分 算法 动态等值
在线阅读 下载PDF
基于Cloude-Pottier目标分解和聚合的层次聚类算法的全极化SAR数据的非监督分类算法研究 被引量:20
9
作者 曹芳 洪文 吴一戎 《电子学报》 EI CAS CSCD 北大核心 2008年第3期543-546,共4页
本文提出了一种新的基于Cloude-Pottier分解和聚合的层次聚类的全极化SAR(Synthetic Aperture Radar)数据的非监督分类算法.作者使用极化总功率SPAN来改进常规的初始化方法,并采用聚合的层次聚类算法对初始化结果进行类的合并,提高非监... 本文提出了一种新的基于Cloude-Pottier分解和聚合的层次聚类的全极化SAR(Synthetic Aperture Radar)数据的非监督分类算法.作者使用极化总功率SPAN来改进常规的初始化方法,并采用聚合的层次聚类算法对初始化结果进行类的合并,提高非监督分类器的性能.实验表明,该算法能获得有效的分类中心,分类结果明显优于常规的WishartH/α/A分类算法. 展开更多
关键词 Cloude—Pottier分解 合的层次 监督 极化SAR
在线阅读 下载PDF
分水岭算法和基于MRF的层次聚类相结合的混合无监督图像分割算法 被引量:7
10
作者 张鲲 王士同 《计算机应用》 CSCD 北大核心 2007年第3期673-676,共4页
提出一种新的混合多阶段无监督图像分割算法。在第一阶段,通过分水岭算法得到一幅过度分割的图像,该图像中的所有小区域作为初始聚类状态将在接下来的层次聚类阶段中被合并。在第二阶段,一种新的启发式的基于Bayesian方法和Markov随机... 提出一种新的混合多阶段无监督图像分割算法。在第一阶段,通过分水岭算法得到一幅过度分割的图像,该图像中的所有小区域作为初始聚类状态将在接下来的层次聚类阶段中被合并。在第二阶段,一种新的启发式的基于Bayesian方法和Markov随机域的计算模型被用于基于区域的层次聚类算法,该算法用来合并初始分割结果中的邻接区域,以改进分水岭算法的分割效果。深入分析了该计算模型中两个相互作用的部分。通过对多种不同种类图像使用该算法进行分割,表明这种多阶段的方法适合无监督分割,它按照视觉一致的方式合并区域,并且比传统的层次聚类算法快很多。 展开更多
关键词 分水岭算法 多阶段无监督分割 MRF 层次 Bayesian方法
在线阅读 下载PDF
基于Gahp-改进系统聚类算法和云模型的化工园区脆弱性评价
11
作者 张明愚 杨思华 +2 位作者 李梦迪 李嘉雪 伊庆宇 《化工自动化及仪表》 2025年第2期307-312,324,共7页
为了精确评估化工园区的脆弱性,考虑个体差异对评估结果的影响,提出基于Gahp-改进系统聚类算法和云模型的化工园区脆弱性评价模型。应用文本挖掘技术对化工园区脆弱性影响因素进行挖掘,在此基础上构建以园区固有危险、园区潜在危险、园... 为了精确评估化工园区的脆弱性,考虑个体差异对评估结果的影响,提出基于Gahp-改进系统聚类算法和云模型的化工园区脆弱性评价模型。应用文本挖掘技术对化工园区脆弱性影响因素进行挖掘,在此基础上构建以园区固有危险、园区潜在危险、园区承载体脆弱性和事故损失程度为准则的评估体系;为综合决策者意愿和客观信息,通过群决策层次分析法(Gahp)和改进系统聚类算法组合,确定指标的主观权重和专家的客观权重;引入云模型理论对化工园区脆弱性等级进行评价。对某化工园区开展实证分析,结果表明:该模型能够全面表征某化工园区脆弱性的关键节点,该园区的云数字特征为(0.7667,0.0265,0.0111),脆弱性等级为“轻度脆弱”,与实际情况一致。 展开更多
关键词 群决策层次分析法(Gahp)-改进系统算法-云模型 安全风险评价 化工园区
在线阅读 下载PDF
基于层次聚类和人工免疫的无监督结构故障分类算法 被引量:2
12
作者 周悦 贾雪松 +1 位作者 张东伟 岳林蓓 《沈阳建筑大学学报(自然科学版)》 CAS 北大核心 2014年第2期374-378,共5页
目的利用层次聚类与人工免疫模式识别相结合的方法解决无监督结构健康监测中对结构故障识别和分类的问题.方法通过凝聚型层次聚类实现样本数据的分类,通过模仿生物免疫识别和学习机理来训练记忆细胞集合,进而实现对结构故障的识别与分类... 目的利用层次聚类与人工免疫模式识别相结合的方法解决无监督结构健康监测中对结构故障识别和分类的问题.方法通过凝聚型层次聚类实现样本数据的分类,通过模仿生物免疫识别和学习机理来训练记忆细胞集合,进而实现对结构故障的识别与分类.结果在benchmark结构模型上的仿真实验测试结果表明在抗原样本数据中采用凝聚型层次聚类和方法能够成功地确定抗原样本数据的模式数目,继而采用人工免疫模式识别算法对实测数据进行模式识别与分类,分类成功率为81%.结论基于层次聚类和人工免疫的无监督结构故障检测与分类算法通过免疫学习和进化产生高质量的记忆细胞,从而有效地识别结构故障模式. 展开更多
关键词 层次 AIPR 无监督 结构健康监测 故障分
在线阅读 下载PDF
新型无监督聚类算法监测与评估桥梁结构健康状况 被引量:2
13
作者 王子龙 《市政技术》 2024年第1期68-72,共5页
近年来,因车辆超载、结构设计缺陷、施工质量问题等原因导致的城市高架桥梁倒塌事故时有发生。因此,首次提出了一种可实时监测高架桥梁运行状况、通过改进K-means聚类算法实现对结构损伤实时检测、对数据驱动结构损伤进行检测的高效方... 近年来,因车辆超载、结构设计缺陷、施工质量问题等原因导致的城市高架桥梁倒塌事故时有发生。因此,首次提出了一种可实时监测高架桥梁运行状况、通过改进K-means聚类算法实现对结构损伤实时检测、对数据驱动结构损伤进行检测的高效方法。该方法主要是对钢结构桥梁模型在结构完好状态下的振动数据进行采集,然后通过深度研究从这些数据中提取有效的结构损伤敏感特征值,最后利用改进的无监督聚类算法训练奇异值检测模型。试验结果表明,采用桥梁结构完好状况下的损伤敏感特征值作为训练数据,对数学模型加以训练后,可以有效检测并识别出桥梁结构在不同损伤状况下的测试结果。该新型检测方法可实现城市高架桥梁在长期运营阶段的结构健康实时监测。 展开更多
关键词 桥梁 结构损伤检测 数据驱动 K-MEANS算法 损伤敏感特征 无监督
在线阅读 下载PDF
一种新的半监督熵模糊聚类算法 被引量:1
14
作者 庄美美 张景 《泉州师范学院学报》 2019年第2期39-45,共7页
结合熵值和半监督模糊聚类两种概念,提出了半监督熵模糊聚类算法.该算法在目标函数中加入了反映划分矩阵的熵值项和已标记数据标签的监督项,使得聚类算法可以同时兼顾划分矩阵的模糊性和已知样本的类别信息.其迭代求解公式具有较为简洁... 结合熵值和半监督模糊聚类两种概念,提出了半监督熵模糊聚类算法.该算法在目标函数中加入了反映划分矩阵的熵值项和已标记数据标签的监督项,使得聚类算法可以同时兼顾划分矩阵的模糊性和已知样本的类别信息.其迭代求解公式具有较为简洁的形式.将聚类方法应用于文本识别及其他真实数据库,实验结果表明,文章提出的半监督聚类算法和传统的聚类算法相比具有更好的聚类效果. 展开更多
关键词 模糊 监督
在线阅读 下载PDF
基于最大熵模糊聚类简化的联合概率数据关联算法
15
作者 韩继辉 高龙 +2 位作者 黄子奇 黄道颖 张安琳 《火力与指挥控制》 CSCD 北大核心 2024年第12期62-67,76,共7页
针对杂波环境下联合概率数据关联算法(joint probabilistic data association,JPDA)计算复杂度较高、实时性较差等问题,提出一种基于最大熵模糊聚类的JPDA算法。基于目标轨迹和量测之间的关联规则,采用最大熵模糊聚类算法实现量测与目... 针对杂波环境下联合概率数据关联算法(joint probabilistic data association,JPDA)计算复杂度较高、实时性较差等问题,提出一种基于最大熵模糊聚类的JPDA算法。基于目标轨迹和量测之间的关联规则,采用最大熵模糊聚类算法实现量测与目标的初步数据关联,分析了公共量测对目标跟踪的影响,并引入了公共量测影响系数来修正关联概率,最后使用卡尔曼滤波算法对目标的状态估计进行预测,从而更新各个目标的状态。仿真结果表明,所提算法有效解决了在密集杂波环境中JPDA算法组合爆炸问题,极大缩短计算时间,提高了算法的实时性。 展开更多
关键词 多目标跟踪 联合概率数据关联算法 最大模糊
在线阅读 下载PDF
基于成对约束的交叉熵半监督聚类算法 被引量:13
16
作者 李晁铭 徐圣兵 郝志峰 《模式识别与人工智能》 EI CSCD 北大核心 2017年第7期598-608,共11页
极大熵聚类(MEC)目标函数中缺乏成对约束的有效信息表达,在拥有少量成对约束的情况下,可能导致有效监督信息的浪费.在MEC的基础上,文中提出基于成对约束的交叉熵半监督聚类算法.利用样本交叉熵表达成对约束信息,并作为惩罚项引入至MEC... 极大熵聚类(MEC)目标函数中缺乏成对约束的有效信息表达,在拥有少量成对约束的情况下,可能导致有效监督信息的浪费.在MEC的基础上,文中提出基于成对约束的交叉熵半监督聚类算法.利用样本交叉熵表达成对约束信息,并作为惩罚项引入至MEC的目标函数中,通过拉格朗日最优化处理目标函数,得出聚类中心与隶属度的迭代公式.实验表明,文中算法能有效利用少量的成对约束监督信息提高聚类性能,在实际数据应用中性能较好. 展开更多
关键词 极大(MEC) 成对约束 交叉 监督
在线阅读 下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:2
17
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 监督学习 机器学习 神经网络 K-MEANS 特征空间增强 mixup算法
在线阅读 下载PDF
基于组合相似度动态聚类和词熵的网络话题在线检测
18
作者 郭慧 王亚楠 +2 位作者 王欣艳 魏艺泽 王养廷 《情报杂志》 CSSCI 北大核心 2024年第5期159-166,共8页
[研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题... [研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题的实体相似度,再取文本词向量与话题中心余弦相似度的最大值作为词向量相似度,二者结合判断文本所属话题。在聚类过程中利用时间窗口策略实现话题中心和成员文本的动态更新。同时,计算文本词熵,生成话题的词熵和列表,实现话题主题词提取和演化跟踪。实验以新冠疫情新闻为数据实现话题在线检测,并展示了话题主题词的演化和跟踪过程。[研究结论]实验表明,与传统相似度计算方法相比,组合相似度能够获得更好的聚类效果,聚类过程中提取出的话题主题词也正确地反映了原始数据的热点话题内容。 展开更多
关键词 网络话题 在线话题检测 增量式 主题词提取 组合相似度 动态算法
在线阅读 下载PDF
基于成对约束的半监督凝聚层次聚类算法
19
作者 盛俊杰 谢丽聪 《微型机与应用》 2012年第24期67-69,共3页
半监督聚类就是利用样本的监督信息来帮助提升无监督学习的性能。在半监督聚类中,成对约束(must-link约束和cannot-link约束)作为样本的先验知识被广泛地使用。凝聚层次聚类(AHC)也叫合成聚类,是层次聚类法的一种。提出了一种基于成对... 半监督聚类就是利用样本的监督信息来帮助提升无监督学习的性能。在半监督聚类中,成对约束(must-link约束和cannot-link约束)作为样本的先验知识被广泛地使用。凝聚层次聚类(AHC)也叫合成聚类,是层次聚类法的一种。提出了一种基于成对约束的半监督凝聚层次聚类算法(PS-AHC),该算法利用成对约束来改变聚类簇之间的距离,使聚类簇之间的距离更真实。在UCI数据集上的实验表明,PS-AHC能有效地提高聚类的准确率,是一种有前景的半监督聚类算法。 展开更多
关键词 监督 成对约束 层次
在线阅读 下载PDF
一种半监督K均值多关系数据聚类算法 被引量:22
20
作者 高滢 刘大有 +1 位作者 齐红 刘赫 《软件学报》 EI CSCD 北大核心 2008年第11期2814-2821,共8页
提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系... 提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系信息.多关系数据库Movie上的实验结果验证了该算法的有效性. 展开更多
关键词 数据挖掘 监督学习 算法 多关系数据 K均值
在线阅读 下载PDF
上一页 1 2 34 下一页 到第
使用帮助 返回顶部