-
题名基于融合改进K-means聚类算法的数据检测技术
被引量:4
- 1
-
-
作者
郭克难
-
机构
河北北方学院附属第一医院
-
出处
《电子设计工程》
2024年第5期41-45,共5页
-
基金
张家口市2022年度社会科学研究课题(2022052)。
-
文摘
针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密度和高密度距离进行计算,进而优化簇中心的选择。同时融合PCA降维算法减少了数据的冗余信息,进一步提高了运行效率。通过引入LOF离群检测算法对分簇后的数据进行检测,从而得到异常数据结果。实验测试中,所提算法在人工数据集上的平均ARI指标为0.844,真实数据集的准确率则达到了79.2%,在所有对比算法中均为最优,表明该算法具有良好的性能,可以对财务异常数据进行准确地检测。
-
关键词
K-MEANS聚类
密度峰值检测
主成分分析法
离群检测算法
异常数据检测
-
Keywords
K-means clustering
density peak detection
principal component analysis
outlier detection algorithm
abnormal data detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TN929.5
[电子电信—通信与信息系统]
-