摘要
[目的 /意义]聚类分析是数据挖掘的常用方法之一,使用聚类簇内数据相似性大、簇间数据相似性小的特点,可以实现对海量基础涉恐数据快速、准确、有效的分组。[方法/过程]本文研究如何利用基于雅卡尔系数的聚类方法对涉恐情报进行分析。在聚类之前要删减与涉恐相关性小的属性并将所有连续属性进行离散化处理。通过不断迭代计算样本数据集的雅卡尔系数并更新不同簇中的元素,直到达到设定的终止条件为止实现涉恐情报的聚类。[结果 /结论]文中的方法可以实现对涉恐基础数据的初步分级分类,同时通过有经验的情报分析员定级以及与数据挖掘分类方法结合使用,可以有效提高情报分析的效率,为反恐预警提供量化的参考依据。
[Purpose/Significance]Clustering analysis is one of the common data mining technologies. Mass terror related data could be classified based on the characteristics of big similarities inside clusters and small similarities between different clusters. [Method/Process]This paper proposed how to classify the basic data with terror related features by using jaccard index. After deleting irrelevant attributes and discretizing continuous attributes,it needed to repeat the process of computing jaccard index and updating the itemsets in different clusters until triggering conditions of termination. [Result/Conclusion] When combined with manual intervention and applying classification techniques of data mining,this method could improve the efficiency of intelligence analysis and provide decision-making references after make the initial classification of mass terror related data.
出处
《现代情报》
CSSCI
2018年第1期51-55,共5页
Journal of Modern Information
基金
2017年度教育部人文社会科学研究青年基金项目"基于数据挖掘的涉恐情报量化分析方法研究"(项目编号:17YJCZH098)
2017年侦查与反恐怖学院学科建设专项
国家社科基金重大项目"当前我国反恐形势及对策研究"(项目编号:15ZDA034)
中国人民公安大学基本科研业务费项目"恐怖袭击记录特征分析与预警模型研究"(项目编号:2016JKF01204-02)
关键词
雅卡尔系数
聚类分析
反恐情报
数据挖掘
簇
分类
jaccard index
clustering analysis
counter terrorism
data mining
cluster
classification