期刊文献+

滑坡数据连续属性值处理的研究 被引量:1

Research in Processing Continuous Property Data of Landslide
在线阅读 下载PDF
导出
摘要 数据预处理是提高挖掘过程精度和性能的关键。文章在分析决策树算法和滑坡数据属性值特点基础上,利用聚类将连续属性值划分区间,提出了一种针对滑坡数据连续属性值离散化的方法,通过实验,新方法构造的决策树比原算法的分类正确率高,规则冗余少。 Data preprocessing is essential to improving accuracy of data mining, Through analyzing the algorithm of decision tree and property of landslide data, we develop a new method to make continuous property discrete using of cluster in this paper. We compare the performance of the method with the performance of the original algorithm on two properties of data sets. The results provide evidence that: (a) new method is competitive with original algorithm with respect to predictive accuracy; and (h) The rule sets discovered by new method are simpler (smaller) than the rule sets discovered by original algorithm.
出处 《微计算机信息》 北大核心 2006年第08X期10-11,32,共3页 Control & Automation
关键词 连续属性值 聚类 滑坡 continuous property, cluster, Landslide
  • 相关文献

参考文献4

二级参考文献4

  • 1王珊 等.数据仓库技术与联机分析处理[M].北京:科学出版社,1999.1-76.
  • 2Jake Strum 著 刘汉宇译.Data Warehousing With Microsoft SQL Server 7.0 Technical Reference[M].北京:机械工业出版社,2000..
  • 3范明 孟小峰.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
  • 4范明,孟小蜂译.数据挖掘:概念与技术--聚类分析[M].北京:机械工业出版社,2001.223-258.

共引文献96

同被引文献5

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部