决策树ID3算法的分析与优化被引量：8

Analysis and Optimization of ID3 Decision Tree Algorithm

在线阅读下载PDF

导出

摘要对ID3算法的基本概念和原理以及其分支策略和构造过程进行了详细阐述,针对ID3算法倾向于选择取值较多的属性的缺点,引进属性偏向阈和信息增益率对其做了改进,并利用凸函数的性质简化了ID3算法中信息增益的计算.通过实验对改进前后的算法进行了比较,实验表明,改进后的算法是有效的. The basic concepts and principles of ID3 algorithm and its branching strategy and construction process are elaborated. For the shortcoming that ID3 algorithm tends to choose attribute with many values, at- tribution deflection threshold and information gain ratio were introduced to improve ID3 algorithm, and the properties of convex function was used to simplify the information gain calculation in the ID3 algorithm. By comparing experiments, the results show that the improved algorithm is effective.

作者李瑞许旭睿

机构地区大连交通大学软件学院

出处《大连交通大学学报》 CAS 2015年第2期91-95,共5页 Journal of Dalian Jiaotong University

基金辽宁省教育厅科学研究计划资助项目(L2012163)

关键词决策树 ID3算法凸函数信息增益率属性偏向阈 decision tree ID3 algorithm convex function information gain ratio attribution deflection threshold

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献12

1WITrENIH,FRANKE.数据挖掘一实用机器学习技术[M].北京:机械工业出版社,2006.
2QUINLAN J R. C4. 5: programs for machine learning [M]. [s. 1. ]: Morgan kaufmann, 1993.
3QUINLAN J R. Simplifying decision trees [ J ]. Interna-tional journal of man-machine studies, 1987, 27 (3 : 221-234.
4I QUINLAN J R. Generating Production Rules from Deci- sion Trees[ C]//IJCAI. 1987, 87 : 304-307.
5COVER T M, THOMAS J A. Elements of information theory[M]. [s. 1. ] : John Wiley & Sons, 2012.
6韩家炜 Michelin K.数据挖掘:概念与技术[M].北京:机械工业出版社,2001..
7曲开社,成文丽,王俊红.ID3算法的一种改进算法[J].计算机工程与应用,2003,39(25):104-107. 被引量：79
8王苗,柴瑞敏.一种改进的决策树分类属性选择方法[J].计算机工程与应用,2010,46(8):127-129. 被引量：22
9同济大学应用数学系.高等数学[M].6版.北京:高等教育出版社,2007:113-223.
10QUINLAN J R. Induction of decision trees [ J ]. Ma- chine learning, 1986, 1 (1) : 81-106.

二级参考文献22

1Quinlan J R.Induction of decision trees[J].Machine Learning, 1986, 1:81-106.
2R·格罗恩.数据挖掘一构筑企业竞争优势[M].西安:西安交通大学出版社,2001..
3Quinlan J R.Induction of decision tree[J].Machine Learning, 1986; (1): 81-106.
4Quinlan J R.C4.5:Programs for Machine Learnint[M].Morgan Kaufmann,1992.
5Quinlan J R.Discovering rules from large collections of examples:Acase study[C].In:Michie D,eds.Expert Systems in the Micro Electronic Age,Edinburgh University Press,1979.
6Quinlan J R.Learning efficient classification procedures and their application to chess endgames[C].In:R S Michalski,J G Carbonell,T M Mitchell eds.Machine Learning:An Artificial Intelligence Approach, Tioga, 1983.
7Quinlan J R.The effect of noise on concept learninl[C].In:R S Michalske,JG Carbonell,T M Mitchell eds.Machine Learning:An Artificial Intelligence Approach,Morgan Kaufmann,1986.
8Quinlan J R.Simplifying Decision Trees[J].Intemet Journal of Man-Machine Studies, 1987;27:221-234.
9Quinlan J R.Generating production rules from decision trees[C].In: Proceedings of IJCAI-87,Milan,Italy,1987.
10Drucker H,Cortes C.Boosting decision tree[M].Neural Information Processing,MorganKaufmann,MIT Press, 1996.

共引文献165

1张伟.数据挖掘中的ID3算法研究与实现[J].软件导刊,2010,9(5):176-178. 被引量：2
2肖庆华,徐卫亚,巫德斌.岩石流变力学试验数据挖掘研究[J].工程地质学报,2004,12(2):215-220. 被引量：5
3张志华,刘清平.一种神经模糊数据分类方法及其应用[J].自动化技术与应用,2004,23(4):16-19.
4赵海,陈燕,张德干,张晓丹.相联规则的粗熵挖掘方法及其在肇事逃逸侦破中的应用[J].东北大学学报（自然科学版）,2004,25(10):938-941. 被引量：1
5何宝群.数学教学要渗透人文精神[J].教学与管理（小学版）,2005(1):49-50. 被引量：1
6罗兵,黄万杰,杨帅.基于BP神经网络的库存动态预测及其应用[J].重庆大学学报（自然科学版）,2005,28(2):137-140. 被引量：11
7王立柱,赵大宇.用分类与回归树算法进行人才识别[J].沈阳师范大学学报（自然科学版）,2005,23(1):44-47. 被引量：4
8李宁,乐琦.决策树算法及其常见问题的解决[J].计算机与数字工程,2005,33(3):60-64. 被引量：25
9王天江,张永俊.一种快速基于约束的医疗图像关联分类算法[J].华中科技大学学报（自然科学版）,2005,33(5):49-51. 被引量：2
10王明娜,刘志刚.粗集中属性约简的一种启发式算法[J].南通职业大学学报,2005,19(2):9-13.

同被引文献73

1刘鹏,姚正,尹俊杰.一种有效的C4.5改进模型[J].清华大学学报（自然科学版）,2006,46(z1):996-1001. 被引量：28
2张晓丹,赵海,王刚,魏守智.不确定信息的模糊决策融合算法[J].东北大学学报（自然科学版）,2004,25(7):657-660. 被引量：4
3刘友军,汪林林.SPRINT算法的改进[J].计算机工程,2006,32(16):55-57. 被引量：5
4彭程,罗可.SPRINT算法中寻找连续属性分割点方法的改进[J].计算机工程与应用,2006,42(27):155-157. 被引量：2
5骆盈盈,王柯玲,陈川,毛云芳.结合递增式学习的CART算法改进[J].计算机工程与设计,2007,28(7):1520-1522. 被引量：10
6秦绪英.利用测井资料预测天然气储层产能方法研究[J].石油地球物理勘探,2007,42(3):318-321. 被引量：9
7徐健锋,刘斓,邱桃荣,刘清.基于粒计算的二进制矩阵及在决策树算法的应用[J].广西师范大学学报（自然科学版）,2008,26(3):157-160. 被引量：2
8张凤莲,林健良.新的决策树构造方法[J].计算机工程与应用,2009,45(10):141-143. 被引量：10
9翟俊海,王熙照,张沧生.基于粗糙集技术的决策树归纳[J].计算机工程与应用,2009,45(18):45-47. 被引量：12
10陶维,王海涛.一种基于ID3决策树的优化算法[J].自动化技术与应用,2009,28(10):38-41. 被引量：1

引证文献8

1黄燕,黄慧颖,汪瑞嵘,丁志刚.基于创业者信息挖掘的创业成功倾向分析[J].微型电脑应用,2017,33(5):8-12.
2杨霖,周军,梅红岩,杜晶鑫.ID3改进算法研究[J].软件导刊,2017,16(8):21-24. 被引量：4
3贾青宁,任洪亮,程兴冉.基于决策树的卫生装备数质量预警模型的应用探讨[J].医疗卫生装备,2017,38(12):20-22. 被引量：2
4孙道远.决策树ID3算法中引入简单工厂模式的设计研究[J].德州学院学报,2018,34(2):61-64. 被引量：1
5邓晓林,陈毅红,王登辉.大数据环境下决策树的研究[J].太原师范学院学报（自然科学版）,2021,20(2):47-57. 被引量：5
6孟雅蕾,周千明,师红宇,马楠.基于改进ID3算法的数据分类方法[J].计算机仿真,2022,39(5):329-332. 被引量：11
7孟雅蕾,师红宇,王予.一种无阻流量预测方法[J].计算机与现代化,2024(4):33-37.
8李博.基于ID3决策树在商务智能中的应用[J].智富时代,2018,0(8X):114-114.

二级引证文献22

1杜威铭,冉羽.决策树ID3算法研究[J].科技视界,2018(11):145-146. 被引量：9
2兰欣,卫荣,蔡宏伟,郭佑民,侯梦薇,邢磊,那天,陆亮.机器学习算法在医疗领域中的应用[J].医疗卫生装备,2019,40(3):93-97. 被引量：65
3余建军,张琼之.基于粗糙集的决策树ID3算法[J].计算机系统应用,2020,29(4):156-162. 被引量：10
4杨晗,陈飞,陈浩,赵亮,张慧,刘记宏,刘子杰.用机器学习算法建立IgA肾病与非IgA肾病的鉴别诊断模型[J].中华检验医学杂志,2022,45(3):282-288. 被引量：2
5陆骏.基于人工智能的网络复杂数据分类方法研究[J].信息记录材料,2022,23(8):195-197. 被引量：2
6李婧璇.数据挖掘技术应用下基于决策树模型的油水井生产异常状况管理[J].中国管理信息化,2022,25(14):104-106.
7张展添,秦可凡,张雨诺,王丹丹,金丽霞,李志敏.基于决策树的校园心理分析模型的构建[J].信息技术与信息化,2022(9):81-84. 被引量：1
8郭海兵,刘亚帅.“互联网+”教育背景下网课学习效果评价的决策树建模[J].中国新通信,2022,24(16):137-139.
9安文利,李国强,孙炜歆.基于自动化采煤设备定位系统应用研究[J].计算机测量与控制,2023,31(1):147-152. 被引量：1
10左荣欣,陈昭稳.基于决策树算法的高校教学质量评价研究[J].经济师,2023(2):169-170. 被引量：3

1王永梅,胡学钢.决策树中ID3算法的研究[J].安徽大学学报（自然科学版）,2011,35(3):71-75. 被引量：47
2徐雯,张扬.ID3算法及其改进[J].计算机与数字工程,2009,37(10):19-21. 被引量：9
3贤继红,王家海.数据挖掘中决策树算法的研究[J].世界科技研究与发展,2009,31(4):600-602. 被引量：1
4郭玉滨.一种改进的ID3算法[J].肇庆学院学报,2005,26(5):8-11. 被引量：3
5曲开社,成文丽,王俊红.ID3算法的一种改进算法[J].计算机工程与应用,2003,39(25):104-107. 被引量：79
6朱颢东,钟勇.ID3算法的优化[J].华中科技大学学报（自然科学版）,2010,38(5):9-12. 被引量：7
7张桂杰,王帅.决策树分类ID3算法研究[J].吉林师范大学学报（自然科学版）,2008,29(3):135-137. 被引量：10
8杜丽英.决策树ID3算法的应用研究[J].轻工科技,2014,30(10):67-68. 被引量：1
9刘燕燕.ID3算法的改进[J].信息通信,2013,26(6):4-5. 被引量：1
10屈志毅,周海波.决策树算法的一种改进算法[J].计算机应用,2008,28(B06):141-143. 被引量：19

大连交通大学学报

2015年第2期

浏览历史

内容加载中请稍等...

决策树ID3算法的分析与优化被引量：8

参考文献12

二级参考文献22

共引文献165

同被引文献73

引证文献8

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

决策树ID3算法的分析与优化 被引量：8

参考文献12

二级参考文献22

共引文献165

同被引文献73

引证文献8

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

决策树ID3算法的分析与优化被引量：8