基于AUC的分类器评价和设计综述被引量：52

A Survey of Evaluation and Design for AUC Based Classifier

导出

摘要尽管精度(或总体错分率)普遍用作分类算法的性能评价指标,但存在诸如敏感于类先验分布和错分代价,忽略分类算法所得的后验概率或排序信息等不足.而接收者操作特性(ROC)曲线下面积则能度量算法在整个类先验分布及错分代价范围内的总体分类性能、后验概率和排序性能,因此在分类学习中受到越来越多的关注,由此涌现出众多研究成果.文章旨在对此作相对全面的回顾和总结,包括AUC作为性能评价指标的优势所在,基于AUC优化的算法设计,基于精度优化和AUC优化的算法间的关系以及AUC存在的不足及改进. Though as a common performance evaluating index for classification algorithms, accuracy （or total miselassification error） has several deficiencies, such as the sensitivity to class prior distribution and misclassification costs, and the ignorance of the posterior probability and ranking information obtained by classification algorithms. While the area under the receiver operation characteristic （ROC） curve measures the classification performance across the entire range of class prior distribution and misclassification costs, as well as the probability and ranking performance. Thus, it attracts much attention in classification learning and evokes a lot of researches. In this paper, a relative comprehensive survey for these researches is presented, including the advantages of AUC as a performance evaluating index, the design of algorithms based on AUC, the relationship between the accuracy-maximizing and AUC-maximizing algorithms and the deficiencies of AUC along with its variants.

作者汪云云陈松灿

机构地区南京航空航天大学信息科学与技术学院计算机科学与技术系

出处《模式识别与人工智能》 EI CSCD 北大核心 2011年第1期64-71,共8页 Pattern Recognition and Artificial Intelligence

基金国家自然科学基金(No.60773061) 江苏省自然科学基金(No.BK2008381) 高校博士点基金(No.200802870003)资助项目

关键词精度接收者操作特性(ROC)曲线 ROC曲线下面积(AUC) 性能评价指标分类器设计 Accuracy, Receiver Operation Characteristic （ROC） Curve, Area under ROC Curve（ AUC ） , Performance Evaluating Index, Classifier Design

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献56

1Duda R O, Hart P E, Stork D G. Pattern Classification. 2nd Edi-tion. New York, USA: Wiley, 2001.
2Bradley A P. The Use of the Area under the ROC Curve in the Eval-uation of Machine Learning Algorithms. Pattern Reeognition, 1997, 30(7): 1145-1159.
3Provost F T, Fawcett T, Kohavi R. The Case against Accuracy Esti-mation for Comparing Induction Algorithms//Proc of the 15th Inter-national Conference on Machine Learning. Madison, USA, 1998:445-453.
4Provost F, Fawcett T. Robust Classification for Imprecise Environ- ments. Machine Learning, 2001,42(3): 203-231.
5Ling C X, Huang Jin, Zhang H. AUC : A Better Measure than Ac-curacy in Comparing Learning Algorithms//Proc of the 16th Cana-dian Society for Computational Studies of Intelligence Conference on Advances in Artificial Intelligence. Halifax, Canada, 2003:329-341.
6Ling C X, Huang Jin, Zhang H. AUC: A Statistically Consistent and More Discriminating Measure Than Accuracy//Proc of the 18th International Joint Conference on Artificial Intelligence. Acapulco, Mexico, 2003:519-526.
7Maloof M A. Learning When Data Sets Are Imbalaneed and When Costs Are Unequal and Unknown//Proc of the Workshop on Learn-ing from Imbalaneed Data Sets Ⅱ. Washington, USA, 2003:96-105.
8Akbani R, Kwek S, Japkowicz N. Applying Support Vector Ma-chines to Imbalance Data Sets//Proc of the 15th European Confer-ence on Machine Learning. Pisa, Italy, 2004:39-50.
9Provost F, Fawcett T. Analysis and Visualization of Classifier Per-formance: Comparison under Imprecise Class and Cost//Proc of the 13th ACM SIGKDD International Conference on Knowledge Dis-covery and Data Mining. San Jose, USA, 1997:43-48.
10Huang Jin, Ling C X. Using AUC and Accuracy in EvaluatingLearning Algorithms. IEEE Trans on Knowledge and Data Engineer- ing, 2005, 17(3) : 299-310.

同被引文献514

1王宇翔,马儒林,郭恒,张向辉,何佳,王馨平,胡云华,马娇龙,郭淑霞.新疆农村地区维吾尔族人群心血管疾病患病率及其影响因素[J].中华疾病控制杂志,2023,27(4):385-391. 被引量：7
2张雯,赵旌旌,王捷思,朱兴磊,张敏,瞿伟菁.金耳菌丝体多糖对实验性2型糖尿病大鼠的降血糖作用研究[J].天然产物研究与开发,2010,22(1):49-53. 被引量：22
3蒋盛益,谢照青,余雯.基于代价敏感的朴素贝叶斯不平衡数据分类研究[J].计算机研究与发展,2011,48(S1):387-390. 被引量：21
4谭友果,甘枝勤,郭君华,刘成文,陈茂娟.二项必选数字记忆测验对伪装病人的鉴别(附164例分析)[J].临床心身疾病杂志,2004,10(2):122-124. 被引量：9
5李妍妍,戴娟,胡玲萍,江振洲,尚靖,张陆勇.仿刺参(Apostichopus japonicus)和海地瓜(Acaudina leucoprocta)体壁多肽的响应面法酶解和N末端测序[J].海洋与湖沼,2015,46(3):620-627. 被引量：5
6王占科,胡新勇,柴长春,杨莉萍,熊晓平.357例创伤死亡患者空腹血糖与多器官功能不全综合征相关分析[J].现代诊断与治疗,2005,16(2):72-74. 被引量：13
7刘经南,张小红.利用激光强度信息分类激光扫描测高数据[J].武汉大学学报（信息科学版）,2005,30(3):189-193. 被引量：65
8许卫东,尹球,匡定波.地物光谱匹配模型比较研究[J].红外与毫米波学报,2005,24(4):296-300. 被引量：53
9李光伟.第三届中国胰岛素分泌专题研究会简报前言[J].中华内分泌代谢杂志,2005,21(4):405-405. 被引量：1
10Joseph L. FOX,Brd-JФrgen BRDSEN.西藏羌塘自然保护区与人类活动有关的藏羚、藏野驴和藏原羚密度(英文)[J].动物学报,2005,51(4):586-597. 被引量：4

引证文献52

1冯建英,苏允汇,龚劭齐,王智,穆维松.基于集成学习的农业生产技术效率评价方法[J].农业机械学报,2021,52(S01):148-155. 被引量：6
2孙康,金钢,朱晓华.基于波动分析的海上小目标检测[J].电子与信息学报,2013,35(4):882-887. 被引量：6
3孙康,金钢,朱晓华,孙理.基于Q-MMSPF的海杂波多重分形互相关分析和目标检测[J].国防科技大学学报,2013,35(3):170-175. 被引量：5
4李秋洁,茅耀斌.基于数据重平衡的AUC优化Boosting算法[J].自动化学报,2013,39(9):1467-1475. 被引量：8
5刘英伟,秦永彬.基于余弦相似性的m-类分类器设计与算法实现[J].计算机与数字工程,2014,42(3):351-354. 被引量：4
6李勇,刘战东,张海军.不平衡数据的集成分类算法综述[J].计算机应用研究,2014,31(5):1287-1291. 被引量：75
7陈苗苗,蔡宁,马嘉,袁援生.原发性开角型青光眼高危人群视网膜光阈值波动与视网膜神经纤维层和神经节细胞复合体厚度改变的时间关系[J].中华眼底病杂志,2019,35(1):58-64. 被引量：7
8张扬,赵治栋,叶海慧.基于遗传算法和最小二乘支持向量机的胎儿状态智能评估[J].生物医学工程学杂志,2019,36(1):131-139. 被引量：4
9姜纪远,陶卿,高乾坤,储德军.求解AUC优化问题的对偶坐标下降方法[J].软件学报,2014,25(10):2282-2292. 被引量：1
10李诒靖,郭海湘,李亚楠,刘晓.一种基于Boosting的集成学习算法在不均衡数据中的分类[J].系统工程理论与实践,2016,36(1):189-199. 被引量：60

二级引证文献372

1崔文泉,余厚莹,侯晓天.不均衡数据情形的基于聚焦损失的CGAN的集成分类方法[J].中国科学技术大学学报,2020,50(7):968-976.
2姜新盈,王舒梵,严涛.基于层次密度聚类的去噪自适应混合采样[J].计算机系统应用,2022,31(10):206-210.
3李村合,姜宇,李帅.基于不等距超平面距离的模糊支持向量机[J].计算机系统应用,2020(10):185-191. 被引量：7
4杨断利,张然,陈辉,鲍惠玲,宣凤苓,高媛.蛋鸡羽毛覆盖度计算及其与体温关系研究[J].农业机械学报,2022,53(10):242-251. 被引量：4
5徐畅,丁俊琦,赵聃桐,乔岩,张领先.基于LightGBM和处方数据的番茄病害诊断方法[J].农业机械学报,2022,53(9):286-294. 被引量：8
6刘允峰,佟季萱,叶应图.动态数据流集成分类算法综述[J].渤海大学学报（自然科学版）,2023,44(1):79-91. 被引量：2
7梁允,李哲,石英,杨亚锡.基于模糊贝叶斯网络的变电站动态汛情风险评估[J].高电压技术,2023,49(S01):153-159.
8侯杰,茅耀斌,孙金生.基于指数损失和0-1损失的在线Boosting算法[J].自动化学报,2014,40(4):635-642. 被引量：2
9张倩,李明,王雪松,程玉虎,朱美强.一种面向多源领域的实例迁移学习[J].自动化学报,2014,40(6):1176-1183. 被引量：24
10康士峰,曹仲晴,王红光,郭相明.基于目标函数的微波超视距雷达天线高度优化方法[J].电子与信息学报,2014,36(7):1767-1770. 被引量：8

1杨明旭,洪文财,米红.基于量子粒子群和随机森林的特征选择方法[J].福建电脑,2010,26(5):94-95.
2孟伶伶.电子电路计算机辅助设计综述[J].科技创新与应用,2014,4(23):80-80.
3金建国,周明华,邬学军.参数化设计综述[J].计算机工程与应用,2003,39(7):16-18. 被引量：73
4朱和平,杨金城.650kt／a乙烯装置ESD系统设计综述[J].世界仪表与自动化,2003,7(6):15-20. 被引量：4
5王斌锋,苏金树,陈琳.云计算数据中心网络设计综述[J].计算机研究与发展,2016,53(9):2085-2106. 被引量：55
6吴志宏.计算机辅助设计综述[J].鞍钢技术,1991(9):13-18.
7蔡晓艳,司小平,蒋华勤.无线传感器网络节点设计综述[J].中国科技信息,2010(23):109-110. 被引量：2
8李秋洁,茅耀斌.基于数据重平衡的AUC优化Boosting算法[J].自动化学报,2013,39(9):1467-1475. 被引量：8
9沙晓光,王盼卿,陈家文.快速原型法在MIS开发中的应用研究[J].河北省科学院学报,2002,19(4):230-232. 被引量：4
10方巍,孙涌.基于Struts框架MVC模式的Web应用[J].计算机与数字工程,2005,33(11):122-125. 被引量：2

模式识别与人工智能

2011年第1期

浏览历史

内容加载中请稍等...

基于AUC的分类器评价和设计综述被引量：52

参考文献56

同被引文献514

引证文献52

二级引证文献372

相关作者

相关机构

相关主题

浏览历史

基于AUC的分类器评价和设计综述 被引量：52

参考文献56

同被引文献514

引证文献52

二级引证文献372

相关作者

相关机构

相关主题

浏览历史

基于AUC的分类器评价和设计综述被引量：52