基于信息熵函数的启发式贝叶斯因果推理被引量：8

Heuristic Bayesian Causal Inference based on Information Entropy Function

在线阅读下载PDF

导出

摘要贝叶斯网络分类器(BNC)由于其优越的分类性能和可解释性在数据挖掘和人工智能等领域有着广泛的应用.信息论为其迅速发展奠定了坚实的数学理论基础,例如条件互信息被用来度量BNC拓扑结构中属性间的条件依赖关系.然而,贝叶斯网络又被称为因果网络,但目前人工智能等领域中有关贝叶斯网络因果关系的研究是一个很有争议性的课题.属性间因果性的定义远比相关性的定义复杂微妙很多.而条件互信息可能不适用于度量BNC整体拓扑结构对数据的拟合性,并且其表达式的对称性决定了其只能描述属性之间的无向相关性,而非有向因果性.本文从信息熵的角度对贝叶斯网络中的因果关系进行了探索性的研究,首先基于对似然函数定义了联合熵函数与贝叶斯网络拓扑结构中联合概率分布的映射关系,然后在此基础上提出了类条件熵和局部条件熵函数来识别拓扑结构中属性间的因果关系.最后提出了一种基于类标签驱动的启发式结构学习方法来构建可以兼顾有标签数据拟合和无标签数据泛化的BNC(记为HBN).对美国加州大学欧文分校(UCI)机器学习数据库中35个数据集的实验评估表明,本文所提出算法与其它算法相比在分类性能上具有显著优势,例如HBN在0-1损失函数上明显优于CFWNB(17优5劣)、SKDB(14优5劣)、AIWNB(17优7劣);在偏差上HBN与CFWNB相比26优6劣,与SKDB相比10优5劣,与WAODE相比15优7劣,与RF相比29优4劣,与AIWNB相比22优6劣.由于CFWNB、WAODE、AIWNB没有结构学习过程,其拓扑结构不受训练数据扰动的影响.这三种算法的方差显著低于其它算法.而HBN的局部拓扑结构能充分体现测试实例中隐含的因果关系,在一定程度上减轻训练数据过拟合带来的负面影响.因此,与SKDB和RF相比,HBN的方差结果均明显占优(20优9劣,26优3劣).与其他算法相比,HBN的0-1损失函数和偏差结果分别平均提高了6.06%和12.65%.与SKDB和RF相比,HBN的方差结果平均提高了16.49%.HBN为不确定性知识表示和推理提供了一种有效且可行的方法. Bayesian network classifier(BNC)has been widely used in the data mining,artificial intelligence and other fields due to its excellent classification performance and interpretability.Information theory has established a strong mathematical and theoretical basis for its rapid development.For example,conditional mutual information is widely used to measure the conditional dependence between attributes in the topology structure of BNC.However,Bayesian network is also called causal network,the research on causality in the Bayesian network is a controversial topic in the artificial intelligence and other fields.The definition of causality between attributes is much more complex and subtler than that of correlation.Conditional mutual information may be not suitable for measuring the extent to which the global topology structureof BNC fits data,and the symmetry of its expression determines that it can only describe the undirected correlation between attributes,not the directed causality.An exploratory research is carried out in the causal relationship of Bayesian networks from the perspective of information entropy.This paper firstly defines the mapping relationship between the joint entropy function and the joint probability distribution within the Bayesian networks from the perspective of the log-likelihood function,and then proposes the class conditional entropy function and local conditional entropy function based on the joint entropy function to identify the causal relationships between attributes in the topology structure.Finally,a label-driven heuristic structure learning method is proposed to build a BNC that can balance labeled data fitting and unlabeled data generalization,which is named HBN.Experimental evaluation on 35 datasets from the UCI machine learning repository shows that the proposed algorithm enjoys significant advantages in terms of classification performance over other state-of-the-art algorithms.For example,in terms of 0-1 loss function,HBN beats the algorithm of correlation-based feature weighting filter for naive Bayes(CFWNB)on 17 datasets and loses 5,beats selective k-dependence Bayesian classifier(SKDB)on 14 datasets and loses 5,beats attribute and instance weighted naive Bayes(AIWNB)on 17 datasets and loses 7.In terms of bias,HBN beats CFWNB on 26 datasets and loses 6,beats SKDB on 10 datasets and loses 5,beats AIWNB on 22 datasets and loses 6.Besides,when compared with ensemble algorithms,HBN also achieves significant advantages over weighted average one-estimators(WAODE:11 wins and 2 loses in terms of 0-1 loss;15 wins and 7 loses in terms of bias)and random forest(RF:19 wins and 9 loses in terms of 0-1 loss;29 wins and 4 loses in terms of bias).Variance-wise,CFWNB,WAODE and AIWNB have no structure learning and are irrelevant to the variation of training data,thus they enjoy lower variance results.The local topology of HBN can fully reflect the implicit causality in testing instances,and reduce the negative impact of training data over fitting to a certain extent.Thus,HBN has significant advantages in terms of variance over SKDB(20 wins and 9 loses)and RF(26 wins and 3 loses).Compared with other algorithms,the average 0-1 loss and bias results of HBN are improved by about 6.06%and 12.65%.Compared with SKDB and RF,the average variance results of HBN is improved by about 16.49%.HBN is effective and feasible for uncertain knowledge representation and reasoning.

作者刘洋王利民孙铭会 LIU Yang;WANG Li-Min;SUN Ming-Hui(College of Computer Science and Technology,Jilin University,Changchun 130012;Key Laboratory of Symbol Computation and Knowledge Engineering of Ministry of Education,Jilin University,Changchun 130012)

机构地区吉林大学计算机科学与技术学院吉林大学符号计算与知识工程教育部重点实验室

出处《计算机学报》 EI CAS CSCD 北大核心 2021年第10期2135-2147,共13页 Chinese Journal of Computers

基金国家重点研发计划(No.2019YFC1804804) 吉林省科技发展计划项目(No.20200201281JC)资助.

关键词贝叶斯网络分类器对数似然函数联合熵条件熵交叉熵 bayesian network classifier log likelihood function joint entropy conditional entropy cross entropy

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1陈为,朱标,张宏鑫.BN-Mapping:基于贝叶斯网络的地理空间数据可视分析[J].计算机学报,2016,39(7):1281-1293. 被引量：20
2王双成,高瑞,杜瑞杰.基于高斯Copula的约束贝叶斯网络分类器研究[J].计算机学报,2016,39(8):1612-1625. 被引量：10
3王双成,张立,郑飞.异步动态贝叶斯网络分类器研究[J].计算机学报,2020,43(9):1737-1754. 被引量：3
4王中锋,王志海.基于条件对数似然函数导数的贝叶斯网络分类器优化算法[J].计算机学报,2012,35(2):364-374. 被引量：19
5崔佳旭,杨博.贝叶斯优化方法和应用综述[J].软件学报,2018,29(10):3068-3090. 被引量：208
6鞠卓亚,王志海.基于选择性模式的贝叶斯分类算法[J].计算机研究与发展,2020,57(8):1605-1616. 被引量：12
7王双成,高瑞,杜瑞杰.具有超父结点时间序列贝叶斯网络集成回归模型[J].计算机学报,2017,40(12):2748-2761. 被引量：18
8綦小龙,高阳,王皓,宋蓓,周春蕾,张友卫.一种可度量的贝叶斯网络结构学习方法[J].计算机研究与发展,2018,55(8):1717-1725. 被引量：6

二级参考文献30

1Han J, Kamber M. Data Mining: Concepts and Techniques. 2nd Edition. San Francisco, CA: Morgan Kaufmann, 2005.
2Friedman N, Geiger D, Goldszmidt M. Bayesian network classifiers. Machine Learning, 1997, 29(2/3): 131-163.
3Greiner R, Zhou W. Structural extension to logistic regres- sion= Discriminative parameter learning of belief net classifi- ers//Proceedings of the 18th Annual National Conference on Artificial Intelligence ( AAAI 2002). Edmonton, Canada, 2002:167-173.
4Greiner R, Su X, Shen B et al. Structural extension to logis- tic regression: Discriminative parameter learning of belief net classifiers. Machine Learning, 2005, 59(3): 297-322.
5Chickering D M, Heckerman D, Meek C. Large sample learning of Bayesian networks is NP-hard. The Journal of Machine Learning Research, 2004, 5 : 1287-1330.
6Tillman R E. Structure learning with independent non-identi cally distributed data//Proceedings of the 26th Annual Inter national Conference on Machine Learning. New York, 2009: 1041-1048.
7Zheng Z, Webb G I. Lazy learning of Bayesian rules. Machine Learning, 2000, 41(1): 53-84.
8Keogh E J, Pazzani M J. Learning the structure of augmen- ted Bayesian classifiers. International Journal on Artificial In telligence Tools, 2002, 11(4): 587-601.
9Webb G I, Boughton J R, Wang Z. Not so naive Bayes: Ag- gregating one-dependence estimators. Machine Learning, 2005, 58(1): 5-24.
10Naele A, Dejori M, Stetter M. Bayesian substructure learn- ing- Approximate learning of very large network strue tures//Proceedings of the 18th European Conference on Ma- chine Learning (ECML, 2007). Warsaw, Poland, 2007: 238-249.

共引文献279

1范霄,孔金玲,钟炎伶,蒋镒竹,张静雅.基于XGBoost算法的遥感图像云检测[J].遥感技术与应用,2023,38(1):156-162. 被引量：3
2徐畅,丁俊琦,赵聃桐,乔岩,张领先.基于LightGBM和处方数据的番茄病害诊断方法[J].农业机械学报,2022,53(9):286-294. 被引量：8
3黄灿,田冷,王恒力,王嘉新,蒋丽丽.基于条件生成式对抗网络的油藏单井产量预测模型[J].计算物理,2022,39(4):465-478. 被引量：3
4杜建玲,刘红霞,于淑平.杨树不同种(品种)间抗溃疡病差异的比较[J].河北林果研究,2000,15(1):55-60. 被引量：4
5高妍方,王继伟.贝叶斯网络生成学习和判别学习对比研究[J].山东建筑大学学报,2013,28(4):328-334.
6于江德,赵红丹,郑勃举,余正涛.基于中文人名用字特征的性别判定方法[J].山东大学学报（工学版）,2014,44(1):13-18. 被引量：2
7孟光胜,赵志宇.基于两层主动学习策略的SVM分类方法[J].河南师范大学学报（自然科学版）,2014,42(2):158-162. 被引量：1
8谢科.融合协同训练和两层主动学习策略的SVM分类方法[J].湖南师范大学自然科学学报,2014,37(1):93-97. 被引量：1
9李艳颖,杨有龙,汪春峰.基于粗糙集属性约简与进化算法的贝叶斯网络分类器[J].郑州大学学报（理学版）,2014,46(2):43-49. 被引量：2
10王双成,高瑞,冷翠平.连续属性一阶贝叶斯衍生分类器学习与集成[J].模式识别与人工智能,2015,28(6):499-506.

同被引文献92

1刘连,王孝通.基于变分贝叶斯推断的字典学习算法[J].控制与决策,2020,35(2):469-473. 被引量：7
2刘胜昔,程春玲.改进的Gabor小波变换特征提取算法[J].计算机应用研究,2020,37(2):606-610. 被引量：25
3罗可,洪亮亮,童小娇.一种有效的分类型数据聚类方法[J].控制与决策,2011,26(10):1542-1544. 被引量：3
4张红民,张见双,罗永涛,陈柏元.一种基于图像区域分块的SIFT快速配准方法[J].红外技术,2017,39(4):341-344. 被引量：6
5雷秀娟,高银,郭玲.基于拓扑势加权的动态PPI网络复合物挖掘方法[J].电子学报,2018,46(1):145-151. 被引量：12
6付立冬,马小科,聂靖靖.进化谱分算法检测动态网络社团结构[J].西安电子科技大学学报,2018,45(2):43-47. 被引量：5
7杨明东,石英,华逸伦,朱剑怀.基于匹配策略融合的低误差快速图像拼接算法[J].计算机应用研究,2019,36(4):1222-1227. 被引量：7
8钱茜,周宗放.供应链上两类不同信用风险的关联及传染效应研究[J].运筹与管理,2019,28(3):78-86. 被引量：7
9刘红卫,肖彩波,胡亦钧.静态多维风险度量研究[J].数学物理学报（A辑）,2019,39(2):393-401. 被引量：2
10张希,朱利,刘路辉,詹杭龙,卢艳民.基于多层网络的银行间市场信用拆借智能风险传染机制[J].计算机应用,2019,39(5):1507-1511. 被引量：4

引证文献8

1盛江明,薛娟,李鹏,伊娜.基于时空图卷积神经网络的蛋白质复合物识别方法[J].南方医科大学学报,2022,42(7):1075-1081. 被引量：1
2张永宾,赵金楼.融合LDA与注意力的网络信息个性化推荐方法[J].计算机仿真,2022,39(12):528-532. 被引量：6
3侯景花.商业银行信用风险度量及评估方法研究[J].晋中学院学报,2022,39(6):57-63.
4陈婷婷,赵世忠.考虑模糊时间序列的高维大数据挖掘方法研究[J].计算机仿真,2023,40(3):467-470. 被引量：5
5梁镇锋,夏海英.一种面向无人机航拍图像的快速拼接算法[J].广西师范大学学报（自然科学版）,2023,41(3):41-52. 被引量：3
6范玥.基于移动图像检测算法的景观照明系统优化改进研究[J].自动化与仪器仪表,2023(9):124-128. 被引量：3
7程宁,李超.基于粒子群算法的无线传感网络大数据聚类优化方法[J].传感技术学报,2023,36(8):1316-1322. 被引量：3
8谭振国,曾佳佳,牛国智,邓睿,刘旭东.基于多源传感的智能双馈风机机械振动故障监测方法[J].机械与电子,2024,42(6):32-37. 被引量：1

二级引证文献22

1强薇.基于改进神经网络算法的英语数字资源个性化推荐方法[J].中阿科技论坛（中英文）,2023(10):90-94. 被引量：2
2颜润生.基于协同过滤的社交网络热点信息个性化推荐研究[J].信息与电脑,2023,35(14):15-17. 被引量：1
3雷继尧.基于关联规则的数据挖掘算法在电商领域中的应用研究[J].信息与电脑,2023,35(16):73-75. 被引量：2
4李鑫,薛世峰.图卷积神经网络结合回译流程的自动翻译器设计[J].自动化与仪器仪表,2024(4):185-188.
5董瑞.基于多源数据挖掘的河道综合治理风险精准预测研究[J].吉林水利,2024(5):47-51. 被引量：1
6王明虎,石智奎,苏佳,张新生.基于RoBERTa和图增强Transformer的序列推荐方法[J].计算机工程,2024,50(4):121-131. 被引量：3
7赵丽.基于云计算智慧平台的健康养老信息推送算法研究[J].长春大学学报,2024,34(4):8-13.
8尚小晶.基于灰靶理论与云模型的能源物联网数据精准挖掘方法[J].物联网技术,2024,14(6):131-133.
9韩广芬.基于用户特征的电力营销信息个性化推荐研究[J].电力设备管理,2024(9):256-258.
10李居尚,战荫泽,于洋,卞玮.“互联网+”时代背景下数字化智慧课堂多维度数据精准搜索方法研究[J].无线互联科技,2024,21(10):72-74.

1熊菊霞,吴尽昭,王秋红.邻域互信息熵的混合型数据决策代价属性约简[J].小型微型计算机系统,2021,42(8):1584-1590. 被引量：16
2本刊编辑部.《环境流行病学:研究方法与应用》中文版已经出版[J].环境与健康杂志,2020,37(4):329-329.
3林松,田林亚,毕继鑫,施贵刚,朱依民,闻亚.基于最优邻域局部熵的点云精简算法[J].测绘工程,2021,30(5):12-17. 被引量：15
4王锦辉,郑闽锋,李月玲,刘曦,李学来.平板过冷却器内结冰行为的实验研究[J].制冷学报,2021,42(4):142-148. 被引量：1
5钟嘉健,丘敏敏,黄泰茗,肖振华,邓永锦.基于结构信息和直觉模糊集的图像相似度测度法在放疗摆位验证中应用[J].中华放射肿瘤学杂志,2021,30(9):936-941. 被引量：3
6许寅喆,潘颖威,张平,陈志达,李美淑,吕文平,童俊翔,孟翔飞,刘博,卢实春.基于快速手术病房的腹腔镜胆囊切除术教学培训模式探讨[J].中华肝胆外科杂志,2021,27(9):667-671. 被引量：4
7时丹蕾,杜宝军.基于BP神经网络的银行客户流失预测[J].科学技术创新,2021(27):104-106. 被引量：2
8赵准,陈淑荣.一种基于自校准卷积残差网络的年龄识别方法[J].现代计算机,2021,27(25):57-62.
9刘婧婧.近年非虚构女性乡土文学辨析--以《妇女闲聊录》《中国在梁庄》《生死十日谈》为例[J].中国现代文学研究丛刊,2021(9):143-151.
10李思思,宋佳鸿,何亚迎,黄英.环状RNA Circ-RANBP1在胰腺癌组织中的表达及其对细胞增殖、迁移和侵袭能力的影响[J].胃肠病学,2021,26(2):76-81. 被引量：1

计算机学报

2021年第10期

浏览历史

内容加载中请稍等...

基于信息熵函数的启发式贝叶斯因果推理被引量：8

参考文献8

二级参考文献30

共引文献279

同被引文献92

引证文献8

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于信息熵函数的启发式贝叶斯因果推理 被引量：8

参考文献8

二级参考文献30

共引文献279

同被引文献92

引证文献8

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于信息熵函数的启发式贝叶斯因果推理被引量：8