基于粗糙集的数据流多标记分布特征选择被引量：6

Feature selection for multi-label distribution learning with streaming data based on rough set

在线阅读下载PDF

导出

摘要针对传统特征选择算法无法处理流特征数据、冗余性计算复杂、对实例描述不够准确的问题,提出了基于粗糙集的数据流多标记分布特征选择算法。首先,将在线流特征选择框架引入多标记学习中;其次,用粗糙集中的依赖度替代原有的条件概率,仅仅利用数据自身的信息计算,使得数据流特征选择算法更加高效快捷;最后,由于在现实世界中,每个标记对实例的描述程度并不相同,为更加准确地描述实例,将传统的逻辑标记用标记分布的形式进行刻画。在多组数据集上的实验表明,所提算法能保留与标记空间有着较高相关性的特征,使得分类精度相较于未进行特征选择的有一定程度的提高。 Traditional feature selection algorithm cannot process streaming feature data,the redundancy calculation is complicated and the description of the instance is not accurate enough.A multi-label Distribution learning Feature Selection with Streaming Data Using Rough Set(FSSRS)was proposed to solve the above problem.Firstly,the online streaming feature selection framework was introduced into multi-label learning.Secondly,the original conditional probability was replaced by the dependency in rough set theory,which made the streaming data feature selection algorithm more efficient and faster than before by only using the information calculation of the data itself.Finally,since each label has a different degree of description for the same instance in real world,to make the description of the instance more accurate,label distribution was used to instead of traditional logical labels.The experimental results show that the proposed algorithm can retain the features with high correlation with the label space,so that the classification accuracy is improved to a certain extent compared with that without feature selection.

作者程玉胜陈飞王一宾 CHENG Yusheng;CHEN Fei;WANG Yibin(School of Computer and Information,Anqing Normal University,Anqing Anhui 246011,China;University Key Laboratory of Intelligent Perception and Computing of Anhui Province,Anqing Anhui 246011,China;Key Laboratory of Data Science and Intelligence Application,Fujian Province University,Zhangzhou Fujian 363000,China)

机构地区安庆师范大学计算机与信息学院安徽省智能感知与计算重点实验室数据科学与智能应用福建省高校重点实验室

出处《计算机应用》 CSCD 北大核心 2018年第11期3105-3111,3118,共8页 journal of Computer Applications

基金安徽省高校重点科研项目(KJ2017A352) 数据科学与智能应用福建省高校重点实验室开放课题(D1801)~~

关键词粗糙集多标记数据流特征选择标记分布 rough set multi-label streaming data feature selection label distribution

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1张振海,李士宁,李志刚,陈昊.一类基于信息熵的多标签特征选择算法[J].计算机研究与发展,2013,50(6):1177-1184. 被引量：62
2杨传健,葛浩,汪志圣.基于粗糙集的属性约简方法研究综述[J].计算机应用研究,2012,29(1):16-20. 被引量：57
3段洁,胡清华,张灵均,钱宇华,李德玉.基于邻域粗糙集的多标记分类特征选择算法[J].计算机研究与发展,2015,52(1):56-65. 被引量：109
4李志欣,卓亚琦,张灿龙,周生明.多标记学习研究综述[J].计算机应用研究,2014,31(6):1601-1605. 被引量：21
5刘景华,林梦雷,王晨曦,林耀进.基于局部子空间的多标记特征选择算法[J].模式识别与人工智能,2016,29(3):240-251. 被引量：28

二级参考文献116

1Su-QingHan JueWang.Reduct and Attribute Order[J].Journal of Computer Science & Technology,2004,19(4):429-449. 被引量：24
2王元珍,裴小兵.增量式的高效属性约简算法[J].小型微型计算机系统,2005,26(11):1983-1985. 被引量：3
3徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
4徐章艳,杨炳儒,宋威.基于简化的二进制差别矩阵的快速属性约简算法[J].计算机科学,2006,33(4):155-158. 被引量：16
5胡彧,李智玲,李春伟.一种基于区分矩阵的属性约简算法[J].计算机应用,2006,26(B06):80-82. 被引量：10
6胡峰,代劲,王国胤.一种决策表增量属性约简算法[J].控制与决策,2007,22(3):268-272. 被引量：18
7杨明.一种基于改进差别矩阵的属性约简增量式更新算法[J].计算机学报,2007,30(5):815-822. 被引量：112
8胡峰,王国胤.属性序下的快速约简算法[J].计算机学报,2007,30(8):1429-1435. 被引量：49
9PAWLAK Z. Rough sets[ J]. International Journal of Parallel and Programming, 1982,11 ( 15 ) :341-356.
10WONG S K M, ZIARKO W. Optimal decision rules in decision table [ J]. Bulletin of Polish Academy of Sciences,1985,33 (11-12) : 693-696.

共引文献243

1程凤伟,王文剑,张珍珍.面向高维小样本数据的层次子空间ReliefF特征选择算法[J].南京大学学报（自然科学版）,2023,59(6):928-936. 被引量：1
2李敏,章国豪,陈梓樑,郭志勇,胡晓敏.基于差分进化的多目标粒子群特征选择算法[J].计算机应用研究,2020,37(1):76-79. 被引量：8
3刘城霞,朱敏玲,刘玮琪.基于互信息的属性约简算法研究与实现[J].北京信息科技大学学报（自然科学版）,2020,35(1):38-42. 被引量：7
4吴建升.全方位培养中学生的语文兴趣[J].石油教育,2000(6):53-55.
5黄山.不完备决策表冲突域的属性约简算法[J].信息系统工程,2012(12):150-151.
6骆世广,杨晓丽.金融结构与产业结构结合效益评价及最优金融结构探索——以广东省为例[J].金融经济学研究,2013,28(1):120-128. 被引量：7
7陈秀明,王璐.基于粗糙集方法的信息系统中属性划分方法研究[J].中北大学学报（自然科学版）,2012,33(6):695-698.
8孟科.基于条件向量的多因素粗集决策分析算法设计及应用[J].兰州理工大学学报,2013,39(1):97-100. 被引量：1
9张国歌,李琳,谢岩.基于粗糙集与神经网络的电力企业员工安全等级评价模型[J].电子世界,2013(4):46-47.
10龙丹丽,黎静华,韦化.粗糙集法解多环境因素影响的母线负荷预测问题[J].电网技术,2013,37(5):1335-1340. 被引量：14

同被引文献48

1危前进,魏继鹏,古天龙,常亮,文益民.粗糙集多目标并行属性约简算法[J].软件学报,2022,33(7):2599-2617. 被引量：7
2吴国清,李靖,陈耀明,袁毅.舰船噪声识别(Ⅱ)──线谱稳定性和唯一性[J].声学学报,1999,24(1):7-11. 被引量：47
3C. Velayutham,K. Thangavel.Unsupervised Quick Reduct Algorithm Using Rough Set Theory[J].Journal of Electronic Science and Technology,2011,9(3):193-201. 被引量：2
4黄莉莉,汤进,孙登第,罗斌.基于多标签ReliefF的特征选择算法[J].计算机应用,2012,32(10):2888-2890. 被引量：37
5张振海,李士宁,李志刚,陈昊.一类基于信息熵的多标签特征选择算法[J].计算机研究与发展,2013,50(6):1177-1184. 被引量：62
6李志欣,卓亚琦,张灿龙,周生明.多标记学习研究综述[J].计算机应用研究,2014,31(6):1601-1605. 被引量：21
7刘志韬,郭良浩,闫超.利用自相关函数warping变换的浅海声源深度判别[J].声学学报,2019,44(1):28-38. 被引量：11
8郑胜家,韩东,李晓,张春华.匹配场定位强干扰抑制最小方差无畸变响应处理技术[J].仪器仪表学报,2014,35(7):1586-1593. 被引量：9
9何志芬,杨明,刘会东.多标记分类和标记相关性的联合学习[J].软件学报,2014,25(9):1967-1981. 被引量：21
10吴磊,张敏灵.基于类属属性的多标记学习算法[J].软件学报,2014,25(9):1992-2001. 被引量：11

引证文献6

1王一宾,吴陈,程玉胜,江健生.不平衡标记差异性多标记特征选择算法[J].深圳大学学报（理工版）,2020,37(3):234-242. 被引量：3
2王一宾,李田力,程玉胜,钱坤.基于核极限学习机自编码器的标记分布学习[J].山东大学学报（工学版）,2020,50(3):58-65. 被引量：2
3姚二亮,李德玉.多标记特征选择算法的综述[J].郑州大学学报（理学版）,2020,52(4):16-27. 被引量：2
4毕雪洁,惠娟,赵安邦,王彪,马林,李晓曼.基于匹配场处理的浅海水声目标深度分类方法研究[J].电子与信息学报,2022,44(11):3917-3930. 被引量：1
5温志峰.一种动态加权条件网络数据的特征标记算法[J].现代信息科技,2023,7(15):87-90.
6马磊,罗川,李天瑞,陈红梅.基于模糊粗糙集的无监督动态特征选择算法[J].计算机应用,2023,43(10):3121-3128. 被引量：2

二级引证文献10

1赵凡超,戴石良,房华伟,张丽敏,刘伟.基于改进集成多隐层小波极限学习神经网络的滚动轴承故障识别研究[J].机电工程,2021,38(9):1152-1159. 被引量：4
2谭亚红.自适应小波分析和多层卷积极限学习自编码器的轴承故障识别研究[J].机车电传动,2021(6):106-113. 被引量：1
3封晓斌,汤易兵,吴增源,徐明江.基于SRFML-Lift的流程制造产品质量状态监测[J].中国管理科学,2021,29(12):227-236. 被引量：4
4孙林,陈雨生,徐久成.基于改进ReliefF的多标记特征选择算法[J].山东大学学报（理学版）,2022,57(4):1-11. 被引量：10
5温志峰.一种动态加权条件网络数据的特征标记算法[J].现代信息科技,2023,7(15):87-90.
6兰旭辉,杨成竹,徐立军.离网格压缩匹配场处理[J].信号处理,2023,39(10):1784-1792.
7陈风.基于模糊粗糙集的工程地形测量数据缺失填补研究[J].资源导刊,2024(22):30-33.
8徐久成,段江豪,牛武林,张杉,白晴.基于自信息和模糊邻域条件熵的特征选择方法[J].山西大学学报(自然科学版),2025,48(1):77-88.
9王艳红,顾建伟,栾卫平,张睿,黄征,王达琳.基于不相关回归和自适应谱图的多标签学习特征选择方法[J].计算机应用与软件,2025,42(3):298-310.
10王小碧.偏多标记分类学习[J].应用数学进展,2024,13(4):1425-1432.

1王一宾,程玉胜,何月,裴根生.回归核极限学习机的多标记学习算法[J].模式识别与人工智能,2018,31(5):419-430. 被引量：5
2胡敏杰,林耀进,王晨曦,唐莉,郑荔平.基于拉普拉斯评分的多标记特征选择算法[J].计算机应用,2018,38(11):3167-3174. 被引量：5
3同莎.为什么现代戏离不开传统特征[J].戏剧之家,2018(31):33-33.
4孙志建.迈向助推型政府监管:机理、争论及启示[J].甘肃行政学院学报,2018(4):57-66. 被引量：23
5宋文杰.大数据时代背景下企业财务管理问题分析[J].现代商贸工业,2018,39(35):132-133. 被引量：8
6陈琳琳,陈德刚.一种基于核对齐的分类器链的多标记学习算法[J].南京大学学报（自然科学版）,2018,54(4):725-732. 被引量：4
7詹文静.英语文学的文化疆界及形象的分析[J].校园英语,2018,0(22):253-254.
8余国先,傅广垣,王峻,郭茂祖.基于降维的蛋白质不相关功能预测[J].中国科学：信息科学,2017,47(10):1349-1368. 被引量：4
9李峰,苗夺谦,张志飞,罗晟.一种标记粒化集成的多标记学习算法[J].小型微型计算机系统,2018,39(6):1121-1125. 被引量：2
10谢铭超,韩旭,栾帅,李芳,王春兴.基于卷积神经网络特征提取的MRI脑肿瘤图像分割[J].曲阜师范大学学报（自然科学版）,2018,44(2):49-53. 被引量：2

计算机应用

2018年第11期

浏览历史

内容加载中请稍等...

基于粗糙集的数据流多标记分布特征选择被引量：6

参考文献5

二级参考文献116

共引文献243

同被引文献48

引证文献6

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于粗糙集的数据流多标记分布特征选择 被引量：6

参考文献5

二级参考文献116

共引文献243

同被引文献48

引证文献6

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于粗糙集的数据流多标记分布特征选择被引量：6