-
题名面向多类不均衡网络流量的特征选择方法
被引量:9
- 1
-
-
作者
孙兴斌
孙彦赞
郑小盈
芮赟
-
机构
上海大学通信与信息工程学院
中国科学院上海高等研究院
上海大学上海市特种光纤与光接入网省部共建重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第2期568-571,594,共5页
-
基金
国家自然科学基金资助项目(61501289)
国家自然科学青年基金资助项目(61302093)
+3 种基金
国家教育部高等学校博士学科点专项基金资助项目(20133108120018)
上海市科委重大项目(14511101505)
中科院先导专项“未来网络系统架构与关键技术研究”子课题资助项目(XDA06010301)
上海市科学技术委员会“扬帆计划”资助项目(14YF1408900)
-
文摘
针对网络流量分类中的多类不均衡问题,提出一种基于相对不确定性和对称不确定性的Hybrid型特征选择方法。首先,利用相对不确定性为每个类选择候选特征集;然后,保留每个候选特征集中对称不确定性较高的特征并去除其他特征;最后,利用基于C4.5决策树的wrapper型特征选择方法确定最优特征子集。在真实网络流量数据集上的实验结果表明,与传统方法相比,该方法具有较高的整体准确率、小类召回率和g-mean值,从而可以减轻多类不均衡问题带来的不良影响。
-
关键词
网络流量
多类不均衡
特征选择
相对不确定性
对称不确定性
-
Keywords
Internet traffic
multi-class imbalance
feature selection
relative uncertainty
symmetric uncertainty
-
分类号
TP393.06
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于统计频率的网络流量特征选择方法
被引量:3
- 2
-
-
作者
孙兴斌
芮赟
-
机构
上海大学通信与信息工程学院
中国科学院上海高等研究院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第11期2483-2487,共5页
-
基金
国家自然科学青年基金项目(61302093)资助
上海市科委重大项目(14511101505)资助
+2 种基金
上海市科委院市合作专项(13DZ1511200)资助
中科院重点部署项目(KGZW-EW-103)资助
东南大学移动通信国家重点实验室开放研究基金项目(2013D07)资助
-
文摘
在对多类不均衡的网络流量进行分类时,基于机器学习的分类模型倾向于多数类,导致少数类召回率较低.针对该问题,提出一种基于统计频率的特征选择方法.该方法首先根据样本的统计频率计算出度量每个特征区分能力的特征选择系数,然后根据特征选择系数构建特征选择矩阵,最后为每个类选择与之相关性较强的特征.在实验阶段,使用该方法选择的特征对多类不均衡的网络流量进行分类获得了较高的整体准确率、少数类召回率和g-mean值,证明该方法可以减轻多类不均衡问题带来的不良影响.
-
关键词
网络流量分类
多类不均衡
统计频率
特征选择
-
Keywords
interact traffic classification
multi-class imbalance
statistic frequency
feature selection
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-