基于Q-Learning的自动入侵响应决策方法被引量：4

Automatic Intrusion Response Decision-making Method Based on Q-Learning

在线阅读下载PDF

导出

摘要针对现有自动入侵响应决策自适应性差的问题,文章提出一种基于Q-Learning的自动入侵响应决策方法——Q-AIRD。Q-AIRD基于攻击图对网络攻防中的状态和动作进行形式化描述,通过引入攻击模式层识别不同能力的攻击者,从而做出有针对性的响应动作;针对入侵响应的特点,采用Softmax算法并通过引入安全阈值θ、稳定奖励因子μ和惩罚因子ν进行响应策略的选取;基于投票机制实现对策略的多响应目的评估,满足多响应目的的需求,在此基础上设计了基于Q-Learning的自动入侵响应决策算法。仿真实验表明,Q-AIRD具有很好的自适应性,能够实现及时、有效的入侵响应决策。 Aiming at the problem of poor adaptability of existing automatic intrusion response decision-making,this paper proposes an automatic intrusion response decision-making method based on Q-Learning(Q-AIRD).Q-AIRD formalizes the states and actions of network attack and defense based on the attack graph,and introduces the attack mode layer to identify attackers with different abilities,so as to make more targeted response actions.According to the characteristics of intrusion response,the Softmax algorithm is adopted and the security thresholdθ,stable reward factorμand penalty factorνare introduced to select the response strategy.Based on the voting mechanism,the multi-response purpose evaluation of the strategy is realized to meet the needs of the multi-response purpose.On this basis,an automatic intrusion response decision algorithm based on Q-Learning is designed.The simulation results show that Q-AIRD has good adaptability and can realize timely and effective intrusion response decision-making.

作者刘璟张玉臣张红旗 LIU Jing;ZHANG Yuchen;ZHANG Hongqi(Department of Cryptogram Engineering,Information Engineering University of PLA,Zhengzhou 450001,China)

机构地区中国人民解放军战略支援部队信息工程大学密码工程学院

出处《信息网络安全》 CSCD 北大核心 2021年第6期26-35,共10页 Netinfo Security

基金国家重点研发计划[2016YFF0204002,2016YFF0204003] 国家自然科学基金[61902427,61471344]。

关键词强化学习自动入侵响应 Softmax算法多目标决策 reinforcement learning automatic intrusion response Softmax algorithm multi-objective decision-making

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1张恒巍,黄世锐.Markov微分博弈模型及其在网络安全中的应用[J].电子学报,2019,47(3):606-612. 被引量：19
2钱亚冠,卢红波,纪守领,周武杰,吴淑慧,雷景生,陶祥兴.一种针对基于SVM入侵检测系统的毒性攻击方法[J].电子学报,2019,47(1):59-65. 被引量：29
3石进,陆音,谢立.基于博弈理论的动态入侵响应[J].计算机研究与发展,2008,45(5):747-757. 被引量：13
4叶云,徐锡山,齐治昌,吴雪阳.大规模网络中攻击图自动构建算法研究[J].计算机研究与发展,2013,50(10):2133-2139. 被引量：28
5王硕,汤光明,寇广,宋海涛.基于因果知识网络的攻击路径预测方法[J].通信学报,2016,37(10):188-198. 被引量：29

二级参考文献44

1C Carver,U Pooch.An intrusion response taxonomy and its role in automatic intrusion response[C].In:Proc of the 2000 IEEE Workshop on Information Assurance and Security.West Point,NY:United States Military Academy,2000.129-135
2F Cuppens,A Miege.Alert correlation in a cooperative intrusion detection framework[C].The IEEE Symp on Research in Security and Privacy,Oakland,USA,2002
3P Ning,D Xu.Learning attack strategies from intrusion alerts[C].The 10th ACM Conf on Computer and Communication Security,Washington,DC,USA,2003
4S Musman,P Flesher.System or security managers'adaptive response tool[C].DARPA Information Survivability Conference and Exposition 2000,Hilton Head,USA,2000
5C Carver,J M Hill,J R Surdu.A methodology for using intelligent agents to provide automated intrusion response[C].The IEEE Systems,Man,and Cybernetics Information Assurance and Security Workshop,West Point,NY,2000
6D Ragsdale,C Carver,J Humphries,et al.Adaptation techniques for intrusion detection and intrusion response system[C].The IEEE Int'l Conf on Systems,Man,and Cybernetics at Nashville,Tennessee,2000
7W Lee,W Fan,M Miller,et al.Toward cost-sensitive modeling for intrusion detection and response[J].Journal of Computer Security,2002,10(1/2):5-22
8B Foo,Y Wu,Y Mao,et al.ADEPTS:Adaptive intrusion response using attack graphs in an E-commerce environment[C].Int'l Conf on Dependable Systems and Networks(DSN'05),Washington,2005
9P F Syveron.A different look at secure distributed computation[C].The 1997 IEEE Computer Security Foundations Workshop,Washington,1997
10K Lye,J M Wing.Game strategies in network security[C].The 2002 IEEE Computer Security Foundations Workshop,Copenhagan,Denmark,2002

共引文献109

1张超群,韦川源,梁刚,黑小龙,朱旭东.基于深度学习技术的恶意攻击的分析与识别[J].计算机应用研究,2020,37(S01):283-286. 被引量：6
2张鹏,王磊,汪慧英.基于动态博弈的空间目标行为预测与决策方法[J].系统仿真学报,2009,21(S2):49-51. 被引量：1
3罗婷.基于动态映射的入侵检测系统设计[J].通信技术,2009,42(7):79-81.
4姜伟,方滨兴,田志宏,张宏莉.基于攻防随机博弈模型的防御策略选取研究[J].计算机研究与发展,2010,47(10):1714-1723. 被引量：76
5王纯子,黄光球.基于不完全信息动态博弈的网络攻防态势感知[J].计算机工程,2010,36(20):125-127. 被引量：3
6邹峰.基于计算机网络的入侵检测与防御研究[J].煤炭技术,2011,30(1):92-94. 被引量：12
7王纯子,黄光球.基于粗糙贝叶斯博弈的网络攻防策略[J].计算机应用,2011,31(3):784-789. 被引量：9
8刘建波.一种基于攻防成本博弈的防御策略评价模型[J].计算机技术与发展,2011,21(10):229-232. 被引量：5
9韩文英,闫明星,柴艳妹,王秀利.基于博弈论的企业信息安全攻防策略研究[J].计算机工程,2013,39(9):162-166. 被引量：6
10黄鹏,张娜.基于网络安全风险评估的攻防博弈模型[J].西昌学院学报（自然科学版）,2014,28(4):71-74. 被引量：3

同被引文献26

1白金荣,王俊峰,赵宗渠.基于PE静态结构特征的恶意软件检测方法[J].计算机科学,2013,40(1):122-126. 被引量：14
2王海龙,唐勇,龚正虎.僵尸网络命令与控制信道的特征提取模型研究[J].计算机工程与科学,2013,35(2):62-67. 被引量：9
3叶云,徐锡山,齐治昌,吴雪阳.大规模网络中攻击图自动构建算法研究[J].计算机研究与发展,2013,50(10):2133-2139. 被引量：28
4张永斌,张艳宁.基于主机行为特征的恶意软件检测方法[J].计算机应用研究,2014,31(2):547-550. 被引量：5
5郑继刚,张静梅.拒绝服务攻击Smurf的特征属性关联分析[J].计算机安全,2014(9):49-50. 被引量：1
6王硕,汤光明,寇广,宋海涛.基于因果知识网络的攻击路径预测方法[J].通信学报,2016,37(10):188-198. 被引量：29
7丁伟,唐洁瑶,曹扬,戴涛,陈华军,许爱东.电网信息物理系统网络安全风险分析与防护对策[J].电力信息与通信技术,2018,16(9):33-38. 被引量：24
8陈晨,李丹.论高校实践基地建设的创新性——虚拟实验教学平台建设[J].电脑知识与技术,2017,13(10X):66-66. 被引量：5
9马力新.电话交换网IP化的网络安全防护[J].电信技术,2014,0(S1):42-44. 被引量：1
10曲洁,范春玲,陈广勇,赵劲涛.新时代下网络安全服务能力体系建设思路[J].信息网络安全,2019(1):83-87. 被引量：50

引证文献4

1李萌,张荷.新一代网络安全管理及运营平台建设的思考与实践[J].信息网络安全,2021(S01):125-128. 被引量：3
2张思拓,林旭斌,吴柳,廖年冬.基于流量聚类分析的电力系统C&C威胁检测[J].信息网络安全,2021(S01):173-176. 被引量：1
3卜宪德,刘世栋,位祺,张立杨.基于强化学习的IMS及软交换网络主动防御安全策略[J].电力信息与通信技术,2024,22(6):45-51.
4王琤.基于网络安全的汽车营销与服务专业实训中心建设研究[J].汽车维护与修理,2024(18):69-71.

二级引证文献4

1张威,司鑫悦.城市轨道交通云平台网络安全体系研究[J].现代城市轨道交通,2022(7):34-38. 被引量：6
2邓金祥,温嵩杰,侯俊龙,田晓东,周恩亚,谷峰.面向网络基础设备的流量识别与威胁检测技术[J].通信技术,2022,55(9):1208-1216. 被引量：2
3邱付裕.基于系统动力学方法的企业网络安全管理研究[J].漳州职业技术学院学报,2023,25(1):76-83.
4刘阳.基于实战化安全运营的智慧医院网络安全保护体系构建与应用[J].中国医疗设备,2023,38(11):127-132. 被引量：12

1王丽媛,李晓风,李玉洁,谭海波.基于系统调用的交互式入侵检测系统设计与实现[J].仪表技术,2020(3):1-5. 被引量：2
2张壮壮,陈永乐,王建华,陈俊杰.分层依赖关系建模的工控异常检测方法[J].计算机工程与设计,2021,42(6):1542-1550. 被引量：1
3崔洪涛,曹科,张虎,崔潇.基于联合投票网络的交通场景天气分类方法[J].西南交通大学学报,2021,56(3):579-586. 被引量：2

信息网络安全

2021年第6期

浏览历史

内容加载中请稍等...

基于Q-Learning的自动入侵响应决策方法被引量：4

参考文献5

二级参考文献44

共引文献109

同被引文献26

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于Q-Learning的自动入侵响应决策方法 被引量：4

参考文献5

二级参考文献44

共引文献109

同被引文献26

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于Q-Learning的自动入侵响应决策方法被引量：4