基于Attention-BiLSTM模型的Python 源代码漏洞检测方法被引量：2

Python Source Code Vulnerability Detection Method Based on Attention-BiLSTM Model

在线阅读下载PDF

导出

摘要针对源代码漏洞检测可有效应对网络攻击,保障软件系统安全。提出了一种基于Attention-BiLSTM模型的Python源代码漏洞检测方法。将含有漏洞的Python源代码进行切片处理,使用Word2Vec模型将代码切片编码为特征向量,并利用Attention-BiLSTM模型对源代码中的漏洞缺陷特征进行学习。使用全连接层对Python源代码语句进行预测分类。在7种不同类型的漏洞数据集上进行实验。实验结果表明,相较于基于LSTM及BiLSTM模型的源代码漏洞检测方法,基于Attention-BiLSTM模型的Python源代码漏洞检测方法具有更高的准确率和F1Score,准确率达到了97.65%~99.64%,F1Score达到了89.56%~97.05%。 Aiming at source code vulnerability detection can effectively deal with network attacks and ensure the security of software systems.A Python source code vulnerability detection method based on Attention-BiLSTM model was proposed.The Python source code containing vulnerabilities was sliced,and then a Word2Vec model was used to encode the code slices into feature vectors.Then the Attention-BiLSTM model was used to learn the vulnerability features in the source code.Python source code statements were predicted and classified using fully-connected layer to determine whether they contain vulnerabilities.Experiments on seven different types of vulnerability datasets were conducted.The experimental results show that,compared to the source code vulnerability detection method based on LSTM and BiLSTM model,the Python source code vulnerability detection method based on the Attention-BiLSTM model has higher accuracy and F1 Score,the accuracy reaches up to 98.05%~99.64%,and the F1Score reaches up to 93.04%~97.96%.

作者李朝杨王希胤 LI Zhao-yang;WANG Xi-yin(College of Science,North China University of Science and Technology,Tangshan Hebei 063210,China)

机构地区华北理工大学理学院

出处《华北理工大学学报（自然科学版）》 CAS 2023年第2期95-103,109,共10页 Journal of North China University of Science and Technology：Natural Science Edition

基金国家自然科学基金项目(32070669)。

关键词漏洞检测源代码 PYTHON 深度学习 vulnerability detection source code Python deep learning

分类号 TP393.081 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1PENG Shuanghe,LIU Peiyao,HAN Jing.A Python Security Analysis Framework in Integrity Verification and Vulnerability Detection[J].Wuhan University Journal of Natural Sciences,2019,24(2):141-148. 被引量：2
2刘嘉华,万明,周晨曦,张攀.基于双向LSTM的Java开源软件漏洞检测[J].计算机应用与软件,2020,37(12):322-327. 被引量：4
3顾绵雪,孙鸿宇,韩丹,杨粟,曹婉莹,郭祯,曹春杰,王文杰,张玉清.基于深度学习的软件安全漏洞挖掘[J].计算机研究与发展,2021,58(10):2140-2162. 被引量：26

二级参考文献8

1吴世忠,郭涛,董国伟,王嘉捷.软件漏洞分析技术进展[J].清华大学学报（自然科学版）,2012,52(10):1309-1319. 被引量：30
2叶志斌,严波.符号执行研究综述[J].计算机科学,2018,45(B06):28-35. 被引量：19
3孙鸿宇,何远,王基策,董颖,朱立鹏,王鹤,张玉清.人工智能技术在安全漏洞领域的应用[J].通信学报,2018,39(8):1-17. 被引量：29
4李珍,邹德清,王泽丽,金海.面向源代码的软件漏洞静态检测综述[J].网络与信息安全学报,2019,5(1):1-14. 被引量：24
5李元诚,黄戎,来风刚,毛一凡,蔡力军.基于深度聚类的开源软件漏洞检测方法[J].计算机应用研究,2020,37(4):1107-1110. 被引量：19
6李韵,黄辰林,王中锋,袁露,王晓川.基于机器学习的软件漏洞挖掘方法综述[J].软件学报,2020,31(7):2040-2061. 被引量：47
7段旭,吴敬征,罗天悦,杨牧天,武延军.基于代码属性图及注意力双向LSTM的漏洞挖掘方法[J].软件学报,2020,31(11):3404-3420. 被引量：37
8Yoon-Ho Choi,Peng Liu,Zitong Shang,Haizhou Wang,Zhilong Wang,Lan Zhang,Junwei Zhou,Qingtian Zou.Using deep learning to solve computer security challenges:a survey[J].Cybersecurity,2020,3(1):203-234. 被引量：1

共引文献28

1梁俊毅,陈静.基于双向LSTM的软件漏洞自动识别方法研究[J].信息与电脑,2021,33(8):174-176. 被引量：2
2肖添明,管剑波,蹇松雷,任怡,张建锋,李宝.基于代码属性图和Bi-GRU的软件脆弱性检测方法[J].计算机研究与发展,2021,58(8):1668-1685. 被引量：7
3徐嬴颖,金可仲,黄辉,刘军.基于深度学习和SDN的网络安全课程综合实验设计[J].计算机教育,2021(11):191-195. 被引量：1
4桂冠,宁金辉,王禹.半监督学习在恶意软件流量检测中的应用[J].移动通信,2022,46(4):28-32. 被引量：3
5宋钊,孙骞.人工智能背景下全球关键信息基础设施安全挑战与对策[J].信息安全与通信保密,2022(6):94-101. 被引量：6
6解超.物联网设备漏洞挖掘技术探究[J].数字通信世界,2022(7):30-32.
7董健,冯莹莹.改进机器学习的软件多类漏洞并行挖掘分析[J].计算机仿真,2022,39(10):386-390. 被引量：3
8安心,王涛.网络教学课程信息窃取风险实时监测方法研究[J].自动化与仪器仪表,2023(1):20-25.
9周香.基于深度学习的计算机软件安全性能检测方法[J].信息与电脑,2023,35(1):17-19. 被引量：2
10马光华,高铁梁,马晨晖.基于机器学习的商业数据安全风险防范研究[J].管理学刊,2023,36(1):70-83. 被引量：3

同被引文献33

1巫喜红,曾锋.AC多模式匹配算法研究[J].计算机工程,2012,38(6):279-281. 被引量：13
2张方国.椭圆曲线在密码中的应用:过去,现在,将来…[J].山东大学学报（理学版）,2013,48(5):1-13. 被引量：3
3范雪莉,冯海泓,原猛.基于互信息的主成分分析特征选择算法[J].控制与决策,2013,28(6):915-919. 被引量：105
4姚登举,杨静,詹晓娟.基于随机森林的特征选择算法[J].吉林大学学报（工学版）,2014,44(1):137-141. 被引量：257
5刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600. 被引量：1028
6徐继伟,杨云.集成学习方法:研究综述[J].云南大学学报（自然科学版）,2018,40(6):1082-1092. 被引量：152
7许佳佳.基于污染混沌动力系统的序列加密算法[J].重庆工商大学学报（自然科学版）,2019,36(1):101-109. 被引量：1
8尚涛,赵铮,舒王伟,刘建伟.基于等差隐私预算分配的大数据决策树算法[J].工程科学与技术,2019,51(2):130-136. 被引量：10
9谢勇,项薇,季孟忠,彭俊,黄益槐.基于Xgboost和LightGBM算法预测住房月租金的应用分析[J].计算机应用与软件,2019,36(9):151-155. 被引量：37
10罗玲,孙学,唐德波.知识图谱在战术云服务平台中的应用[J].电讯技术,2020,60(9):1035-1042. 被引量：4

引证文献2

1邓佳棋,王月波,蒲卿路,李继秀,杨旭.典型测试用例推荐与用例期望结果生成系统[J].计算机测量与控制,2024,32(2):1-6.
2靳珂,荣存庆,常锦才.基于集成特征选择的个性化差分隐私LightGBM算法[J].华北理工大学学报（自然科学版）,2024,46(2):145-155.

1杨宏宇,杨海云,张良,成翔.基于特征依赖图的源代码漏洞检测方法[J].通信学报,2023,44(1):103-117. 被引量：5
2郝静宇.基于以太坊的智能合约漏洞问题与安全策略分析[J].科学与信息化,2023(7):92-94.
3刘泽润,郑红,邱俊杰.基于抽象语法树裁剪的智能合约漏洞检测研究[J].计算机科学,2023,50(4):317-322. 被引量：3
4蔡翔宇.餐饮服务评价情感倾向分析——基于不同分类模型的比较[J].应用数学进展,2023,12(3):940-952.
5程靖云,王布宏,罗鹏.基于图表示和MHGAT的代码漏洞静态检测方法[J].系统工程与电子技术,2023,45(5):1535-1543. 被引量：2
6何杰,蔡瑞杰,尹小康,陆炫廷,刘胜利.面向Cisco IOS-XE的Web命令注入漏洞检测[J].计算机科学,2023,50(4):343-350. 被引量：5
7李彦.路由器和交换机安全技术应用研究[J].华东科技,2023(2):75-77.
8吴皓,周世龙,史东辉,李强.符号执行技术及应用研究综述[J].计算机工程与应用,2023,59(8):56-72. 被引量：2
9薛之芹,张贯虹,王见贤,范义飞.基于Attention-BiLSTM模型的对话式文本抑郁识别研究[J].电脑知识与技术,2023,19(7):38-41. 被引量：1
10汤洁仪,李大军,刘波.基于BERT-BiLSTM-CRF模型的地理实体命名实体识别[J].北京测绘,2023,37(2):143-147. 被引量：7

华北理工大学学报（自然科学版）

2023年第2期

浏览历史

内容加载中请稍等...

基于Attention-BiLSTM模型的Python 源代码漏洞检测方法被引量：2

参考文献3

二级参考文献8

共引文献28

同被引文献33

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于Attention-BiLSTM模型的Python 源代码漏洞检测方法 被引量：2

参考文献3

二级参考文献8

共引文献28

同被引文献33

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于Attention-BiLSTM模型的Python 源代码漏洞检测方法被引量：2