-
题名代码相似性检测技术综述
被引量:1
- 1
-
-
作者
孙祥杰
魏强
王奕森
杜江
-
机构
郑州大学网络空间安全学院
信息工程大学网络空间安全学院
-
出处
《计算机应用》
CSCD
北大核心
2024年第4期1248-1258,共11页
-
基金
国家重点研发计划项目(2019QY0502)。
-
文摘
代码复用为软件开发带来便利的同时也引入了安全风险,如加速漏洞传播、代码恶意抄袭等,代码相似性检测技术通过分析代码间词法、语法、语义等信息计算代码相似程度,是判断代码复用最有效的技术之一,也是近年发展较快的程序安全分析技术。首先,系统梳理代码相似性检测的近期技术进展,根据目标代码是否开源,将代码相似性检测技术分为源码相似性检测和二进制代码相似性检测,又根据编程语言、指令集的不同进行二次细分;其次,总结每一种技术的思路和研究成果,分析机器学习技术在代码相似性检测领域成功的案例,并讨论现有技术的优势与不足;最后,给出代码相似性检测技术的发展趋势,为相关研究人员提供参考。
-
关键词
二进制代码相似性
源代码相似性
跨语言代码相似性
深度学习
代码克隆
-
Keywords
binary code similarity
source code similarity
cross language code similarity
deep learning
code clone
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-