-
题名基于URL混淆技术识别的钓鱼网页检测方法
被引量:4
- 1
-
-
作者
丁岩
努尔布力
-
机构
新疆大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2017年第20期75-82,共8页
-
基金
国家自然科学基金(No.61303231
No.61433012
No.U1435215)
-
文摘
针对钓鱼URL常用的混淆技术,提出一种基于规则匹配和逻辑回归的钓鱼网页检测方法(RMLR)。首先,使用针对违反URL命名标准及隐藏钓鱼目标词等混淆技术所构建的规则库对给定网页分类,若可判定其为钓鱼网址,则省略后续的特征提取及检测过程,以满足实时检测的需要。若未能直接判定为钓鱼网址,则提取该URL的相关特征,并使用逻辑回归分类器进行二次检测,以提升检测的适应性和准确率,并降低因规则库规模不足导致的误报率。同时,RMLR引入基于字符串相似度的Jaccard随机域名识别方法来辅助检测钓鱼URL。实验结果表明,RMLR准确率达到98.7%,具有良好的检测效果。
-
关键词
钓鱼网页
统一资源定位符(url)混淆技术
规则匹配
机器学习
-
Keywords
phishing
uniform/universal resource locator(url)obfuscation techniques
rule matching
machine learning
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-