-
题名基于手机信令数据的轨迹相似度计算技术研究
被引量:1
- 1
-
-
作者
李欣桐
崔丙维
李明哲
-
机构
长安通信科技有限责任公司创服研发中心
国家计算机网络应急技术处理协调中心实验室
-
出处
《网络新媒体技术》
2022年第5期15-23,共9页
-
基金
基于机器学习的高精度大规模手机去重与区域人口预测技术研究与示范(编号:2020YFF0304901)。
-
文摘
针对在百万级用户计算与目标号码轨迹最相似的用户存在时间复杂度高,推荐精度低的情况,提出了一种轨迹相似度的快速计算框架。这一框架将时间地理位置组合形成字符串,能够对时空金字塔匹配等多种经典的轨迹分析模型进行效果增强和性能增强,并基于增强后的轨迹分析模型完成轨迹相似度判别。该框架能够针对手机信令数据的特点进行去噪,清洗其中的冗余数据、无效数据及乒乓切换数据,将手机信令应用于轨迹重合度比对的实践性框架,其优势在于灵活适配广泛的相似度度量模型,并兼顾了算法准确度和计算效率。本文对优化后的时空金字塔匹配模型(STPM)、最长公共子序列LCS算法、MinHash算法、SimHash算法及动态时间归整DTW算法5种不同的轨迹相似度算法进行量化对比,在效率和准确度两方面进行讨论。在本文的实验数据集上,优化后的时空金字塔匹配算法效果优于其他几种算法。
-
关键词
手机信令数据
轨迹清洗
轨迹相似度
轨迹伴随
Geohash
-
Keywords
mobile signaling data
trajectory cleaning
trajectory similarity
trajectory accompanying
Geohash
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TN929.53
[电子电信—通信与信息系统]
-
-
题名基于机器学习算法的Android恶意程序检测系统
被引量:11
- 2
-
-
作者
张家旺
李燕伟
-
机构
国家计算机网络应急技术处理协调中心实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第6期1774-1777,1782,共5页
-
文摘
对于传统的恶意程序检测方法存在的缺点,针对将数据挖掘和机器学习算法被应用在未知恶意程序的检测方法进行研究。当前使用单一特征的机器学习算法无法充分发挥其数据处理能力,检测效果不佳。将语音识别模型与随机森林算法相结合,首次提出了综合APK文件多类特征统一建立N-gram模型,并应用随机森林算法用于未知恶意程序检测。首先,采用多种方式提取可以反映Android恶意程序行为的三类特征,包括敏感权限、DVM函数调用序列以及OpCodes特征;然后,针对每类特征建立N-gram模型,每个模型可以独立评判恶意程序行为;最后,三类特征模型统一加入随机森林算法进行学习,从而对Android程序进行检测。基于该方法实现了Android恶意程序检测系统,并对811个非恶意程序及826个恶意程序进行检测,准确率较高。综合各个评价指标,与其他相关工作对比,实验结果表明该系统在恶意程序检测准确率和有效性上表现更优。
-
关键词
随机森林
恶意代码检测
多类特征
安卓应用
机器学习
-
Keywords
random forest
malicious code detection
multiple feature
Android application
machine learning
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-