-
题名基于群体智慧的Web访问日志会话主题识别研究
被引量:4
- 1
-
-
作者
方奇
刘奕群
张敏
茹立云
马少平
-
机构
智能技术与系统国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2011年第1期35-40,共6页
-
基金
自然科学基金资助项目(60736044,60903107)
高等学校博士学科点专项科研基金资助项目(20090002120005)
-
文摘
Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列。会话主题(topic)是指会话中具有相同用户意图的部分。从会话中进一步识别出能体现用户意图的处理单元(topic)是进行用户访问行为分析的重要基础。目前相关工作主要集中在边界识别上,无法处理用户意图交叉情况。为了解决该问题,该文重新形式化定义了session和topic的相关概念,提出最大划分的求解任务,并设计出了基于用户群体智慧的会话主题识别算法。在使用大规模真实Web访问日志的实验中,我们的算法取得了不错的效果。
-
关键词
会话主题识别
web访问日志
-
Keywords
session topic identification
web access log
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种对移动Web访问日志中层次数据的提取方法
- 2
-
-
作者
高丽峰
高丽萍
李梦颖
-
机构
四川大学计算机学院
北京南瑞智芯微电子科技有限公司
-
出处
《现代计算机》
2015年第8期47-53,共7页
-
基金
四川省科技厅项目(No.2013GZ0015)
-
文摘
提出一种基于可视分析的层次数据提取方法,实现对移动Web访问日志中层次数据的精确高效提取。通过数据样本建立数据字典,确保没有信息遗漏,并根据字典统计样本并记录相关数据,建立数据网络权重图。可视化该网络,并以可视分析的方法确定数据间的层次结构,并以此构建数据层次结构有向图,结合结点权重进行拓扑排序,使用得到的拓扑序列更新数据字典。将待提取日志与数据字典中的关键词依次进行正则匹配,并保存提取结果。对移动Web访问日志中User-Agent域中的浏览器信息进行数据提取,实验表明该方法能够很好地确定层次数据间的层次关系,实现数据的精确提取。
-
关键词
数据提取
可视分析
层次数据
移动web访问日志
User—Agent
-
Keywords
Data Extraction
Visual Analysis
Hierarchical Data
Mobile web Access Log
User-Agent
-
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
-
-
题名Web日志数据挖掘的数据预处理方法研究
被引量:31
- 3
-
-
作者
张娥
郑斐峰
冯耕中
-
机构
西安交通大学管理学院
-
出处
《计算机应用研究》
CSCD
北大核心
2004年第2期58-60,共3页
-
文摘
主要介绍了Web用户访问日志数据挖掘数据预处理过程,综述了国际上的研究现状,流行的预处理方法。在对用户访问行为的合理假定基础上,最后提出了基于综合最大前向参引模型和时间窗口模型的新方法。
-
关键词
web用户访问日志数据挖掘
数据预处理方法
-
Keywords
web Usage Data Mining
Data Preparation Method
-
分类号
TP274.2
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名面向电力信息系统日志数据的注入攻击特征提取方法
被引量:2
- 4
-
-
作者
殷博
朱静雯
刘磊
许静
-
机构
国网天津市电力公司
南开大学软件学院
南开大学人工智能学院
-
出处
《计算机应用与软件》
北大核心
2021年第3期319-326,共8页
-
基金
国家电网公司总部科技项目(SGTJDK00DWJS1900105)。
-
文摘
电力数据安全随着电力信息网与互联网的接入变得尤为严峻,其数据与规模愈加庞大复杂。为了对其进行有效的安全分析及特征提取,提出一种基于特征提取的SQL注入攻击检测模型。从Web访问日志中提取SQL注入语法特征和行为特征,得到语法特征矩阵和行为特征矩阵数据集。以漏报率和误报率为评价指标,选取K-means、Naive Bayes、SVM和RF算法分别在两类数据集上实验。实验结果表明,与以语法特征矩阵作为数据集相比,行为特征矩阵在SQL注入攻击检测中具有更好的效果。此外SVM和RF检测效果较好,具有较低的漏报率和误报率,该方法能有效检测出SQL注入攻击。
-
关键词
web访问日志
SQL注入
语法特征
行为特征
电力系统
-
Keywords
web access logs
SQL injection
Syntactic feature
Behavioral feature
Power systems
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-
-
题名Web数据挖掘研究
被引量:2
- 5
-
-
作者
包骏杰
-
机构
重庆教育学院计算机与现代教育技术系
-
出处
《重庆教育学院学报》
2004年第3期35-37,共3页
-
文摘
针对当前Web数据量急剧膨胀的状况,本文主要介绍了一种解决Web信息过载问题的新技术——Web数据挖掘.本文首先简述了Web挖掘的定义和分类,之后详细论述了各类Web挖掘中所用到的关键技术,最后对Web挖掘的发展趋势作了展望.
-
关键词
数据挖掘
web挖掘
web内容挖掘
web访问日志挖掘
web结构挖掘
-
分类号
TP311.131
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于行为的Web用户满意模型
- 6
-
-
作者
张凌华
张莉
LEW Philip
王守信
-
机构
北京航空航天大学计算机科学与技术系
-
出处
《计算机应用研究》
CSCD
北大核心
2010年第5期1802-1805,1812,共5页
-
基金
国家重点基础研究发展计划(2007CB310803)
国家重大研究计划“可信软件基础研究”(90818017)
-
文摘
在激烈的商业竞争中,努力使得用户满意是企业成功的根本保证之一。分析用户对产品以及服务的满意情况对产品的改进具有直接推动作用,但是在复杂多变的网络环境下,基于用户主观打分的满意分析方法和理论在时效性及灵活性上存在不足。提出了一个基于行为的Web用户满意模型,以Web访问日志为数据来源,通过分析用户的访问行为来研究用户的客观满意。此模型针对分析对象实时获取、分析用户的访问信息和客观满意情况,保证了较好的时效性和灵活性。
-
关键词
用户满意
用户行为
web访问日志
-
Keywords
user satisfaction
user behavior
web access log
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名ILASII OPAC系统访问日志建模初探
被引量:2
- 7
-
-
作者
王泽贤
李美红
-
机构
广州大学图书馆
-
出处
《图书情报工作》
CSSCI
北大核心
2010年第7期119-122,共4页
-
基金
广州市属高校科技计划项目“广州大学城高校图书馆书目信息效益综合研究”(项目编号:08B066)研究结果之一
-
文摘
详细论述ILASII OPAC系统访问日志建模过程,包括对ILASII OPAC系统功能及其访问日志格式的分析,维度模型及数据库的设计以及如何实现数据引入及数据分析,并对ILASII OPAC系统访问日志建模的应用实例进行介绍。
-
关键词
web访问日志
数据建模
数据挖掘
ILASⅡ
OPAC
-
Keywords
web Access Log data modeling data mining ILASII OPAC
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
G250.7
[文化科学—图书馆学]
-