期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
Web日志挖掘预处理中的用户识别技术 被引量:21
1
作者 吴强 梁继民 杨万海 《计算机科学》 CSCD 北大核心 2002年第4期64-66,共3页
1引言 互联网技术和应用的迅速发展使得可以从因特网获取的信息量日益剧增,因此迫切需要一种新的技术从这些信息中快速、及时地发现有用的知识,提高信息的利用率.作为数据挖掘技术[1]研究的一个重要领域,Web日志挖掘(Web L0gMining)是... 1引言 互联网技术和应用的迅速发展使得可以从因特网获取的信息量日益剧增,因此迫切需要一种新的技术从这些信息中快速、及时地发现有用的知识,提高信息的利用率.作为数据挖掘技术[1]研究的一个重要领域,Web日志挖掘(Web L0gMining)是从服务器日志文件内大量的用户访问记录中抽取有用信息的过程.通过对Web日志的分析,可以构造出用户的行为模式,对于分析改进网络性能、优化网站的设计和拓扑结构以及改善企业的市场营销决策等会有极大的帮助[2,3]. 展开更多
关键词 因特网 服务器 web 日志挖掘预处理 用户识别
在线阅读 下载PDF
Web日志挖掘中的数据预处理技术 被引量:22
2
作者 李燕 冯博琴 鲁晓锋 《计算机工程》 CAS CSCD 北大核心 2009年第22期44-46,49,共4页
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中... 数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。 展开更多
关键词 web日志挖掘 数据预处理 用户会话识别 路径补充
在线阅读 下载PDF
Web访问挖掘预处理的用户识别算法 被引量:5
3
作者 李煊 庄镇泉 《计算机工程与应用》 CSCD 北大核心 2002年第7期173-176,共4页
Web访问挖掘是目前网上智能信息检索和电子商务的主要研究课题之一。该文主要对Web挖掘技术中的预处理过程进行了研究,着重分析了其中的用户识别方法,并给出了一个用户识别的通用算法。
关键词 预处理 用户识别算法 数据挖掘 数据库 web 数据格式
在线阅读 下载PDF
基于用户访问树的Web日志挖掘数据预处理 被引量:8
4
作者 刘加伶 范军 《计算机科学》 CSCD 北大核心 2009年第9期154-156,210,共4页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果。提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以... 在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果。提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理。 展开更多
关键词 web日志挖掘 数据预处理 用户识别 事务识别
在线阅读 下载PDF
Web访问挖掘的预处理技术的研究 被引量:19
5
作者 熊忠阳 周亚峰 《计算机技术与发展》 2007年第8期11-14,18,共5页
Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。对数据预处理的各个环节进行研究,并介绍各个环节中的一些特殊处理方法,根据对Web服务期日志数据格式的分析,对会话概念进... Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。对数据预处理的各个环节进行研究,并介绍各个环节中的一些特殊处理方法,根据对Web服务期日志数据格式的分析,对会话概念进行了形式化描述,然后在分析目前会话构造算法的基础上,提出了基于时间和引用的启发式方法来构造会话。 展开更多
关键词 web挖掘 web日志挖掘 数据预处理 用户会话 会话识别
在线阅读 下载PDF
Web日志挖掘数据预处理研究 被引量:6
6
作者 何波 涂飞 程勇军 《微电子学与计算机》 CSCD 北大核心 2011年第4期111-114,共4页
数据预处理在Web日志挖掘过程中起着至关重要的作用.论文分析了Web日志挖掘数据预处理的主要步骤,设计了用户识别、访问操作识别和路径完善三个步骤的关键算法.实验结果表明,设计的关键算法是有效的.
关键词 数据预处理 web日志挖掘 路径完善 用户识别
在线阅读 下载PDF
Web挖掘中的用户识别与虹膜识别技术 被引量:2
7
作者 王彤 何丕廉 《计算机工程》 CAS CSCD 北大核心 2008年第6期182-184,共3页
提出引入生物信息技术解决Web挖掘中的用户识别问题的设想及基于隐马尔科夫模型的虹膜识别方法,该方法仅需要虹膜的方向域作为输入参数,对虹膜图像的噪声与扭曲并不敏感,从而使该方法具有鲁棒性的特点。通过准确识别用户,克服了现有Web... 提出引入生物信息技术解决Web挖掘中的用户识别问题的设想及基于隐马尔科夫模型的虹膜识别方法,该方法仅需要虹膜的方向域作为输入参数,对虹膜图像的噪声与扭曲并不敏感,从而使该方法具有鲁棒性的特点。通过准确识别用户,克服了现有Web体系无状态的缺陷,可以实现对Web日志数据按"用户维"进行切片,使挖掘出的结果能够满足对用户个性化使用的需求。 展开更多
关键词 隐马尔科夫模型 虹膜识别 用户识别 web挖掘
在线阅读 下载PDF
Web日志数据挖掘中数据预处理模型的研究与建立 被引量:9
8
作者 赵莹莹 韩元杰 《现代电子技术》 2007年第4期103-105,共3页
数据的质量直的好坏接关系到数据挖掘的结果,因此数据预处理是Web日志数据挖掘首要的步骤,基于前期提出的几种数据预处理方法,提出了通用的Web日志挖掘的数据预处理模型,将Web日志数据的预处理分为5个步骤:数据清理、用户标识、会话标... 数据的质量直的好坏接关系到数据挖掘的结果,因此数据预处理是Web日志数据挖掘首要的步骤,基于前期提出的几种数据预处理方法,提出了通用的Web日志挖掘的数据预处理模型,将Web日志数据的预处理分为5个步骤:数据清理、用户标识、会话标识、路径补充和格式化,并结合旅游网站进行了实例验证。证明该数据预处理模型是完全可行,并且具有良好的通用性和可扩展性。 展开更多
关键词 web日志挖掘 数据挖掘 数据预处理 用户标识 会话标识
在线阅读 下载PDF
Web日志挖掘数据预处理优化 被引量:4
9
作者 周爱武 肖云 封军 《计算机技术与发展》 2011年第1期42-45,共4页
在web日志挖掘中,数据预处理技术是各项工作的基础,此项内容将直接影响到后面的各个阶段,因此,也就显得至关重要。在已有的预处理方法基础上,选用了一种建立用户访问树的方法对用户进行识别,并且可以在缺乏网站拓扑结构的情况下对日志... 在web日志挖掘中,数据预处理技术是各项工作的基础,此项内容将直接影响到后面的各个阶段,因此,也就显得至关重要。在已有的预处理方法基础上,选用了一种建立用户访问树的方法对用户进行识别,并且可以在缺乏网站拓扑结构的情况下对日志进行处理。提出了一种改进的事务处理方法,这可以在不额外增加步骤的基础上,能直接去除无用的事务,从而减少预处理结果对数据挖掘的影响,使得到的事务能更好地应用到模式分析当中,大大增强了后期挖掘的正确性。 展开更多
关键词 数据预处理 web日志 用户识别 事务识别
在线阅读 下载PDF
Web日志挖掘中的用户识别算法 被引量:11
10
作者 肖慧 王立华 《计算机系统应用》 2011年第5期223-226,共4页
介绍了现有的用户识别算法,针对用户识别目前存在的问题提出了IASR(IP,Agent,Session and Referrer)用户识别算法。该算法采用重写URL的用户跟踪技术,引入会话(Session)来识别用户,能够高效准确地识别访问同一代理服务器的不同用户,很... 介绍了现有的用户识别算法,针对用户识别目前存在的问题提出了IASR(IP,Agent,Session and Referrer)用户识别算法。该算法采用重写URL的用户跟踪技术,引入会话(Session)来识别用户,能够高效准确地识别访问同一代理服务器的不同用户,很好地解决同一用户直接从浏览器地址输入URL信息访问站点造成的"多用户问题"。最后,对用户识别算法的发展趋势进行了展望。 展开更多
关键词 用户识别 重写URL 会话机制 web日志挖掘
在线阅读 下载PDF
Web日志挖掘的数据预处理研究 被引量:12
11
作者 方成效 袁可风 《计算机与现代化》 2006年第4期79-81,84,共4页
分析了Web日志挖掘的数据预处理过程,提出了基于日志引用页的用户识别算法,并对其性能进行分析,最后给出了应用实例。
关键词 web日志挖掘 数据预处理 用户识别算法
在线阅读 下载PDF
一种改进的Web日志数据预处理研究 被引量:4
12
作者 孙名松 王艳丽 唐亮 《自动化技术与应用》 2008年第3期23-25,共3页
Web日志中包含大量的冗余信息,这给挖掘带来了不便。数据预处理就是处理这些冗余信息,经过数据净化、用户识别、会话识别、路径补全操作后得到能够用于挖掘的数据。本文详细介绍了预处理过程,同时对传统的会话识别算法加以改进。本文提... Web日志中包含大量的冗余信息,这给挖掘带来了不便。数据预处理就是处理这些冗余信息,经过数据净化、用户识别、会话识别、路径补全操作后得到能够用于挖掘的数据。本文详细介绍了预处理过程,同时对传统的会话识别算法加以改进。本文提到的实际系统是基于SQL语句的,能够显著缩短预处理时间。 展开更多
关键词 web习志挖掘 用户识别 会话识别 路径补全
在线阅读 下载PDF
Web日志挖掘的预处理过程及算法 被引量:5
13
作者 靳风荣 郑雪峰 《微型电脑应用》 2004年第6期44-45,55,共3页
随着WWW的广泛应用和Web技术的发展,数据挖掘进入一个崭新阶段。本文详细介绍了Web日志挖掘的预处理过程,通过实例分析了预处理方法,并给出了预处理过程中用户识别的算法实现。
关键词 web日志挖掘 预处理 算法 数据挖掘 数据格式 数据库
在线阅读 下载PDF
Web使用挖掘中的数据预处理算法研究 被引量:2
14
作者 张慧颖 梁伟 《微型电脑应用》 2007年第8期45-48,6,共4页
数据预处理是Web使用挖掘的一个关键环节,数据预处理的结果直接影响到后续步骤,如事务识别、路径分析、关联规则挖掘和序列模式挖掘的效果。提出了一种精确识别用户和会话的数据预处理算法(USIA),并且用实验证明它是高效的。
关键词 web使用挖掘 数据预处理 用户识别 会话识别
在线阅读 下载PDF
Web日志挖掘预处理中复杂问题的解决方法 被引量:2
15
作者 徐志玮 《现代情报》 北大核心 2008年第6期79-81,共3页
随着网络的日益普及和信息技术的进步,Web日志挖掘的数据收集和原始数据处理工作变得越来越复杂,使得预处理技术也要进行相应的提高。本文通过对预处理中出现的复杂问题,进行了详细的分析,并列出了目前比较成熟的算法。
关键词 web日志挖掘 预处理 数据收集 数据清洗 用户/会话识别 最佳事务识别
在线阅读 下载PDF
基于URL语义分析的Web用户会话识别方法 被引量:1
16
作者 朱志国 《大连理工大学学报》 EI CAS CSCD 北大核心 2011年第3期440-446,共7页
由于现有基于时间和引用的经典会话识别方法在复杂Web使用模式挖掘中存在局限性,提出了一个基于URL语义分析的用户会话识别新方法.这个方法借助Web目录服务,将Web日志中的每一条URL记录赋予一定的语义信息,并给出一些测度指标对URL之间... 由于现有基于时间和引用的经典会话识别方法在复杂Web使用模式挖掘中存在局限性,提出了一个基于URL语义分析的用户会话识别新方法.这个方法借助Web目录服务,将Web日志中的每一条URL记录赋予一定的语义信息,并给出一些测度指标对URL之间的语义相似度进行评价.对静态和流动两类Web日志情况进行分析,分别给出了语义奇异值鉴别方法SOAs和SOAd对用户会话进行切分识别.最后对提出的方法与现有经典方法进行了比较实验与分析,结果表明会话识别的精确率和召回率有所提高. 展开更多
关键词 数据挖掘 web使用挖掘 数据预处理 用户会话识别
在线阅读 下载PDF
Web日志挖掘中预处理过程的具体研究 被引量:2
17
作者 毕永成 《现代电子技术》 2010年第18期97-100,共4页
Web日志的数据预处理是Web日志挖掘过程中基础而关键的一步,对之后的模式识别和模式分析有着很大的影响。为了达到有效处理数据的目的,针对此预处理过程中的5个步骤逐一进行分析,并在事务识别这一步骤中,比较了常用的两种算法。最后,基... Web日志的数据预处理是Web日志挖掘过程中基础而关键的一步,对之后的模式识别和模式分析有着很大的影响。为了达到有效处理数据的目的,针对此预处理过程中的5个步骤逐一进行分析,并在事务识别这一步骤中,比较了常用的两种算法。最后,基于这些算法思想,在Windows平台下,采用Java语言实现了Web日志预处理。实验结果表明是有效的。 展开更多
关键词 数据预处理 web挖掘 用户识别 路径补充
在线阅读 下载PDF
Web日志挖掘的用户识别算法研究 被引量:5
18
作者 吴荣 《微型电脑应用》 2007年第9期61-62,73,共2页
Web日志挖掘是将数据挖掘技术应用到Web服务器的日志中,发现Web用户的行为模式,以便进一步改善网站结构或为用户提供个性化的服务。文中探讨了Web日志挖掘中的用户识别算法,提出了一种多重约束条件的用户识别算法。
关键词 web日志挖掘 数据预处理 用户识别
在线阅读 下载PDF
Web日志挖掘中数据预处理技术的研究 被引量:2
19
作者 秦文胜 《广东轻工职业技术学院学报》 2008年第3期9-12,共4页
Web日志挖掘是利用数据挖掘技术挖掘和分析网络日志,并获取网站使用过程中的有价值的信息和模式的过程。预处理是Web日志挖掘的第一步,也是非常关键的一步,预处理的结果决定了挖掘的效率和质量。本文主要阐述了预处理的一般过程,并针对... Web日志挖掘是利用数据挖掘技术挖掘和分析网络日志,并获取网站使用过程中的有价值的信息和模式的过程。预处理是Web日志挖掘的第一步,也是非常关键的一步,预处理的结果决定了挖掘的效率和质量。本文主要阐述了预处理的一般过程,并针对目前国内外常用的一些预处理技术进行了探讨和分析。 展开更多
关键词 web日志挖掘 数据预处理 用户识别 会话识别
在线阅读 下载PDF
Web使用挖掘日志预处理算法设计 被引量:1
20
作者 孙金华 谢彦麒 《现代计算机》 2009年第8期7-10,共4页
数据预处理是整个Web使用挖掘过程的基础和实施有效挖掘算法的前提,在Web使用挖掘中起着重要的作用。论述数据预处理在Web使用挖掘中的重要性,详细分析Web使用挖掘数据预处理过程,在数据预处理的每个阶段给出一些规则并针对这些规则设... 数据预处理是整个Web使用挖掘过程的基础和实施有效挖掘算法的前提,在Web使用挖掘中起着重要的作用。论述数据预处理在Web使用挖掘中的重要性,详细分析Web使用挖掘数据预处理过程,在数据预处理的每个阶段给出一些规则并针对这些规则设计相应的预处理算法。 展开更多
关键词 web日志 web使用挖掘 数据预处理 用户识别
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部