期刊文献+

第三代搜索引擎与天网二期 被引量:18

The 3^(rd) Generation Search Engine and WebGather Version 2.0
在线阅读 下载PDF
导出
摘要 论述了三代搜索引擎的发展 ,着重介绍了第三代搜索引擎的体系结构 ,详细讨论了该搜索引擎的几个核心技术———大规模搜集技术、超链分析技术和用户行为分析技术。介绍了作者参与研发的第三代搜索引擎———“天网”的研究进展 。 With the rapid growing of WWW,significant progress has been made in search engine research area.The evolvement of search engine and the system architecture for the 3 rd generation are reviewed.More emphasis will be given on some core technologies related to search engines of the 3 rd generation.For example,the massive and efficient web\|crawling technology,the method of hyper\|link analysis,and the user behavior analyzing technology will be described in detail.In addition,it is also presented the recent research progress of WebGather,which is a typical search engine of 3 rd generation.Several research hotspots for future search engine systems are pointed out in the conclusion.
出处 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第5期734-740,共7页 Acta Scientiarum Naturalium Universitatis Pekinensis
基金 国家"九五"重点科技攻关项目 (96 743 0 1 0 5 0 1) 国家"973"支持项目(G19990 32 70 6 )
关键词 WWW 搜索引擎 信息检索 超链分析 用户行为分析 大规模搜集技术 体系结构 World\|wide Web search engine information retrieval hyper\|link analysis user behavior analyzing
  • 相关文献

参考文献3

二级参考文献6

  • 1[1]Narayanan Shivakumar,et al.Finding near-replicas of documents on the web[DB/OL].http://dbpubs.stanford.edu/pub/1998-31.
  • 2[2]J.Liu,M.Lei,J.Wang,and B.Chen.Digging for gold on the web:Experience with the WebGather[A].Proc.of the 4th Inter.Conf.on High Performance Computing in the Asia-Pacific Region[C],Beijing,P.R.China,May 2000:751-755.
  • 3[3]U.Manber.Finding similar files in a large file system[R].Technical Report TR 93-33,University of Arizona,Tuscon,Arizona,October 1993.
  • 4周利民,软件学报,1998年,9卷,增刊,504页
  • 5He J,Proc of Text Retrieval Conference.National Institute of Standardsand Technology,,1996年,191页
  • 6黄萱菁,吴立德.基于向量空间模型的文档分类系统[J].模式识别与人工智能,1998,11(2):147-153. 被引量:24

共引文献34

同被引文献115

引证文献18

二级引证文献72

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部