期刊文献+

简析搜索引擎中网络爬虫的搜索策略 被引量:15

Analysis on Web Crawler's Searching Strategies
在线阅读 下载PDF
导出
摘要 随着网络信息的迅速发展,搜索引擎已成为人们获取有用信息必不可少的工具.以何种策略有效地访问网络资源是专业搜索引擎中网络爬虫研究的主要问题.本文对搜索引擎中网络爬虫的搜索策略进行简要分析,比较各种搜索算法的优缺点,总结提高搜索效率的因素,使人们对网络爬虫的搜索算法有个大概了解,以及对新一代搜索引擎的期望,以便更快捷获取自己需要的信息. In recent years, search engine turns more and more important for us to get useful information . How can Web crawler visit the web efficiently in the domain of Topic-Specific Search Engine has become the main problem. This paper analysizes web crawler's searching strategies, compares their advantage and disadvantage. This paper wants to make people know the web crawler's strategy and long for the new searching engine so as to get information quickly which they need.
作者 刘世涛
出处 《阜阳师范学院学报(自然科学版)》 2006年第3期59-62,共4页 Journal of Fuyang Normal University(Natural Science)
关键词 网络爬虫 搜索引擎 策略 web crawler search engine strategy
  • 相关文献

参考文献6

  • 1[2]Michelangelo Diligenti,Frans Coetzee,Steve Lawrence,et al.Focused Crawling using Context Graphs[J],Intemational Conference on Very Large Databases.2002,(26):527-534.
  • 2黄萱菁,吴立德.独立于语种的文本分类方法[J].2000 International Conference on Multilingual Information Processing,2000,:37-43.
  • 3鲁松,白硕.文本中词语权重计算方法的改进[J].2000 International Conference on Multilingual Information Proeessing,2000,:31-36.
  • 4[5]Google 的 PageRank 算法[EB/OL].[2003-12-18].http://blog.xdanger.com/archives/2003/12/18/000046.html.
  • 5[6]朱炜,王超,李俊,等.WEB超链分析算法纵纵览[EB/OL].[2005-08-02].http://www.tjgan gyuan.com/seo/show-article.asp?id=450.
  • 6叶允明,于水,马范援,宋晖,张岭.分布式Web Crawler的研究:结构、算法和策略[J].电子学报,2002,30(12A):2008-2011. 被引量:23

二级参考文献2

  • 1Allan Heydon,Marc Najork. Mercator: A scalable, extensible Web crawler[J] 1999,World Wide Web(4):219~229
  • 2刘济波,朱培栋.WWW大规模cache技术[J].现代计算机,1998(6):8-10. 被引量:1

共引文献22

同被引文献47

引证文献15

二级引证文献43

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部