-
题名基于机器学习的Web网络爬虫算法优化研究
- 1
-
-
作者
刘俊培
贾继洋
班岚
迟欢
孙沛叶
-
机构
北京科技大学天津学院
枣庄学院
-
出处
《软件》
2024年第4期4-7,共4页
-
基金
北京科技大学天津学院首批骨干人才培养计划“青年骨干教师”项目资助(TYGG2022J05)
北京科技大学天津学院第二批校级一流课程建设项目“计算机控制技术”资助(YLKC202107)。
-
文摘
随着互联网的不断发展,网络爬虫在信息获取和数据挖掘等领域中的应用越来越广泛。同时在互联网相关应用中,机器学习技术成为一种非常重要的手段,能够完成更加高效和准确的网络爬取。然而,现有的网络爬虫算法还存在着很多问题,比如效率低下、容易被封禁等。因此,本文对现有的网络爬虫算法进行分析和总结,找出其中存在的问题和不足之处,提出一种基于机器学习的网络爬虫算法优化方法,使其更加智能和自适应,以期更好地满足实际应用的需求。
-
关键词
机器学习
web网络爬虫算法
算法优化
-
Keywords
machine learning
web crawler algorithm
algorithm optimization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-