期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
自动提取布局结构相似网页的结构化信息 被引量:1
1
作者 赵靖 王侨文 +1 位作者 管马周 单传佳 《安徽科技学院学报》 2010年第6期37-42,共6页
数据库驱动的Web站点根据查询产生的Web页结构布局都是极其相似的;现有的Web提取方法忽视或者忽略了这种相似性,因而在提取效率性能和通用性上都有较大的限制。本文提出一种基于标签树相似度的模板自动学习方法;进而根据模板来提取这类... 数据库驱动的Web站点根据查询产生的Web页结构布局都是极其相似的;现有的Web提取方法忽视或者忽略了这种相似性,因而在提取效率性能和通用性上都有较大的限制。本文提出一种基于标签树相似度的模板自动学习方法;进而根据模板来提取这类网页的数据;并利用Eclipse和开源HTML Parser对算法进行了实现;实验结果表明该算法具有较快的提取速度和较好的准确率。 展开更多
关键词 深层Web 标签树-相似度模型 结构化信息提取
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部