期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于约束的半结构化信息的抽取方法 被引量:2
1
作者 黄豫清 邹涛 《计算机应用与软件》 CSCD 北大核心 2002年第1期53-59,共7页
为了对WEB上不规则的动态信息按照数据库的方式集成和查询,本文采用对象交换模型(OEM)建立WEB上信息模型。为了将页面中各个部分表示为对应的OEM对象,本文(1)设计了半结构化信息的抽取算法;(2)定义了满足约束条件的数据抽取格式,并且设... 为了对WEB上不规则的动态信息按照数据库的方式集成和查询,本文采用对象交换模型(OEM)建立WEB上信息模型。为了将页面中各个部分表示为对应的OEM对象,本文(1)设计了半结构化信息的抽取算法;(2)定义了满足约束条件的数据抽取格式,并且设计了输出正确抽取格式的候选者算法;(3)给出测试结果。该方法可以抽取结构化和半结构化的信息,比现有的抽取方法通用性更强。 展开更多
关键词 数据抽取格式 OEM模型 数据抽取格式约束 半结构化信息 数据
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部