本体驱动的半结构化Web生物数据抽取被引量：5

Ontology-driven Extracting of Semi-structure Web Biological Data

在线阅读下载PDF

导出

摘要提出由本体驱动,并根据文档结构和特征匹配来进行信息定位和信息抽取的方法,并实现了一个用户指导的交互式信息抽取原型系统。有效地解决了信息抽取中涉及的同义词,一词多义等语义问题,以及数据项不完整和排序不固定的问题。 A new approach to extract information from semi-structured Web documents is presented, which locates the data blocks needed in the documents by means of document structure and performs pattern matching based on ontology. Meanwhile, it implements an interactive information extraction prototype system. This approach can efficiently locate the information needed in document, and avoid the semantic problems such as synonyms, polysemy and units missing, etc.

作者成瑜何洁月

机构地区东南大学计算机科学与工程系

出处《计算机工程》 EI CAS CSCD 北大核心 2006年第5期192-194,共3页 Computer Engineering

基金国家"863"计划基金资助项目(2002AA231071)

关键词信息抽取本体资源描述框架/Web本体语言生物数据 Information extraction Ontology RDF（s）/OWL Biological data

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1O'Day V L,Adler A,Kuchinsky A,et al.When Worlds Collide:Molecular Biology as Interdisciplinary Collaboration[C].ECSCW 2001,2001:399-41.
2Vailaya A,Bluvas P,Kincaid R,et al.An Architecture for Biological Information Extraction and Representation[C].In SAC'04,2004.
3Gruber C T R.A Translation Approach to Portable Ontologies[J].Knowledge Acquisition,1993,5(2):199-220.
4Chang Henghsou,Kuo Yauhwang,Hsu Jangpong.An Event-driven and Ontology-based Approach for the Delivery and Information Extraction of E-mail[C].2000 International Symposium on Multimedia Software Engineering,Taipei,Taiwan,2000-12.
5Ashburner M,Ball C A,Blake J A,et al.Gene Ontology:Tool for the Unification of Biology[C].The Gene Ontology Consortium,Nature Genetics,Nat Genet,2000.

同被引文献56

1赵作鹏,尹志民,王潜平,许新征,江海峰.一种改进的编辑距离算法及其在数据处理中的应用[J].计算机应用,2009,29(2):424-426. 被引量：51
2马峻.一种从线性概念图中自动抽取本体概念的算法[J].计算机工程与应用,2004,40(23):161-164. 被引量：2
3胡东东,孟小峰.一种基于树结构的Web数据自动抽取方法[J].计算机研究与发展,2004,41(10):1607-1613. 被引量：21
4黄伟,金远平.形式概念分析在本体构建中的应用[J].微机发展,2005,15(2):28-31. 被引量：10
5田春虎.国内语义Web研究综述[J].情报学报,2005,24(2):243-249. 被引量：37
6董慧,余传明.中文本体的自动获取与评估算法分析[J].情报理论与实践,2005,28(4):415-418. 被引量：12
7薛亮,冯博琴,管涛.网络跨库检索中基于Ontology的数据抽取与合并[J].小型微型计算机系统,2005,26(10):1807-1809. 被引量：2
8许文,都云程,李渝勤,施水才.一种通用HTML网页主题信息提取方法[J].现代图书情报技术,2007(1):40-43. 被引量：11
9刘迁,焦慧,贾惠波.信息抽取技术的发展现状及构建方法的研究[J].计算机应用研究,2007,24(7):6-9. 被引量：41
10Lim S ,Ng Y. An automated approach for retrieving hierarchical data from HTML tables[A]. Missouri. In proceedings of the Eighth International Conferenee on Information and Knowledgd management[C]. Kansas City: Missouri, 1999 : 466--474.

引证文献5

1刘勇军,聂规划.多信息源下本体自动抽取的实现[J].计算机应用研究,2007,24(11):183-184. 被引量：1
2袁鸿雁.基于本体的HTML表格识别技术的研究[J].长春工程学院学报（自然科学版）,2010,11(1):108-110.
3袁鸿雁.基于本体的Web表格信息抽取技术的研究[J].青岛大学学报（自然科学版）,2010,23(2):47-51. 被引量：3
4刘荣辉,郑建国,王翔.采用最小DFS的Deep Web结构化数据抽取[J].图书情报工作,2010,54(14):126-130.
5魏颖,范兆军,李天宪,阎保平.生物本体的研究与应用概况[J].科研信息化技术与应用,2013,4(3):16-22. 被引量：1

二级引证文献5

1唐颖峰,周肆清.一种基于数据表元组的原始本体抽取方法[J].计算机系统应用,2009,18(2):125-128.
2吕抒真,范兆军,李天宪,阎保平.我国重要自然宿主及媒介昆虫病毒性病原调查本体的构建与应用[J].科研信息化技术与应用,2014,5(4):53-61. 被引量：1
3梁天恺,苏新铎,黄宇恒,徐天适,张华俊,曾碧.智能化表格识别技术综述[J].计算机工程与应用,2023,59(12):62-76. 被引量：2
4陈雨,蒋三新.基于改进结构与位置对齐网络的表结构识别法[J].国外电子测量技术,2023,42(12):57-62. 被引量：2
5李志义,沈之锐.基于重复模式识别的网页信息抽取研究[J].情报科学,2019,37(3):88-92. 被引量：6

1那罡,石菲,董丽凤,边凯.科技创新ON之路[J].中国计算机用户,2007(13):47-53.
2陈振.基于数字图象的交互式信息隐藏技术[J].福建电脑,2009,25(12):21-22.
3王志超,张磊.具有用户特征约束的多关系聚类[J].计算机工程与应用,2011,47(23):124-129.
4胡境轩.刍议网页中的交互式信息可视化设计[J].艺术教育,2015(8):300-300. 被引量：2
5何莎莎.交互式信息迫在眉睫[J].科技创业,2011(1):42-44.
6秦学礼,邓松如.WEB应用的发展及研究方向[J].数字化工,2004(11):6-8. 被引量：4
7陈建忠,刘志华,黄元生,王洪涛.电路图交互式信息系统设计与实现[J].微计算机信息,2008,24(4):255-256. 被引量：1
8O.Ryan Tabibian,Robert P.Lipschutz,刘丰.基于Windows NT的WEB服务器 WEB大步向前[J].个人电脑,1996,0(8):129-131.
9路学新.Internet网上交互式信息交流的实现[J].计算机与现代化,1997(4):52-55.
10李晓东.Macintosh的多媒介交互式信息传递方式[J].计算机世界月刊,1991(10):74-75.

计算机工程

2006年第5期

浏览历史

内容加载中请稍等...

本体驱动的半结构化Web生物数据抽取被引量：5

参考文献5

同被引文献56

引证文献5

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

本体驱动的半结构化Web生物数据抽取 被引量：5

参考文献5

同被引文献56

引证文献5

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

本体驱动的半结构化Web生物数据抽取被引量：5