期刊文献+

基于本体论的文本特征提取 被引量:11

The feature extraction of Chinese text based on Ontology
在线阅读 下载PDF
导出
摘要 文章提出了一种基于本体论的文本特征提取方法。通过构建文本结构树来充分利用文本结构分析得到的信息 ,利用本体对领域知识的描述信息来分析特征词之间的关系 ,而且在特征权值的计算中提出了特征词统领长度的概念和计算方法。实验数据表明该方法提高了文本特征提取的准确性。 The paper proposed a new method of the feature extraction of Chinese text based on Ontology. The method can make full use of the structure information by constructing the text structure tree. The description about on domain knowledge make it available to analyze the relation of the key words by the Ontology. The paper also present the weight formula, and put forward a new concept named presidential length and its formula. The experimental results display the improvement of the veracity of feature extraction.
作者 唐晓文
出处 《电脑与信息技术》 2005年第1期36-38,62,共4页 Computer and Information Technology
关键词 领域知识 文本结构分析 特征词 权值 本体论 描述 信息 文本特征 构建 实验数据 Ontology feature of Chinese text text structure presidential length
  • 相关文献

参考文献8

二级参考文献17

  • 1史继红,赖茂生.汉语自动标引加权方法试验研究[J].现代图书情报技术,1994(3):18-21. 被引量:1
  • 2靳从,樊春丽,杨静宇.主题词自动标引中的知识处理方法[J].情报理论与实践,1996,19(2):30-33. 被引量:3
  • 3[1]Guarino N. Formal Ontology and Information System. www.ladseb.pd.cnr.it/infor/Ontology/Papers/FOIS98.pdf,2002.
  • 4[2]IEEE Working Group P1600.1.IEEE Standard Upper Ontology(draft proposal). http://ontology.teknowledge.com/#introduction,2002.
  • 5[3]Chandrasekaran B,Josephson JR. What are Ontologies,and Why do We Need Them? [J]. IEEE Intelligent Systems,1999,14(1):20-26.
  • 6[4]Niles I,Pease A. Origins of the IEEE Standard Upper Ontology. http://reliant.teknowledge.com/HPKB/about/Pease.html,2002.
  • 7[5]Gruber T. Towards Principles for the Design of Ontologies Used for Knowledge Sharing. http://ksl.stanford.edu/pub/KSL_Reports/KSL-93-04.tex.gz,2002.
  • 8[6]Gruber T. A Translation Approach to Portable Ontology Specificatons. http://ksl.stanford.edu/pub/KSL_Reports/KSL-92-71.tex.gz,2002.
  • 9[7]Gruber T. The Role of Common Ontology in Achieving Sharable,Resuable Knowledge. http://ksl.stanford.edu/pub/KSL_Reports/KSL-91-10.tex.gz,2002.
  • 10刘开瑛,计算机期刊关键词标引统计分析技术报告,1996年

共引文献104

同被引文献92

引证文献11

二级引证文献52

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部