摘要
文章提出了一种基于hownet提取出词语的词义,用词语的词义代替传统的词形频率统计方法,并基于词义排歧建立主题语义概念向量空间模型。通过对抽取出的语句进行句子相似度的计算提高文摘精确度,设计实现了一个中文自动文摘系统。
The paper presents a novel approach to Chinese summarization.The novelty lies in extracting the word sense based on hownet,morphology statistical approach is replaced by word sense,and thematic semantic conceptual vector space model that is based on word sense disambiguation is established.An effective automatic Chinese summarization system is developed,by using computation of sentence similarity to improve precision of summarization.
出处
《计算机工程与应用》
CSCD
北大核心
2005年第1期107-110,共4页
Computer Engineering and Applications
基金
国家语言文字应用委员会"十五"应用项目(编号:ZDI105-43B)
湖北省自然科学基金项目(编号:2001ABB012)