期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一个基于语义分析的倾向性文档过滤系统 被引量:7
1
作者 江宝林 刘永丹 +2 位作者 金峰 葛家翔 胡运发 《计算机应用与软件》 CSCD 北大核心 2005年第1期10-11,139,共3页
目前的过滤系统大都是基于关键词的 ,这类系统适用于主题性过滤 ,而对倾向性过滤效果不好。本文提出一种适用于倾向性文档过滤的系统 ,通过语义分析 ,有效地识别和过滤倾向性文本信息。
关键词 倾向性 主题性 文档过滤 关键词 语义分析 文本信息 适用 过滤系统 识别
在线阅读 下载PDF
网络竞争情报采集的文档过滤与净化 被引量:3
2
作者 韩毅 《情报理论与实践》 CSSCI 北大核心 2006年第6期761-763,共3页
网络竞争情报的异构、分布等特性要求必须对之进行相应的过滤与净化。在区别过滤净化和信息检索差异的基础上,给出了网络竞争情报采集系统的过滤与净化总体框架,并阐述了其作用机制,指出要有效地实现过滤与净化操作,必须根据系统的需求... 网络竞争情报的异构、分布等特性要求必须对之进行相应的过滤与净化。在区别过滤净化和信息检索差异的基础上,给出了网络竞争情报采集系统的过滤与净化总体框架,并阐述了其作用机制,指出要有效地实现过滤与净化操作,必须根据系统的需求解决规则学习器与过滤净化器的智能化设计。 展开更多
关键词 网络竞争情报 情报采集 文档过滤 文档净化 规则学习器
在线阅读 下载PDF
XML文档过滤算法YFilter的一种改进技术 被引量:1
3
作者 苏明柿 张守志 《计算机工程》 EI CAS CSCD 北大核心 2005年第21期63-65,共3页
采用索引技术,对输入的XML文档建立一个双索引结构来改进YFilter算法,优化XML文档过滤性能。藉助索引结构,该算法超前搜索元素结点在文档中的结构信息,预先排除不能保证得到任何匹配结果的元素结点,以避免大量不必要的查询处理。实验结... 采用索引技术,对输入的XML文档建立一个双索引结构来改进YFilter算法,优化XML文档过滤性能。藉助索引结构,该算法超前搜索元素结点在文档中的结构信息,预先排除不能保证得到任何匹配结果的元素结点,以避免大量不必要的查询处理。实验结果显示,当输入的XML文档较大时,该算法有较好的过滤性能。 展开更多
关键词 XML 文档过滤 索引结构
在线阅读 下载PDF
基于Ontology的文档过滤研究
4
作者 房艳焱 余锦凤 《图书情报工作》 CSSCI 北大核心 2006年第1期76-79,共4页
区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用... 区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用,重点阐述公共本体、用户本体和文档本体的构建方法以及实施过程中涉及的技术体系;最后指出今后的努力方向。 展开更多
关键词 文档过滤 电子文档过滤 ONTOLOGY 本体构建 个性化服务
原文传递
基于互信息和余弦相似度的维吾尔文不良文档信息过滤方案 被引量:3
5
作者 赵旭东 亚森.艾则孜 《电子设计工程》 2016年第16期109-112,共4页
针对网页中的维吾尔文不良文档信息的过滤问题,提出一种基于互信息和余弦相似度的不良文档信息过滤方案。首先,对输入文档进行预处理,过滤掉无用单词。然后,利用文档频率(DF)和互信息(MI)相结合,从文档中提取出高区分度的特征向量。最后... 针对网页中的维吾尔文不良文档信息的过滤问题,提出一种基于互信息和余弦相似度的不良文档信息过滤方案。首先,对输入文档进行预处理,过滤掉无用单词。然后,利用文档频率(DF)和互信息(MI)相结合,从文档中提取出高区分度的特征向量。最后,利用TF-IDF方法对特征进行加权,并计算加权特征向量与分类模板中的各类加权特征向量之间的余弦相似度,来分类文档并过滤掉不良文档信息。实验结果表明,该方案能够有效过滤不良维吾尔文文档,正确过滤率达到了83.5%。 展开更多
关键词 维吾尔文 不良文档过滤 互信息 余弦相似度 TF—IDF
在线阅读 下载PDF
基于词频统计的个性化信息过滤技术 被引量:12
6
作者 张国印 陈先 皮鹏 《哈尔滨工程大学学报》 EI CAS CSCD 2003年第1期63-67,共5页
对Internet信息进行过滤,筛选出与用户兴趣最相符的文档,是智能搜索引擎要解决的一个重要问题.本文在介绍搜索引擎基本原理的基础上,提出了一种文档学习和用户个性词典构建的实现方法,其中包括内码转换、分词、摘词处理、用户个性词典... 对Internet信息进行过滤,筛选出与用户兴趣最相符的文档,是智能搜索引擎要解决的一个重要问题.本文在介绍搜索引擎基本原理的基础上,提出了一种文档学习和用户个性词典构建的实现方法,其中包括内码转换、分词、摘词处理、用户个性词典的构建及词条权值调整等环节.然后提出了一种基于词频统计的个性化文档过滤算法,该算法对传统的向量空间模型法做了改进,使之能够更好地计算文档与用户个性词典之间的相关度,根据用户的兴趣爱好对文档进行相关度的过滤、排序,并给出了实验数据.实验结果表明该方法较好地解决了智能搜索引擎中Internet信息过滤、排序的问题. 展开更多
关键词 搜索引擎 文档过滤 向量空间模型法 词频统计 个性词典
在线阅读 下载PDF
基于文档信息空间模型的词元权重调整
7
作者 吴科 石冰 《计算机工程与应用》 CSCD 北大核心 2004年第9期191-193,共3页
在web文档信息检索中,文档分类、文档过滤的质量一直是影响用户查询结果的关键。这篇论文将通过分析一些典型的权重函数的构造,提出一个基于文档信息空间的权重函数来计算调整文档中词元的权重,使文档的分类和过滤效率更高。
关键词 信息检索 文档分类 文档过滤 权重函数
在线阅读 下载PDF
智能信息检索中个性化模式的表示形式研究 被引量:9
8
作者 田萱 孟祥光 刘希玉 《情报学报》 CSSCI 北大核心 2004年第1期21-26,共6页
智能信息检索中,个性化模式的描述和更新决定了文档过滤的效率。本文根据Huffman树的特点,提出基于Huffman树形式组织用户个性化模式并给出其相应的文档过滤算法。与其他他同的个性化模式过滤算法的性能比较而言,其具有占用空间少,... 智能信息检索中,个性化模式的描述和更新决定了文档过滤的效率。本文根据Huffman树的特点,提出基于Huffman树形式组织用户个性化模式并给出其相应的文档过滤算法。与其他他同的个性化模式过滤算法的性能比较而言,其具有占用空间少,过滤速度快的优点。 展开更多
关键词 智能信息检索 个性化检索 文档过滤 HUFFMAN树 数据结构
在线阅读 下载PDF
DTD上的YFilter数据流查询优化算法
9
作者 蔡俊仁 俞建家 《计算机工程与设计》 CSCD 北大核心 2012年第2期811-814,共4页
为了提高YFilter的查询处理效率,在已有的研究工作和YFilter的过滤技术上,定义了唯一父亲约束的完整性约束,并结合DTD的结构和约束信息优化XPath表达式,这种优化算法是在系统运行前进行的预处理,所以有效地降低了YFilter系统的查询时间... 为了提高YFilter的查询处理效率,在已有的研究工作和YFilter的过滤技术上,定义了唯一父亲约束的完整性约束,并结合DTD的结构和约束信息优化XPath表达式,这种优化算法是在系统运行前进行的预处理,所以有效地降低了YFilter系统的查询时间和空间复杂度。实验结果表明,优化后查询表达式之间相同的前缀增加了,减少了有限自动机的状态数目,并且有效地加快了YFilter的查询速度。 展开更多
关键词 XML文档 XML路径语言 文档过滤 查询优化 文档类型定义
在线阅读 下载PDF
基于因特网的自动化和智能化信息搜集技术 被引量:4
10
作者 刘素兰 《情报理论与实践》 CSSCI 北大核心 2001年第4期311-312,共2页
In order to make the information acquisition work of libraries more effectively,this paper proposes an automatic intelligent system based on Internet and explores the concepts and principles of meta search and documen... In order to make the information acquisition work of libraries more effectively,this paper proposes an automatic intelligent system based on Internet and explores the concepts and principles of meta search and document classification technologies. 展开更多
关键词 因特网 自动化 智能化 信息搜集技术 数字化图书馆 多元搜索技术 文档分类过滤技术
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部