期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于改进倒排表和集合的最频繁项集挖掘算法 被引量:1
1
作者 陈小玉 杨艳燕 +1 位作者 刘克成 朱颢东 《计算机应用研究》 CSCD 北大核心 2012年第6期2135-2137,共3页
最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能。针对当前在最频繁项集挖掘方面的不足,将集合论引入倒排表以对其进行改进,然后以此为基础提出了几个命题和推论,并结合最小支持度阈值动态调... 最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能。针对当前在最频繁项集挖掘方面的不足,将集合论引入倒排表以对其进行改进,然后以此为基础提出了几个命题和推论,并结合最小支持度阈值动态调整策略,提出了一个基于改进的倒排表和集合理论的最频繁项集挖掘算法,最后对所提算法进行验证。实验结果表明,所提算法的规则有效率和时间性能比常用的两个最频繁项集挖掘算法,即NApriori和IntvMatrix算法都好。 展开更多
关键词 最频繁项集 文本关联规则 倒排表 集合理论
在线阅读 下载PDF
基于倒排表的中文全文检索研究 被引量:6
2
作者 杨安生 《情报探索》 2009年第7期77-80,共4页
对全文检索倒排表技术作了较细致的研究,对全文检索的基本原理和技术进行了深入的探讨。对中文分词方法作了重点研究和总结,并对词典分词法中的最大匹配法加以改进,使用C++设计了一个程序,真正实现了最大匹配法。
关键词 全文检索 倒排表 中文分词 词典分词法 N元索引法
在线阅读 下载PDF
基于倒排表与B+树的联合索引技术
3
作者 刘高嵩 万里勇 龙军 《计算机工程》 CAS CSCD 2012年第16期49-51,56,共4页
为提高XML文档的查询效率,提出一种基于倒排表与B+树的联合索引技术。DTD结构索引和内容索引采用倒排表作为索引单位,XML文档索引使用B+树作为索引基本组织。在DTD结构索引的结点编码中设置标识信息,便于确定需要查询的文档。通过建立DT... 为提高XML文档的查询效率,提出一种基于倒排表与B+树的联合索引技术。DTD结构索引和内容索引采用倒排表作为索引单位,XML文档索引使用B+树作为索引基本组织。在DTD结构索引的结点编码中设置标识信息,便于确定需要查询的文档。通过建立DTD结构索引、XML文档索引和内容索引,实现混合型XML文档的查询。理论分析与实验结果表明,该技术具有较小的空间开销和较高的查询效率。 展开更多
关键词 可扩展标记语言文档 编码 倒排表 B+树 索引 查询性能
在线阅读 下载PDF
基于倒排表的数据检索优化系统
4
作者 姚逸涛 彭宇扬 彭自成 《电脑与信息技术》 2008年第2期18-21,共4页
针对通用数据库海量数据检索速度慢的缺点,文章提出了一个数据检索优化系统。该系统通过将海量数据拆分成短语和单词,利用哈稀算法和基数排序算法,将拆分的短语和单词重新组织成词典,并对每个短语和单词建立倒排表,利用该倒排表对通用... 针对通用数据库海量数据检索速度慢的缺点,文章提出了一个数据检索优化系统。该系统通过将海量数据拆分成短语和单词,利用哈稀算法和基数排序算法,将拆分的短语和单词重新组织成词典,并对每个短语和单词建立倒排表,利用该倒排表对通用数据库中的海量数据做索引。使用这种基于倒排表的数据索引能够将数据检索速度降低到毫秒级。 展开更多
关键词 倒排表 分词 数据检索优化 词典
在线阅读 下载PDF
基于倒排表的图书馆参考咨询问答系统的设计与实现
5
作者 柴源 《微型电脑应用》 2021年第9期172-175,共4页
参考咨询是高校图书馆的一项重要工作,为了提高参考咨询问答系统的效率,在分析传统参考咨询问答系统的不足及倒排表的优势的基础上,构建了基于倒排表的图书馆知识问答系统,并以西安航空学院图书馆参考咨询为例,进行了实证研究。
关键词 倒排表 图书馆 参考咨询 问答系统
在线阅读 下载PDF
C#通用倒排表生成算法
6
作者 鄢家奇 《电脑编程技巧与维护》 2012年第21期14-20,26,共8页
通过在Visual Studio 2008中用Visual C#建立静态类和静态方法,将数据倒排算法进行封装,使程序员可以只用一条语句就能轻松自如的实现数据倒排或转置,从而生成倒排表,直接导出至Excel。同时,还展示了C#处理Excel表格和SYBASE数据库的一... 通过在Visual Studio 2008中用Visual C#建立静态类和静态方法,将数据倒排算法进行封装,使程序员可以只用一条语句就能轻松自如的实现数据倒排或转置,从而生成倒排表,直接导出至Excel。同时,还展示了C#处理Excel表格和SYBASE数据库的一般方法。 展开更多
关键词 SYBASE EXCEL C#类 数据库 倒排表
在线阅读 下载PDF
一种基于跳表和等间距偏移值的倒排表快速合并方法 被引量:2
7
作者 鲁娇龙 《数字技术与应用》 2019年第1期50-51,共2页
信息检索旨在通过一系列的计算过程达到处理用户的查询请求,并返回相关的文档列表以满足其信息需求的目的。检索任务依赖于具体的模型,检索系统主要基于布尔、向量空间、概率等模型。本文在传统跳表基础上结合等间距偏移值策略提出了一... 信息检索旨在通过一系列的计算过程达到处理用户的查询请求,并返回相关的文档列表以满足其信息需求的目的。检索任务依赖于具体的模型,检索系统主要基于布尔、向量空间、概率等模型。本文在传统跳表基础上结合等间距偏移值策略提出了一种新的倒排表合并方法。这种方法对于倒排表中记录分布较离散的情况具有很好的性能。 展开更多
关键词 布尔检索 倒排记录 集合交集
在线阅读 下载PDF
基于XML文档的倒排索引研究
8
作者 谭新良 蔡代纯 《电脑知识与技术》 2007年第3期1279-1280,共2页
本文分析了评价搜索引擎中索引机制优劣的几个指标,针对XML文档的特点,设计了一个索引模块,给出了一种倒排索引方法。
关键词 XML文档 索引 倒排表
在线阅读 下载PDF
倒排文件的组织与最佳归并分析
9
作者 赵长林 《西南民族学院学报(自然科学版)》 1995年第4期484-488,共5页
对倒排文件的组织与最佳归并进行较系统的分析,提出了倒排文件的存储结构与实现的方法,倒排文件上的算法分析,最佳归并顺序的分析与论证。
关键词 倒排文件 倒排表 最佳归并 程序设计
在线阅读 下载PDF
不确定图上的极大团枚举及高效验证算法
10
作者 赵丹枫 吕闫妍 +2 位作者 张文博 黄冬梅 高峰 《智能系统学报》 CSCD 北大核心 2024年第6期1539-1551,共13页
现有的不确定图中极大团枚举方法“子图划分—枚举—验证”,在处理大规模图时,整体效率不高;当挖掘出的伪极大团数量较多时,验证速率明显下降。因此,提出高效枚举及验证算法(multiple inversion list enumerate uncertain maximal cliqu... 现有的不确定图中极大团枚举方法“子图划分—枚举—验证”,在处理大规模图时,整体效率不高;当挖掘出的伪极大团数量较多时,验证速率明显下降。因此,提出高效枚举及验证算法(multiple inversion list enumerate uncertain maximal cliques,MILEUMC)。在子图划分和枚举前,定义并构造概率阈值(α)不确定图,通过缩小图的规模,提高枚举效率;在“验证”时,提出基于多重倒排表的验证方法,分为去重复和去包含关系2个阶段去除伪极大团,以不同索引构建各个阶段的多重倒排表,根据极大团的属性完成验证,同时动态更新相应的倒排表和映射表,以减小工作量,提高时间效率。最后在多个真实的数据集上比较,结果验证了MILEUMC算法的高效性。该算法更适用于在较为稀疏的图上寻找联系更紧密的极大团。 展开更多
关键词 不确定图 极大团 数据挖掘 枚举算法 验证算法 子图划分 倒排表 映射
在线阅读 下载PDF
全文检索模型综述 被引量:12
11
作者 申展 江宝林 +2 位作者 陈祎 唐磊 胡运发 《计算机科学》 CSCD 北大核心 2004年第5期61-64,共4页
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全... 全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全文检索模型构建中一些关键问题进行了分析。 展开更多
关键词 信息检索 文档数据库 全文检索模型 倒排表 Pat-树 互关联后继树 位图 署名文件
在线阅读 下载PDF
面向网络的全文检索中索引文件的组织 被引量:12
12
作者 颜维龙 盖杰 +1 位作者 武港山 袁春风 《计算机应用研究》 CSCD 北大核心 2002年第11期124-126,146,共4页
为了提高网络中全文检索的效率 ,需要对Web页面中内容进行分析、建立全文索引 ,并对索引的结构进行高效率的组织。讨论了索引的组织结构及其实现方法 ,并分析了不同的组织方法的性能。
关键词 全文检索 正排 倒排表 索引
在线阅读 下载PDF
一种基于XML文档关键字检索的结构索引 被引量:5
13
作者 娄颖 李战怀 +2 位作者 郭文琪 陈群 韩萌 《计算机科学》 CSCD 北大核心 2010年第12期120-124,共5页
XML数据索引对其检索效率有较大的影响。在深入分析现有XML结构索引之后,结合XML文档特点,提出了一种基于关键字检索的结构索引——LSS(Level Structure Summary)。LSS采用了把具有相同标签路径的结点进行合并的策略,具有高效判断结点... XML数据索引对其检索效率有较大的影响。在深入分析现有XML结构索引之后,结合XML文档特点,提出了一种基于关键字检索的结构索引——LSS(Level Structure Summary)。LSS采用了把具有相同标签路径的结点进行合并的策略,具有高效判断结点之间同构异构关系的能力。实现了LSS索引生成算法CSCAN,并在LSS索引的基础上设计了XML关键字检索算法LSSearch。该算法依据LSS索引,将各个关键字的原始倒排表集合分拆成不同类型的子集合,最后在所有子集合上进行查询。实验结果表明,LSS可以帮助减少XML文档中关键字倒排表的规模,提高检索效率。 展开更多
关键词 XML 关键字检索 索引 倒排表
在线阅读 下载PDF
全文索引的研究 被引量:10
14
作者 徐小刚 王俊杰 于玉 《计算机工程》 CAS CSCD 北大核心 2002年第2期101-103,共3页
在倒排表模型的基础上,从加快索引创建速度和改进索引动态结构两个方面着手,提出并实现了一种高效的索引创建算法和相应的索引模型,经过测试,新系统的索引创建速度可以和数据复制速度相提并论。而在空间效率上,也得到了一定程度的提高。
关键词 全文索引 倒排表模型 Pat数组 文本数据库 研究
在线阅读 下载PDF
一种基于可排序视图的RDF模式匹配算法 被引量:2
15
作者 熊政 王金明 +3 位作者 郑海雁 李昆明 徐立臻 崇志宏 《计算机工程与应用》 CSCD 北大核心 2016年第8期62-69,共8页
随着语义网络中数据量的激增,在RDF数据集中高效查询数据已成为一个亟待解决的问题。传统的基于物化视图的RDF模式匹配方法虽然能降低表的自连接操作次数,加快查询模式重写过程,但在视图集中检索模式匹配的视图等价于子图同构这一NP-har... 随着语义网络中数据量的激增,在RDF数据集中高效查询数据已成为一个亟待解决的问题。传统的基于物化视图的RDF模式匹配方法虽然能降低表的自连接操作次数,加快查询模式重写过程,但在视图集中检索模式匹配的视图等价于子图同构这一NP-hard问题。为了减小查询模式重写代价,提高RDF模式匹配过程效率,引入可排序视图概念,设计包含映射发现算法contain及其扩展算法contain+,简化等长度模式间包含映射发现过程,同时保证模式间的匹配代价与输入数据的规模线性相关。此外,提出基于倒排表/Map Reduce检索候选可排序视图的方法,实现RDF模式重写算法rewrite,用以处理不同规模数据集上的模式匹配问题。理论分析及实验证明,基于可排序视图的RDF模式匹配算法能有效地兼顾算法效率及算法可扩展性。 展开更多
关键词 可排序视图 倒排表 MAPREDUCE 模式重写
在线阅读 下载PDF
基于最长公共子序列的人体运动序列检索 被引量:2
16
作者 冯林 李璞 +1 位作者 孙焘 郑虎 《系统仿真学报》 CAS CSCD 北大核心 2009年第22期7164-7167,共4页
在计算机仿真领域,运用重新组合等相关技术,可以对已经捕捉的人体运动数据实现重用,以较低的成本产生新的运动。但是,由于运动库的数据庞大,对其实施有效检索成为一个重要问题。以倒排表数据结构为基础,设计出一套针对人体运动的检索算... 在计算机仿真领域,运用重新组合等相关技术,可以对已经捕捉的人体运动数据实现重用,以较低的成本产生新的运动。但是,由于运动库的数据庞大,对其实施有效检索成为一个重要问题。以倒排表数据结构为基础,设计出一套针对人体运动的检索算法。不同于传统的最长公共子序列(Longest Common Subsequence,LCSS)的度量算法,提出了一种限制最小匹配率ρmin的有限最长公共子序列(Limited-LCSS)算法,并在此基础上针对倒排表的数据结构特点对算法进行了优化,显著的提高了算法的效率。实验表明提出的检索方法具有较好的速度和准确性。 展开更多
关键词 运动捕捉 检索 最长公共序列 倒排表
在线阅读 下载PDF
基于最小支持度阈值动态调整策略的最频繁项集挖掘算法 被引量:1
17
作者 陈超 刘才铭 《兰州理工大学学报》 CAS 北大核心 2012年第4期85-88,共4页
最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能.针对当前在最频繁项集挖掘方面的不足,改进传统的倒排表,并结合最小支持度阈值动态调整策略,提出一个新的基于改进的倒排表和集合理论的最频... 最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能.针对当前在最频繁项集挖掘方面的不足,改进传统的倒排表,并结合最小支持度阈值动态调整策略,提出一个新的基于改进的倒排表和集合理论的最频繁项集挖掘算法.另外,给出几个命题和推论,并把它们用于本文算法以提高性能,最后对所提算法进行实验验证.实验结果表明,该算法的规则有效率和时间性能比常用的两个最频繁项集挖掘算法(NApriori算法,IntvMatrix算法)都好. 展开更多
关键词 频繁项集 关联规则 倒排表 集合理论
在线阅读 下载PDF
一种基于XML的索引查询方法 被引量:1
18
作者 原庆能 唐培和 《广西工学院学报》 CAS 2004年第1期19-22,26,共5页
针对XML文件的特点,提出一种对XML文件建立索引的方法。该方法所采用的数据结构和算法,在充分利用XML文件的标记所隐含的上下文信息提高查询准确率的同时,有较小的索引冗余和较快的查询速度。
关键词 XML 索引查询方法 倒排表 数据结构 查询速度 界面设计
在线阅读 下载PDF
地理社交网中基于范围的星型组查询
19
作者 陈子军 马迎梅 +2 位作者 刘文远 孙德杰 刘永山 《燕山大学学报》 CAS 北大核心 2017年第5期419-427,共9页
针对星型组查询只考虑了用户的位置信息和朋友关系,而没有考虑用户的偏好信息,使得推荐质量不高的问题,本文提出一种基于范围的星型组查询算法(m SG),同时考虑用户的社交关系、文本信息和当前位置信息,在给定范围为用户返回k个得分最高... 针对星型组查询只考虑了用户的位置信息和朋友关系,而没有考虑用户的偏好信息,使得推荐质量不高的问题,本文提出一种基于范围的星型组查询算法(m SG),同时考虑用户的社交关系、文本信息和当前位置信息,在给定范围为用户返回k个得分最高的星型组。为了迅速查找中心点用户,提出带倒排表的网格索引结构。为中心点用户更快速地查找朋友,提出了社交关系和文本信息混合索引结构。最后,通过实验表明,利用所提索引结构减少了查询算法的运行时间。 展开更多
关键词 倒排表 范围查询 星型组查询 地理社交网
在线阅读 下载PDF
关于Top-N最频繁项集挖掘的研究
20
作者 朱颢东 李红婵 《电子科技大学学报》 EI CAS CSCD 北大核心 2010年第5期757-761,773,共6页
最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点。该文分析了当前最频繁项集挖掘方面的不足,改进了传统的倒排表,结合最小支持度阈值动态调整策略,提出了一个新的基于改进的倒排表和集合理论的T... 最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点。该文分析了当前最频繁项集挖掘方面的不足,改进了传统的倒排表,结合最小支持度阈值动态调整策略,提出了一个新的基于改进的倒排表和集合理论的Top-N最频繁项集挖掘算法。同样,给出了几个命题和推论,并把它们用于该文算法以提高性能,实验结果表明,所提算法的规则有效率和时间性能优于NApriori算法和IntvMatrix算法。 展开更多
关键词 关联规则 倒排表 频繁项集 集合理论 支持度
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部