-
题名一种改进的潜在语义检索模型研究
被引量:2
- 1
-
-
作者
陈燕红
刘风华
-
机构
新疆农业大学计算机与信息工程学院
新疆工程学院计算机工程系
-
出处
《计算机技术与发展》
2014年第9期120-124,共5页
-
基金
新疆维吾尔自治区科技攻关项目(200931103)
新疆农业大学校前期资助课题(XJAU201117)
-
文摘
针对传统潜在语义检索模型计算成本大、检索速度慢、不利于应用在大规模农业信息检索领域的缺陷,文中提出一种针对农业主题的改进潜在语义检索模型(ALSI)。该模型先利用全文检索生成农业信息全文倒排索引库,然后利用农业高频词库和潜在语义分析生成的语义索引库,进行语义检索。通过多组实验分析确定了该模型所采用的词条权重计算方法和语义空间维数。最后,通过实验分析对比了改进后的潜在语义检索模型(ALSI)与传统潜在语义检索模型(LSI)的检索效果。结果表明,ALSI的检索效果明显好于LSI,适合应用于较大规模农业信息检索。
-
关键词
农业信息
垂直搜索引擎
潜在语义检索
面向农业的潜在语义检索模型
-
Keywords
agricultural information
vertical search engine
latent semantic indexing
ALSI
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于农业领域本体的语义检索模型
被引量:11
- 2
-
-
作者
陈叶旺
李海波
余金山
-
机构
华侨大学计算机科学与技术学院
-
出处
《华侨大学学报(自然科学版)》
CAS
北大核心
2012年第1期27-32,共6页
-
基金
福建省自然科学基金资助项目(A0810013)
福建省农业科技重大项目(2010N5008)
华侨大学高层次人才科研启动项目(09BS619)
-
文摘
基于农业领域本体和词汇,给出一个针对农业领域的语义检索改进模型.该模型接受用户自然语言输入,通过计算词语与本体知识之间的相关度和相似度,来实现词汇到知识的映射.针对农业领域本体特点,给出相应的语义扩展规则,把检索结果从本体知识扩展到与之相关的资源文档,并对检索结果进行排序.
-
关键词
本体
语义扩展
语义检索模型
农业领域
-
Keywords
ontology
semantic extension
semantic retrieval model
agricultural domain
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名基于双重语义空间的农业信息检索模型研究
被引量:2
- 3
-
-
作者
陈燕红
张太红
冯向萍
白涛
马健
-
机构
新疆农业大学计算机与信息工程学院
-
出处
《新疆农业大学学报》
CAS
2012年第3期253-258,共6页
-
基金
新疆维吾尔自治区科技攻关项目(200931103)
-
文摘
为了提高针对大规模农业信息的语义检索性能,提出一种基于改进的随机索引语义空间和潜在语义空间的农业信息检索模型(IRI&LSA)。利用120万张中文网页和2 000张分为4类的小规模中文农业网页,对IRI&LSA和两种分别基于单向量兰克泽斯算法(LAS2)和半离散矩阵分解算法(SDD)的常用潜在语义检索模型(LSA-LAS2和LSA-SDD)进行了对比实验。结果表明,IRI&LSA检索结果的平均F1值可达83%,明显高于LSA-LAS2(71%)和LSA-SDD(64%);IRI&LSA的检索速度分别是LSA-LAS2和LSA-SDD的3.6倍和4.9倍。研究结果表明,IRI&LSA适合应用于较大规模农业信息检索。
-
关键词
农业信息检索
随机索引
潜在语义分析
IRI&LSA
-
Keywords
agricultural information retrieval
RI&LSA
IRI&LSA
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于潜在语义线性嵌入的三维模型检索方法
被引量:2
- 4
-
-
作者
王新颖
吕天阳
王生生
王钲旋
-
机构
吉林大学计算机科学与技术学院
哈尔滨工程大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2010年第4期761-765,共5页
-
基金
国家自然科学基金项目(60773096
60603030)资助
高等学校博士学科点专项科研基金项目(20060183041)资助
-
文摘
在三维模型检索中,为了保持模型之间的形状相似性,并且考虑保持模型之间的语义关系不变的情况下实现特征的维数缩减,提出一个基于潜在语义分析的非线性降维方法-潜在语义线性嵌入LSLE.该方法通过构建的三维模型语义空间确定数据库中三维模型的语义近邻,并通过改进的局部线性嵌入方法实现数据维数的缩减,对Princeton Shape Benchmark的实验表明,该方法在三维模型的特征降维和检索中都取得了较好的效果.
-
关键词
相关反馈
潜在语义分析
局部线性嵌入
数据维数缩减
三维模型检索
-
Keywords
relevance feedback
LSA
LLE
reducing dimension
3D model retrieval
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于NMF的潜在语义模型在文本检索中的应用
被引量:1
- 5
-
-
作者
黄钢石
张亚非
陆建江
肖江
-
机构
解放军理工大学通信工程学院
解放军理工大学训练部
解放军理工大学理学院
解放军理工大学指挥自动化学院~~
-
出处
《解放军理工大学学报(自然科学版)》
EI
2004年第2期36-39,共4页
-
基金
~~
-
-
关键词
非负矩阵分解
潜在语义模型
信息检索
自然语言处理
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于潜在语义分析的信息检索
被引量:29
- 6
-
-
作者
盖杰
王怡
武港山
-
机构
南京大学计算机科学与技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第2期58-60,共3页
-
基金
国家自然科学基金资助项目(60073030)
国家"863"计划基金资助项目(2001AA110334)
-
文摘
潜在语义分析是一种用于自动实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从中提取出词语的上下文使用含义。文章介绍了基于潜在语义分析的文本信息检索的基本思想、特点以及实现方法 。
-
关键词
潜在语义分析
信息检索
语义
向量空间模型
-
Keywords
Latent semantic analysis
Information retrieval context
semantic
Vector spatial model(VSM)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于潜在语义的双层图像-文本多模态检索语义网络
被引量:6
- 7
-
-
作者
董永亮
柴旭清
-
机构
河南师范大学计算机与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第7期299-303,309,共6页
-
基金
河南省科技厅基金资助项目(142102310524)
河南省教育厅基金资助项目(15A520081
+2 种基金
17A520009
SKL-2016-1992
SKL-2016-1167)
-
文摘
为提高多模态检索中相似性匹配的准确度,同时保持检索结果的可解释性,构建一种双层的多模态语义网络。对每个单模态的数据分别建立一个子语义网络,把子语义网络中的节点聚类成不同的分组。将子语义网络的分组作为节点,依据语义关系建立多模态语义网络,并进一步聚类成不同的分组。在进行信息检索时,按照与构建多模态语义网络相反的顺序即可检索到相关的信息。实验结果表明,与基于哈希索引、低秩矩阵嵌入和深度神经网络的检索方法相比,所提方法具有更高的检索准确性。
-
关键词
多模态
潜在语义
层次模型
聚类算法
跨模态检索
深度神经网络
-
Keywords
multi-modal
latent semantic
hierarchical model
clustering algorithm
cross-modal retrieval
deep neural network
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名潜在语义标引在中文信息检索中的研究与实现
被引量:16
- 8
-
-
作者
居斌
-
机构
浙江省科技信息研究院网管中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第5期193-196,共4页
-
文摘
随着网络信息的迅猛发展,信息检索已经成为人们获取信息不可缺少的工具。基于向量空间模型的检索方法是语义检索的重要研究方向,潜在语义标引模型是向量检索方法的一个有力扩展。对LSI中所涉及的关键技术,包括传统的向量空间模型的原理,以及潜在语义索引模型的原理、设计、实现,进行了研究和探讨,同时开发了一个适合中文信息检索的系统原型。对系统进行了测试,取得了较好的实验效果。
-
关键词
潜在语义标引
向量空间模型
信息检索
中文
-
Keywords
Latent semantic indexing(LSI)
Vector space model
Information retrieval
Chinese
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于潜语义标引的自然语言检索
被引量:3
- 9
-
-
作者
陶跃华
孙茂松
-
机构
云南师范大学计算机科学系
清华大学计算机科学与技术系
-
出处
《现代图书情报技术》
CSSCI
北大核心
2001年第5期40-41,共2页
-
文摘
在信息检索中 ,向量空间模型是最有效的数学工具之一。由于自然语言检索的特殊性 ,以及传统信息检索模型受到同义词、多义词的影响 ,检索的查准率不高。为了提高自然语言检索的查准率 ,我们对基于概念的信息检索模型——潜语义标引 ( LSI)模型进行了探讨 ,并分析了基于 LSI的两个实例。
-
关键词
自然语言
信息检索
潜语义标引
向量空间模型
-
Keywords
Natural language Information retrieval Semantic indexing
-
分类号
G354.2
[文化科学—情报学]
-
-
题名LSI潜在语义标引方法在情报检索中的应用
被引量:11
- 10
-
-
作者
冯项云
-
机构
中国科学院文献情报中心
-
出处
《现代图书情报技术》
CSSCI
北大核心
1998年第4期19-21,53,共4页
-
文摘
介绍了一种基于词相依性的语义结构,被称为“潜在语义标引”的文献自动标引和检索技术。采用词频统计和奇值分解技术来捕捉文献的语义结构,得到标引词、提问和文献的向量表示,检索系统可以预测文献与提问之间的相关度。
-
关键词
情报检索
自动标引
向量空间模型
潜在语义标引
-
分类号
G354
[文化科学—情报学]
G254-39
[文化科学—图书馆学]
-
-
题名基于潜在语义分析的电子文献检索方法及实验分析
被引量:2
- 11
-
-
作者
王睿
杨舒卉
张丽
-
机构
海军工程大学训练部
-
出处
《海军工程大学学报(综合版)》
2017年第1期88-92,共5页
-
文摘
利用潜在语义分析方法,设计出了检索算法,通过奇异值分解得到缩减后的词汇向量,再计算各个文件段落的向量,最后将这些向量与查询条件所得向量加以比较。该方法能够使得不同类之下的词汇完全不相关,从而有助于概念检索。另外,还构建了实验系统对该方法的有效性进行了验证,并分析、比较了其适用范围。
-
关键词
文献检索
潜在语义分析
向量空间模型
概念检索
-
Keywords
document retrieval
latent semantic analysis
vector space model
concept retrieval
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名潜在语义索引在图像检索中的应用
被引量:1
- 12
-
-
作者
龚主杰
-
机构
武汉大学信息管理学院
-
出处
《图书馆学刊》
2009年第5期91-93,共3页
-
文摘
传统的图像检索方法利用图像的外部特征进行检索,它不能分析和处理图像的语义内容而使应用受到限制。为了解决这一问题,基于内容的图像检索技术应运而生。要将语义内容结合到检索中,就需要进行语义建模。介绍了潜在语义模型在图像的语义建模中的应用。
-
关键词
基于内容的图像检索
向量空间模型
潜在语义索引
-
分类号
G254
[文化科学—图书馆学]
-
-
题名基于潜在语义索引技术的用户兴趣模型构建
- 13
-
-
作者
米晓红
-
机构
河南科技大学经济与管理学院信息管理研究所
-
出处
《信息技术》
2008年第7期20-24,共5页
-
基金
河南科技大学人才科学研究基金资助项目(13520026)
-
文摘
用户兴趣模型的表示是信息检索的核心技术之一。利用潜在语义索引的方法构建了一种用户兴趣模型,通过计算文本与模型的匹配程度,将满足约定条件的文本推荐给用户,并利用相关反馈信息更新用户的兴趣模型。最后通过实验验证了该方法的有效性,实验表明该模型可以很好地提高用户信息检索的效率。
-
关键词
信息检索
用户兴趣模型
潜在语义索引
-
Keywords
information retrieval
user interest-model
latent semantic indexing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于增量式潜在语义分析的构件检索算法
- 14
-
-
作者
祝仰凯
高茂庭
-
机构
上海海事大学信息工程学院
-
出处
《现代计算机(中旬刊)》
2016年第11期20-25,共6页
-
文摘
针对基于潜在语义分析的构件检索算法,在应用与问题规模逐渐增大时,空间和时间复杂度也随之提高的问题,提出一种增量式潜在语义分析的构件检索算法,在进行增量矩阵的奇异值分解时,利用增量前矩阵的分解结果进行运算,从而避免重复运算。实验结果表明,该算法能够提高构件检索效率。
-
关键词
潜在语义分析
增量式
构件检索
向量空间模型
-
Keywords
Latent Semantic Analysis
Incremental
Component Retrieval
VSM
-
分类号
TP311.12
[自动化与计算机技术—计算机软件与理论]
-
-
题名潜在语义索引方法在信息过滤中的应用
被引量:16
- 15
-
-
作者
牛伟霞
张永奎
-
机构
山西大学计算机科学系
-
出处
《计算机工程与应用》
CSCD
北大核心
2001年第9期57-60,共4页
-
基金
山西省自然科学基金!(编号:991035)
山西省归国留学基金的资助!(编号:lx976003)
-
文摘
信息过滤是一种WEB信息服务的新技术,旨在实现网络服务器向客户端主动的信息推迟,其核心技术之一是用户兴趣主题模型的表示。文章利用潜在语义索引方法构建用户兴趣主题模型,并对网上大量的中文科技文献信息进行过滤。初步实验的结果表明,该方法与传统的向量空间方法相比,效率有明显提高。
-
关键词
信息过滤
潜在语义索引
兴趣主题模型
信息检索
WEB
互联网
-
Keywords
Information filtering,Latent Semantic Indexing,Topic Profile, Information Retrieval
-
分类号
G354.4
[文化科学—情报学]
-
-
题名基于潜在语义索引的中文文本聚类的研究
被引量:4
- 16
-
-
作者
马国俊
贠卫国
-
机构
西安建筑科技大学信控学院
-
出处
《现代电子技术》
2005年第10期58-59,共2页
-
文摘
讨论了中文文本聚类的现状以及存在的问题,介绍了向量空间模型,详细阐述了潜在语义索引理论以及采用该模型进行中文文本聚类的主要步骤,最后采用两种模型进行了实验对比,实验表明采用潜在语义索引模型可以取得更好的聚类效果。
-
关键词
文本聚类
潜在语义索引
向量空间模型
信息检索
-
Keywords
text clustering
latent semantic index
vector space model
information index
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于代数理论的信息检索模型及其推广
被引量:1
- 17
-
-
作者
王知津
郑红军
-
机构
南开大学国际商学院图书馆学系
-
出处
《现代图书情报技术》
CSSCI
北大核心
2005年第7期30-33,共4页
-
文摘
在信息检索中,代数理论是构建检索模型的重要手段之一,以代数理论为基础的检索模型克服了布尔模型不能进行部分匹配的缺点而广为采用。本文分析了代数理论的向量空间模型,并对该模型进行了扩展:用最小项标引词以反映词与词之间的关系,用奇异值分解来捕捉文献的语义结构;最后对这三种模型进行了比较。
-
关键词
信息检索
数学模型
向量空间模型
广义向量空间模型
潜语义标引
-
Keywords
Information retrieval Mathematics model Vector space model Generalized vector space model Latent semantic indexing
-
分类号
G354
[文化科学—情报学]
-
-
题名改进潜在语义索引的个性化搜索引擎的设计
被引量:1
- 18
-
-
作者
刘静
-
机构
健雄职业技术学院计算机工程系
-
出处
《苏州市职业大学学报》
2010年第2期54-57,共4页
-
基金
健雄职业技术学院教改资助项目(200905)
健雄职业技术学院精品课程资助项目(200803)
-
文摘
个性化搜索引擎是一种通过机器主动学习用户兴趣,并根据用户兴趣帮助用户进行信息筛选的新一代智能化搜索引擎,潜在语义索引模型在词与词、文本与文本之间的检索中具有先进性.针对该模型中文档集用户兴趣有效性低的问题引入用户个性词典来改进,给出一个完整的可学习用户兴趣并可动态调整的个性化搜索引擎的设计.实验表明潜在语义索引比向量空间模型具有更好的信息检索性能,同时改进的潜在语义索引算法与传统算法相比在文献检索方面性能有明显提高.
-
关键词
个性化
潜在语义索引
向量空间模型
用户个性词典
信息检索
-
Keywords
personalized
latent semantic indexing
vector space models user's personalized dictionary
information retrieval
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名潜在语义分析技术在自动评卷系统中的应用
被引量:1
- 19
-
-
作者
赵亚慧
-
机构
延边大学工学院计算机科学与技术系智能信息处理研究室
-
出处
《延边大学学报(自然科学版)》
CAS
2011年第4期345-348,共4页
-
文摘
提出了一种基于潜在语义分析(LSA)的相似文本匹配算法,并将其应用于自动评卷系统中。首先,在充分考虑词项之间相关性的基础上,在低维空间中表示学生答案文本与标准答案文本,然后利用奇异值分解方法模型对其进行了改进;其次,利用LSA技术,以学生答案文本与标准答案文本之间的余弦相似度作为相似性准则,根据相似度值确定该题的得分。实验结果表明,该算法充分考虑了文本语义信息,评分效果较好,是实现基于语义评卷系统的有益探索。
-
关键词
文本信息检索
向量空间模型
潜在语义分析
自动评卷系统
-
Keywords
text Information retrieval
vector space modec
latent semantic analysis
automatic grading system
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于VSM的潜在语义索引
被引量:1
- 20
-
-
作者
王瑛
-
机构
闽江学院教务处
-
出处
《陕西科技大学学报(自然科学版)》
2010年第5期151-154,158,共5页
-
文摘
传统向量空间模型信息检索技术,只是统计关键词在文档中出现的频度,检索结果不能反映出文档的相关性.为了解决关键词检索时潜在语义的挖掘问题,提出了一种基于向量空间模型的潜在语义索引的改进算法.对比实验证明,该算法能够有效提高检索查准率.
-
关键词
向量空间模型
潜在语义索引
信息检索
-
Keywords
vector space model
latent semantic indexing
information retrieval
-
分类号
TP274.2
[自动化与计算机技术—检测技术与自动化装置]
TP391
[自动化与计算机技术—计算机应用技术]
-