期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于分区层次图的海量高维数据学习索引构建方法
1
作者 华悦琳 周晓磊 +2 位作者 范强 王芳潇 严浩 《计算机工程与科学》 CSCD 北大核心 2024年第7期1193-1201,共9页
学习索引是破解海量高维数据近似最近邻搜索问题的关键。然而,现有学习索引技术结果仅局限于单个分区中,且依赖于近邻图的构建。随着数据维度和规模的增长,索引难以对分区边界数据进行精确判断,并且构建时间复杂度增大,可扩展性难以保... 学习索引是破解海量高维数据近似最近邻搜索问题的关键。然而,现有学习索引技术结果仅局限于单个分区中,且依赖于近邻图的构建。随着数据维度和规模的增长,索引难以对分区边界数据进行精确判断,并且构建时间复杂度增大,可扩展性难以保障。针对上述问题,提出了基于分区层次图的学习索引方法PBO-HNSW。该方法对分区边界数据进行重新分配,并行构建分布式图索引结构,从而有效应对近似最近邻搜索问题所面临的挑战。实验结果表明,该方法能够在百万级海量高维数据上实现毫秒级的索引构建。当召回率为0.93时,PBO-HNSW方法构建时间仅为基线方法的36.4%。 展开更多
关键词 近似最近邻搜索 学习索引 层次可导航小世界图 分区学习 索引结构
在线阅读 下载PDF
量化编码的分层可通航小世界图算法 被引量:1
2
作者 李秋珍 白兴强 +1 位作者 李立夏 王赢 《计算机工程与科学》 CSCD 北大核心 2019年第4期618-625,共8页
随着大数据和人工智能的高速发展,针对多媒体数据的结构化处理与基于内容的检索受到极大的关注,面对多媒体数据结构化后的海量高维特征向量,如何快速、准确地检索是人工智能处理大规模数据所必须解决的问题。最近提出的分层可通航小世界... 随着大数据和人工智能的高速发展,针对多媒体数据的结构化处理与基于内容的检索受到极大的关注,面对多媒体数据结构化后的海量高维特征向量,如何快速、准确地检索是人工智能处理大规模数据所必须解决的问题。最近提出的分层可通航小世界图HNSW检索算法在多个公开数据集取得了最佳的性能表现,但该算法存在内存开销大的问题。而基于量化编码的检索算法能够压缩数据集向量,大幅度降低内存占用。将量化编码和分层可通航小世界图算法结合,提出了2种基于量化编码改进的HNSW算法,分别是使用标量量化编码向量的HNSWSQ算法和使用乘积量化编码向量的HNSWPQ算法,2种算法使用不同的量化策略存储原始向量编码,以降低内存开销,再通过HNSW算法建立索引达到缩短检索耗时的目的。其中HNSWSQ算法在多个数据集上获得了与HNSW算法相近的查全率和平均检索耗时,而内存开销大幅降低。实验结果表明,HNSWSQ算法在SIFT-1M和GIST-1M数据集上的内存开销比HNSW算法分别降低了45.1%和70.4%。 展开更多
关键词 近似最近邻检索 分层可通航小世界图算法 乘积量化 标量量化 相似性搜索 高维数据索引
在线阅读 下载PDF
基于层次化可导航小世界网络改进的SeqSLAM算法
3
作者 张梦真 王庆芝 刘其朋 《复杂系统与复杂性科学》 CAS CSCD 北大核心 2023年第1期105-110,共6页
SeqSLAM是移动机器人领域广泛使用的一种视觉定位算法,它对光照等因素较鲁棒,但受视角变化影响较大。另外,SeqSLAM采用了蛮力搜索匹配的方式,在较大规模数据集中无法满足实时性要求。针对以上问题,对SeqSLAM算法做了两方面的改进:首先... SeqSLAM是移动机器人领域广泛使用的一种视觉定位算法,它对光照等因素较鲁棒,但受视角变化影响较大。另外,SeqSLAM采用了蛮力搜索匹配的方式,在较大规模数据集中无法满足实时性要求。针对以上问题,对SeqSLAM算法做了两方面的改进:首先将图像表示为局部聚合描述子向量,提取图像特征;然后采用层次化可导航小世界网络算法搜索相似图像序列,具有更高的搜索效率。测试表明,改进的SeqSLAM算法可以获得更高的精确率和召回率,搜索时间显著降低。 展开更多
关键词 SeqSLAM 回环检测 局部聚合描述子向量 层次化可导航小世界网络
在线阅读 下载PDF
基于SecureCNN的高效加密图像内容检索系统
4
作者 卢雨晗 陈立全 +1 位作者 王宇 胡致远 《计算机科学》 CSCD 北大核心 2023年第9期26-34,共9页
随着智能设备的快速发展,云上的基于内容的图像检索技术(CBIR)越来越受欢迎。但在半诚实的云服务器上进行图像检索存在泄露用户隐私的风险。为了防止个人隐私遭到泄露,用户外包图像给云之前会对其进行加密,但现有的明文域上CBIR方案对... 随着智能设备的快速发展,云上的基于内容的图像检索技术(CBIR)越来越受欢迎。但在半诚实的云服务器上进行图像检索存在泄露用户隐私的风险。为了防止个人隐私遭到泄露,用户外包图像给云之前会对其进行加密,但现有的明文域上CBIR方案对于加密图像数据的搜索是无效的。为了解决这些问题,文中提出了一个基于近似数同态的高效加密图像内容检索方案,在保护用户隐私的情况下,能够快速实现以图搜图,且无需用户的持续交互。首先使用近似数同态神经网络对图像集进行特征提取,可以保证网络模型的参数和图像集数据不会泄露给云服务器。其次,提出了一种新的神经网络分治方法,该方法可以减少同态加密乘法深度和提高模型运行效率;利用分级可导航小世界(HNSW)算法构造索引,实现高效图像检索。此外,使用同态加密保障图像数据传输过程的安全性,使用对称加密算法保证存储阶段的安全性。最后,通过实验对比和安全性分析证明了该方案的安全性和效率。实验结果表明,该方案是IND-CCA的,且在保证图像私密性的前提下,其同态加密的乘法次数最多为3次,在检索精度上远超过现有方案,在检索时间复杂度方面比现有方案高出至少100倍,实现了检索精度和效率的兼顾。 展开更多
关键词 近似同态 基于内容的图像检索技术 神经网络 分级可导航小世界图算法 高效检索
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部