期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
二级Hash全局和局部索引筛选的长序列比对并行算法 被引量:3
1
作者 潘登 钟诚 《小型微型计算机系统》 CSCD 北大核心 2022年第9期1999-2004,共6页
通过构建参考基因组的二级Hash索引,以快速筛选出测序长序列在参考基因组中可能匹配的候选区域;建立测序序列局部索引,以加速测序序列和参考基因组候选区域之间的映射定位;对每个候选区域里的k-mer与测序序列的索引命中进行左右扩展获... 通过构建参考基因组的二级Hash索引,以快速筛选出测序长序列在参考基因组中可能匹配的候选区域;建立测序序列局部索引,以加速测序序列和参考基因组候选区域之间的映射定位;对每个候选区域里的k-mer与测序序列的索引命中进行左右扩展获得比对种子;采用等距离抽样方式对种子抽取多个位置,利用抽样结果建立判断依据来过滤掉那些不可能匹配的种子;建立处理包含“均聚物”类型错误的序列片段全局比对得分方程,并行填补比对骨架的空隙,并采取GPU显存预分配和后释放独立的并行比对策略,以提升序列片段全局并行比对效率.模拟与真实数据的实验结果表明,相较于已有同类的长序列比对并行算法,本文提出的并行算法获得整体上较高的比对敏感度、碱基层次灵敏度和准确度,且可有效处理第3代测序长序列含有的“均聚物”类型错误,显著加速了大规模长序列与参考基因组比对的完成. 展开更多
关键词 序列比对 并行算法 hash索引 动态规划 筛选
在线阅读 下载PDF
基于Hash索引的高通量基因序列比对并行加速技术研究 被引量:4
2
作者 王文迪 汤文 +3 位作者 段勃 张春明 张佩珩 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2013年第11期2463-2471,共9页
近年来随着高通量基因测序技术的迅速发展,测序成本和周期都得到了大幅降低.然而,新一代测序技术海量数据生成能力以及各类测序算法蕴含的高并发性却对现有计算机的运算能力提出了新挑战.以一个基于Hash索引算法实现的开源重测序程... 近年来随着高通量基因测序技术的迅速发展,测序成本和周期都得到了大幅降低.然而,新一代测序技术海量数据生成能力以及各类测序算法蕴含的高并发性却对现有计算机的运算能力提出了新挑战.以一个基于Hash索引算法实现的开源重测序程序(PerM)为例,研究了在商用多核CPU上加速该应用程序的关键技术.在一个64核SMP系统上的实验结果证明,提出的优化技术可以使Cache缺失率降低90%,性能提升4~11倍.接下来探讨了在一个包含XilinxLX330FPGA的加速卡上设计实现专用并行加速系统的相关问题.作为原型验证系统,在基于FPGA的PCIe加速卡上设计并实现了包含11个处理单元的脉动陈列并行计算系统.和IntelXeonX75508核CPU相比,提出的并行加速器有30~65倍性能功耗比优势. 展开更多
关键词 hash索引 生物信息学 高通量测序 FPGA 并行加速器
在线阅读 下载PDF
面向批量插入优化的并行存储引擎MTPower 被引量:5
3
作者 陈虎 唐海浩 +1 位作者 廖江苗 彭江峰 《计算机学报》 EI CSCD 北大核心 2010年第8期1492-1499,共8页
针对多核处理器的特点,文章提出了一个符合MySQL接口标准的并行存储引擎MTPower.该存储引擎着重利用多核处理器的并行计算能力提升批量插入过程中的索引产生过程,主要包含存储引擎接口、并行批量线性Hash索引、并行批量B+树插入、支持... 针对多核处理器的特点,文章提出了一个符合MySQL接口标准的并行存储引擎MTPower.该存储引擎着重利用多核处理器的并行计算能力提升批量插入过程中的索引产生过程,主要包含存储引擎接口、并行批量线性Hash索引、并行批量B+树插入、支持并行访问的磁盘存储缓冲等部分.测试结果表明,在批量插入记录且需要创建Hash和B+树索引时,MTPower的性能比经典的单线程存储引擎MyISAM最高可以提高6.1倍和4.8倍;在系统中线程总数略大于处理器核数时,MTPower可以达到最佳性能;在处理器核的数量增加时,MTPower的性能也能随之提高. 展开更多
关键词 并行数据库 hash并行索引 B+树并行索引 磁盘缓冲 多核处理器
在线阅读 下载PDF
加密环境下大数据特征集并行存储方法研究 被引量:1
4
作者 李蓉蓉 《现代电子技术》 北大核心 2019年第18期69-72,共4页
针对传统方法存在数据存储速度慢,容量小的问题,提出一种加密环境下大数据特征集并行存储方法.采用MMSE算法对大数据特征集进行优化处理,以获得并行的大数据特征集.在加密环境下,当内存中保留数据记录达到一定数量时,在并行处理后的数... 针对传统方法存在数据存储速度慢,容量小的问题,提出一种加密环境下大数据特征集并行存储方法.采用MMSE算法对大数据特征集进行优化处理,以获得并行的大数据特征集.在加密环境下,当内存中保留数据记录达到一定数量时,在并行处理后的数据中插入批量Hash索引.以此为基础,基于Map函数对数据进行映射处理,进而完成对大数据特征集的并行存储.实验结果表明,利用所提方法的存储过程中数据分布通道具有较好的一致性,且存储速度约为传统方法的3倍,存储容量大. 展开更多
关键词 大数据特征集 并行存储 MMSE算法 hash索引 结果分析 映射处理
在线阅读 下载PDF
一种新的分布式并行索引树——DPB^+-Tree
5
作者 唐继勇 白新跃 +1 位作者 杨峰 何建 《计算机科学》 CSCD 北大核心 2005年第12期75-78,共4页
随着数据规模的增大,查询越来越复杂,分布式并行索引以其高性能而逐渐成为解决复杂查询问题的有效手段。本文提出一种适合于分布式并行的新索引树结构——DPB^+-Tree,该索引树以B^+树和 hash结构为基础,其叶子结点被组织为有n个散列表元... 随着数据规模的增大,查询越来越复杂,分布式并行索引以其高性能而逐渐成为解决复杂查询问题的有效手段。本文提出一种适合于分布式并行的新索引树结构——DPB^+-Tree,该索引树以B^+树和 hash结构为基础,其叶子结点被组织为有n个散列表元的hash表链,从树的根结点到叶子结点,结点副本数量逐渐减少,并且其数量的变化是动态的。对DPB^+-Tree响应时间的仿真结果表明 DPB^+-Tree系统提高了系统的查询效率,与其它相关策略,如CPB方法比较具有较明显优势。 展开更多
关键词 分布式并行索引 B^+树 hash结构 DPB^+-Tree
在线阅读 下载PDF
GSHR-Tree:一种基于动态空间槽和哈希表的网格环境下的空间索引树 被引量:1
6
作者 陈占龙 吴信才 +1 位作者 谢忠 马丽娜 《地球科学(中国地质大学学报)》 EI CAS CSCD 北大核心 2010年第3期463-470,共8页
为提高网格环境下海量空间数据管理与并行化处理效率,将网格环境下的分布并行处理技术与空间索引相融合,提出了一种空间索引框架(grid slot and hash Rtree,GSHR-Tree).该索引树结构基于散列hash表和动态空间槽,结合R树结构的范围查询... 为提高网格环境下海量空间数据管理与并行化处理效率,将网格环境下的分布并行处理技术与空间索引相融合,提出了一种空间索引框架(grid slot and hash Rtree,GSHR-Tree).该索引树结构基于散列hash表和动态空间槽,结合R树结构的范围查询优势和哈希表结构的高效单key查询,分析改进了索引结构的组织和存储.构造了适合于大规模空间数据的网格并行空间计算的索引结构,该索引树算法根据空间数据划分策略,动态分割空间槽,并将它们映射到多个节点机上.每个节点机再将其对应空间槽中的空间对象组织成R树,以大节点R树方式在多个节点上分布索引数据.以空间范围查询并行处理的系统响应时间为性能评估指标,通过模拟实验证明,该GSHR-Tree索引满足了当前网格环境空间索引的需要,并具有设计合理、性能高效的特点. 展开更多
关键词 空间数据索引 分布式空间索引 R-树 散列hash 动态空间槽 网格计算 地理信息系统
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部